• Title/Summary/Keyword: 질문/응답

Search Result 558, Processing Time 0.028 seconds

Poly-encoder based COVID-19 Question and Answering with Task Adaptation (Poly-encoder기반의 COVID-19 질의 응답 태스크)

  • Lee, Seolhwa;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.188-191
    • /
    • 2020
  • 본 연구는 COVID-19 질의 응답 태스크를 위한 Poly-encoder 기반의 태스크를 제안하였다. COVID-19 질의 응답 시스템은 사람들에게 최신 정보에 대해 빠르고 신뢰성이 높은 정보를 전달하는 특성을 가져야한다. 검색 기반 질의 응답 시스템은 pairwise 연산을 기반으로 수행되는데, Poly-encoder는 사전 학습된 트랜스포머(transformer)기반의 pairwise 연산 방법론 중 기존 Cross-encoder와 Bi-encoder보다 실사용 및 성능이 뛰어남을 보였다 [1]. 특히, Poly-encoder는 정확도가 높으면서도 빠른 응답속도를 가지며 검색기반의 각종 태스크에서 좋은 성능을 보였다. 따라서 본 연구는 COVID-19를 위한 Poly-encoder기반의 질의 응답 태스크를 위하여 기존 질의 응답 태스크와 페르소나 기반의 질의 응답 태스크로 두 가지 유형의 태스크를 생성하여 모델을 학습하였다. 또한 신뢰성 있는 리소스정보로부터 모델에 최신 정보 반영을 위하여 자동 크롤러를 구축하여 데이터를 수집하였다. 마지막으로 전문가를 통한 데이터셋을 구축하여 질문-응답과 질의어-질문에 대한 모델 검증을 수행하였다.

  • PDF

Pre-trained Language Model for Table Question and Answering (표 질의응답을 위한 언어 모델 학습 및 데이터 구축)

  • Sim, Myoseop;Jun, Changwook;Choi, Jooyoung;Kim, Hyun;Jang, Hansol;Min, Kyungkoo
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.335-339
    • /
    • 2021
  • 기계독해(MRC)는 인공지능 알고리즘이 문서를 이해하고 질문에 대한 정답을 찾는 기술이다. MRC는 사전 학습 모델을 사용하여 높은 성능을 내고 있고, 일반 텍스트문서 뿐만 아니라 문서 내의 테이블(표)에서도 정답을 찾고자 하는 연구에 활발히 적용되고 있다. 본 연구에서는 기존의 사전학습 모델을 테이블 데이터에 활용하여 질의응답을 할 수 있는 방법을 제안한다. 더불어 테이블 데이터를 효율적으로 학습하기 위한 데이터 구성 방법을 소개한다. 사전학습 모델은 BERT[1]를 사용하여 테이블 정보를 인코딩하고 Masked Entity Recovery(MER) 방식을 사용한다. 테이블 질의응답 모델 학습을 위해 한국어 위키 문서에서 표와 연관 텍스트를 추출하여 사전학습을 진행하였고, 미세 조정은 샘플링한 테이블에 대한 질문-답변 데이터 약 7만건을 구성하여 진행하였다. 결과로 KorQuAD2.0 데이터셋의 테이블 관련 질문 데이터에서 EM 69.07, F1 78.34로 기존 연구보다 우수한 성능을 보였다.

  • PDF

Confidence Interval for Sensitive Binomial Attribute : Direct Question Method and Indirect Question Method (민감한 이항특성에 대한 신뢰구간 : 직접질문법과 간접질문법)

  • Ryu, Jea-Bok
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.1
    • /
    • pp.75-82
    • /
    • 2015
  • We discuss confidence intervals for sensitive binomial attributes obtained by a direct question method and indirect question method. The Randomized Response Technique(RRT) by Warner (1965) is an indirect question method that uses a randomization device to reduce the response burden of respondents. We used the mean coverage probability (MCP), root mean squared error (RMSE), and mean expected width (MEW) to compare the confidence intervals by the two methods. The numerical comparisons indicated found that the MEW of RRT is too large and the RRT is so conservative that the MCP exceeds a nominal level(${\alpha}$); therefore, it is necessary to complement these problem in order to increase the utility of the indirect question method.

2단계 확률화응답기법의 효율성 및 응답자보호수준

  • 김영원;정선아
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.2
    • /
    • pp.139-150
    • /
    • 1996
  • 확률화응답기법은 민감한 사항에 대한 모비율의 효율적인 추정과 응답자에 대한 충분한 보호수준 제공이라는 두 가지 측면을 동시에 추구하는 통계조사기법이다. 본 연구에서는 기법에서 적용된 질문선택확률이 이와 같은 두 가지 측면에 미치는 영향을 정리하고, 이런 관점에서 최근에 제시된 2단계 확률화응답 기법들은 기존의 기법에서 단순히 질문선택확률구조만을 수정한 것으로 해석될 수 있으며, 따라서 효율성 측면에서 본질적으로 기존의 방법과 동일한 기법임을 보였다.

  • PDF

A Study on Question-Order and Question-Intention Effects in Surveys of Job Satisfaction (직무만족 조사에서의 질문 순서 및 질문 의도 효과에 관한 연구)

  • Ahn, Myung-Sik;Han, In-Soo;Oh, Hong-Seok
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.7
    • /
    • pp.423-430
    • /
    • 2016
  • The results of the response in the Self-report survey are occurred differently according to situational factors and personal characteristics. This study attempts to examine the effects of the question-order and question-intentions in surveys of job satisfaction. Four types of questionnaires were used in consideration of the difference between Whole Questions and detail Questions in question-order and the difference between job satisfaction measurement and job dissatisfaction measurement in question-intentions. This study surveyed 94 employees. As a result, the order and intention of questions could affect respondent's answers. However, It was not statistically significant support. Also, this study suggest significant implications, limits of this study and research direction of future study.

Analysis of Digital Reference Services in Korean Academic Libraries (대학도서관의 디지털참고봉사 제공 및 이용 분석)

  • Chang, Hye-Rhan
    • Journal of the Korean Society for information Management
    • /
    • v.20 no.4 s.50
    • /
    • pp.49-66
    • /
    • 2003
  • To understand current state of the digital reference services in Korean academic libraries. a comprehensive examination and analysis was performed. Data was collected from July 8, 2003 to July 22, 2003, through direct site examination and recording the question and answer transcripts. The analysis focused on the provision characteristics and use of the digital reference services. Results revealed interesting findings and related problems. Suggestions for future development are provided.

A Study on the Dense Vector Representation of Query-Passage for Open Domain Question Answering (오픈 도메인 질의응답을 위한 질문-구절의 밀집 벡터 표현 연구)

  • Minji Jung;Saebyeok Lee;Youngjune Kim;Cheolhun Heo;Chunghee Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.115-121
    • /
    • 2022
  • 질문에 답하기 위해 관련 구절을 검색하는 기술은 오픈 도메인 질의응답의 검색 단계를 위해 필요하다. 전통적인 방법은 정보 검색 기법인 빈도-역문서 빈도(TF-IDF) 기반으로 희소한 벡터 표현을 활용하여 구절을 검색한다. 하지만 희소 벡터 표현은 벡터 길이가 길 뿐만 아니라, 질문에 나오지 않는 단어나 토큰을 검색하지 못한다는 취약점을 가진다. 밀집 벡터 표현 연구는 이러한 취약점을 개선하고 있으며 대부분의 연구가 영어 데이터셋을 학습한 것이다. 따라서, 본 연구는 한국어 데이터셋을 학습한 밀집 벡터 표현을 연구하고 여러 가지 부정 샘플(negative sample) 추출 방법을 도입하여 전이 학습한 모델 성능을 비교 분석한다. 또한, 대화 응답 선택 태스크에서 밀집 검색에 활용한 순위 재지정 상호작용 레이어를 추가한 실험을 진행하고 비교 분석한다. 밀집 벡터 표현 모델을 학습하는 것이 도전적인 과제인만큼 향후에도 다양한 시도가 필요할 것으로 보인다.

  • PDF

The Learning Ability Checking system based on the Capability Maturity Model (능력성숙 모델을 기반으로 한 학습능력 진단 시스템)

  • 방영일;구본경;허용도;김진수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.714-716
    • /
    • 2000
  • 본 논문에서는 웹상에서 학습자의 학습능력을 진단하기 위하여 각 단계별로 질문을 제시하고 질문의 응답여부에 따라 자신의 학습 능력을 평가받고 향후 자신의 능력을 좀 더 향상시킬 수 있는 지침을 제공하는 학습능력 진단시스템을 개발하였다. 본 시스템에서는 소프트웨어 프로세스를 향상시키기 위해 사용되고 있는 능력성숙 모델(CMM)을 기반으로 질문 리스트를 구성하였으며 다양한 학습자의 학습능력을 전단할 수 있도록 학습자의 직업에 따라 별도의 질문 리스트를 준비하였고 질문 리스트와 메시지 및 가산점을 조정한다면 다양한 분야에서도 활용될 수 있을 것이다.

  • PDF

Design of a Korean Question-Answering System for News Item Retrieval (우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구)

  • Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.4 no.1
    • /
    • pp.3-23
    • /
    • 1987
  • This paper describes a question-answering system that can automatically analyze input texts and questions in Korean natural language. The particular texts used for the research were newspaper articles in the specific domain of sports news. The system consists of a set of Cobol programs and an associated set of data files containing lexicon, case grammar, linguistic rules. and data base. This system employs two retrieval functions of fact retrieval and passage retrieval. Therefore input questions can be answered in forms of either sentence or factual data.

  • PDF

Design and Implemention of Automatic Answering BBS for Repeated Questions (중복질문에 대한 자동응답 게시판의 설계 및 구현)

  • Lee, Hwa-Sook;Kim, Hyoung-Chul;Woo, Jong-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.947-950
    • /
    • 2003
  • 최근 WBI가 발달하면서 학습자는 교수자와 의사소통을 위하여 웹이 제공하는 다양한 형태를 이용하여 상호작용을 한다. WBI에서 상호작용 수단으로 가장 보편적으로 사용되고 있는 예로 Q&A 게시판을 들 수가 있는데, 기존의 일반적인 게시판의 경우 중복 질문 등에 대한 효율적 관리 및 이용이 되지 못하고 있다. 본 논문에서는 이러한 문제점을 보완하기 위하여 반복되는 중복 질문에 자동응답처리가 가능한 게시판을 구현하였고, 또한 빈도수가 높은 중복 질문을 FAQ에 적응적으로 갱신함으로서 학습자와 교수자간에 상호작용의 효율성을 높일 수 있도록 하였다.

  • PDF