• 제목/요약/키워드: Question answering system

검색결과 153건 처리시간 0.022초

질의 응답 시스템을 위한 질의, 문서, 답변 검증기 (Question, Document, Response Validator for Question Answering System)

  • 민태홍;이재홍;인수교;문기윤;조휘열;김경덕
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.604-607
    • /
    • 2022
  • 본 논문은 사용자의 질의에 대한 답변을 제공하는 질의 응답 시스템에서, 제공하는 답변이 사용자의 질의에 대하여 문서에 근거하여 올바르게 대답하였는지 검증하는 QDR validator에 대해 기술한 논문이다. 본 논문의 과제는 문서에 대한 주장을 판별하는 자연어 추론(Natural Language inference, NLI)와 유사한 과제이지만, 문서(D)와 주장(R)을 포함하여 질의(Q)까지 총 3가지 종류의 입력을 받아 NLI 과제보다 난도가 높다. QDR validation 과제를 수행하기 위하여, 약 16,000 건 데이터를 생성하였으며, 다양한 입력 형식 실험 및 NLI 과제 데이터 추가 학습, 임계 값 조절 실험을 통해 최종 83.05% 우수한 성능을 기록하였다

  • PDF

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

거대언어모델과 문서검색 알고리즘을 활용한 한국원자력연구원 규정 질의응답 시스템 개발 (Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model)

  • 김홍비;유용균
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.31-39
    • /
    • 2023
  • 최근 자연어 처리(NLP) 기술, 특히 ChatGPT를 비롯한 거대 언어 모델(LLM)의 발전으로 특정 전문지식에 대한 질의응답(QA) 시스템의 연구개발이 활발하다. 본 논문에서는 거대언어모델과 문서검색 알고리즘을 활용하여 한국원자력연구원(KAERI)의 규정 등 다양한 문서를 이해하고 사용자의 질문에 답변하는 시스템의 동작 원리에 대해서 설명한다. 먼저, 다수의 문서를 검색과 분석이 용이하도록 전처리하고, 문서의 내용을 언어모델에서 처리할 수 있는 길이의 단락으로 나눈다. 각 단락의 내용을 임베딩 모델을 활용하여 벡터로 변환하여 데이터베이스에 저장하고, 사용자의 질문에서 추출한 벡터와 비교하여 질문의 내용과 가장 관련이 있는 내용들을 추출한다. 추출된 단락과 질문을 언어 생성 모델의 입력으로 사용하여 답변을 생성한다. 본 시스템을 내부 규정과 관련된 다양한 질문으로 테스트해본 결과 복잡한 규정에 대하여 질문의 의도를 이해하고, 사용자에게 빠르고 정확하게 답변을 제공할 수 있음을 확인하였다.

정확한 해답 추출을 위한 개념 기반의 질의 분석 (Concept-based Question Analysis for Accurate Answer Extraction)

  • 신승은;강유환;안영민;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권1호
    • /
    • pp.10-20
    • /
    • 2007
  • 본 논문에서는 정확한 해답 추출을 위해 키워드보다 중요한 역할을 하는 개념을 분석하는 개념 기반 질의 분석에 대해 기술한다 해답 유형이 같은 질의들에서 나타나는 개념은 유사하기 때문에 이러한 개념들을 잘 정의하여 이용할 경우, 해답을 포함하는 다양한 형태의 구문으로부터 보다 정확한 해답을 추출할 수 있다는 것이 본 논문의 주요 아이디어이다. 즉, 해답을 포함하는 문서와 그 문서 내에 있는 해답을 좀더 정확하게 추출하기 위해 질문에 있는 각 단어나 구절들의 구문 및 의미 역할을 파악하고자 하는 것이다. 이를 위해, 정답 유형별로 그 유형의 질문에서 공통으로 나타나는 주요 개념들로 구성된 개념 프레임을 정의하고, 사용자 질의를 분석하여 개념 프레임을 채우는 과정으로 질의 분석을 수행한다. 실험 결과 본 논문에서 제안한 개념 기반 방식이 기존의 질의분석 기법에 비해 높은 정답 추출 성능을 보여주었다. 본 논문에서 제안한 개념 기반 접근 방법은 언어에 관계없이 적용 가능한 모델이며, 또한 기존 방식과 함께 사용할 수 있는 장점도 있다.

안전기준의 검색과 분석을 위한 기계독해 기반 질의응답 시스템 (Machine Reading Comprehension-based Question and Answering System for Search and Analysis of Safety Standards)

  • 김민호;조상현;박덕근;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제23권2호
    • /
    • pp.351-360
    • /
    • 2020
  • If various unreasonable safety standards are preemptively and effectively readjusted, the risk of accidents can be reduced. In this paper, we proposed a machine reading comprehension-based safety standard Q&A system to secure supporting technology for effective search and analysis of safety standards for integrated and systematic management of safety standards. The proposed model finds documents related to safety standard questions in the various laws and regulations, and then divides these documents into provisions. Only those provisions that are likely to contain the answer to the question are selected, and then the BERT-based machine reading comprehension model is used to find answers to questions related to safety standards. When the proposed safety standard Q&A system is applied to KorQuAD dataset, the performance of EM 40.42% and F1 55.34% are shown.

속성 그래프 및 GraphQL을 활용한 지식기반 공간 쿼리 시스템 설계 (Design of Knowledge-based Spatial Querying System Using Labeled Property Graph and GraphQL)

  • 장한메;김동현;유기윤
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.429-437
    • /
    • 2022
  • 최근 사람과 기계의 소통을 위해 QA (Question Answering) 시스템에 대한 요구가 증가하였다. QA 시스템 중 공간에 관련된 질문을 처리할 수 있는 폐쇄 도메인 QA 시스템을 GeoQA라 하는데 본 연구는 GeoQA 분야에서 주로 사용되던 RDF (Resource Description Framework)기반의 데이터베이스가 데이터 입출력 및 변형에 한계를 보인다는 점을 극복하기 위해 최근 주목받고 있는 새로운 형태의 그래프 데이터베이스인 LPG (Labeled Property Graph)를 사용하였다. 또한, LPG 쿼리(query)언어가 표준화되지 않아 GeoQA 시스템이 특정 제품에 의존할 수 있다는 점 때문에 API 형태의 쿼리 언어인 GraphQL (Graph Query Language)을 도입하여 다양한 LPG를 사용할 방안을 제시하였다. 본 연구에서는 공간 관련 질문이 입력되었을 때 답변을 검색할 수 있도록 대한민국 중심의 별도 데이터베이스를 구축하였는데 각 데이터는 국가공간정보포털 및 지방행정 인허가데이터개방 서비스에서 취득하였으며 각 공간 객체 간 공간적 관계는 미리 계산되어 그래프의 엣지(edge) 형태로 입력되었다. 사용자의 질문은 먼저 FOL (First Order Logic)형태를 거쳐 최종적으로 GraphQL로 변환되며 GraphQL 서버를 통해 데이터베이스에 전달되었다. 실험에 사용한 LPG로는 현재 가장 높은 점유율을 보이는 그래프 데이터베이스인 Neo4j를 선택하였고 내장 함수와 QGIS 일부가 공간 연산에 사용되었다. 시스템 구축 결과 사용자의 질문을 변환, Apollo GraphQL 서버를 통해 처리하고 데이터베이스로부터 적합한 답변을 얻을 수 있음을 확인하였다.

주관식 문제 채점에서의 구문의미트리 비교 시스템에 대한 연구 (Research on Comparing System with Syntactic-Semantic Tree in Subjective-type Grading)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.79-88
    • /
    • 2017
  • 질높은 주관식 문제 채점을 위해서는 답변 속에 들어있는 단어간의 구문의미적 관계를 분석하는 구문 의미 분석이 필요하다. 그러나 구문의미 분석의 결과인 구문의미트리는 단어간의 구조적 의미 관계를 내포하고 있어 단어의 나열인 일차원적인 벡터의 유사도 계산을 적용할 수가 없다. 본 연구는 단어의 지식과 함께 단어와 단어간의 구조적 의미 관계를 내포하는 구문의미트리를 비교하는 비교 시스템에 대한 연구를 한다. 본 연구에서는 구문의미트리 비교를 위해 유사성 계산 원칙을 제안하고 실험을 통해 검증하였다. 본 구문의미트리 비교 시스템은 구문의미분석의 결과를 비교할 수 있게 하여 주관식 문제 채점에 도움을 줄 것이고 문서 유사도 영역에도 활용할 수 있을 것이다.

ExoTime: Temporal Information Extraction from Korean Texts Using Knowledge Base

  • Jeong, Young-Seob;Lim, Chae-Gyun;Choi, Ho-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권12호
    • /
    • pp.35-48
    • /
    • 2017
  • Extracting temporal information from documents is becoming more important, because it can be used to various applications such as Question-Answering (QA) systems, Recommendation systems, or Information Retrieval (IR) systems. Most previous studies only focus on English documents, and they are not applicable to the other languages due to the inherent characteristics of languages. In this paper, we propose a new system, named ExoTime, designed to extract temporal information from Korean documents. The ExoTime adopts an external Knowledge Base (KB) in order to achieve better prediction performance, and it also applies a bagging method to the temporal relation prediction. We show that the effectiveness of the proposed approaches by empirical results using Korean TimeBank. The ExoTime system works as a part of ExoBrain that is an artificial intelligent QA system.

Survey of Temporal Information Extraction

  • Lim, Chae-Gyun;Jeong, Young-Seob;Choi, Ho-Jin
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.931-956
    • /
    • 2019
  • Documents contain information that can be used for various applications, such as question answering (QA) system, information retrieval (IR) system, and recommendation system. To use the information, it is necessary to develop a method of extracting such information from the documents written in a form of natural language. There are several kinds of the information (e.g., temporal information, spatial information, semantic role information), where different kinds of information will be extracted with different methods. In this paper, the existing studies about the methods of extracting the temporal information are reported and several related issues are discussed. The issues are about the task boundary of the temporal information extraction, the history of the annotation languages and shared tasks, the research issues, the applications using the temporal information, and evaluation metrics. Although the history of the tasks of temporal information extraction is not long, there have been many studies that tried various methods. This paper gives which approach is known to be the better way of extracting a particular part of the temporal information, and also provides a future research direction.

Biaffine 한국어 의존파서 (Biaffine Dependency Parser for Korean)

  • ;민태홍;윤준영;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.678-681
    • /
    • 2018
  • Dependency parsing is an important task in natural language processing whose results are used in many downstream tasks such as machine translation, information retrieval, relation extraction, question answering and many others. Most of the dependency parsing literature focuses on using end-to-end and sequence-to-sequence neural architectures as the core of the system. One such system, namely Biaffine dependency parser is explored in the current paper for effective dependency parsing of Korean language.

  • PDF