• Title/Summary/Keyword: Question answering system

Search Result 153, Processing Time 0.032 seconds

A LF based Answer Indexing Method for Encyclopedia Question-Answering System (백과사전 질의응답을 위한 구문정보기반 정답색인방법)

  • Kim Hyeon-Jin;Lee Chung-Hee;Oh Hyo-Jung;Wang Ji-Hyun;Jang Myung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.511-513
    • /
    • 2005
  • 본 논문은 정답 색인 방법을 이용하여 응답 속도가 빠르고 정확한 백과사전 질의응답 시스템을 구현하는 방법을 제안한다. 논문에서 제안한 정답 색인 방법은 대상 문서에서 160여 개의 정답 유형 범주에 해당하는 정답 후보를 인식하고, 정답 후보와 색인 범주에 속하는 키워드를 색인단위로 정의하여 저장하였다. 특히 용언정보에 대해서는 LF(Logical Form)단위로 색인하여 색인 정확도를 높였다. 정답 랭킹에서는 사용자 질문에서 각 단어별로 문장 성분. 단어 가중치 정보 등을 이용하여, 필수단어를 산정하고 이를 정답랭킹의 방법으로 활용하였다. 이러한 방법론은 용언 정보를 활용해야 효과적인 백과사전이라는 문서 도메인의 특성을 반영하고, 빠른 질문 응답 시간을 보장하는 백과사전 질의응답 시스템에 적합하다.

  • PDF

R3 : Open Domain Question Answering System Using Structure Information of Tables (R3 : 테이블의 구조 정보를 활용한 오픈 도메인 질의응답 시스템)

  • Deokhyung Kang;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.455-460
    • /
    • 2022
  • 오픈 도메인 질의 응답에서 질의에 대한 답변은 질의에 대한 관련 문서를 검색한 다음 질의에 대한 답변을 포함할 수 있는 검색된 문서를 분석함으로써 얻어진다. 문서내의 테이블이 질의와 관련이 있을 수 있음에도 불구하고, 기존의 연구는 주로 문서의 텍스트 부분만을 검색하는 데 초점을 맞추고 있었다. 이에 테이블과 텍스트를 모두 고려하는 질의응답과 관련된 연구가 진행되었으나 테이블의 구조적 정보가 손실되는 등의 한계가 있었다. 본 연구에서는 테이블의 구조적 정보를 모델의 추가적인 임베딩을 통해 활용한 오픈 도메인 질의응답 시스템인 R3를 제안한다. R3는 오픈 도메인 질의 응답 데이터셋인 NQ에 기반한 새로운 데이터셋인 NQ-Open-Multi를 이용해 학습 및 평가하였으며, 테이블의 구조적 정보를 활용하지 않은 시스템에 비해 더 좋은 성능을 보임을 확인할 수 있었다.

  • PDF

Question Answering System with Recommending FAQ (빈발질의를 추천하는 질의 응답 시스템)

  • Ahn, Chan-Min;Choi, Bumghi;Lee, Ju-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.500-503
    • /
    • 2009
  • 질의 응답 시스템은 사용자가 입력한 질의에 대한 답변 문장들을 보여주는 시스템이다. 대부분의 기존의 연구는 사용자의 질의문에 대해서 가장 적합한 문장들을 찾는 방법을 제안하고 있다. 그러나 질의문에 사용되는 단어들은 근본적으로 애매모호성을 포함하고 있기 때문에, 시스템이 사용자의 정확한 질의 의도를 파악하여 가장 적합한 문장들을 찾는 것은 불가능하다. 이러한 근본적인 문제를 개선하기 위해서 여러가지 연구들이 수행되었다. 본 논문에서는 이러한 문제점을 해결하기 위한 방법으로서 시스템에서 답변이 준비된 빈발 질의(FAQ)들 중에서 사용자의 질의를 함의하는 것들을 추천하여 사용자가 자신의 질의 의도에 따라 정확한 답변을 효과적으로 찾도록 도와주는 방법을 제안한다.

Korean Open Domain Question Answering System Using KorQuAD (KorQuAD를 활용한 한국어 오픈도메인 질의응답 시스템)

  • Cho, Sanghyun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.321-325
    • /
    • 2019
  • 오픈 도메인 질의응답이란, 질문을 줬을 때 그 질문과 연관성이 높은 문서를 검색하고 검색된 문서에서 정답을 추출하는 태스크이다. 본 논문은 기계 독해 데이터인 KorQuAD를 활용한 오픈도메인 질의응답 시스템을 제안한다. 문서 검색기를 이용하여 질문과 관련 있는 위키피디아 문서들을 검색하고 검색된 문서에 단락 선택 모델을 통해서 문서 질문과 연관성이 높은 단락들을 선별하여 기계 독해 모델에서 처리해야 할 입력의 수를 줄였다. 문서 선별모델에서 선별된 여러 단락에서 추출된 정답 후보에서 여러 가지 정답 모형을 적용하여 성능을 비교하는 실험을 하였다. 본 논문에서 제안한 오픈도메인 질의응답 시스템을 KorQuAD에 적용했을 때, 개발 데이터에서 EM 40.42%, F1 55.34%의 성능을 보였다.

  • PDF

Re-Inference Method using Graph Merging in Graph Neural Network based Question Answering System (그래프 신경망 기반 질의응답 시스템에서 그래프 병합을 활용한 재추론 기법)

  • Lee, Pil-Won;Kim, Sang-Hoon;Shin, Yong-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.480-482
    • /
    • 2021
  • 최근 다수의 문서를 고려해야하는 다중홉(multi-hop) 추론과 같은 복잡한 문제를 해결하기 위해 계층적 그래프 신경망기반 질의응답 시스템이 제안되었다. 계층적 그래프 신경망 기반 질의응답 시스템은 사람의 정확도를 뛰어넘었으나 제한된 문서를 통해 추론을 진행하기 때문에 문서에 충분한 정보가 없을 경우 추론에 실패할 가능성이 존재한다. 따라서 본 논문에서는 위 문제를 해결하기 위해 정보를 재탐색하고 기존의 그래프 정보와 병합하여 기존의 정보와 새로운 정보를 고려하여 재추론 할 수 있는 그래프 병합 기법을 제안한다. 제안하는 그래프 병합 기법은 사전에 정의된 규칙에 의해 수행되며 노드의 병합 및 연결을 통해 새로운 그래프를 도출한다. 새로운 그래프는 그래프 신경망을 통해 추론을 진행하여 기존 정보와 새로운 정보를 고려한 정답을 도출할 수 있다.

A Recommendation System by Extracting Scholarship Information with a BERT's Q&A Model (BERT Q&A 모델을 활용한 장학금 정보 추출 및 추천 시스템)

  • Byeongjun Kang;Kyujin Kim;Jinah Park;Ijun Jang;Jaehyun Joo;Hyungjoon Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.288-289
    • /
    • 2023
  • 본 논문은 글로벌 이슈로 인한 인플레이션과 대학 등록금 인상 우려 등으로 인해 장학금의 중요성이 부각되고 있는 상황을 고려하여 기존의 장학금 공고 게시물을 수집한 후 BERT Q&A (Bidirectional Encoder Representations from Transformers Question & Answering) 모델을 이용해 개별 맞춤형 장학 공고를 추천하는 시스템을 제안한다. 우선 웹 크롤링을 통해 장학금 정보를 수집하고, BERT Q&A 모델과 사전에 정의한 규칙 기반으로 핵심 정보를 추출한다. 이후 분류 과정을 거쳐 사용자가 입력한 정보와 매칭하여 조건에 맞는 장학금 게시물을 추천할 수 있는 어플리케이션을 구현하였다.

A Study on the Implementation and Performance Verification of DistilBERT in an Embedded System(Raspberry PI 5) Environment (임베디드 시스템(Raspberry PI 5) 환경에서의 DistilBERT 구현 및 성능 검증에 관한 연구)

  • Chae-woo Im;Eun-Ho Kim;Jang-Won Suh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.617-618
    • /
    • 2024
  • 본 논문에서 핵심적으로 연구할 내용은 기존 논문에서 소개된 BERT-base 모델의 경량화 버전인 DistilBERT 모델을 임베디드 시스템(Raspberry PI 5) 환경에 탑재 및 구현하는 것이다. 또한, 본 논문에서는 임베디드 시스템(Raspberry PI 5) 환경에 탑재한 DistilBERT 모델과 BERT-base 모델 간의 성능 비교를 수행하였다. 성능 평가에 사용한 데이터셋은 SQuAD(Standford Question Answering Dataset)로 질의응답 태스크에 대한 데이터셋이며, 성능 검증 지표로는 EM(Exact Match) Score와 F1 Score 그리고 추론시간을 사용하였다. 실험 결과를 통해 DistilBERT와 같은 경량화 모델이 임베디드 시스템(Raspberry PI 5)과 같은 환경에서 온 디바이스 AI(On-Device AI)로 잘 작동함을 증명하였다.

A Study on Smart Knowledge Sharing System with Friends (지인 기반의 스마트 지식공유 시스템에 관한 연구)

  • Yoon, Won-Beom;Park, Kinam;Lim, Heui-Seok
    • Journal of Digital Convergence
    • /
    • v.11 no.2
    • /
    • pp.279-285
    • /
    • 2013
  • The development of information networks and computer technology has become a foundation to open up a sea of information and knowledge. The recent popularization of smart devices has been used as a tool to easily obtain the desired information and knowledge. In this paper, a knowledge-sharing system using information and social networks based on smart devices is proposed. The proposed system consists of functions of an Internet information search for user queries, accumulated knowledge, and social network response from acquaintances. An evaluation for user satisfaction was conducted to analyze the efficacy of the proposed system. According to the experiment, the knowledge-sharing system using smart device information results in significant satisfaction compared to the general information search engines.

Recognition of Answer Type for WiseQA (WiseQA를 위한 정답유형 인식)

  • Heo, Jeong;Ryu, Pum Mo;Kim, Hyun Ki;Ock, Cheol Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.4 no.7
    • /
    • pp.283-290
    • /
    • 2015
  • In this paper, we propose a hybrid method for the recognition of answer types in the WiseQA system. The answer types are classified into two categories: the lexical answer type (LAT) and the semantic answer type (SAT). This paper proposes two models for the LAT detection. One is a rule-based model using question focuses. The other is a machine learning model based on sequence labeling. We also propose two models for the SAT classification. They are a machine learning model based on multiclass classification and a filtering-rule model based on the lexical answer type. The performance of the LAT detection and the SAT classification shows F1-score of 82.47% and precision of 77.13%, respectively. Compared with IBM Watson for the performance of the LAT, the precision is 1.0% lower and the recall is 7.4% higher.

TITIUS-BODE'S Relation and 55 Cancri

  • Chang, Heon-Young
    • Journal of Astronomy and Space Sciences
    • /
    • v.25 no.3
    • /
    • pp.239-244
    • /
    • 2008
  • Two kinds of important issues on Titius-Bode's relation have been discussed up to now: one is if there is a simple mathematical relation between distances of natural bodies orbiting a central body, and the other is if there is any physical basis for such a relation. These may be tackled by answering a question whether Titius-Bode's relation is valid universally in exo-planetary systems. We have examined whether Titius Bode's relation is also applicable to exo-planetary systems by statistically studying the distribution of the ratio of rotational periods of two planets in an exo-planetary system, 55 Cnc, by comparing it with that derived from Titius-Bode's relation. We find that the distribution of the ratio of rotational periods of randomly chosen two planets in the 55 Cnc system is apparently inconsistent with that derived from Titius-Bode's relation. The probability that two data sets are drawn from the same distribution function is 50%. We also find that the Fourier power spectra show that the distribution of the semi-major axis of planets in the 55 Cnc system seems to be stretched. We conclude by pointing out that large numbers of planets should be examined to more convincingly explain the distribution of the distance of planetary formation regions.