• Title/Summary/Keyword: 복잡한 질문 이해

Search Result 23, Processing Time 0.027 seconds

Structured Data Question Answering using S3-NET (S3-NET을 이용한 정형 데이터 질의 응답)

  • Park, Cheoneum;Lee, Changki;Park, Soyoon;Lim, Seungyoung;Kim, Myungji;Lee, Jooyoul
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.273-277
    • /
    • 2018
  • 기계가 주어진 텍스트를 이해하고 추론하는 능력을 기계독해 능력이라 한다. 기계독해는 질의응답 태스크에 적용될 수 있는데 이것을 기계독해 질의응답이라 한다. 기계독해 질의응답은 주어진 질문과 문서를 이해하고 이를 기반으로 질문에 적합한 답을 출력하는 태스크이다. 본 논문에서는 구조화된 표 형식 데이터로부터 질문에 대한 답을 추론하는 TableQA 태스크를 소개하고, $S^3-NET$을 이용하여 TableQA 문제를 해결할 것을 제안한다. 실험 결과, 본 논문에서 제안한 방법이 EM 96.36%, F1 97.04%로 우수한 성능을 보였다.

  • PDF

Question Answering over Knowledge Graphs Using Bilinear Graph Neural Network (쌍 선형 그래프 신경망을 이용한 지식 그래프 기반 질문 응답)

  • Lee, Sangui;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.563-566
    • /
    • 2020
  • 지식 그래프 기반의 질문 응답 문제는 자연어 질문에 대한 이해뿐만 아니라, 기반이 되는 지식 그래프상에서 올바른 답변을 찾기 위한 효과적인 추론 능력을 요구한다. 본 논문에서는 다중 홉 추론을 요구하는 복잡한 자연어 질문에 대해 연관 지식 그래프 위에서 답변 추론을 효과적으로 수행할 수 있는 심층 신경망 모델을 제안한다. 제안 모델에서는 지식 그래프상의 추론 과정에서 추른 경로를 명확히 하기 위한 노드의 양방향 특정 전파와 이웃 노드들 간의 맥락 정보까지 각 노드의 특정값에 반영할 수 있는, 표현력이 풍부한 쌍 선형 그래프 신경망 (BGNN)을 이용한다. 본 논문에서는 오픈 도메인의 지식 베이스 Freebase와 자연어 질문 응답 데이터 집합 WebQuestionsSP를 이용한 실험들을 통해, 제안 모델의 효과와 우수성을 확인하였다.

Machine Reading Comprehension System to Solve Unanswerable Problems using Method of Mimicking Reading Comprehension Patterns (기계독해 시스템에서 답변 불가능 문제 해결을 위한 독해 패턴 모방 방법)

  • Lee, Yejin;Jang, Youngjin;Lee, Hyeon-gu;Shin, Dongwook;Park, Chanhoon;Kang, Inho;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.139-143
    • /
    • 2021
  • 최근 대용량 말뭉치를 기반으로 한 언어 모델이 개발됨에 따라 다양한 자연어처리 분야에서 사람보다 높은 성능을 보이는 시스템이 제안되었다. 이에 따라, 더 어렵고 복잡한 문제를 해결하기 위한 데이터셋들이 공개되었으며 대표적으로 기계독해 작업에서는 시스템이 질문에 대해 답변할 수 없다고 판단할 수 있는지 평가하기 위한 데이터셋이 공개되었다. 입력 받은 데이터에 대해 답변할 수 없다고 판단하는 것은 실제 애플리케이션에서 중요한 문제이기 때문에, 이를 해결하기 위한 연구도 다양하게 진행되었다. 본 논문에서는 문서를 이해하여 답변할 수 없는 데이터에 대해 효과적으로 판단할 수 있는 기계독해 시스템을 제안한다. 제안 모델은 문서의 내용과 질문에 대한 이해도가 낮을 경우 정확한 정답을 맞히지 못하는 사람의 독해 패턴에서 착안하여 기계독해 시스템의 문서 이해도를 높이고자 한다. KLUE-MRC 개발 데이터를 통한 실험에서 EM, Rouge-w 기준으로 각각 71.73%, 76.80%을 보였다.

  • PDF

Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model (거대언어모델과 문서검색 알고리즘을 활용한 한국원자력연구원 규정 질의응답 시스템 개발)

  • Hongbi Kim;Yonggyun Yu
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.28 no.5
    • /
    • pp.31-39
    • /
    • 2023
  • The evolution of Natural Language Processing (NLP) and the rise of large language models (LLM) like ChatGPT have paved the way for specialized question-answering (QA) systems tailored to specific domains. This study outlines a system harnessing the power of LLM in conjunction with document search algorithms to interpret and address user inquiries using documents from the Korea Atomic Energy Research Institute (KAERI). Initially, the system refines multiple documents for optimized search and analysis, breaking the content into managable paragraphs suitable for the language model's processing. Each paragraph's content is converted into a vector via an embedding model and archived in a database. Upon receiving a user query, the system matches the extracted vectors from the question with the stored vectors, pinpointing the most pertinent content. The chosen paragraphs, combined with the user's query, are then processed by the language generation model to formulate a response. Tests encompassing a spectrum of questions verified the system's proficiency in discerning question intent, understanding diverse documents, and delivering rapid and precise answers.

Bilinear Graph Neural Network-Based Reasoning for Multi-Hop Question Answering (다중 홉 질문 응답을 위한 쌍 선형 그래프 신경망 기반 추론)

  • Lee, Sangui;Kim, Incheol
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.8
    • /
    • pp.243-250
    • /
    • 2020
  • Knowledge graph-based question answering not only requires deep understanding of the given natural language questions, but it also needs effective reasoning to find the correct answers on a large knowledge graph. In this paper, we propose a deep neural network model for effective reasoning on a knowledge graph, which can find correct answers to complex questions requiring multi-hop inference. The proposed model makes use of highly expressive bilinear graph neural network (BGNN), which can utilize context information between a pair of neighboring nodes, as well as allows bidirectional feature propagation between each entity node and one of its neighboring nodes on a knowledge graph. Performing experiments with an open-domain knowledge base (Freebase) and two natural-language question answering benchmark datasets(WebQuestionsSP and MetaQA), we demonstrate the effectiveness and performance of the proposed model.

도서관 운영에 있어서의 시스팀 접근법의 응용

  • Kim, Du-Hong
    • KLA journal
    • /
    • v.13 no.9
    • /
    • pp.17-19
    • /
    • 1972
  • 도서관업무의 복잡성이 가중됨에 따라, 사서들은 실업계에서 다년간의 사용되어 온 각종 경영공학적 도구와 기법을 응용하는 기술을 발전시키지 않으면 안 되게 되었다. 이들 도구 중의 하나인 시스팀 분석법을 사용함으로써 도서관 - 규모의 대소와 기계화 여부를 막론하고 - 은 많은 이득을 가져올 수 있다. 분석단계(혹은 질문단계)에 선행하는 플로우차아트 기법은 시스팀의 개선을 결과케 하며, 새로운 시스팀 설계의 기반을 만들어 준다. 그런데, 무엇보다도 플로우 차아트 기법의 소산인 시스팀의 시각적 표현은 천 마디의 말보다도 가치가 있으며, 도서관에 대한 가일층의 이해를 요하는 모든 인사에 대하여 전반적인 양상을 제시하는 데 가장 중요한 커뮤니케이션 모체가 된다. 시스팀 분석은 일상의 선량한 도서관관리의 일부가 되어야 한다.

  • PDF

An Analysis on Argumentation in the Task Context of 'Monty Hall Problem' at a High School Probability Class (고등학교 확률 수업의 '몬티홀 문제' 과제 맥락에서 나타난 논증과정 분석)

  • Lee, Yoon-Kyung;Cho, Cheong-Soo
    • School Mathematics
    • /
    • v.17 no.3
    • /
    • pp.423-446
    • /
    • 2015
  • This study aims to look into the characteristics of argumentation in the task context of 'Monty Hall problem' at a high school probability class. As a result of an analysis of classroom discourses on the argumentation between teachers and second-year students in one upper level class in high school using Toulmin's argument pattern, it was found that it would be important to create a task context and a safe classroom culture in which the students could ask questions and refute them in order to make it an argument-centered discourse community. In addition, through the argumentation of solving complex problems together, the students could be further engaged in the class, and the actual empirical context enriched the understanding of concepts. However, reasoning in argumentation was mostly not a statistical one, but a mathematical one centered around probability problem-solving. Through these results of the study, it was noted that the teachers should help the students actively participate in argumentation through the task context and question, and an understanding of a statistical reasoning of interpreting the context would be necessary in order to induce their thinking and reasoning about probability and statistics.

A Comparative Study of Two Paradigms in Information Retrieval: Centering on Newer Perspectives on Users (정보검색에 있어서 두 패러다임의 비교분석 : 이용자에 대한 새로운 인식을 중심으로)

  • Cho Myung-Dae
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.24
    • /
    • pp.333-369
    • /
    • 1993
  • 정보검색 시스템을 대하는 대부분의 이용자의 대답은 '이용하기에 어렵다'라는 것이다. 기계적인 정보검색을 기본 철학으로 하는 기존의 matching paradigm은 정보 곡체를 여기 저기 내용을 옮길 수 있는 물건으로 간주한다. 그리고 기존의 정보시스템은 이용자가 시스템을 구성한 사람의 의도 (즉, indexing, cataloguing rule)를 완전히 이해한다면, 즉 완전하게 질문식(query)을 작성한다면, 효과적인 검색을 할 수 있는 그런 시스템이다. 그러나 어느 이용자가 그 복잡한 시스템을 이해하고 정보검색을 할 수 있겠는가? 한마디로 시스템을 설계한 사람의 의도로 이용자가 적응해서 검색을 한다는 것은 아주 힘든 일이다. 그러나 우리가 이용자에 대한 인식을 다시 한다면 보다 나은 시스템을 만들 수 있다고 본다. 우리 인간은 아주 창조적이어서 자기가 처한 상황에서 이치에 맞게끔 자기 나름대로의 행동을 할 수 있다(sense-making approach). 이 사실을 인식한다면, 왜 이용자들의 행동양식에 시스템 설계자가 적응을 못하는 것인가? 하고 의문을 던질 수 있다. 앞으로의 시스템이 이용자들의 자연스러운 행동 패턴에 맞게 끔 설계된다면 기존의 시스템과 함께 쉽게 이용할 수 있는 편리한 시스템이 설계될 수 있을 것이다. 그러므로 도서관 및 정보학 연구에 있어서 기존의 분류. 목록에 대한 연구와 이용자체에 대한연구(예를 들면, 몇 시에 이용자가 많은가? 어떤 종류의 책을 어떤 계충에서 많이 보는가? 도서 및 잡지가 어떻게 양적으로 성장해 왔는가? 등등의 use study)와 함께 여기서 제시한 제3의 요소인 이용자의 인식(cognition)을 시스템설계에 반드시 도입을 해야만 한다고 본다(user-centric approach). 즉 이용자를 중간 중간에서 도울 수 있는 facilitator가 많이 제공되어야 한다. 이용자의 다양한 패턴의 정보요구(information needs)에 부응할 수 있고, 질문식(query)을 잘 만들 수 없는 이용자를 도울 수 있고(ASK hypothesis: Anomolous State of Knowledge), 어떤 질문식 없이도 자유스럽게 Browsing할 수 있는(예를 들면 hypertext) 시스템을 설계하기 위해서는 눈에 보이는 이용자의 행동패턴(external behavior)도 중요하지만 우리 눈에는 보이지 않는 이용자의 심리상태를 이해한다면 훨씬 나은 시스템을 만들 수 있다. 이용자가 '왜?' '어떤 상황에서,' '어떤 목적으로,' '어떻게,' 정보를 검색하는지에 대해서 새로운 관심을 들려서 이용자들이 얼마나 우리 시스템 설계자들의 의도에 미치지 못한다는 사실을 인식 해야한다. 이 분야의 연구를 위해서는 새로운 paradigm이 필수적으로 필요하다고 본다. 단지 'user-study'만으로는 부족하며 새로운 시각으로 이용자를 연구해야 한다. 가령 새롭게 설치된 computer-assisted system에서 이용자들이 어떻게, 그리핀 어떤 분야에서 왜 그렇게 오류 (error)를 범하는지 분석한다면 앞으로의 computer 시스템 선계에 큰 도움을 줄 수 있을 것으로 믿는다. 실제로 많은 방법이 개발되고 있다. 그러면 시스템 설계자가 가졌던 이용자들이 이러 이러한 방식으로 정보검색을 할 것이라는 예측과(즉, conceptual model) 실제 이용자들이 정보검색을 할 때 일어나는 행동패턴 사이에는(즉, mental model) 상당한 차이점이 있다는 것을 알게 될 것이다. 이 차이점을 줄이는 것이 시스템 설계자의 의무라고 생각한다. 결론적으로, Computer에 대한 새로운 지식과 함께 이용자들의 인식을 연구할 수 있는, 철학적이고 방법론적인 연구를 계속하나가면서, 이용자들의 행동패턴을 어떻게 시스템 설계에 적용할 수 있는 지를 연구해야 한다. 중요하게 인식해야할 사실은 구 Paradigm을 완전히 무시하라는 것은 아니고 단지 이용자에 대한 새로운 인식을 추가하자는 것이다. 그것이 진정한 User Study가 될 수 있는 길이라고 생각하며, 컴퓨터와 이용자 사이의 '원활한 의사교환'이 필수불가결 한 지금 우리 학문이 가야 할 한 연구분야이다. (Human Interaction with Computers)

  • PDF

Effects of Spacing Words on Reading Adnominal Eojeol (띄어쓰기가 관형어절 이해에 미치는 영향)

  • Kim, Jihye;Nam, Kichun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.251-254
    • /
    • 2009
  • 띄어쓰기는 한글 맞춤법에 명시되어 있는 규정에 따르면 되지만, 근본적으로 명확한 정의가 내려있지 않으며 복잡하고 애매모호한 기준들이 얽혀 사용자들이 혼란을 겪는 등 많은 오류를 일으키고 있다. 이에 맞춤법 오류에 대한 원인을 찾아 체계적인 교육이 이루어지거나, 맞춤법을 수정 및 보완할 필요성이 있다 하겠다. 본 연구는 사용자들의 편의성을 우선시하여 맞춤법에 있어 논리적 근거를 마련하고 한국어 정보처리의 양상을 살펴보는 것에 의의가 있다. 이에 비교적 띄어쓰기 기준이 명확한 관형어절에 초점을 두어 띄어쓰기가 읽기에 어떤 영향을 미치는지 알아보고자 실시하였다. '관형사 + 명사' 구조와 '~적 + 명사' 구조의 관형어절이 포함된 104개의 문장을 가지고 2개의 목록을 만들었다. 목록 간에는 띄어쓰기 여부가 반대이며 피험자는 목록 중 하나를 경험하였다. 하나의 문장을 끊어서 제시하여 피험자는 읽는 데로 space bar key를 누르는 자기 읽기 조절 과제를 시행하였고, 이어서 문장에 대한 질문을 통해 이해도 검사를 실시하였다. 관형어절을 읽는 평균 속도를 분석한 결과 미세한 차이가 있었으나, 유의미하지는 않았다. 이는 관형어절에 있어서 띄어쓰기의 영향이 크지 않음을 의미한다고 볼 수 있겠다.

  • PDF

Application of Information Flow Statistics to Micrometeorological Data to Identify the Ecosystem State (생태계의 상태 파악을 위한 정보 흐름 통계의 미기상학적 자료에의 적용)

  • Kim, Sehee;Yun, Juyeol;Kang, Minseok;Chun, Junghwa;Kim, Joon
    • Proceedings of The Korean Society of Agricultural and Forest Meteorology Conference
    • /
    • 2013.11a
    • /
    • pp.26-27
    • /
    • 2013
  • 산림생태계의 에너지, 물질, 정보의 교환 과정과 그 변화를 이해하려면 먼저 생태계의 구조와 기능이 어떻게 상호작용하는지를 이해해야 한다. 생태계의 기능은 한, 두 가지의 특징에 의해서만 이루어지는 것이 아니다. 그렇기 때문에 그 기능을 파악하고 적절히 이용하거나 대응하기 위해서는 한 생태계와 주변 환경 전체를 바라볼 수 있는 시스템 사고가 필요하다. 이에 우리는 생태계의 '구조'를 파악함으로써 생태계의 '상태'를 이해하고자 한다. 본 연구에서는 Ruddell and Kumar (2009)의 접근법을 따라, 어떻게 한 생태계의 상태를 파악할 수 있는가라는 질문을 광릉활엽수림에 적용하여 답하고자 한다. 즉, 우리는 산림생태계가 열린 복잡계라고 가정하고, 생태계 내에서 다양한 프로세스들 간의 시시각각 변하는 네트워크의 구조가 각 시점의 시스템의 상태를 나타내는 지표가 될 수 있다고 가정하였다. 이 연구에서는 그 구조적 특징을 정량화하여 나타내는데 초점을 맞추었다. 각각의 프로세스를 대표하는 상태 변수들 간의 정보 흐름의 양과 방향, 시간 규모를 계산해냄으로써 네트워크 구조를 파악하고자 하였다. 온대 산악지형 활엽수림인 GDK의 2008년 순생태계교환량(NEE), 총일차생산량(GPP), 생태계호흡량(RE), 현열플럭스(H), 잠열플럭스(LE), 하향단파복사(Rg), 강수량(Precipitation), 기압(Pressure), 기온(T), 포차(VPD)의 시계열 자료를 월별로 나누어 최장 18 시간 규모의 정보 흐름을 계산하였다. 정보 흐름의 구조를 파악하기 위하여 변수들 간의 전이엔트로피(Transfer entropy)와 상호정보(Mutual Information)를 계산하는 방법을 사용하였다. 또한 시계열 자료를 이용함으로써 변수들 간에 정보가 전달되는 시간 규모의 특성을 파악할 수 있었다. 최종적으로, 계산한 정보 흐름을 시각화하여 프로세스 네트워크 구조를 나타내었다. 결과는 월별로 생태계의 정보 흐름의 종류, 방향과 시간 규모, 그에 따른 프로세스 간 상호 작용의 특징 등을 보여준다. 이를 통해 계절적 환경 변화에 따라 시스템의 네트워크 구조와 상태가 어떻게 변화하는지 이해할 수 있을 것이다. 이 연구는 추후 우리 연구실에서 생산한 8 년 자료에 적용함으로써 다양한 날씨 및 기후변화와 환경 변화에 따라 생태계의 구조와 상태가 어떻게 변화하는지 연구하는 시작점이 될 것이다. 이 접근법은 단위나 차원에 무관하게 다양한 종류의 자료에 적용할 수 있는 반면에, 일관성 있게 정의된 시스템의 상태 및 그 상태를 구성하는 주요 하부 시스템들의 네트워크 상태를 이해하는데 이용될 수 있다. 본 연구는 비평형 열역학과 복잡계의 관점에서 바라 본 시스템 사고를 적용하려 하는 여러 연구 분야에 새로운 도전을 촉발할 좋은 선행연구가 될 것이라 기대된다.

  • PDF