• 제목/요약/키워드: 복잡한 질문 이해

검색결과 23건 처리시간 0.024초

S3-NET을 이용한 정형 데이터 질의 응답 (Structured Data Question Answering using S3-NET)

  • 박천음;이창기;박소윤;임승영;김명지;이주열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.273-277
    • /
    • 2018
  • 기계가 주어진 텍스트를 이해하고 추론하는 능력을 기계독해 능력이라 한다. 기계독해는 질의응답 태스크에 적용될 수 있는데 이것을 기계독해 질의응답이라 한다. 기계독해 질의응답은 주어진 질문과 문서를 이해하고 이를 기반으로 질문에 적합한 답을 출력하는 태스크이다. 본 논문에서는 구조화된 표 형식 데이터로부터 질문에 대한 답을 추론하는 TableQA 태스크를 소개하고, $S^3-NET$을 이용하여 TableQA 문제를 해결할 것을 제안한다. 실험 결과, 본 논문에서 제안한 방법이 EM 96.36%, F1 97.04%로 우수한 성능을 보였다.

  • PDF

쌍 선형 그래프 신경망을 이용한 지식 그래프 기반 질문 응답 (Question Answering over Knowledge Graphs Using Bilinear Graph Neural Network)

  • 이상의;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.563-566
    • /
    • 2020
  • 지식 그래프 기반의 질문 응답 문제는 자연어 질문에 대한 이해뿐만 아니라, 기반이 되는 지식 그래프상에서 올바른 답변을 찾기 위한 효과적인 추론 능력을 요구한다. 본 논문에서는 다중 홉 추론을 요구하는 복잡한 자연어 질문에 대해 연관 지식 그래프 위에서 답변 추론을 효과적으로 수행할 수 있는 심층 신경망 모델을 제안한다. 제안 모델에서는 지식 그래프상의 추론 과정에서 추른 경로를 명확히 하기 위한 노드의 양방향 특정 전파와 이웃 노드들 간의 맥락 정보까지 각 노드의 특정값에 반영할 수 있는, 표현력이 풍부한 쌍 선형 그래프 신경망 (BGNN)을 이용한다. 본 논문에서는 오픈 도메인의 지식 베이스 Freebase와 자연어 질문 응답 데이터 집합 WebQuestionsSP를 이용한 실험들을 통해, 제안 모델의 효과와 우수성을 확인하였다.

기계독해 시스템에서 답변 불가능 문제 해결을 위한 독해 패턴 모방 방법 (Machine Reading Comprehension System to Solve Unanswerable Problems using Method of Mimicking Reading Comprehension Patterns)

  • 이예진;장영진;이현구;신동욱;박찬훈;강인호;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-143
    • /
    • 2021
  • 최근 대용량 말뭉치를 기반으로 한 언어 모델이 개발됨에 따라 다양한 자연어처리 분야에서 사람보다 높은 성능을 보이는 시스템이 제안되었다. 이에 따라, 더 어렵고 복잡한 문제를 해결하기 위한 데이터셋들이 공개되었으며 대표적으로 기계독해 작업에서는 시스템이 질문에 대해 답변할 수 없다고 판단할 수 있는지 평가하기 위한 데이터셋이 공개되었다. 입력 받은 데이터에 대해 답변할 수 없다고 판단하는 것은 실제 애플리케이션에서 중요한 문제이기 때문에, 이를 해결하기 위한 연구도 다양하게 진행되었다. 본 논문에서는 문서를 이해하여 답변할 수 없는 데이터에 대해 효과적으로 판단할 수 있는 기계독해 시스템을 제안한다. 제안 모델은 문서의 내용과 질문에 대한 이해도가 낮을 경우 정확한 정답을 맞히지 못하는 사람의 독해 패턴에서 착안하여 기계독해 시스템의 문서 이해도를 높이고자 한다. KLUE-MRC 개발 데이터를 통한 실험에서 EM, Rouge-w 기준으로 각각 71.73%, 76.80%을 보였다.

  • PDF

거대언어모델과 문서검색 알고리즘을 활용한 한국원자력연구원 규정 질의응답 시스템 개발 (Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model)

  • 김홍비;유용균
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.31-39
    • /
    • 2023
  • 최근 자연어 처리(NLP) 기술, 특히 ChatGPT를 비롯한 거대 언어 모델(LLM)의 발전으로 특정 전문지식에 대한 질의응답(QA) 시스템의 연구개발이 활발하다. 본 논문에서는 거대언어모델과 문서검색 알고리즘을 활용하여 한국원자력연구원(KAERI)의 규정 등 다양한 문서를 이해하고 사용자의 질문에 답변하는 시스템의 동작 원리에 대해서 설명한다. 먼저, 다수의 문서를 검색과 분석이 용이하도록 전처리하고, 문서의 내용을 언어모델에서 처리할 수 있는 길이의 단락으로 나눈다. 각 단락의 내용을 임베딩 모델을 활용하여 벡터로 변환하여 데이터베이스에 저장하고, 사용자의 질문에서 추출한 벡터와 비교하여 질문의 내용과 가장 관련이 있는 내용들을 추출한다. 추출된 단락과 질문을 언어 생성 모델의 입력으로 사용하여 답변을 생성한다. 본 시스템을 내부 규정과 관련된 다양한 질문으로 테스트해본 결과 복잡한 규정에 대하여 질문의 의도를 이해하고, 사용자에게 빠르고 정확하게 답변을 제공할 수 있음을 확인하였다.

다중 홉 질문 응답을 위한 쌍 선형 그래프 신경망 기반 추론 (Bilinear Graph Neural Network-Based Reasoning for Multi-Hop Question Answering)

  • 이상의;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권8호
    • /
    • pp.243-250
    • /
    • 2020
  • 지식 그래프 기반의 질문 응답 문제는 자연어 질문들에 대한 깊은 이해뿐만 아니라, 대규모 지식 그래프 상에서 올바른 답변을 찾기 위한 효과적인 추론 능력을 필요로 한다. 본 논문에서는 다중 홉 추론을 요구하는 복잡한 자연어 질문에 대해 연관 지식 그래프 위에서 답변 추론을 효과적으로 수행할 수 있는 심층 신경망 모델을 제안한다. 제안 모델에서는 지식 그래프 상의 각 개체 노드와 이웃 노드 간의 양방향 특징 전파를 허용할뿐만 아니라, 두 이웃 노드 쌍 간의 맥락 정보까지 활용할 수 있는, 표현력이 뛰어난 쌍 선형 그래프 신경망(BGNN)을 이용한다. 본 논문에서는 오픈 도메인의 지식 베이스인 Freebase, 자연어 질문 응답을 위한 벤치마크 데이터 집합들인 WebQuestionsSP와 MetaQA를 이용한 실험들을 통해, 제안 모델의 효과와 우수성을 확인하였다.

도서관 운영에 있어서의 시스팀 접근법의 응용

  • 김두홍
    • 도서관문화
    • /
    • 제13권9호
    • /
    • pp.17-19
    • /
    • 1972
  • 도서관업무의 복잡성이 가중됨에 따라, 사서들은 실업계에서 다년간의 사용되어 온 각종 경영공학적 도구와 기법을 응용하는 기술을 발전시키지 않으면 안 되게 되었다. 이들 도구 중의 하나인 시스팀 분석법을 사용함으로써 도서관 - 규모의 대소와 기계화 여부를 막론하고 - 은 많은 이득을 가져올 수 있다. 분석단계(혹은 질문단계)에 선행하는 플로우차아트 기법은 시스팀의 개선을 결과케 하며, 새로운 시스팀 설계의 기반을 만들어 준다. 그런데, 무엇보다도 플로우 차아트 기법의 소산인 시스팀의 시각적 표현은 천 마디의 말보다도 가치가 있으며, 도서관에 대한 가일층의 이해를 요하는 모든 인사에 대하여 전반적인 양상을 제시하는 데 가장 중요한 커뮤니케이션 모체가 된다. 시스팀 분석은 일상의 선량한 도서관관리의 일부가 되어야 한다.

  • PDF

고등학교 확률 수업의 '몬티홀 문제' 과제 맥락에서 나타난 논증과정 분석 (An Analysis on Argumentation in the Task Context of 'Monty Hall Problem' at a High School Probability Class)

  • 이윤경;조정수
    • 대한수학교육학회지:학교수학
    • /
    • 제17권3호
    • /
    • pp.423-446
    • /
    • 2015
  • 본 연구의 목적은 고등학교 확률 수업의 '몬티홀 문제' 과제 맥락에서 나타난 논증과 정의 특징을 알아보는 것이다. 고등학교 2학년 상 수준 한 학급의 학생을 대상으로 교사와 학생 사이의 논증과정에 관한 수업담화를 Toulmin의 논증패턴을 이용하여 분석한 결과, 논증 중심의 담화 공동체로 만들기 위한 과제 맥락과 학생들이 질문하고 반박할 수 있는 안전한 교실 문화의 중요성이 밝혀졌다. 또한 복잡한 문제를 함께 해결해 나가는 논증과정을 통해 학생들은 수업에 더 몰입하게 되었으며, 실제적인 경험적 맥락은 개념의 이해를 풍부하게 해 주었다. 그러나 논증과정에서 나타난 추론은 통계적 추론이 아니라 대부분 확률 문제 풀이 위주의 수학적 추론이 나타났다. 이러한 연구 결과는 맥락에 따라 결과를 해석하는 과정에서 학생들의 통계적 추론이 일어남을 교사가 이해할 필요가 있고, 과제 맥락과 질문을 통해 학생들이 논증과정에 적극적으로 참여하도록 해야 한다는 확률 통계 수업에 대한 시사점을 제공할 수 있다.

정보검색에 있어서 두 패러다임의 비교분석 : 이용자에 대한 새로운 인식을 중심으로 (A Comparative Study of Two Paradigms in Information Retrieval: Centering on Newer Perspectives on Users)

  • 조명대
    • 한국문헌정보학회지
    • /
    • 제24권
    • /
    • pp.333-369
    • /
    • 1993
  • 정보검색 시스템을 대하는 대부분의 이용자의 대답은 '이용하기에 어렵다'라는 것이다. 기계적인 정보검색을 기본 철학으로 하는 기존의 matching paradigm은 정보 곡체를 여기 저기 내용을 옮길 수 있는 물건으로 간주한다. 그리고 기존의 정보시스템은 이용자가 시스템을 구성한 사람의 의도 (즉, indexing, cataloguing rule)를 완전히 이해한다면, 즉 완전하게 질문식(query)을 작성한다면, 효과적인 검색을 할 수 있는 그런 시스템이다. 그러나 어느 이용자가 그 복잡한 시스템을 이해하고 정보검색을 할 수 있겠는가? 한마디로 시스템을 설계한 사람의 의도로 이용자가 적응해서 검색을 한다는 것은 아주 힘든 일이다. 그러나 우리가 이용자에 대한 인식을 다시 한다면 보다 나은 시스템을 만들 수 있다고 본다. 우리 인간은 아주 창조적이어서 자기가 처한 상황에서 이치에 맞게끔 자기 나름대로의 행동을 할 수 있다(sense-making approach). 이 사실을 인식한다면, 왜 이용자들의 행동양식에 시스템 설계자가 적응을 못하는 것인가? 하고 의문을 던질 수 있다. 앞으로의 시스템이 이용자들의 자연스러운 행동 패턴에 맞게 끔 설계된다면 기존의 시스템과 함께 쉽게 이용할 수 있는 편리한 시스템이 설계될 수 있을 것이다. 그러므로 도서관 및 정보학 연구에 있어서 기존의 분류. 목록에 대한 연구와 이용자체에 대한연구(예를 들면, 몇 시에 이용자가 많은가? 어떤 종류의 책을 어떤 계충에서 많이 보는가? 도서 및 잡지가 어떻게 양적으로 성장해 왔는가? 등등의 use study)와 함께 여기서 제시한 제3의 요소인 이용자의 인식(cognition)을 시스템설계에 반드시 도입을 해야만 한다고 본다(user-centric approach). 즉 이용자를 중간 중간에서 도울 수 있는 facilitator가 많이 제공되어야 한다. 이용자의 다양한 패턴의 정보요구(information needs)에 부응할 수 있고, 질문식(query)을 잘 만들 수 없는 이용자를 도울 수 있고(ASK hypothesis: Anomolous State of Knowledge), 어떤 질문식 없이도 자유스럽게 Browsing할 수 있는(예를 들면 hypertext) 시스템을 설계하기 위해서는 눈에 보이는 이용자의 행동패턴(external behavior)도 중요하지만 우리 눈에는 보이지 않는 이용자의 심리상태를 이해한다면 훨씬 나은 시스템을 만들 수 있다. 이용자가 '왜?' '어떤 상황에서,' '어떤 목적으로,' '어떻게,' 정보를 검색하는지에 대해서 새로운 관심을 들려서 이용자들이 얼마나 우리 시스템 설계자들의 의도에 미치지 못한다는 사실을 인식 해야한다. 이 분야의 연구를 위해서는 새로운 paradigm이 필수적으로 필요하다고 본다. 단지 'user-study'만으로는 부족하며 새로운 시각으로 이용자를 연구해야 한다. 가령 새롭게 설치된 computer-assisted system에서 이용자들이 어떻게, 그리핀 어떤 분야에서 왜 그렇게 오류 (error)를 범하는지 분석한다면 앞으로의 computer 시스템 선계에 큰 도움을 줄 수 있을 것으로 믿는다. 실제로 많은 방법이 개발되고 있다. 그러면 시스템 설계자가 가졌던 이용자들이 이러 이러한 방식으로 정보검색을 할 것이라는 예측과(즉, conceptual model) 실제 이용자들이 정보검색을 할 때 일어나는 행동패턴 사이에는(즉, mental model) 상당한 차이점이 있다는 것을 알게 될 것이다. 이 차이점을 줄이는 것이 시스템 설계자의 의무라고 생각한다. 결론적으로, Computer에 대한 새로운 지식과 함께 이용자들의 인식을 연구할 수 있는, 철학적이고 방법론적인 연구를 계속하나가면서, 이용자들의 행동패턴을 어떻게 시스템 설계에 적용할 수 있는 지를 연구해야 한다. 중요하게 인식해야할 사실은 구 Paradigm을 완전히 무시하라는 것은 아니고 단지 이용자에 대한 새로운 인식을 추가하자는 것이다. 그것이 진정한 User Study가 될 수 있는 길이라고 생각하며, 컴퓨터와 이용자 사이의 '원활한 의사교환'이 필수불가결 한 지금 우리 학문이 가야 할 한 연구분야이다. (Human Interaction with Computers)

  • PDF

띄어쓰기가 관형어절 이해에 미치는 영향 (Effects of Spacing Words on Reading Adnominal Eojeol)

  • 김지혜;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-254
    • /
    • 2009
  • 띄어쓰기는 한글 맞춤법에 명시되어 있는 규정에 따르면 되지만, 근본적으로 명확한 정의가 내려있지 않으며 복잡하고 애매모호한 기준들이 얽혀 사용자들이 혼란을 겪는 등 많은 오류를 일으키고 있다. 이에 맞춤법 오류에 대한 원인을 찾아 체계적인 교육이 이루어지거나, 맞춤법을 수정 및 보완할 필요성이 있다 하겠다. 본 연구는 사용자들의 편의성을 우선시하여 맞춤법에 있어 논리적 근거를 마련하고 한국어 정보처리의 양상을 살펴보는 것에 의의가 있다. 이에 비교적 띄어쓰기 기준이 명확한 관형어절에 초점을 두어 띄어쓰기가 읽기에 어떤 영향을 미치는지 알아보고자 실시하였다. '관형사 + 명사' 구조와 '~적 + 명사' 구조의 관형어절이 포함된 104개의 문장을 가지고 2개의 목록을 만들었다. 목록 간에는 띄어쓰기 여부가 반대이며 피험자는 목록 중 하나를 경험하였다. 하나의 문장을 끊어서 제시하여 피험자는 읽는 데로 space bar key를 누르는 자기 읽기 조절 과제를 시행하였고, 이어서 문장에 대한 질문을 통해 이해도 검사를 실시하였다. 관형어절을 읽는 평균 속도를 분석한 결과 미세한 차이가 있었으나, 유의미하지는 않았다. 이는 관형어절에 있어서 띄어쓰기의 영향이 크지 않음을 의미한다고 볼 수 있겠다.

  • PDF

생태계의 상태 파악을 위한 정보 흐름 통계의 미기상학적 자료에의 적용 (Application of Information Flow Statistics to Micrometeorological Data to Identify the Ecosystem State)

  • 김세희;윤주열;강민석;천정화;김준
    • 한국농림기상학회:학술대회논문집
    • /
    • 한국농림기상학회 2013년도 추계 학술발표논문집
    • /
    • pp.26-27
    • /
    • 2013
  • 산림생태계의 에너지, 물질, 정보의 교환 과정과 그 변화를 이해하려면 먼저 생태계의 구조와 기능이 어떻게 상호작용하는지를 이해해야 한다. 생태계의 기능은 한, 두 가지의 특징에 의해서만 이루어지는 것이 아니다. 그렇기 때문에 그 기능을 파악하고 적절히 이용하거나 대응하기 위해서는 한 생태계와 주변 환경 전체를 바라볼 수 있는 시스템 사고가 필요하다. 이에 우리는 생태계의 '구조'를 파악함으로써 생태계의 '상태'를 이해하고자 한다. 본 연구에서는 Ruddell and Kumar (2009)의 접근법을 따라, 어떻게 한 생태계의 상태를 파악할 수 있는가라는 질문을 광릉활엽수림에 적용하여 답하고자 한다. 즉, 우리는 산림생태계가 열린 복잡계라고 가정하고, 생태계 내에서 다양한 프로세스들 간의 시시각각 변하는 네트워크의 구조가 각 시점의 시스템의 상태를 나타내는 지표가 될 수 있다고 가정하였다. 이 연구에서는 그 구조적 특징을 정량화하여 나타내는데 초점을 맞추었다. 각각의 프로세스를 대표하는 상태 변수들 간의 정보 흐름의 양과 방향, 시간 규모를 계산해냄으로써 네트워크 구조를 파악하고자 하였다. 온대 산악지형 활엽수림인 GDK의 2008년 순생태계교환량(NEE), 총일차생산량(GPP), 생태계호흡량(RE), 현열플럭스(H), 잠열플럭스(LE), 하향단파복사(Rg), 강수량(Precipitation), 기압(Pressure), 기온(T), 포차(VPD)의 시계열 자료를 월별로 나누어 최장 18 시간 규모의 정보 흐름을 계산하였다. 정보 흐름의 구조를 파악하기 위하여 변수들 간의 전이엔트로피(Transfer entropy)와 상호정보(Mutual Information)를 계산하는 방법을 사용하였다. 또한 시계열 자료를 이용함으로써 변수들 간에 정보가 전달되는 시간 규모의 특성을 파악할 수 있었다. 최종적으로, 계산한 정보 흐름을 시각화하여 프로세스 네트워크 구조를 나타내었다. 결과는 월별로 생태계의 정보 흐름의 종류, 방향과 시간 규모, 그에 따른 프로세스 간 상호 작용의 특징 등을 보여준다. 이를 통해 계절적 환경 변화에 따라 시스템의 네트워크 구조와 상태가 어떻게 변화하는지 이해할 수 있을 것이다. 이 연구는 추후 우리 연구실에서 생산한 8 년 자료에 적용함으로써 다양한 날씨 및 기후변화와 환경 변화에 따라 생태계의 구조와 상태가 어떻게 변화하는지 연구하는 시작점이 될 것이다. 이 접근법은 단위나 차원에 무관하게 다양한 종류의 자료에 적용할 수 있는 반면에, 일관성 있게 정의된 시스템의 상태 및 그 상태를 구성하는 주요 하부 시스템들의 네트워크 상태를 이해하는데 이용될 수 있다. 본 연구는 비평형 열역학과 복잡계의 관점에서 바라 본 시스템 사고를 적용하려 하는 여러 연구 분야에 새로운 도전을 촉발할 좋은 선행연구가 될 것이라 기대된다.

  • PDF