• 제목/요약/키워드: 질문답변

검색결과 231건 처리시간 0.027초

텍스트/비텍스트 특성기반 질의답변문서의 품질지수 알고리즘 (A Quality Value Algorithm based on Text/Non-text Features in Q&A Documents)

  • 김덕주;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.105-108
    • /
    • 2010
  • 쌍방향으로 질문과 답변을 하는 커뮤니티 기반의 지식검색서비스에서는 질의를 통해 원하는 답변을 얻을 수 있지만, 수많은 사용자들이 참여함에 따라 방대한 문서 속에서 검증된 문서를 찾아내는 것은 점점 더 어려워지고 있다. 지식검색서비스에서 기존 연구는 사용자들이 생성한 데이터 즉 추천수, 조회수 등의 비텍스트 정보를 이용하거나 답변의 길이, 자료첨부, 연결어 등의 텍스트 정보 이용하여 전문가를 식별하거나 문서의 품질을 평가하고, 이를 검색에 반영하여 검색성능을 향상시키는 데 활용했다. 그러나 비텍스트 정보는 질의/응답의 초기에 사용자들에 의해 충분한 정보를 확보할 수 없는 단점이 제기 되며, 텍스트 정보는 전체의 문서를 답변의 길이, 자료 첨부등과 같은 일부요인으로 판단해야하기 때문에 품질평가의 한계가 있다고 볼 수 있겠다. 본 논문에서는 이러한 비텍스트 정보와 텍스트 정보의 문제점을 개선하기 위한 품질평가 알고리즘을 제안한다. 제안된 알고리즘을 통한 품질지수는 텍스트/비텍스트 정보와 소셜 네트워크 사용자 중앙성을 고려하여 질문에 적합하고 신뢰성 있는 답변을 랭킹화 함으로써 지식검색문서를 분별하는 지표가 되며, 이는 지식검색서비스의 성능향상에 기여를 할 수 있을 것으로 기대된다.

  • PDF

자료 : 도서관정책 질의 및 답변 관련

  • 한국도서관협회
    • 도서관문화
    • /
    • 제39권1호통권308호
    • /
    • pp.80-87
    • /
    • 1998
  • 아래 자료는 '97 대통령 선거를 앞두고 도서관운동연구회(대표 이혜연)가 하이텔 등 통신업체들이 추진했던「'97 대선후보 초청 사이버 대토론회」를 통해 차기 대통령 입후보자가 있는 각 정당에 보낸 도서관관련 정책 질문들과 그에 대한 각 정당의 답변만을 모은 것임.

  • PDF

문장 표현 단위를 활용한 기계독해 시스템 (Machine Reading Comprehension System using Sentence units Representation)

  • 장영진;이현구;신동욱;박찬훈;강인호;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.568-570
    • /
    • 2021
  • 기계독해 시스템은 주어진 질문에 대한 답변을 문서에서 찾아 사용자에게 제공해주는 질의응답 작업 중 하나이다. 하지만 대부분의 기계독해 데이터는 간결한 답변 추출을 다루며, 이는 실제 애플리케이션에서 유용하지 않을 수 있다. 실제 적용 단계에서는 짧고 간결한 답변 뿐 아니라 사용자에게 자세한 정보를 제공해줄 수 있는 긴 길이의 답변 제공도 필요하다. 따라서 본 논문에서는 짧은 답변과 긴 답변 모두 추출할 수 있는 모델을 제안한다. 실험을 통해 Baseline과 비교하여 짧은 답변 추출에서는 F1 score 기준 0.7%, 긴 답변 추출에는 1.4%p의 성능 향상을 보이는 결과를 얻었다.

  • PDF

다중 작업, 다중 홉 질문 응답을 위한 그래프 추론 및 맥락 융합 (Graph Reasoning and Context Fusion for Multi-Task, Multi-Hop Question Answering)

  • 이상의;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권8호
    • /
    • pp.319-330
    • /
    • 2021
  • 최근 오픈 도메인 자연어 질문 응답 분야에서는 다중 작업, 다중 홉 질문 응답에 관한 연구들이 활발히 진행되어 오고 있다. 본 논문에서는 이러한 다중 작업, 다중 홉 질문들에 효과적으로 응답하기 위해, 계층적 그래프 기반의 새로운 심층 신경망 모델을 제안한다. 제안 모델에서는 계층적 그래프와 그래프 신경망을 이용해 여러 문단들로부터 서로 다른 수준의 맥락 정보를 얻어낸 후, 이들을 활용하여 답변 유형, 뒷받침 문장들과 답변 영역 등을 동시에 예측해낸다. 본 논문에서는 오픈 도메인 자연어 질문 응답 데이터 집합인 HotpotQA를 이용한 실험들을 통해, 제안 모델의 높은 성능과 긍정적 효과를 입증한다.

기계독해 시스템에서 답변 불가능 문제 해결을 위한 독해 패턴 모방 방법 (Machine Reading Comprehension System to Solve Unanswerable Problems using Method of Mimicking Reading Comprehension Patterns)

  • 이예진;장영진;이현구;신동욱;박찬훈;강인호;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-143
    • /
    • 2021
  • 최근 대용량 말뭉치를 기반으로 한 언어 모델이 개발됨에 따라 다양한 자연어처리 분야에서 사람보다 높은 성능을 보이는 시스템이 제안되었다. 이에 따라, 더 어렵고 복잡한 문제를 해결하기 위한 데이터셋들이 공개되었으며 대표적으로 기계독해 작업에서는 시스템이 질문에 대해 답변할 수 없다고 판단할 수 있는지 평가하기 위한 데이터셋이 공개되었다. 입력 받은 데이터에 대해 답변할 수 없다고 판단하는 것은 실제 애플리케이션에서 중요한 문제이기 때문에, 이를 해결하기 위한 연구도 다양하게 진행되었다. 본 논문에서는 문서를 이해하여 답변할 수 없는 데이터에 대해 효과적으로 판단할 수 있는 기계독해 시스템을 제안한다. 제안 모델은 문서의 내용과 질문에 대한 이해도가 낮을 경우 정확한 정답을 맞히지 못하는 사람의 독해 패턴에서 착안하여 기계독해 시스템의 문서 이해도를 높이고자 한다. KLUE-MRC 개발 데이터를 통한 실험에서 EM, Rouge-w 기준으로 각각 71.73%, 76.80%을 보였다.

  • PDF

협력형 디지털 참고서비스(CDRS) 지식정보DB 내용분석 연구 (Content Analysis of Collaborative Digital Reference Service Knowledge Information Database)

  • 장수현;남영준
    • 한국비블리아학회지
    • /
    • 제32권2호
    • /
    • pp.101-123
    • /
    • 2021
  • 본 연구는 협력형 디지털 참고서비스인 '사서에게 물어보세요'의 지식정보DB에 수록된 질문과 답변을 분석하여 이용자 요구현황을 파악해 이를 바탕으로 서비스 초창기의 정보 이용행태를 도출하였다. 지식정보DB 3,506건 중 1,124건의 DB 항목 데이터를 ① 질문의 개수와 참고 질문 여부, ② 질문의 주제와 키워드, ③ 질문의 목적, ④ 질문의 유형, ⑤ 이용자의 정보 요구, ⑥ 사서가 제공한 정보원과 참고 서비스, ⑦ 답변의 소요 일수와 상관관계, ⑧ 참여 도서관 수준, ⑨ 주제별 질문 유형, 총 9가지 기준으로 분석하였다. 그 결과, 첫째, 이용자는 유사한 주제의 질문을 한 번에 하나씩 요청하는 것이 아닌, 필요에 따라 다양한 주제의 참고 질문을 요청하였지만, 절반 이상의 전체 순수 참고질문은 문헌정보학 분야의 질문이었다. 둘째, 약 71.35%의 이용자는 '사서에게 물어보세요' 서비스를 특정 주제나 연구 문제와 관련된 정보 자원의 목록을 추천받기 위해 이용하고 있었으며 독서상황에 대한 참고 상담을 요구하는 질문도 존재하였다. 셋째, 이용자가 가장 선호하는 정보원은 서지 및 서지사항으로 나타났으며, 온라인 정보원의 경우 이용자는 상대적으로 선호하지 않았다. 넷째, 답변의 소요 일수는 질문의 유형과 참여 도서관의 수준에 따라 유의미한 차이가 남을 확인할 수 있었다. 다섯째, 총류 분야 질문의 목적을 분석한 결과 약 31.33%이 이용자 스스로가 해결 당위성을 가진 자발적 질문으로 나타났다.

거대언어모델과 문서검색 알고리즘을 활용한 한국원자력연구원 규정 질의응답 시스템 개발 (Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model)

  • 김홍비;유용균
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.31-39
    • /
    • 2023
  • 최근 자연어 처리(NLP) 기술, 특히 ChatGPT를 비롯한 거대 언어 모델(LLM)의 발전으로 특정 전문지식에 대한 질의응답(QA) 시스템의 연구개발이 활발하다. 본 논문에서는 거대언어모델과 문서검색 알고리즘을 활용하여 한국원자력연구원(KAERI)의 규정 등 다양한 문서를 이해하고 사용자의 질문에 답변하는 시스템의 동작 원리에 대해서 설명한다. 먼저, 다수의 문서를 검색과 분석이 용이하도록 전처리하고, 문서의 내용을 언어모델에서 처리할 수 있는 길이의 단락으로 나눈다. 각 단락의 내용을 임베딩 모델을 활용하여 벡터로 변환하여 데이터베이스에 저장하고, 사용자의 질문에서 추출한 벡터와 비교하여 질문의 내용과 가장 관련이 있는 내용들을 추출한다. 추출된 단락과 질문을 언어 생성 모델의 입력으로 사용하여 답변을 생성한다. 본 시스템을 내부 규정과 관련된 다양한 질문으로 테스트해본 결과 복잡한 규정에 대하여 질문의 의도를 이해하고, 사용자에게 빠르고 정확하게 답변을 제공할 수 있음을 확인하였다.

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF