• 제목/요약/키워드: 질문 검색

검색결과 167건 처리시간 0.02초

지식(知識) 베이스를 이용한 한국어(韓國語) 질문 처리(處理) 시스템에 관한 연구 (A Study on Korean Question Processing System Using Knowledge Base)

  • 김판준
    • 정보관리연구
    • /
    • 제24권3호
    • /
    • pp.1-30
    • /
    • 1993
  • 문헌정보(文獻情報)를 검색하고자 하는 이용자가 한국어(韓國語) 자연언어로 직접 검색(檢索) 시스템에 접근할 수 있도록 한국어 질문을 현재 정보검색(情報檢索) 시스템에서 많이 사용되고 있는 정형탐색문(불탐색문)으로 변환하는 한국어 질문처리(質間處理) 시스템을 설계하였다.

  • PDF

적합성 가중치 검색 및 P-NORM 검색에 관한 연구 -불 논리 검색의 개선을 중심으로- (A Comparative Analysis of the Relevance Weighted Boolean Model and the P-NORM Model: An Improvement on the Boolean Retrieval)

  • 이효숙
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.31-56
    • /
    • 1994
  • 본 연구에서는 검색실험을 통하여 질문 변환에 의한 불 논리 검색, 적합성 가중치 검색, P-NORM 검색에 대해 평가하였다. 적합성 가중치 검색은 질문 변환에 의한 불 논리 검색 및 P-NORM 검색보다 정확률과 검색순위에 있어 효과적이었다. 정보 탐색과정에서 적합성 정보의 이용수준과 용어에 대한 가중치방법은 검색성능에 영향을 주는 것으로 밝혀졌다.

  • PDF

Pointer-Generator Networks를 이용한 cQA 시스템 질문 요약 (Pointer-Generator Networks for Community Question Answering Summarization)

  • 김원우;김선훈;장헌석;강인호;박광현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.126-131
    • /
    • 2018
  • cQA(Community-based Question Answering) 시스템은 사용자들이 질문을 남기고 답변을 작성하는 시스템이다. cQA는 사용자의 편의를 위해 기존의 축적된 질문을 검색하거나 카테고리로 분류하는 기능을 제공한다. 질문의 길이가 길 경우 검색이나 카테고리 분류의 정확도가 떨어지는 한계가 있는데, 이를 극복하기 위해 cQA 질문을 요약하는 모델을 구축할 필요가 있다. 하지만 이러한 모델을 구축하려면 대량의 요약 데이터를 확보해야 하는 어려움이 존재한다. 본 논문에서는 이러한 어려움을 극복하기 위해 cQA의 질문 제목, 본문으로 데이터를 확보하고 필터링을 통해 요약 데이터 셋을 만들었다. 또한 본문의 대표 단어를 이용하여 추상 요약을 하기 위해 딥러닝 기반의 Pointer-generator model을 사용하였다. 실험 결과, 기존의 추출 요약 방식보다 딥러닝 기반의 추상 요약 방식의 성능이 더 좋았으며 Pointer-generator model이 보다 좋은 성능을 보였다.

  • PDF

질문구조의 전형을 이용한 정보요구의 모형화에 관한 연구 (A Study on Modeling of Information Need Using Stereotype of Question Structures)

  • 김기영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.17-20
    • /
    • 1995
  • 본 연구는 질의어 확장 및 단기 이용자 모형 구축에 응용할 수 있는 하나의 기법으로서 이용자 질문구조의 전형을 통한 정보요구의 모형화를 실험을 통해 제시한다. 실험방법은 이용자의 질문을 시소러스를 통해 분석, 구조화 하고 그 질문구조에서 전형을 추출한 후 전형에 따라 요구하는 정보가 질문구조내에 일정하게 위치하는지를 알아보았다. 이러한 실험을 통해 6가지 질문구조 전형을 추출할 수 있었으며 질문구조의 전형을 이용한 정보요구 모형의 구축이 타당성이 있음을 입증하였고 지능형 정보검색 시스템에의 적용가능성을 논의하였다.

  • PDF

거대언어모델과 문서검색 알고리즘을 활용한 한국원자력연구원 규정 질의응답 시스템 개발 (Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model)

  • 김홍비;유용균
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.31-39
    • /
    • 2023
  • 최근 자연어 처리(NLP) 기술, 특히 ChatGPT를 비롯한 거대 언어 모델(LLM)의 발전으로 특정 전문지식에 대한 질의응답(QA) 시스템의 연구개발이 활발하다. 본 논문에서는 거대언어모델과 문서검색 알고리즘을 활용하여 한국원자력연구원(KAERI)의 규정 등 다양한 문서를 이해하고 사용자의 질문에 답변하는 시스템의 동작 원리에 대해서 설명한다. 먼저, 다수의 문서를 검색과 분석이 용이하도록 전처리하고, 문서의 내용을 언어모델에서 처리할 수 있는 길이의 단락으로 나눈다. 각 단락의 내용을 임베딩 모델을 활용하여 벡터로 변환하여 데이터베이스에 저장하고, 사용자의 질문에서 추출한 벡터와 비교하여 질문의 내용과 가장 관련이 있는 내용들을 추출한다. 추출된 단락과 질문을 언어 생성 모델의 입력으로 사용하여 답변을 생성한다. 본 시스템을 내부 규정과 관련된 다양한 질문으로 테스트해본 결과 복잡한 규정에 대하여 질문의 의도를 이해하고, 사용자에게 빠르고 정확하게 답변을 제공할 수 있음을 확인하였다.

지식검색서비스의 이용에 관한 실증적 연구 (An Empirical Study of Web-based Question-Answer Services)

  • 박주범;정동열
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.31-38
    • /
    • 2004
  • 본 연구는 지식검색서비스의 특성과 성능 분석을 근거로 이용자의 정보요구와 이용행태 등 지식검색 서비스 이용과 관련된 제반사항을 조사 · 분석함으로써 이용자들의 요구를 보다 충족시킬 수 있는 지식검색서비스 방안을 제시하기 위한 목적으로 수행되었다. 이론적 연구와 실증적 이용연구에서 분석된 결과를 기초로 한 개선방안은 지식의 효과성과 검색서비스의 효율성을 강화시키는 요소를 중심으로 제시되었다. 지식 자체의 효과를 높이기 위해서는 답변의 전문성, 정확성, 주제의 특성 및 다양성을 향상시켜야 하고, 검색서비스의 효율성을 높이기 위해서는 쌍방향성, 즉시성, 편리성의 측면을 강화시켜야 한다. 이에 대한 구체적 방안으로 답변자나 답변내용의 제한, 지식 자체의 가치결정, 커뮤니케이션 수단의 확대, 질문처리과정 확인 기능, 질문자나 답변자의 로그온 상태 표시, 지능형 검색방식의 확충 등을 제안한다.

  • PDF

확장된 나이브 베이즈 분류기를 활용한 질문-답변 커뮤니티의 질문 분류 (Modified Na$\ddot{i}$ve Bayes Classifier for Categorizing Questions in Question-Answering Community)

  • 연종흠;심준호;이상구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.95-99
    • /
    • 2010
  • 소셜 미디어(social media)는 블로그, 소셜 네트워크, 위키 등과 같이 사용자의 참여로 만들어지는 정보 컨텐츠이다. 사용자가 작성한 질문에 다른 사용자들이 답변을하는 질문-답변 커뮤니티 서비스도 이러한 소셜 미디어의 한 가지로서 지난 몇 년간 많은 양의 정보를 축적해왔다. 하지만 축적된 질문-답변의 양이 많아질수록 이전의 질문을 정확히 검색하는 것은 점점 어려운 작업이 되고 있다. 본 논문에서는 질문-답변 커뮤니티의 효율적인 정보 검색을 위해 확장된 나이브 베이즈 분류기(Na$\ddot{i}$ve Bayes classifier)를 이용하여 질문을 그 목적에 따라 정보형, 제안형, 의견형으로 자동 분류하는 기법을 제안한다. 정확한 분류를 위해 분류기는 질문-답변 문서의 구조적인 특징을 활용한다. 실제 질문-답변 커뮤니티의 질문들에 대해 실험을 수행한 결과 71.2%의 분류 정확도를 보였다.

용어간 관계를 이용한 검색문헌의 순위부여에 관한 연구 (A Study on Ranking Retrieved Documents Utilizing Term Relationship)

  • 강일중;정영미
    • 정보관리학회지
    • /
    • 제8권1호
    • /
    • pp.100-116
    • /
    • 1991
  • 본 연구에서는 지식베이스의 용어간 관계와 증거추론이론을 이용한 정보검색 시스템을 설계하였다. 실험을 위한 문헌파일은 한국전자통신연구소의 통신분야 기술문서를 대상으로 작성하였으며, 지식베이스는 INSPEC 시소러스의 통신분야 용어 및 용어간 관계들을 발췌하여 구성하였다. 그리고 용어간의 관련성은 용어간 관계의 종류에 따라 수치로 표현하였으며, 이들 수치를 이용하여 뎀스터-셰이퍼 이론에 따라 질문과 문헌간의 관련성을 추론, 산출하였다. 실험결과 질문의 탐색어외에도 관련된 용어의 확장검색을 통하여 포괄적인 검색을 할 수 있었으며, 용어간 관계를 반영하여 질문과 문헌간의 관련성을 산출하고, 관련성 순위에 따라 검색결과를 제시할 수 있었다.

  • PDF

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF

복사 방법 및 검색 방법을 이용한 종단형 생성 기반 질의응답 채팅 시스템 (End-to-End Generative Question-Answering Chat System Using Copying and Retrieving Mechanisms)

  • 김시형;김학수;권오욱;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.25-28
    • /
    • 2017
  • 채팅 시스템은 기계와 사람이 서로 의사소통 하는 시스템이다. 의사소통 과정에서 질문을 하고 질문에 대한 답변을 하는 질의응답 형태의 의사소통이 상당히 많다. 그러나 기존 생성 기반 채팅 시스템에서 자주 사용되는 Sequence-to-sequence모델은 질문에 대한 답변보다는 좀 더 일반적인 문장을 생성하는 경우가 대부분이다. 이러한 문제를 해결하기 위해 본 논문에서는 복사 방법과 검색 방법을 이용한 생성 기반 질의응답 채팅 시스템을 제안한다. 템플릿 기반으로 구축한 데이터를 통한 실험에서 제안 시스템은 복사 방법만 이용한 질의응답 시스템 보다 45.6% 높은 정확도를 보였다.

  • PDF