• 제목/요약/키워드: Question Answer system

검색결과 200건 처리시간 0.02초

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

구문 관계 정보를 이용한 한국어 질의-응답 시스템 (Korean Question-Answering System using Syntactic-Relation Information)

  • 신승은;이대연;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위한 동사의 구문 관계 정보를 이용한 한국어 질의-응답 시스템에 대해 기술한다. 구문 관계 정보는 동사의 원형, 사용 패턴, 각 문장 성분들의 의미 속성, 유의 동사 등의 정보를 담고 있다. 문장 및 구에 대한 구문분석은 구문관계 정보에 나타난 동사에 의존적인 문장 성분들의 의미속성과 동사의 일반적인 사용 패턴을 활용한다. 또한 정답후보 문장들의 구문분석을 위해 구문 관계 정보를 사용하고, 질의문의 격 슬롯(case slot)으로부터 정답을 찾기 위해 구문관계 정보를 사용한다. 실험에서 동사의 구문 관계 정보의 이용이 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위해 한국어 질의-응답 시스템에 효율적으로 활용될 수 있음을 보였다.

  • PDF

항공기 시뮬레이타 모션시스템의 인간공학적 유용성평가

  • 박성하;오제상
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1994년도 춘계공동학술대회논문집; 창원대학교; 08월 09일 Apr. 1994
    • /
    • pp.587-595
    • /
    • 1994
  • The use of flight training simulators has been increased remarkably during the past 20 years stimulated by the benefit that simulators can contribute to safety and training efficiency. Simulators have incorporated higher and higher levels of reality to provide more realistic training. Now, however, users are beginning to question how such reality is enough. Especially, it has raised question about the need for a notion system in the aircraft simulator. To help answer this question, this report describes notion cue requirements and types of motion system, and finally presents the assessment of the effectiveness of three different notion system alternatives.

WiseQA를 위한 정답유형 인식 (Recognition of Answer Type for WiseQA)

  • 허정;류법모;김현기;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권7호
    • /
    • pp.283-290
    • /
    • 2015
  • 본 논문에서는 WiseQA 시스템에서 정답유형을 인식하기 위한 하이브리드 방법을 제안한다. 정답유형은 어휘정답유형과 의미정답유형으로 구분된다. 본 논문은 어휘정답유형 인식을 위해서 질문초점에 기반한 규칙모델과 순차적 레이블링에 기반한 기계학습모델을 제안한다. 의미정답유형 인식을 위해 다중클래스 분류에 기반한 기계학습모델과 어휘정답유형을 이용한 필터링 규칙을 소개한다. 어휘정답유형 인식성능은 F1-score 82.47%이고, 의미정답유형 인식성능은 정확률 77.13%이다. 어휘정답유형 인식성능은 IBM 왓슨과 비교하여, 정확률은 1.0% 저조하고, 재현율은 7.4% 높다.

자기구성 지도를 이용한 인터넷 FAQ의 자동응답 및 개념적 브라우징 (Automatic Response and Conceptual Browsing of Internet FAQs Using Self-Organizing Maps)

  • 안준현;류중원;조성배
    • 한국지능시스템학회논문지
    • /
    • 제12권5호
    • /
    • pp.432-441
    • /
    • 2002
  • 최근 인터넷상의 정보를 가공하여 사용자에게 효율적으로 제공하는 서비스들이 많아지고 있지만, 컴퓨터에 익숙하지 않은 사용자들은 이러한 서비스를 쉽게 이용하지 못하기 때문에 사용자들을 돕는 시스템이 필요하다. 예를 들어, 웹사이트의 경우 전자우편을 통한 사용자들의 질문에 대해 관리자가 직접 답을 해줘야 하는데, 사용자의 증가로 질의응답 업무의 양이 커지고 있다. 본 논문에서는 이를 해결하기 위하여 사용자의 질의를 자동으로 분류하여 응답하고 사용자가 FAQ를 개념적으로 브라우징할 수 있도록 하는 시스템을 제안한다. 이 시스템은 다양한 크기의 질의 메일을 정형화된 크기로 만들기 위한 키워드 클러스터링 자기구성 지도(SOM)와 이를 실제 해당 답변 클래스로 분류하는 전자 우편 분류 SOM의 이단계 구조로 구성되어 사용자의 질의에 해당하는 답변을 자동으로 전송할 수 있으며, 사용자가 이차원상에 표현된 문서 지도를 이용하여 쉽게 전체 자료의 분포를 파악하여 검색할 수 있다. 실제 한 달간 수집한 2,206개의 한메일넷 질의 데이터에 대한 실험 결과, 95%의 분류율을 보여 그 유용성을 볼 수 있었으며, 단계별 검색이 가능하여 사용자가 효율적으로 검색할 수 있음을 확인할 수 있었다.

단서표현 기반의 인물관련 질의-응답문 문장 주제 분류 시스템 (A Topic Classification System Based on Clue Expressions for Person-Related Questions and Passages)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.577-584
    • /
    • 2015
  • 일반적으로 질의응답 시스템은 입력된 질문에 대한 정답을 찾기 위해 질문과 관련된 문서 또는 단락 단위의 검색을 수행한다. 그렇지만 단어 기반의 검색만으로는 정답을 포함하는 단락을 찾기 어려운 경우가 있다. 본 논문에서는 이러한 문제를 각 문장이 가지고 있는 주제를 통해 해결할 수 있다고 판단하고 이를 위한 질의-응답문의 주제 분류 시스템에 대해 연구하였다. 이러한 시스템을 위해 필요한 인물과 관련한 주제 유형을 소개하고, 주제를 찾기 위한 단서표현을 정의하였다. 또한 단서표현기반으로 문장의 주제를 파악하는 시스템의 구성에 대해 소개하고, 이 시스템의 구성요소들에 대한 성능 평가를 수행하였다.

위치문답형 지역광고 기반의 문화정보 서비스 모델링 (Regional Culture Contents Service Modeling Based On Localized Advertising of Question And Answer Format)

  • 신환섭;이재원
    • 한국콘텐츠학회논문지
    • /
    • 제19권8호
    • /
    • pp.465-472
    • /
    • 2019
  • 지역에서 생산되는 문화행사 및 문화 콘텐츠가 다양하고 많지만 관련한 경제소비의 확대를 위한 지역정보의 유통과 확산이 부족하다. 본 연구는 지역 문화정보의 확산과 사용을 목적으로 위치기반 서비스 관점에서 지역광고주의 지역광고를 질문과 답변 형식의 지식검색 방법과 결합하고 서비스화 하였다. 접근 방법으로는 지역에 기반한 지식검색에 대한 국내외 사례와 위치기반 광고 연구를 살펴보고, 위치문답형 정보서비스의 커뮤니티 모델 그리고 지역광고의 수익 모델을 제시하였다. 이를 통해 본 연구는 지역 문화행사와 문화콘텐츠의 정보유통을 위한 문답기반 커뮤니티와 지역광고의 운영구조 모델을 설계하고 정보 서비스 시스템을 프로토타이핑 형태로 개발하였다. 사용자간의 문답 데이터의 유통을 위치정보에 확장함으로써 지역의 문화콘텐츠 정보와 사용자 접근의 수요를 지역광고의 수익모델과 결합하여 제공하는 비즈니스 서비스 모델을 제시하였다는 의의를 갖는다.

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

한국어 질의 응답 시스템을 위한 초점단어 기반 질의분석 (Question Analysis based on Focus-words for Korean Question-Answering System)

  • 김원남;신승은;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.476-482
    • /
    • 2004
  • 질의 응답 시스템은 사용자의 질의를 분석하여 제한된 길이의 정답을 제시해 주는 시스템이다. 질의 응답 시스템은 정확한 정답을 추출하기 위해 사용자의 질의를 분석하는 과정을 필요로 한다. 본 논문에서는 초점단어(focus-word)를 이용한 질의분석을 제안한다. 초점단어란 정답유형을 결정하는데 단서가 되는 단어로써, 추출된 초점단어에 의해 75개의 하위정답유형 중 하나가 결정된다. 실험에는 학습 데이터의 일부와 일반 Web에서 수집한 테스트 데이터가 사용되었다. 실험결과 상위범주는 97.18%, 하위범주는 95.31%의 정확도를 보였다.

  • PDF

데이터 마이닝을 이용한 시험 응답데이터 분석시스템 설계 및 구현 (Design and Implementation of Analysis System for Answer Dataset with Data Mining)

  • 곽은영;김현철
    • 컴퓨터교육학회논문지
    • /
    • 제11권1호
    • /
    • pp.65-74
    • /
    • 2008
  • 본 논문은 데이터 마이닝 기법 중 연관규칙 추출 알고리즘을 이용하여 시험 응답 데이터에서 서로 연관된 문항들을 찾아내고, 그 원인을 규명함으로써 교육평가에서 사용되고 있는 기존의 검사이론 기반의 분석 결과와 함께 사용되면 문항의 질뿐만 아니라 피험자의 성취 수준을 심층적으로 분석하는데 도움을 줄 수 있는 시험 응답데이터 분석시스템을 개발하고 구현하는데 연구의 목적이 있다. 현재의 교육평가 분야에서 문항 분석에 사용되는 고전검사 이론과 문항반응 이론은 각 문항의 독립성을 전제로 하고, 피험자들이 각 개별 문항에 반응하여 나타나는 결과를 통계적 수치를 이용하여 설명하고 있다. 그러나 실제 학교 현장에서 실시한 시험의 결과를 보면, 피험자들의 반응에 의하여 문항간 연관성이 발생하게 되며 이러한 연관성은 각각의 문항들을 분석하고 피험자의 능력을 추정하는 데 의미 있는 영향을 미치게 된다. 제안된 시스템은 연관규칙 마이닝을 이용하여 흥미로운 문항간 연관성을 추출하고, 그 원인을 분석하여 사용자에게 제공함으로써 교수-학습 방법 개선이나 문제은행의 질을 향상시키는데 도움을 줄 수 있도록 하였다.

  • PDF