Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2004.10d
- /
- Pages.159-166
- /
- 2004
- /
- 2005-3053(pISSN)
Method of Semantic Passage Generation and Retrieval for Encyclopedia QA system
백과사전 질의응답 시스템을 위한 의미적 단락 생성 및 검색 기법
- Lee, Chung-Hee (Knowledge Mining Research Team Electronics and Telecommunications Research Institute(ETRI)) ;
- Oh, Hyo-Jung (Knowledge Mining Research Team Electronics and Telecommunications Research Institute(ETRI)) ;
- Kim, Hyeon-Jin (Knowledge Mining Research Team Electronics and Telecommunications Research Institute(ETRI)) ;
- Jang, Myung-Gil (Knowledge Mining Research Team Electronics and Telecommunications Research Institute(ETRI))
- 이충희 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
- 오효정 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
- 김현진 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀) ;
- 장명길 (한국전자통신연구원 음성/언어정보연구부 지식마이닝연구팀)
- Published : 2004.10.08
Abstract
본 논문에서는 질의응답 시스템에서 질문의 주제와 개념적으로 일치하는 단락으로부터 정보를 추출할 경우에 보다 정확한 정답을 추출할 수 있다는 가정 하에 문장 주제를 활용한 의미적 단락 생성 및 검색 기법을 제안한다. 문장주제란 백과사전 문서 집합에서 공통으로 기술하는 내용이나 자주 언급하고 있는 사건 혹은 개념들의 집합을 의미하는 것으로, 주제별로 응집된 문장들로 재구성된 단락을 의미적 단락이라고 정의한다. 제안된 방법의 성능을 평가하기 위해 의미적 단락의 신뢰도를 파악하고, 백과사전 본문을 3문장 단위로 잘라서 고정길이 단락을 만든 후 의미적 단락의 검색결과와 비교하였다. 평가척도로는 TREC의 역순위평균(MRR : Mean Reciprocal Rank)과 상위 5개 단락 안에 정답유무를 측정하는 사용자 정답만족도를 사용하였다. ETRI 평가셋을 대상으로 한 실험 결과, 주제를 이용한 의미적 단락 검색 성능이 고정길이 단락 검색보다 우수함을 알 수 있었다.
Keywords