Document filtering for automatic construct ion of Answer Set

Answer set 자동 구축을 위한 문서 필터링

  • Jeong, Yong-Kyo (Dept. of Computer Engineering, Chungbuk National University) ;
  • Shin, Seug-Eun (Dept. of Computer Engineering, Chungbuk National University) ;
  • Oh, Hyo-Jung (Member of Engineering Staff, Human Information Retrieval Technology Research Team, Human Information Processing Department, ETRI-Computer & Software Technology Lab, Electronics Telecommunications Research Institute(ETRI)) ;
  • Jang, Myung-Gil (Member of Engineering Staff, Human Information Retrieval Technology Research Team, Human Information Processing Department, ETRI-Computer & Software Technology Lab, Electronics Telecommunications Research Institute(ETRI)) ;
  • Seo, Young-Hoon (Dept. of Computer Engineering, Chungbuk National University)
  • 정용교 (충북대학교 컴퓨터공학과) ;
  • 신승은 (충북대학교 컴퓨터공학과) ;
  • 오효정 (한국전자통신연구원, 휴먼정보처리연구부, 휴먼정보처리연구팀) ;
  • 장명길 (한국전자통신연구원, 휴먼정보처리연구부, 휴먼정보처리연구팀) ;
  • 서영훈 (충북대학교 컴퓨터공학과)
  • Published : 2002.10.11

Abstract

본 논문은 의미기반 정보검색 소프트웨어 기술에서 정답 문서 자동 구축을 위한 문서 필터링기법을 제안한다. 문서 필터링은 1차 질의어와 문서간의 유사도와 2차 질의어와 문서간의 유사도를 이용하여 이루어지며, 1차 질의어와 문서간의 유사도를 구하기 위하여 개념 망과 백과사전 정보를 이용한 1차 질의어 확장 과정을 수행하고, 화장된 질의어와 문서와의 유사도를 계산한다. 1차 확장 질의어를 이용해 얻어진 결과 중 유사도가 상위 10%에 속하는 문서를 이용하여 2차 질의어 확장을 한다. 2차 질의어 확장은 상위 10% 문서에 출현하는 명사중 문서 출현 빈도가 임계치 이상인 명사를 선택하여 이루어지고, 그것을 이용하여 문서의 유사도를 계산한다. 이렇게 얻어진 두 가지의 유사도를 결합하여 문서들을 순위화하고 Accept Point를 이용하여 문서를 필터링한다.

Keywords