ACE 관계 추출과 특징화 과정에서 성능 향상을 위한 새로운 방법(1)

A New Method for Improving Performance in ACE Relation Detect ion and Characterization

  • 김경덕 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실) ;
  • 김석환 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실) ;
  • 이근배 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실) ;
  • 차정원 (창원대학교 컴퓨터공학과)
  • Kim, Kyung-Duk (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Kim, Seok-Hwan (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Lee, Gray Geun-Bae (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Cha, Jeong-Won (School of Computer information & Communication, Changwon University)
  • 발행 : 2005.10.21

초록

텍스트 기반 문서의 급증으로 인해 정보 추출 기술이 더욱 중요해지고 있다 특히 최근에 활발한 연구가 진행되고 있는 개체 간 관계 추출 기술은 정보검색과 질의응답 등 많은 분야에 걸쳐 활용될 수 있는 기술이다 본 논문은 기존의 자질 기반 관계 추출 시스템의 재현율을 향상시키기 위해 WHISK 알고리즘을 도입한 시스템에 관한 것이다. WHISK 알고리즘은 문장으로부터 관계에 참여하는 개체 쌍을 추출하는 규칙을 자동으로 학습한다. 그리고 시스템은 최대 엔트로피 모델을 이용하여 WHISK에 의해 추출된 개체 쌍에 적합한 관계 유형을 파악해 낸다. 본 논문은 시스템에 사용된 WHISK 알고리즘과 최대 엔트로피 모델에 대해서 알아보고, 실제로 WHISK 알고리즘을 도입하여 관계를 가지는 개체 쌍을 추출하여 문제를 해결했을 때 어느 정도의 성능 향상이 있는지 알아본다.

키워드