랭킹 결합에 의한 기술용어 패러프레이즈 추출

Terminological Paraphrase Extraction with Ranking Combination

  • 최성필 (한국과학기술정보연구원 소프트웨어연구실) ;
  • 조민희 (한국과학기술정보연구원 소프트웨어연구실) ;
  • 정한민 (한국과학기술정보연구원 소프트웨어연구실) ;
  • 맹성현 (한국과학기술원 전산학과)
  • 발행 : 2012.10.06

초록

기술용어 패러프레이즈 (Terminological Paraphrase, TP)는 학술 문헌 내에서 기술 용어의 개념 및 정의를 다른 형태로 풀어서 알기 쉽게 서술적 문구 (descriptive expression) 를 의미한다. 이러한 TP들에 대한 효율적인 식별과 추출은 학술 정보에 대한 개념적 접근이나 학술 정보 검색의 재현율 향상에 매우 중요하다. 본 논문은 생명 공학 분야의 논문에 나타나는 다양한 형태의 TP들을 효율적으로 추출하기 위한 정보 검색 기반의 추출 방법론을 제시하고 총 여섯 가지의 추출 랭킹 모델을 기반으로 이를 결합함으로써 TP추출의 확장 가능성에 대한 실험적 연구를 수행한다. 실험 결과, 활용된 랭킹 모델이 서로 상호 보완적인 관계에 있음을 알 수 있었으며, 랭킹 결합에 의한 성능 개선 효과를 얻을 수 있었다.

키워드