Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2012.10a
- /
- Pages.175-180
- /
- 2012
- /
- 2005-3053(pISSN)
Terminological Paraphrase Extraction with Ranking Combination
랭킹 결합에 의한 기술용어 패러프레이즈 추출
- Choi, Sung-Pil (Korea Institute of Science and Technology Information) ;
- Cho, Min-Hee (Korea Institute of Science and Technology Information) ;
- Jung, Hanmin (Korea Institute of Science and Technology Information) ;
- Myaeng, Sung-Hyon (Korea Advanced Institute for Science and Technology)
- 최성필 (한국과학기술정보연구원 소프트웨어연구실) ;
- 조민희 (한국과학기술정보연구원 소프트웨어연구실) ;
- 정한민 (한국과학기술정보연구원 소프트웨어연구실) ;
- 맹성현 (한국과학기술원 전산학과)
- Published : 2012.10.06
Abstract
기술용어 패러프레이즈 (Terminological Paraphrase, TP)는 학술 문헌 내에서 기술 용어의 개념 및 정의를 다른 형태로 풀어서 알기 쉽게 서술적 문구 (descriptive expression) 를 의미한다. 이러한 TP들에 대한 효율적인 식별과 추출은 학술 정보에 대한 개념적 접근이나 학술 정보 검색의 재현율 향상에 매우 중요하다. 본 논문은 생명 공학 분야의 논문에 나타나는 다양한 형태의 TP들을 효율적으로 추출하기 위한 정보 검색 기반의 추출 방법론을 제시하고 총 여섯 가지의 추출 랭킹 모델을 기반으로 이를 결합함으로써 TP추출의 확장 가능성에 대한 실험적 연구를 수행한다. 실험 결과, 활용된 랭킹 모델이 서로 상호 보완적인 관계에 있음을 알 수 있었으며, 랭킹 결합에 의한 성능 개선 효과를 얻을 수 있었다.