한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
- /
- Pages.39-49
- /
- 1992
- /
- 2005-3053(pISSN)
시소러스 작성을 위한 개념 획득 도구
A Concept Acquisition Tool for Thesaurus Construction
- Kim, Myoung-Cheol (Dept. of Computer Science, KAIST) ;
- Lee, Woon-Jae (Dept. of Computer Science, KAIST) ;
- Choi, Key-Sun (Dept. of Computer Science, KAIST) ;
- Kim, Gil-Chang (Dept. of Computer Science, KAIST)
- 발행 : 1992.10.09
초록
시소러스를 작성하기 위해 시소러스 작성자가 고려래야 하는 문제는 단어간의 개념 관계이다. 단어간의 관개는 계층구조에 정의된 개념을 기반으로 분석하여 하향식으로 시소러스를 작성하는 것이 일반적이다. 이러한 방식은 작성자에 의존적이므로 시소러스의 정확도를 보장할 수 없고 주관적인 성향을 가진다. 그래서 Corpus에서 자동으로 개념 및 개념 관계를 추출하는 상향식 방법들이 다양하게 시도되고 있다. 본 논문에서는 시소러스 작성을 위한 자동 개념 획득 도구를 설계, 구현하였다. Mutual Information이라는 방법을 이용하여 공기 정보(Collocation)를 정량화하고 이를 통하여 단어간의 개념관계의 크기를 측정한 후 개념 관계의 크기(MI 값)가 큰 값을 선택하여 개념 화일을 작성한다. 실험 결과로 얻은 개념 화일은 두 개념간의 밀접도를 나타내므로 시소러스 작성에 매우 유용하다.
키워드