Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1997.10a
- /
- Pages.111-115
- /
- 1997
- /
- 2005-3053(pISSN)
Clustering Noun Using Syntactic Relations
용언의 구문관계를 이용한 명사 분류
- Kim, Hyun-Jin (Natural Language Processing Department, SERI) ;
- Park, Se-Young (Natural Language Processing Section, ETRI) ;
- Jang, Myung-Gil (Natural Language Processing Department, SERI) ;
- Park, Jay-Duke (Natural Language Processing Department, SERI) ;
- Park, Dong-In (Natural Language Processing Department, SERI)
- 김현진 (시스템공학연구소 자연어정보처리연구부) ;
- 박세영 (한국전자통신연구원 소프트웨어연구부) ;
- 장명길 (시스템공학연구소 자연어정보처리연구부) ;
- 박재득 (시스템공학연구소 자연어정보처리연구부) ;
- 박동인 (시스템공학연구소 자연어정보처리연구부)
- Published : 1997.10.10
Abstract
자연언어를 처리하는 응용시스템에서는 의미적으로 유사한 집합으로 분류된 단어들을 이용하는 것이 필요하다. 특히 한국어에서는 명사마다 함께 쓰이는 용언들이 제한되어 있다. 이 논문에서는 문장에서 용언과 명사의 구문 관계로 추출되는 정보를 이용하여 명사를 분류하는 방법을 제시한다. 또한 실제 코퍼스에서 추출된 명사들을 중심으로 의미적 집합으로 묶는 작업을 하고, 각 의미군마다 특징적인 구문 정보를 적용하여 자동 명사 추출에서 나타나는 모호성 해소에도 이용하였다. 용언의 구문관계 추출은 기존 연구된 용언 하위 분류 연구를 이용하였고, 코퍼스를 통해 얻은 명사와 용언을 이용하여 수정 및 보완하였다. 실험 코퍼스는 1만 문장 가량의 구문 구조가 부착된 코퍼스(Tree Tagged Corpus)를 이용하였다.
Keywords