Clustering Noun Using Syntactic Relations

Kim, Hyun-Jin;Park, Se-Young;Jang, Myung-Gil;Park, Jay-Duke;Park, Dong-In;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

1997.10a
/
Pages.111-115
/
1997
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Clustering Noun Using Syntactic Relations

용언의 구문관계를 이용한 명사 분류

Kim, Hyun-Jin (Natural Language Processing Department, SERI) ;
Park, Se-Young (Natural Language Processing Section, ETRI) ;
Jang, Myung-Gil (Natural Language Processing Department, SERI) ;
Park, Jay-Duke (Natural Language Processing Department, SERI) ;
Park, Dong-In (Natural Language Processing Department, SERI)

김현진 (시스템공학연구소 자연어정보처리연구부) ;
박세영 (한국전자통신연구원 소프트웨어연구부) ;
장명길 (시스템공학연구소 자연어정보처리연구부) ;
박재득 (시스템공학연구소 자연어정보처리연구부) ;
박동인 (시스템공학연구소 자연어정보처리연구부)

Published : 1997.10.10

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

자연언어를 처리하는 응용시스템에서는 의미적으로 유사한 집합으로 분류된 단어들을 이용하는 것이 필요하다. 특히 한국어에서는 명사마다 함께 쓰이는 용언들이 제한되어 있다. 이 논문에서는 문장에서 용언과 명사의 구문 관계로 추출되는 정보를 이용하여 명사를 분류하는 방법을 제시한다. 또한 실제 코퍼스에서 추출된 명사들을 중심으로 의미적 집합으로 묶는 작업을 하고, 각 의미군마다 특징적인 구문 정보를 적용하여 자동 명사 추출에서 나타나는 모호성 해소에도 이용하였다. 용언의 구문관계 추출은 기존 연구된 용언 하위 분류 연구를 이용하였고, 코퍼스를 통해 얻은 명사와 용언을 이용하여 수정 및 보완하였다. 실험 코퍼스는 1만 문장 가량의 구문 구조가 부착된 코퍼스(Tree Tagged Corpus)를 이용하였다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Clustering Noun Using Syntactic Relations

용언의 구문관계를 이용한 명사 분류

Abstract

Keywords