Analyzing Dependency of Korean Subordinate Clauses Using Support Vector Machine

Kim, Sang-Soo;Park, Seong-Bae;Lee, Sang-Jo;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
/
Pages.148-155
/
2006
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

SVM을 사용한 한국어 종속절의 의존관계 분석

Analyzing Dependency of Korean Subordinate Clauses Using Support Vector Machine

김상수 (경북대학교 컴퓨터공학) ;
박성배 (경북대학교 컴퓨터공학) ;
이상조 (경북대학교 컴퓨터공학)

Kim, Sang-Soo (Dept. of Computational Engineering, Kyungpook National University) ;
Park, Seong-Bae (Dept. of Computational Engineering, Kyungpook National University) ;
Lee, Sang-Jo (Dept. of Computational Engineering, Kyungpook National University)

발행 : 2006.10.13

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

한국어 구문 분석에서 가장 어려운 작업들 중에 하나는 종속절의 의존관계 파악이다. 본 논문에서는 이를 해결하기 위해서 종속절의 의존관계를 걸을 구성하는 서술어부(동사와 어미)의 관련 정보의 유무에 따라 의존관계가 성립한다고 가정했다. 즉 각각의 절들의 서술부의 관련 정보의 유무로 보고, 이진 분류 문제로 이 문제를 해결하였다. 사용한 자질은 정적 자질(static feature)와 동적 자질(dynamic feature)를 구성되어 있다. 정적 자질은 동사와 어미에서 표면적인 어휘 정보이고 이는 단어, POS 테그 및 위치 정보들이다. 동적 자질은 문장에서 절이 가지는 문법적인 형태를 의미하고, 이를 추출하기 위해 간단한 규칙을 만들고 이를 바탕으로 CKY 차트 파서를 통하여 추출하였다. 기계학습 방법으로는 이진 분류 문제에서 널리 사용되는 SVM을 사용하였다. 실험 결과 어휘 정보들 중에서 어미의 정보만 사용하였을 경우는 64.4%의 정확도를 보였고 문법적인 정보인 동적 자질을 사용한 경우는 73.5%로 어휘 정보만을 사용한 경우 보다 9.1%의 성능 향상됨을 보였다

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

SVM을 사용한 한국어 종속절의 의존관계 분석

Analyzing Dependency of Korean Subordinate Clauses Using Support Vector Machine

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)