Browse > Article

Korean Syntactic Analysis by Using Clausal Segmentation of Embedded Clause  

Lee, Hyeon-Yeong (전북대학교 컴퓨터정보학과)
Lee, Yong-Seok (전북대학교 컴퓨터정보학과)
Abstract
Most of Korean sentences are complex sentences which consisted of main clause and embedded clause. These complex sentences have more than one predicate and this causes various syntactic ambiguities in syntactic analysis. These ambiguities are caused by phrase attachment problems which are occurred by the modifying scope of embedded clause. To resolve it, we decide the scope of embedded clause in the sentence and consider this clause as a unit of syntactic category. In this paper, we use sentence patterns information(SPI) and syntactic properties of Korean to decide a scope of embedded clause. First, we split the complex sentence into embedded clause and main clause by the method that embedded clause must have maximal arguments. This work is done by the SPI of the predicate in the embedded clause. And then, the role of this embedded clause is converted into a noun phrases or adverbial phrases in the main clause by the properties of Korean syntax. By this method, the structure of complex sentence is exchanged into a clause. And some phrases attachment problem, which is mainly caused by the modifying scope, is resolved easily. In this paper, we call this method clausal segmentation for embedded clause. By empirical results of parsing 1000 sentences, we found that our method decreases 88.32% of syntactic ambiguities compared to the method that doesn't use SPI and split the sentence with basic clauses.
Keywords
Phrases attachment problems; Clausal segmentation of Embedded clause; Sentence patterns information; Syntactic analysis;
Citations & Related Records
연도 인용수 순위
  • Reference
1 박현재, 이수선, 우요섭, '의미 정보를 이용한 이단계 단문분할 알고리즘', 제 11회 한글 및 한국어 정보처리 학술대회, pp. 237-241, 1999
2 황이규, 구문 형태소를 이용한 형태소 및 구문 모호성 축소, 전북대학교 박사학위 논문, 2001
3 양승원, 박영진, 이용석, '조건 단일화 기반 PATRII를 이용한 한국어 구문 분석', 한국정보과학회 논문지 Vol.22, No.4, pp. 653-662, 1995
4 교육부, 사회 5-1, 국정교과서주식회사, 1995
5 KIBS : Korean Information Base System, http:// kibs.kaist.ac.kr/kibs
6 김광백, 박의규, 나동렬, 윤준태, '구간 분할 기반 한국어 구문 분석', 제 14회 한글 및 한국어 정보처리 학술대회, pp. 163-168, 2002
7 신효필, '최소자원 최대효과의 구문 분석', 제11회 한글 및 한국어 정보처리 학술대회, pp. 242-247, 1999
8 장재철, 박의규, 나동렬, '구간 분할 기반 한국어 대등접속 구문분석 기법', 제 14회 한글 및 한국어 정보처리 학술대회, pp. 139-146, 2002
9 장석진, 정보기반 한국어 문법, 도서출판 언어와 정보, 1993
10 이현영, 황이규, 이용석, '문형과 단문 분할을 이용한 한국어 구문 모호성 해결', 제 12회 한글 및 한국어 정보처리 학술대회, pp. 116-123, 2000
11 연세대학교 언어정보개발원, 연세한국어 사전, 두산동아, 1999
12 서울대학교, '한.영동사의 하위범주화와 대응에 관한 연구', 한국전자통신연구소 최종 연구보고서, 1989