Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1997.10a
- /
- Pages.291-295
- /
- 1997
- /
- 2005-3053(pISSN)
Chart Parser Using Compound Unit Information
복합 단위 정보를 이용한 차트 파서
- Jung, Han-Min (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
- Yuh, Sang-Hwa (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
- Kim, Tae-Wan (Machine Translation Laboratory, Natural Language Information Processing Department, SERI) ;
- Park, Dong-In (Machine Translation Laboratory, Natural Language Information Processing Department, SERI)
- 정한민 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
- 여상화 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
- 김태완 (기계번역연구실/자연어정보처리연구부/시스템공학연구소) ;
- 박동인 (기계번역연구실/자연어정보처리연구부/시스템공학연구소)
- Published : 1997.10.10
Abstract
본 논문은 복합 단위 정보를 이용하여 모호성을 감소시키고 자연스러운 대역어 정보를 제공할 수 있는 차트파서를 기술한다. 복합 단위 정보를 사용하는 파싱은 태깅과 구문 분석 과정 사이에서 여러 단어들을 하나의 단위로 만들어서 형태론적/구문적 모호성과 파스 트리의 수를 감소시킨다. 우리는 Bottom-up 차트 파싱을 사용하는데, 이는 모호성 있는 태깅 결과가 많을수록 파스 트리의 생성 시간과 수의 증가를 초래하므로 복합 단위를 사용하여 파서에 대한 입력 단어의 수 및 모호성을 감소시켜 안정적인 파싱 결과를 얻을 수 있게 한다. 실험 결과는 복합 단위 정보를 사용한 차트 파싱이 차트들의 크기와 파스 트리의 수를 50%까지 감소시킴을 보여준다.
Keywords