Annual Conference of KIPS (한국정보처리학회:학술대회논문집)
- 2003.11a
- /
- Pages.487-490
- /
- 2003
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
An Interrupted and Uninterrupted Compound Unit Recognizer using Regular Expression
정규표현을 이용한 연속 및 불연속 복합단위 인식기
- Yuh, Sang-Hwa (Div. of Computer Information Technology, Kyung-In Women's College) ;
- Seo, Jung-Yun (Dept. of Computer Science, Sogang University)
- Published : 2003.11.14
Abstract
기계번역 시스템에서 복합단위 처리는 원문의 분석 부담을 줄이고 조합적으로 대역문의 의미를 생성하지 못하는 원문의 처리를 위해 필수적이다. 본 논문에서는 정규표현(Regular Expression)을 이용하여 영어의 연속(Non-Interrupted) 및 불연속(Interrupted) 복합 단위를 인식하는 복합단위 인식기를 제안한다. 제안된 방법은, 기존에 trie 와 같은 index 의 갱신 과정이 불필요하므로, 다수의 작업자에 의해 복합단위 사전을 동시에 구축하는 경우에, 한 작업자의 결과가 실시간으로 다른 작업자의 작업에 반영되는 장점이 있으며, 복합단위 인식에 있어 정규 표현을 이용함으로써 복합단위 인식기의 성능을 선언적으로 향상시킬 수 있다. 번역 실행시의 고속 탐색을 위해서는 전체 복합단위로부터 FSA(finite State Automata) 를 자동으로 구축하여 빠른 속도로 인식 가능하도록 하였다.
Keywords