Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1997.10a
- /
- Pages.430-435
- /
- 1997
- /
- 2005-3053(pISSN)
The Design and Implementation of Alignment Workbench
정렬 워크벤치의 설계 및 구현
- Lee, Jae-Sung (KAIST CS Dept.) ;
- Kang, Jung-Goo (KAIST CS Dept.) ;
- Lee, Ju-Ho (KAIST CS Dept.) ;
- Le, Hung (California Polytechnic State Univ.) ;
- Choi, Key-Sun (KAIST CS Dept.)
- Published : 1997.10.10
Abstract
통계적인 방법으로 병렬 코퍼스(parallel corpus)로부터 사전정보를 추출해 내는 정렬 시스템에 대한 연구가 세계 여러곳에서 진행되고 있다(신중호 1996; Dagan 1996; Fung 1995; Kupiec 1993). 그 결과로 만들어진 사전정보는 유용한 대역어와 대역 확률을 포함하고 있지만, 불필요하거나 잘못된 요소들도 많이 포함되어 있어 재조정 작업이 필요하다. 이는 사전정보를 직관적으로 확인함으로써 조정을 할 수도 있지만, 좀 더 정확한 조정을 위해 각각의 사전정보(정렬의 결과)가 코퍼스의 어떤 문장에서 나온 것인가 등을 확인할 필요가 있다. 정렬 워크벤치는 이와 같은 작업을 효율적으로 처리할 수 있도록 만들어졌으며, 현재 구현되어 작동되고 있다. 본 논문에서는 정렬 워크벤치를 위해 필요한 정렬시스템의 변형과 사전작업의 편의를 위해 제공되어져야 하는 기능 등에 관하여 설명하고, 간단한 평가 결과를 설명한다.
Keywords