Constructing A Korean-English Bilingual Dictionary For Well-formed English Sentence Generations In A Glossary-based System

Glossary에 기초한 시스템에서의 적형태 영어문장 생성을 위한 한영 대역에 전자사전구축

  • 신효필 (서울대학교 인문대학 언어학과)
  • Published : 2003.06.01

Abstract

We introduce a way to generate morphologically and syntactically well-formed English sentences when building Korean to English bilingual dictionary for Machine Translation Systems. It has been proved that basic inflectional or structural descriptions for English sentences are by no means enough to generate proper English sentences because of traditional dictionary structures. Furthermore, much research has been focused only on how to disambiguate semantic ambiguities of words in a bilingual dictionary To take advantage of existing paperback Korean to English bilingual dictionary, its automatic conversion to an electronic version and methodologies to assign proper features to the descriptions for well-formed English sentences with minimum human effort have been proposed on the basis of the dictionary-specific structures. This approach was originally motivated for a glossary-based machine translation system, but it can be also applied to large scale dictionary work.

본 논문은 자연언어처리 (Natural Language Processing), 특히 한영 기계번역에서 필수적 인 한영 대역어 사전을 구축함에 있어 영어 생성시 정확한 문장형태를 도출하기 위한 방법에 대해 논의한다. 기간의 연구는 주로 한국어와 영어의 의미적 모호성이 해결된 정확한 번역을 위한 대역어 내지 변환사전 구조에 초점이 맞추어져 왔고 상대적으로 형태적 또는 구문적으로 정확한 영어문장을 생성하는 것은 간과되어져 왔다. 기존 자원의 황용이라는 측면에서는 텍스트화된 한영사전을 그대로 이용한다고 하면 그 기술방식과 영어표현은 다양한 형태로 나타나기 때문에 정확한 의미의 대역어 뿐만 아니라 적격한 영어문장의 생성을 위해서는 어떠한 정보들이 대역어 사전에 기술되어야 하는지 고려해 볼 필요가 있다 따라서 본 논의에서는 기존의 인쇄된 한영사전을 구조분석하여 자동으로 변환하여 최소한의 인간의 간섭으로 정확한 영어생성에 필요한 형태적 정보를 자질로 부여하는 방법을 기술한다. 기본적으로 이 방법은 단어 대 단어 번역시스템 둥 glossary에 기초한 얕은 층위의 번역이 필요한 시스템을 위한 사전을 구축에서 시작하며 더 나아가 대규모의 전자사전 구축작업에서 어떻게 응용될 수 있는지 논의한다.

Keywords

References

  1. 21세기 세종계획 전자사전 개발분과, 연구보고서 문화관광부/국립국어연구소
  2. Ontology-based Cross Lingual Information Retrieval Nirenburg Sergei
  3. Proceedings of the International Conference KBCS2000 A Knowledge-Based Fact Database:Acquisition To Application Shin Hyopil;Spencer Koehler
  4. 인지과학 v.13 no.1 지식기반(Knowledge-based) 질의응답시스템:사실자료(Fact Database) 구축을 중심으로 신효필
  5. 서울대학교 박사학위 논문 한-영 기계번역을 위한 구 단위 변환사전 옥철영
  6. 엣센스 한영사전
  7. Semantics and the Lexicon Models for lexical knowledge bases Boguraev.B.;Levin,B.;Pustejovsky(ed.)
  8. International Journal of Computational Lexicography v.4 Special Issue on computational lexicons Boguraev.B.
  9. Proceedings of the First International Workshop on Inheritance in Natural Language Processing An approach to building the hierarchical element of a lexical knowledge base from a machine readable dictionary Copestake,A.
  10. 언어와 정보 v.6 no.2 어휘정보구축을 위한 사전텍스트 최병진
  11. 정보과학회 논문지:소프트웨어 및 응용 v.28 no.9 사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결시스템 허정;옥철영