• 제목/요약/키워드: 변환사전

Search Result 351, Processing Time 0.024 seconds

English-Korean Transfer Dictionary Extension Tool in English-Korean Machine Translation System (영한 기계번역 시스템의 영한 변환사전 확장 도구)

  • Kim, Sung-Dong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.1
    • /
    • pp.35-42
    • /
    • 2013
  • Developing English-Korean machine translation system requires the construction of information about the languages, and the amount of information in English-Korean transfer dictionary is especially critical to the translation quality. Newly created words are out-of-vocabulary words and they appear as they are in the translated sentence, which decreases the translation quality. Also, compound nouns make lexical and syntactic analysis complex and it is difficult to accurately translate compound nouns due to the lack of information in the transfer dictionary. In order to improve the translation quality of English-Korean machine translation, we must continuously expand the information of the English-Korean transfer dictionary by collecting the out-of-vocabulary words and the compound nouns frequently used. This paper proposes a method for expanding of the transfer dictionary, which consists of constructing corpus from internet newspapers, extracting the words which are not in the existing dictionary and the frequently used compound nouns, attaching meaning to the extracted words, and integrating with the transfer dictionary. We also develop the tool supporting the expansion of the transfer dictionary. The expansion of the dictionary information is critical to improving the machine translation system but requires much human efforts. The developed tool can be useful for continuously expanding the transfer dictionary, and so it is expected to contribute to enhancing the translation quality.

Hangul-Hanja Transfer for Terminology (전문용어 한글-한자 자동 변환)

  • 황금하;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.886-888
    • /
    • 2004
  • 기존의 한글-안자 변환에서는 문맥정보와 통계정보를 고려하지 않는 사전기반의 단어단위 변환 방법을 사용한 반면, 본 논문에서는 언어모델 밀 변환모델을 이용한 문장단위의 한자 자동변환 방법을 제안하고. 사전 미등록어와 복합어의 한글-한자 변환을 위하여 단어분할을 변환의 숨김 과정으로 처리하는 통합모델을 사용하였다. 실험 결과, 전문용어의 한글-한자 변환에서 제한된 한자 데이터를 이용하여 기존의 사전기반 변환보다 나은 결과를 얻을 수 있었다.

  • PDF

The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation (적절한 동사 대역어 선택을 위한 한영 변환 사전 구성)

  • Song, Jung-Keun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

The Construction of Korean-to-English Verb Dictionary for Phrase-to-Phrase Translations (구절 변환을 위한 한영 동사 사전 구성)

  • Ok, Cheol-Young;Kim, Yung-Taek
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.44-57
    • /
    • 1991
  • In the transfer machine translation, transfer dictionary decides the complexity of the transfer phase and the quality of translation according to the types and precision of informations supplied in the dictionary. Using the phrasal level translated informations within the human readable dictionary, human being translates a source sentence correctly and naturally. In this paper, we propose the verb transfer dictionary in which the various informations are constructed so the machine readable format that the Korean-to-English machine translation system can utilize them. In the proposed dictionary, we first provide the criterions by which an appropriate target verb is selected in phrase-to-phrase translations without an additional semantic analysis in transfer phase. Second, we provide the concrete sentence structure of a target verb so that we can resolve the expressive gaps between two languages and reduce the complexity of the various structure transfer in word-to-word translation.

  • PDF

Transfer Dictionary for A Token Based Transfer Driven Korean-Japanese Machine Translation (토큰기반 변환중심 한일 기계번역을 위한 변환사전)

  • Yang Seungweon
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.9 no.3
    • /
    • pp.64-70
    • /
    • 2004
  • Korean and Japanese have same structure of sentences because they belong to same family of languages. So, The transfer driven machine translation is most efficient to translate each other. This paper introduce a method which creates a transfer dictionary for Token Based Transfer Driven Koran-Japanese Machine Translation(TB-TDMT). If the transfer dictionaries are created well, we get rid of useless effort for traditional parsing by performing shallow parsing. The semi-parser makes the dependency tree which has minimum information needed output generating module. We constructed the transfer dictionaries by using the corpus obtained from ETRI spoken language database. Our system was tested with 900 utterances which are collected from travel planning domain. The success-ratio of our system is $92\%$ on restricted testing environment and $81\%$ on unrestricted testing environment.

  • PDF

통계적 기계 번역 기술의 연구 동향

  • 김선호;윤준태;임해창
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.76-87
    • /
    • 2004
  • 기계번역은 자연어 처리 및 인공지능 분야에서 가장 어려 운 태스크 중의 하나로 인식되어 왔다. 이는 정확한 번역이란 텍스트에 대한 이해 없이는 불가능하기 때문이다. 그러한 이유로 연구자들은 한때 기계번역에 대한 부정적인 결론에 도달하기도 하였다. 지금까지 기계번역을 위해 다양한 방법이 연구되어 왔으며 이들 연구에서는 주로 두 언어에 대한어휘나 구의 대역사전, 숙어사전, 개별 언어의 문법, 혹은 변환규칙 및 변환사전, 문장생성에 관련된 지식, 의미나 실세계 지식, 도메인에 적합한 지식 등 번역의 방식과 목적에 따라 다양한 형태의 지식과 알고리즘이 적용되었으며 그 대부분은 방대한 양의 수작업에 의존적이었다.(중략)

  • PDF

Word Sense Disambiguation in Query Translation of CLTR (교차 언어 문서 검색에서 질의어의 중의성 해소 방법)

  • Kang, In-Su;Lee, Jong-Hyeok;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.52-58
    • /
    • 1997
  • 정보 검색에서는 질의문과 문서를 동일한 표현으로 변환시켜 관련성을 비교하게 된다. 특히 질의문과 문서의 언어가 서로 다른 교차 언어 문서 검색 (CLTR : Cross-Language Text Retrieval) 에서 이러한 변환 과정은 언어 변환을 수반하게 된다. 교차 언어 문서 검색의 기존 연구에는 사전, 말뭉치, 기계 번역 등을 이용한 방법들이 있다. 일반적으로 언어간 변환에는 필연적으로 의미의 중의성이 발생되며 사전에 기반한 기존 연구에서는 다의어의 중의성 의미해소를 고려치 않고 있다. 본 연구에서는 질의어의 언어 변환시 한-일 대역어 사전 및 카도가와 시소러스 (각천(角川) 시소러스) 에 기반한 질의어 중의성 해소 방법과 공기하는 대역어를 갖는 문서에 가중치를 부여하는 방법을 제안한다. 제안된 방법들은 일본어 특허 문서를 대상으로 실험하였으며 5 %의 정확도 향상을 얻을 수 있었다.

  • PDF

한글 단어를 발음 기호로 변환 시키는 인공신경망에 관한 연구

  • Yang, Jae-U;Kim, Doo-Hyeon
    • ETRI Journal
    • /
    • v.10 no.3
    • /
    • pp.113-124
    • /
    • 1988
  • 본 논문에서는 한글 단어를 발음 기호로 변환시키는 인공신경망의 설계와 이를 시뮬레이션한 결과에 대하여 논한다. 이 인공신경망은 multi-layer perceptron 구조를 가지며 error back-propagation 학습 알고리즘을 사용하였다. 이 인공신경망에 한글 발음 사전의 일부를 반복적으로 제시하여 학습시킨 결과, 학습한 단어에 대하여 최고 97%의 정확도로 변환 작업을 수행하였고 학습하지 않은 단어에 대해서는 91%의 정확도를 보였다. 이는 설계된 인공신경망이 발음 사전 내에 포괄적으로 내재되어 있는 발음규칙을 스스로 학습하였음을 나타낸다. 아울러 신경망의 학습 성취도와 입력 코드와의 관계도 연구하였는데, 한글단어를 발음기호로 변환하는 데에 있어서 compact 코드 보다 local 코드일 때 학습 성취도가 높은 것이 실험을 통해 밝혀졌다.

  • PDF

An Automated Transformation of XML Documents (XML 문서의 자동변환)

  • 이준승;신동훈;이경호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.822-826
    • /
    • 2004
  • XML 문서가 인터넷을 비롯한 다양한 분야에서 정보 교환을 위한 표준으로 널리 사용되면서 XML 문서의 변환에 대한 필요성이 증가하고 있단 본 논문에서는 XML 문서의 자동 변환 방법을 제안한다. 제안된 방법은 스키마 매칭과 XSLT 스크립트 생성의 두 단계로 구성된다. 특히, 제안된 방법은 정교한 수준의 스키마 매칭을 위해서 동의어 사전, 축약어 사전, 도메인 온톨로지 등의 부가정보를 활용한다. 또한 기존 연구와 비교하여 보다 빠른 변환 속도를 지원하는 XSLT 스크립트를 생성한다.

  • PDF

Noninformative Priors for the Ratio of Parameters in Inverse Gaussian Distribution (INVERSE GAUSSIAN분포의 모수비에 대한 무정보적 사전분포에 대한 연구)

  • 강상길;김달호;이우동
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.1
    • /
    • pp.49-60
    • /
    • 2004
  • In this paper, when the observations are distributed as inverse gaussian, we developed the noninformative priors for ratio of the parameters of inverse gaussian distribution. We developed the first order matching prior and proved that the second order matching prior does not exist. It turns out that one-at-a-time reference prior satisfies a first order matching criterion. Some simulation study is performed.