• Title/Summary/Keyword: 기계 번역

Search Result 416, Processing Time 0.036 seconds

Translation Method of '-hada' verb in a Korean-to-Japanese Machine Translation (한-일 기계번역에서 '하다'용언의 번역 방법)

  • Moon, Kyong-Hi
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.4 s.36
    • /
    • pp.181-189
    • /
    • 2005
  • Due to grammatical similarities, even a one-to-one mapping between Korean and Japanese morphemes can usually result in a high quality Korean-to-Japanese machine translation. So most of Korean-to-Japanese machine translation are based on a one-to-one mapping relation. Most of Korean '-hada' verbs, which consist of a noun and '-hada', also correspond to Japanese '-suru' verbs, which consist of a noun and '-suru', so we generally use one-to-one mapping relation between them. However, the applications only by one-to-one mapping may sometimes result in incorrect Japanese correspondences in some cases that Korean 'hada' verbs don't correspond to Japanese 'suru' verbs. In these cases, we need to handle a noun and '-hada' as one translation unit. Therefore, this paper examined the characteristics of Korean '-hada' verb and proposed transfer rules of Korean 'hada' verb, applying for various states of input sentences such as discontinuity due to inserted words between a noun and '-hada', passivization, and modification of '-hada' verb. In an experimental evaluation, the proposed method was very effective for handling '-hada' verb in a Korean-to-Japanese machine translation, showing high quality of translation results.

  • PDF

HS-eLearner: A Tool for English Learning and Evaluation of English-Korean Machine Translation System (HS-eLearner: 영어 학습과 영한번역 시스템 평가를 위한 도구)

  • Kim Sung-Dong;Park Sung-Hoon
    • Annual Conference of KIPS
    • /
    • 2006.05a
    • /
    • pp.629-632
    • /
    • 2006
  • 본 논문에서는 영어 학습을 도와주고 영한 기계번역 시스템의 평가를 통해 기계번역 시스템의 성능 개선을 위한 도구인 HS-eLearner를 설계, 구현하였다. HS-eLearner는 영어 문장의 번역 뿐만 아니라 입력 문장의 구조, 문장에 사용된 단어의 의미를 제공하여 사용자의 효과적인 영어 학습을 보조하는 기능을 가진다. 또한 사용자가 번역된 문장을 평가하여 사용자에 의한 객관적인 번역 시스템에 대한 평가를 기대할 수 있으며 평가 결과를 개발자에게 제공함으로써 번역 시스템의 성능 개선에 사용될 수 있다. 즉 사용자와 개발자간의 커뮤니케이션을 제공함으로써 사용자의 요구를 수용할 수 있는 시스템으로의 개선을 용이하게 한다.

  • PDF

Retargetable Oolong-to-SIL IL Translator (재목적 Oolong-to-SIL 중간 언어 번역기)

  • 권혁주;김영근;이양선
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.310-313
    • /
    • 2004
  • 자바는 컴파일러에 의해 아키텍처 독립적인 바이트코드로 구성된 바이너리 형태의 클래스 파일을 생성하면 JVM에 의해 하드웨어와 운영체제에 상관없이 실행이 가능한 플랫폼 독립적인 언어로 현재 가장 널리 사용되는 범용 프로그램 언어중 하나이다. EVM(Embedded Virtual Machine)은 Microsoft사의 .NET 언어와 SUN사의 Java 언어등을 모두 수용할 수 있는 임베디드 시스템을 위한 가상기계이며, SIL(Standard Intermediate Language)은 EVM에서 실행되는 중간언어로 다양한 프로그래밍 언어를 수용하기 위해서 객체지향 언어와 순차적 언어를 모두 수용하기 위한 연산 코드 집합을 갖고 있다. 본 논문에서는 자바 프로그램을 EVM에서 실행 될 수 있도록 자바 프로그램을 컴파일하여 생성된 클래스 파일로부터 Oolong 코트를 추출하고 추출된 Oolong 코드를 EVM의 SIL 코드로 변환하는 Oolong-to-SIL 번역기 시스템을 구현하였다. 번역기 시스템을 정형화하기 위해 Oolong 코드의 명령어 등을 문법으로 작성하였으며, PGS를 통해 생성된 어휘 정보를 가지고 스캐너를 구성하였고, 파싱테이블을 가지고 파서를 설계하였다 파서의 출력으로 AST가 생성되면 번역기는 AST를 탐색하면서 의미적으로 동등한 SIL 코드를 생성하도록 번역기 시스템을 컴파일러 기법을 이용하여 모듈별로 구성하였다. 이와 같이 번역기를 구성함으로써 목적기계의 중간언어 형태에 따라 중간언어 번역기를 자동으로 구성할 수 있어 재목적성(Retargetability)을 높일 수 있다.

  • PDF

Internet English Newspaper Article Extraction Tool for English Corpus Construction (영어 말뭉치 구축을 위한 인터넷 영어 신문기사 추출 도구)

  • Kim, Sung-Dong;Eum, Jae-Young;Song, Chulmin
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.154-156
    • /
    • 2012
  • 영한 기계번역 시스템의 개발을 위해서는 여러 가지 사전이 필요하고, 다앙한 모호성 해소를 위한 연구를 위한 데이터가 필요하며, 번역 시스템의 테스트를 위해 많은 영어 문장이 필요하다. 따라서 영어 말뭉치를 구축하여 이로부터 사전에 필요한 정보, 모호성 해소 연구에 필요한 데이터, 번역 테스트를 위한 문장 등을 추출할 필요가 있다. 본 논문에서는 영어 말뭉치를 구축하기 위해 인터넷 영어 신문 사이트로부터 영어로 작성된 신문기사를 추출하는 도구를 개발하였다. 이를 통해 자동적으로 영어 신문기사를 추출하여 말뭉치를 구축할 수 있으며, 이를 통해 영한 기계번역 시스템의 성능 향상을 지원할 수 있다.

  • PDF

An Extension of Grammar Writing Language for Machine Translation (기계 번역을 위한 문법 기술 언어의 확장)

  • 심철민;최승권;여상화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.171-173
    • /
    • 1998
  • 변환 방식의 기계 번역 시스템에서 구조 변환은 번역의 품질을 결정하는 중요한 요소이다. 각 번역 시스템들은 이러한 구조 변환을 수행하기 위해 특별한 기법을 사용한다. 구조 변환을 수행하는 방안으로는 어휘 사전에 기술된 구조 변환 정보를 이용하는 방법, 변환 엔진에 언어 현상별 구조 변환 규칙을 프로그래밍하는 방법, 스크립트 언어를 이용하여 구조 변환 규칙을 기술하는 방법이 있다. 이 논문에서는 스크립트 형식의 범용 문법 기술 언어(Grammar Writing Language)를 제안한다. 이 논문에서 제안하는 문법 기술 언어는 규칙 기술을 용이하게 하기 위해 다양한 연산자와 기본 함수를 제공하며, 그 적용 대상에 따라 컴파일러 버전과 인터프리터 버전을 선택적으로 사용할 수 있다. 문법 기술 언어는 영한 기계번역의 변환 모듈뿐만 아니라 한영 변환 등의 트리 구조 변환을 요하는 다양한 응용 분야에 활용할 수 있다.

  • PDF

Machine Translation in an Automated Defense System for Combined Operation (연합작전을 위한 군 자동화 시스템에서의 기계번역)

  • Jung, Gwang-Ryeol;Kim, Seong-Yong;Kim, Cheol-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.481-490
    • /
    • 1992
  • 본 논문은 연합 작전을 위한 군 자동화 시스템에서의 기계번역에 대하여 설명한다. 연합작전은 단일한 임무의 수행을 위하여 공동 행동을 취하는 둘 이상의 연합국 부대에 의하여 실시되는 작전이며, 작전 구성원들이 사용하는 언어는 한국어와 영어 등 2개 국어 이상을 동시에 사용하고 있으므로, 상호간의 의사소통을 원활히 하기 위해서는 정확한 번역시스템이 필요하다. 현재 사용중인 군 자동화 시스템에서 기계번역의 개발과 시험 내용을 사용자의 요구사항, 시험 항목 및 현 기능을 중심으로 설명한다. 또한, 번역 결과의 평가에 대해 설명하고 향후의 기능 향상 요구사항 및 예정사항을 제시한다.

  • PDF

Korean-to-English Machine Translation System based on Verb-Phrase : 'CaptionEye/KE' (용언구에 기반한 한영 기계번역 시스템 : 'CaptionEye/KE')

  • Seo, Young-Ae;Kim, Young-Kil;Seo, Kwang-Jun;Choi, Sung-Kwon
    • Annual Conference of KIPS
    • /
    • 2000.10a
    • /
    • pp.269-272
    • /
    • 2000
  • 본 논문에서는 ETRI에서 개발 중인 용언구에 기반한 한영 기계번역 시스템 CaptionEye/KE에 대하여 논술한다. CaptionEye/KE는 대량의 고품질 한-영 양방향 코퍼스로부터 추출된 격틀사전 및 대역패턴, 대역문 연결패턴 등의 언어 지식들을 바탕으로 하여, 한국어의 용언구 단위의 번역을 조합하여 전체 번역을 수행한다. CaptionEye/KE는 변환방식의 기계번역 시스템으로서, 크게 한국어 형태소 분석기, 한국어 구문 분석기, 부분 대역문 연결기, 부분 대역문 생성기, 대역문 선택/정련기, 영어형태소 생성기로 구성된다. 입력된 한국어 문장에 대해 형태소 분석 및 태깅을 수행한 후, 격틀사전을 이용하여 구문구조를 분석하고 의존 트리를 생성해 낸다. 이렇게 생성된 의존 트리로부터 대역문 연결패턴을 이용하여 용언구들간의 연결에 대한 번역을 수행한 후 대역패턴을 이용하여 각 용언구들을 번역하고 문장 정련과정을 거쳐 영어 문장을 최종 생성한다.

  • PDF

Integrated Clustering Method based on Syntactic Structure and Word Similarity for Statistical Machine Translation (문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역)

  • Kim, Hankyong;Na, Hwi-Dong;Li, Jin-Ji;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.44-49
    • /
    • 2009
  • 통계기계번역에서 도메인에 특화된 번역을 시도하여 성능향상을 얻는 방법이 있다. 이를 위하여 문장의 유형이나 장르에 따라 클러스터링을 수행한다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 문장 사이의 문법적 구조 유사성으로 문장을 유형별로 분류하는 새로운 기법을 제시하였고, 단어 유사도 정보로 문서의 장르를 구분하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조의 유사성과 단어 유사도 계산을 위하여 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정은 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

  • PDF

Extension and Management of Verb Phrase Patterns based on Lexicon Reconstruction and Target Word Information (사전 재구성과 대역어 정보를 통한 동사구 패턴의 확장 및 관리)

  • Hong, Mun-Pyo;Kim, Young-Kil;Ryu, Chul;Choi, Sung-Kwon;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.103-107
    • /
    • 2002
  • 데이터 기반 기계번역의 성공여부는 대량의 데이터를 단기간에 구축하는 방법과, 또 구축된 데이터에 대한 효과적인 관리 방법이 좌우한다고 할 수 있다. 대표적인 데이터 기반 기계번역 방법론인 예제 기반 기계번역 방식이나 패턴 기반 기계번역 방식에서는 최소한의 학습 내지는 학습과정 없이 데이터를 구축하는 데에 연구가 중점적으로 이루어져왔으나, 데이터의 관리 문제에 대해서는 많은 연구가 이루어지지 못하였다. 그러나 데이터의 확장 못지않게 데이터의 효율적인 관리도 데이터 기반 기계번역 시스템의 개발에서 매우 중요하다. 이 논문에서는 사/피동 링크 등을 이용하여 사전을 재구성하는 것이 데이터의 일관성과 관리성을 향상시키고, 이론적인 면에서는 정보 기술상의 잉여성을 줄인다는 점을 보인다. 또한 이러한 정보에 기반하여 기구축된 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 패턴을 만들어내는 방법론도 제시한다.

  • PDF

Errors and Their Circumstances in Korean Japanese M/T Systems in Japan (일본의 한일(韓日) 기계번역(機械飜譯) 시스템에 있어서의 오역(誤譯)과 그 언어환경)

  • Kang, Yong-Hee
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.303-310
    • /
    • 1997
  • 일본의 한일(韓日) 기계번역(機械飜譯) 시스템을 평가한 결과 각기 다른 번역 시스템임에도 불구하고 오역(誤譯)의 패턴에 있어서는 유사(類似)한 점이 많았다. 이는 사전(辭典)의 입력 단위와 구문(構文)분석의 해석단계에서 오역(誤譯)의 언어환경에 대비하지 못한 점을 지적할 수 있다. 본 연구는 오역(誤譯)의 TYPE을 언어적 환경과 기계적 환경으로 구분하여 그 영향관계를 밝혀서 오역(誤譯)의 환경에 대비한 사전(辭典)과 그 모듈의 작성을 목적으로 삼는다.

  • PDF