• 제목/요약/키워드: 자동 번역

검색결과 218건 처리시간 0.032초

최신 기계번역 사후 교정 연구 (Recent Automatic Post Editing Research)

  • 문현석;박찬준;어수경;서재형;임희석
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.199-208
    • /
    • 2021
  • 기계번역 사후교정이란, 기계번역 문장에 포함된 오류를 자동으로 교정하기 위해 제안된 연구 분야이다. 이는 번역 시스템과 관계없이 번역문의 품질을 높이는 오류 교정 모델을 생성하는 목적을 가진 연구로, 훈련을 위해 소스문장, 번역문, 그리고 이를 사람이 직접 교정한 문장이 활용된다. 특히, 최신 기계번역 사후교정 연구에서는 사후교정 데이터를 통한 학습을 진행하기 이전에, 사전학습된 다국어 언어모델을 활용하는 방법이 적용되고 있다. 이에 본 논문은 최신 연구들에서 활용되고 있는 다국어 사전학습 언어모델들과 함께, 해당 모델을 도입한 각 연구에서의 구체적인 적용방법을 소개한다. 나아가 이를 기반으로, 번역 모델과 mBART모델을 활용하는 향후 연구 방향을 제안한다.

영한 기계번역에서 전치사구를 해석하는 시스템 (An Analysis System of Prepositional Phrases in English-to-Korean Machine Translation)

  • 강원석
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1792-1802
    • /
    • 1996
  • 영한 기계번역에서 전치사구의 해석 부착의 문제(Attachment Problem)와 의미 해석의 문제, 그리고 해석에 필요한 정보 획득의 문제가 있다. 이 세 가지 문제를 해결하기 위하여 본 논문은 전치사구 해석 시스템을 제시한다. 이 시스템은 규칙 제어기와 신경망의 하이브리드 구문해석 시스템, 격의미 해석 시스템, 그리고 신경망 의 입력 정보를 자동으로 생성하는 의미속성 생성기로 구성한다. 의미속성 생성기는 시스템의 입력이 되는 의미속성을 자동으로 생성하는 방법으로 인위적인 방법의 단점 을보완하여 객관성 있는 전치사구 해석을 하게 한다. 격의미 해석 시스템은 영한 기계 번역에 맞는 격의미를 찾아내어 자연스런 한국어 생성을 하게 하고 구문해석 시스템은 규칙 방법의 장점과 신경망 방법의 장점을 취한 하이브리드 방식의 시스템으로 전치사 구 부착의 문제를 해결한다.

  • PDF

번역과 웹그래프를 활용한 언어 간 위키피디아 인포박스 자동생성 기법 (An Approach to Automatically Generating Infobox for Wikipedia in Cross-languages through Translation and Webgraph)

  • 김은경;최동현;고은비;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2011
  • 여러 언어로 작성되는 위키피디아의 경우 언어 간에 등록되어 있는 정보의 양과 내용이 달라 언어 간 정보를 상호 추출하고 서로 통합하는 연구에 대한 관심이 증가하고 있다. 특히, 위키피디아의 요약본으로써 의미가 있는 인포박스는 위키피디아 아티클에 존재하는 구조화된 정보 중 가장 근간이 되는 정보로, 본 논문에서는 위키피디아에 존재하는 인포박스를 1)소스 언어 자원으로부터 획득하여 타겟 언어로 번역하고, 2)번역된 결과물과 웹그래프를 이용하여 타겟 언어 데이터에서 획득하는 정보와 결합하는 과정을 통해 자동으로 인포박스를 생성하는 기법에 대하여 설명한다. 웹그래프는 위키피디아에 존재하는 링크 구조를 통해 서로 다른 두 용어간의 관련도를 측정하여 인포박스에 추가될 내용을 파악하는데 사용한다. 본 논문의 기법은 언어 간 인포박스를 생성하는 측면에서, 영어 인포박스 데이터를 입력으로 하여 한국어 인포박스 데이터를 생성하는 방식으로 진행하였다. 평가를 위하여 기존 한국어에 실제 존재하는 인포박스 데이터와 비교 실험하는 방식을 사용하여 평균적으로 40%의 정확률과 83%의 재현율을 나타내었다. 하지만, 기존 한국어에 존재하는 인포박스 데이터의 내용이 인포박스에 포함될 완전한 데이터를 모두 포함했다고 볼 수 없으므로 본 논문에서 제안하는 수행한 실험의 정확률이 상대적으로 낮게 나온 것으로 분석되었다. 실제 사람이 수작업으로 새롭게 생성된 인포박스 데이터의 적합성을 판별한 경우 평균 76%의 정확률과 91%의 재현율을 나타내었다.

  • PDF

음성정보처리 기술 개발 현황 및 전방

  • 김회린
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.25-32
    • /
    • 2004
  • 미국 MIT의 기술혁신 잡지인 테크놀로지 리뷰(Technology Review)는 2004년 2월호에서 미래를 변화시킬 10대 기술(10 emerging technologies that will change your world) 중 그 첫 번째로 만국어 번역 (Universal Translation)을 선정하였다. 만국어 번역은 통역자가 중간에서 어떤 음성언어를 상대방 언어로 즉시 통역해 주는 일을 컴퓨터가 자동으로 처리해 주는 것이다. 이 기술이 상용화되면 그 사회적 파급효과가 실로 지대한 꿈같은 기술로서이 기술의 핵심에는 음성정보처리 기술 및 언어정보처리 기술이 자리 잡고 있다.(중략)

  • PDF

프로토콜 공학기술 : 적합성시험언어 번역기술 (Translation Technology of Conformance Test Language)

  • 김광수;강태운;임주환
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1991년도 추계종합학술발표회논문집
    • /
    • pp.196-198
    • /
    • 1991
  • 분산 시스팀 환경하에서 여러 다양한 구성요소사이의 상호작용과 통신을 관장하는 규칙들인 프로토콜을 설계하는데 있어서 컴퓨터 과학 및 공학 영역의 형식방법과 소프트웨어 공학기법이 적용되고 있다. 그 결과로서 새로운 영역인 프로토콜 공학(Protocol Engineering)의 중요성이 점차 대두되고 있다. 본 연구에서는 프로토콜 공학 사이클(프로토콜과 서비스 명세, 프로토콜 검정과 검증, 프로토콜 종합, 프로토콜 변환, 성능 평가, 자동 구현, 그리고 적합성 시험) 중에서 적합성시섬 즉, 적합성 시험언어인 TTCN(Tree and Tabular Combined Notation) 특성, 시험시나리오, 그리고 추상적 시험 시나리오를 수행하는 시험언어 번역기(TTCN2C)에 관해서 논하였다.

한영 자동 번역을 위한 한국어 구문 분석 전처리 (Pre-Processing of Korean Syntactic Analyzer for Korean to English MT)

  • 김영길;양성일;서영애;김창현;홍문표;최승권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.175-177
    • /
    • 2001
  • 형태소 해석 결과 생성되는 형태소 옅은 구문 분석을 수행하기에는 적절하지 않은 구문 단위로 구성되어 있는 경우가 많으며 이로 인해 구문 분석기가 불필요한 연산을 수행하여 과도한 구문 트리를 생성하는 원인이 된다. 따라서 본 논문에서는 한영 자동 번역의 한국어 구문 분석기 성능 향상 및 자연스러운 대역문 생성을 위하여 시간 부사구와 명사구에 대한 구묶음을 위한 구문 분석 전처리 방법을 제안하며 이를 위한 각 구 단위의 대역 패턴을 정의한다. 방송자막 및 매뉴얼 문장을 대상으로 실험한 결과, 각 문장 구문 단위를 평균적으로 26% 정도 감소시킴으로써 불필요한 파스 트리의 생성을 배제하여 구문 분석기의 성능을 향상시킬 수 있었다.

  • PDF

특허 News

  • (사)한국여성발명협회
    • 발명하는 사람들
    • /
    • 23호
    • /
    • pp.2-2
    • /
    • 2004
  • 건강 만점 원적외선 복합 사우나 관련 출원 증가 - 나노구조, 자기조립으로 해결한다! - 무역센터 특허 에너지 시스템 통해 8억원 절감 - 특허청, ETRI와 공동으로 특허문서 한영자동번역 시스템 개발 - 수출품 특허전쟁 `특허분쟁센터`에서 맡는다

  • PDF

네트웍 관리를 위한 MIB의 자동생성 (Automatic Generation of MIB for Network Management)

  • 유재우;김영철;김성근
    • 한국통신학회논문지
    • /
    • 제25권6A호
    • /
    • pp.848-854
    • /
    • 2000
  • TMN에서의 네트웍 관리는 네트웍에 존재하는 운영체제나 통신 장비를 객체로 정의하고 관리한다. 이들 객체를 기술하기 위해 GDMO(Guidelines for the DefInition of Managed Objects)를 사용하고 있다. GDMO는 네트웍 관리를 위해 직접 이용되지 않으며, 객체지향 파라다임을 가지는 언어로 변환되어 사용된다. 또한 GDMO는 객체들을 관리하기 위하여 ASN.1(Abstract Syntax Notation One)을 참조한다. 본 논문에서는 ASN.1 & GDMO 명세를 Managed object Instance Base(MIB) 생성에 사용되는 객체지향 언어로 자동 번역하는 번역기를 설계하고 구현하였다. 본 시스템은 기존의 네트워크 관리를 위한 원시코드 생성기와는 달리 MIB 생성에 이용될 수있는 다양한 객체지향 언어를 자동 생성할 수 있도록 고안되었으며, ASN.1과 GDMO를 하나의 부라우져에서 처리할 수 있는 통합 환경을 제공함으로써 응용프로그램을 개발하는데 편리하도록 하였다.

  • PDF