• 제목/요약/키워드: 번역어

검색결과 263건 처리시간 0.02초

C-STAR 인터체인지 포멧을 이용한 다국어 대화체 번역시스템의 성능 (Performance of Multi-Lingual Spoken Language Translation System using C-STAR Interchange Format)

  • 최운천;박준;양재우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-202
    • /
    • 1999
  • ETRI 통신단말연구부에서는 1999년 7월 22일에 C-STAR 회원국이 함께 참여하는 국제간 음성언어번역 시스템 공동 시연을 가졌다. 이 논문은 다국어 대화체 번역시스템인 음성언어번역 시스템의 국제간 공동 시연에 사용된 한국어 번역 시스템의 성능에 대해 기술한다. 번역 시스템의 성능은 전사문장을 이용한 영어, 일본어, 한국어의 번역 결과와 음성인식 결과를 이용한 각 언어의 번역 결과를 평가하여 얻었다. 그리고 세부 시스템의 성능을 알아보기 위해 음성인식의 결과로부터 C-STAR IF(interchange format)까지의 해석 시스템과 C-STAR IF로부터 한국어, 영어, 일본어로 생성해 내는 생성 시스템의 성능으로 나누어서 평가한다.

  • PDF

번역메모리(Translation Memory) 기반 자동번역 및 번역지원(Computer Aided Translation)시스템

  • 강명주
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.98-103
    • /
    • 2004
  • 자동 번역에 대한 연구는 1940년대부터 시작되었고, 이 때의 연구는 일반 사람들에게는 거의 알려져 있지 않았으며. 본격적인 연구는 컴퓨터가 나오게 되는 1950년대부터 시작되었다. 이들이 생각했던 자동 번역은 두 언어간의 단어들을 교환하여 대치시키고 단어 방으로 이루어진 전자사전을 컴퓨터에 입력하여 번역하는 형태였다. 이 시기에 사용한 언어 쌍은 영어-러시아어였으며 주로 군사적인 목적으로 미국과 구 소련에서 연구되었다[1, 2].(중략)

  • PDF

외국인 관광객을 위한 다국어 통번역 시스템 (Multilingual Speech and Machine Translation System for Foreign Tourists)

  • 최승권;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.665-666
    • /
    • 2016
  • 본 논문은 현재 개발 중에 있는 외국인 관광객을 위한 다국어 통번역 시스템을 기술하는 것을 목표로 한다. 다국어 통번역 시스템에서 개발 중에 있는 언어는 한국어, 일본어, 중국어, 영어, 스페인어, 불어, 독일어, 러시아어이다. 이렇게 개발된 다국어 통번역 시스템은 2018년 평창 동계 올림픽 때 다국어 통번역 서비스를 제공할 예정이다. 현재의 다국어 통번역 시스템의 성능은 번역만 보았을 때, 영한 87.63%, 한영 88.21%, 중한 85.38%, 한중 77.94%, 일한 89.00%, 한일 86.69%, 스한 76.90%, 한스 77.46%, 불한 76.28%, 한불 79.78%이다.

k-최근점 학습에 기반한 타동사-목적어 연어 사전의 최적화 (Optimization of Transitive Verb-Objective Collocation Dictionary based on k-nearest Neighbor Learning)

  • 김유섭;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권3호
    • /
    • pp.302-313
    • /
    • 2000
  • 영한 기계번역에서 영어 문장의 동사구를 한국어로 정확하게 번역하기 위해서는 일반적으로 타동사와 목적어의 연어 관계를 이용한다. 본 논문에서는 k-최근점(k-nearest neighbor) 학습을 연어 관계에 적용하여 동사 번역을 선택하는 알고리즘을 제시하였는데 k-최근점 학습을 위해서 워드넷에서의 의미거리를 정의하여 사용하였다. 그리고 실시간 번역 시스템에 사용될 사전을 구성하기 위하여, 말뭉치로부터 타동사-목적어 쌍을 추출하여 학습예제를 구축하고, 이 예제의 크기를 번역률과 연관시켜 최적화시키는 알고리즘을 제시한다. 본 논문에서는 위의 알고리즘들을 사용하여 동사 'build'의 번역률을 약 90%로 유지하면서 사전의 크기를 최적화하였다.

  • PDF

논변, 논의 그리고 논증: 개념의 명료화를 위한 문헌조사 연구 (Argument and Argumentation: A Review of Literature for Clarification of Translated Words)

  • 강남화;이은경
    • 한국과학교육학회지
    • /
    • 제33권6호
    • /
    • pp.1119-1138
    • /
    • 2013
  • 국내 과학교육연구 문헌에서 argument와 argumentation이 소개되고 연구되어온 지 거의 10년이 되었고, 그 용어가 크게 세 가지 단어로 번역이 됨을 관찰할 수 있다. 이 연구의 목적은 국내 과학교육 문헌에서 두 용어가 어떻게 정의되고 있으며, 어떤 상황에서 사용하는지를 고찰하여 다양하게 번역된 용어들의 의미를 명료화하는 것이다. 이를 위해 번역의 다양성에 관한 철학적 관점에서 외국 과학교육 문헌에서 argument와 argumentation의 정의와 그 연구 맥락을 검토하고, 국내의 관련 문헌을 고찰하였다. 고찰된 문헌은 2000년 이후 제목에 argument와 argumentation을 포함하는 79개의 외국 주요 과학교육저널에 실린 논문과 그 두 용어의 번역어를 제목에 포함한 37개의 국내 과학교육 논문이다. 분석 결과 국내 연구자들은 연구 맥락에 따라 argument와 argumentation을 일반적인 상황에서의 정의 또는 탐구의 한 측면과 같은 구체적인 상황에 기인한 정의를 제시하는 것으로 드러났다. 대부분의 국내 과학교육 논문에서 번역 용어의 다양성에 관해 명시적으로 언급하지 않았으며, 언급한 경우에도 하나의 예외를 제외하고 선택한 번역용어를 사용한 이유를 제시하지 않았다. 또한 argument 또는 argumentation의 정의를 위해 여러 연구자들이 동일한 외국 문헌을 고찰하였음에도 불구하고 연구자마다 서로 다른 번역어를 사용하였다. 이는 그 용어의 정의와 특정 번역어의 사용은 연구자들에게는 관련이 없음을 보여주었다. 반면, 특정 연구 집단이 특정 번역어를 일관되게 사용하는 것으로부터 번역이 실천적 습관일 수 있다고 분석하였다. 연구결과로부터 번역 용어의 결정에 관한 입장을 연구 전문성과 연구집단 간의 의사소통의 측면에서 제시하였다.

중간언어에 기반한 기계 번역시스템의 설계 (Design of a Multilingual Translation System Based on Interlingual Approach)

  • 김상국;박창호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.521-526
    • /
    • 1993
  • 다언어간 번역을 지향하는 기계번역시스템의 개발을 위해서는, 의미 이해기반의 해석기술과 언어에 독립적인 생성기술의 설계가 기본이므로 원시언어와 목표언어가 어느 한쪽의 언어지식에 의존하지 않고 언어형식화가 가능한 중간언어 구조를 설정하는 것이 중요하다. 따라서, 한국어를 중심으로 하는 다언어 번역의 설계에서는 비교적 문구조의 정형화가 이루어진 영어와는 달리 어순 배열의 자유도가 높고 조사의 격표시로 문장구조가 결정되는 한국어의 특성을 고려한 해석 및 생성 메카니즘이 필요하다. 본 논문에서는 문장에 내포된 심층의미의 중간 표현으로써, 단어의 의미를 개념화시킨 개념소(Conceptual Primitive)간의 의미적 결합관계를 나타내는 개념 그래프(Conceptual Graph)를 채택하고 설계한 다언어 번역지향의 중간언어기반 번역시스템에 대하여 기술한다.

  • PDF

《목양애화(牧羊哀話)》의 시대별 한국어 번역 전략 연구 (A Study on the Korean Translation Strategy of 《Mu Yang Ai Hua, 牧羊哀話》 by Period)

  • 문대일
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.377-382
    • /
    • 2021
  • 《牧羊哀話, 목양애화》는 중국현대문학사상 최초의 한인제재 소설로 알려져 있으며, 저자가 직접 한국을 방문하고 영감을 얻어 창작한 소설로 유명하다. 《목양애화(牧羊哀話)》의 번역본은 꾸준히 재번역(4종)되고 있다. 이러한 번역본은 시기별 특성도 반영하고 있으며, 활용한 번역 전략도 각기의 특징을 가지고 있다. 본 연구를 통해 4종의 번역본을 비교 분석한 결과는 다음과 같다. A역은 일제시기 출판된 작품으로 검열을 피하기 위해서 역자의 의도에 따라 일정부분이 축소, 생략되었으며 이국화 번역 전략을 사용하였다. B역, C역, D역은 많은 부분 자국화 번역 전략을 활용하여 내용적 등가를 구현해 내었으며, 독자의 이해를 돕기 위해서 부분적으로 보충설명을 덧붙여 놓았다. 번역은 의사소통의 과정이므로 단순히 원천 텍스트를 목표 텍스트로의 전환하는 것이 아니라, 작품에 대한 목표어 독자들의 반응이 출발어 독자들의 반응과 같아야만 한다. 때문에 번역은 시대 환경과 독자층을 감안해야만하며, 가능한 모든 방법을 동원하여 독자로 하여금 원문을 읽은 것과 같은 감동과 공감을 이끌어내야 한다. 그러므로 번역자는 목표어와 도착어 국가의 정치, 경제, 역사, 문화 등에 대한 이해를 바탕으로 자(이)국화 전략은 동시에 적절히 활용할 필요가 있다.

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족 문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

대화체 문장 번역을 위한 토큰기반 변환중심 한일 기계번역 (A Token Based Transfer Driven Koran -Japanese Machine Translation for Translating the Spoken Sentences)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.40-46
    • /
    • 1999
  • 본 논문에서는 음성언어 자동 통역시스템의 일부 모듈로 구현한 한일 기계번역 시스템을 소개하였다. 이 번역시스템은 예제중심 기계번역(EBMT)에 기초를 둔 변환중심 기계번역(TDMT) 방법을 기반으로 구현하였다. 본 시스템에서는 토큰(TOKEN)이라는 새로운 번역단위를 정의하여 사용하였다. 토큰단위의 번역방법을 사용함으로써 한국어 문장의 매우 비 정형적인 점을 해결하고 번역의 질을 높일 수 있다. 본 시스템의 구문분석 단계에서는 대역어를 선정하기에 적합한 정도까지의 의존트리를 생성하는 간이파싱만을 함으로써 필요없는 노력을 경감시켰다. 대역어 사전은 한국전자통신 연구원이 수집한 음성 데이터베이스로부터 추출한 말뭉치를 사용해 구성하였다. 구현한 시스템은 여행 계획영역에서 수집된 600 발화 안의 문장을 대상으로 시험하였는데 제한된 환경에서 87%, 아무런 제약이 없는 환경에서는 71%의 성공률을 보였다.

  • PDF