• 제목/요약/키워드: 오번역

검색결과 33건 처리시간 0.024초

극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템 (Automatic English-Korean Address Translation System for Extremely Unpredictable Error Generating Language Environments)

  • 김경식;황명진;이승필
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.239-242
    • /
    • 2016
  • 데이터베이스 기반 자동 주소번역은 입력 오류에 취약하며 범용 기계번역을 이용한 주소번역은 입력 및 번역 주소에 대한 품질 평가가 어렵다. 본 논문에서는 예측할 수 없는 입력 오류에도 대응할 수 있는 자동 주소번역 시스템을 제안한다. 제안 시스템은 n-gram 기반 검색, 미검색/오검색 분류, 번역, 신뢰도 자동평가로 구성된다. 신뢰할 수 있는 입력으로 자동 분류한 영문 국내주소를 국문으로 번역한 결과 95%이상의 정확도를 보였다.

  • PDF

숫자 기호화를 통한 신경기계번역 성능 향상 (Symbolizing Numbers to Improve Neural Machine Translation)

  • 강청웅;노영헌;김지수;최희열
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1161-1167
    • /
    • 2018
  • 기계 학습의 발전은 인간만이 할 수 있었던 섬세한 작업들을 기계가 할 수 있도록 이끌었고, 이에 따라 많은 기업체들은 기계 학습 기반의 번역기를 출시하였다. 현재 상용화된 번역기들은 우수한 성능을 보이지만 숫자 번역에서 문제가 발생하는 것을 발견했다. 번역기들은번역할문장에 큰숫자가 있을경우종종숫자를잘못번역하며, 같은문장에서숫자만바꿔번역할 때문장의구조를 완전히바꾸어 번역하기도 한다. 이러한 문제점은오번역의 가능성을 높이기 때문에해결해야 될 사안으로여겨진다. 본 논문에서는 Bidirectional RNN (Recurrent Neural Network), LSTM (Long Short Term Memory networks), Attention mechanism을 적용한 Neural Machine Translation 모델을 사용하여 데이터 클렌징, 사전 크기 변경을 통한 모델 최적화를 진행 하였고, 최적화된 모델에 숫자 기호화 알고리즘을 적용하여 상기 문제점을 해결하는 번역 시스템을 구현하였다. 본논문은 데이터 클렌징 방법과 사전 크기 변경, 그리고 숫자 기호화 알고리즘에 대해 서술하였으며, BLEU score (Bilingual Evaluation Understudy score) 를 이용하여 각 모델의 성능을 비교하였다.

극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템 (Automatic English-Korean Address Translation System for Extremely Unpredictable Error Generating Language Environments)

  • 김경식;황명진;이승필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-242
    • /
    • 2016
  • 데이터베이스 기반 자동 주소번역은 입력 오류에 취약하며 범용 기계번역을 이용한 주소번역은 입력 및 번역 주소에 대한 품질 평가가 어렵다. 본 논문에서는 예측할 수 없는 입력 오류에도 대응할 수 있는 자동 주소번역 시스템을 제안한다. 제안 시스템은 n-gram 기반 검색, 미검색/오검색 분류, 번역, 신뢰도 자동평가로 구성된다. 신뢰할 수 있는 입력으로 자동 분류한 영문 국내주소를 국문으로 번역한 결과 95%이상의 정확도를 보였다.

  • PDF

동의어와 용어에 대한 번역 신뢰도 개선 방법 (The Way to Improve Credibility of Translation for Synonyms and Terms)

  • 임지연;윤재열;김이준;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1095-1096
    • /
    • 2012
  • 인터넷의 비약적인 발전으로 우리는 생활에 필요한 많은 것들을 인터넷을 통해 얻는다. 날씨, 뉴스, 만화, 나아가서는 전공 공부까지 많은 정보를 인터넷에서 얻을 수 있다. 또한 이러한 여러 서비스를 제공하고 있는 포털사이트에서는 무료 번역기 또한 무료로 제공하고 있다. 하지만 무료로 제공하는 만큼 번역기의 신뢰도가 높지 않아, 실제 사용함에 있어 실제 번역에 제약이 있기 마련이다. 이러한 점에서 본 논문에서는 수많은 사람들이 작성한 정보를 통해 문맥 속에서 쉽게 틀릴 수 있는 전공 용어의 올바른 해석을 위해 오피니언 마이닝 기법 중 PMI-IR 수식을 이용하여 번역기의 신뢰도를 개선하는 방법을 제안한다.

서평 - 공유의 비극을 넘어

  • 이성희
    • 한국관개배수회지
    • /
    • 제45호
    • /
    • pp.55-56
    • /
    • 2010
  • 이 책은 엘리너 오스트롬(Elinor Ostrom)이 출간한 Governing The Commons(1990)의 국문 번역서로서 관개배수와 관련된 전공서적은 아니지만, 관개배수 정책에 관심 있는 전문가 및 실무자들이 읽어볼만한 책이다.

  • PDF

이인전류 영역(英譯) 양상과 번역 태도 (The aspect and attitude toward translation of a prodigy man story - in The Classical Novels of Korea)

  • 최윤희
    • 동양고전연구
    • /
    • 제49호
    • /
    • pp.461-486
    • /
    • 2012
  • 이 논문은 한국고전문학의 영역(英譯)에 대해 논의한 것이다. 영역(英譯)에 대한 논의 범주를 소설에서 확장하여 인물전 작품의 영역(英譯) 양상과 번역 태도를 살피고자 하였다. 논의 대상으로 삼고 있는 "The Classical Novels of Korea"는 한국문화예술진흥원에서 발행한 한국문화예술에 대한 소개 시리즈 총서의 두 번째 책이다. 이 책에 5개의 작품이 영역되어 있는 데 그 가운데 이인전류 <장생전>, <검승전>, <오대검협전>을 논의하였다. 이들의 영역(英譯)은 번역 과정에서 나타나는 일반적 양상과 동일하였다. 생략과 첨가, 의역과 오역 현상이 나타났다. 보다 주목할 점은 이인전에 대한 번역 태도에 있다. 사건의 나열과 포폄의식으로 특징지어지는 전의 양식적 특징은 약화되고 이야기성이 강화되는 방향에서 서사성이 원텍스트 보다 더욱 강화되는 양상을 보였다. 이는 한국문학에 대한 흥미와 관심을 유발하고자 하는 "The Classical Novels of Korea"의 번역 목적에는 부합하는 것이다. 다만, 학습 및 연구 목적을 두고 이인전류가 영역(英譯)될 때는 전(傳)의 양식적 특징과 주제의식이 드러날 수 있도록 되어야 할 것이다.

응구기 와 시옹오의 문화이론과 번역의 의미 (Ngugi wa Thiong'o's Cultural Theory and Its Significance in Translation)

  • 이효석
    • 비교문화연구
    • /
    • 제46권
    • /
    • pp.411-434
    • /
    • 2017
  • 응구기는 최근 기쿠유어로 쓴 자신의 작품을 50여개 이상의 아프리카 지역어로 번역하는 작업에 관여하고 있다. 이는 로컬의 다양한 언어와 문화의 가치를 수호하기 위해 서구의 강한 언어와 문화에 맞서는 구체적인 행동이다. 한편 응구기는 자신의 작품을 영어로도 직접 번역하였는데, 이는 아프리카 문화의 폐쇄성을 막고 외부의 지평으로 열어두는 수평적 운동을 위한 것이다. 요컨대 주변부 언어 간의 대화도 중요하지만, 지배언어와 주변부 언어 간의 대화 역시 중요하다는 것을 강조하고 있는 것이다. 이때 번역이 이러한 역할을 수행하는 가교가 된다고 본다. 한편 사이먼 기칸디와 같은 학자는 응구기의 영어소설은 응구기 자신이 보존하려는 기쿠유어가 아니라 오히려 번역언어인 영어를 더욱 강화시켜 주는 것은 아닌지 의심한다. 강한 언어인 영어로의 번역본이 상대적으로 소수언어인 기쿠유 원본의 존재와 권위를 훼손하는 딜레마에 빠지게 된다는 것이다. 그러나 포스트식민 번역을 다루는 여러 학자들은 '두터운' 번역이 원본의 권위를 훼손하기 보다는 일종의 '새로운' 텍스트로서 문화적 대화와 소통의 메커니즘 속에서 작동한다고 주장한다. 또 응구기는 영어 번역본을 통해 아프리카 외부와 소통하고 아프리카 다양한 지역어로의 번역을 통해 내부와 소통하는 이중적인 전략을 구사한다. 응구기는 번역을 다양한 보편들의 대화와 연대, 나아가 보편적 보편을 탐색하는 가능성의 매체로 본다.

MPEG-21 RDD를 위한 다중언어 레지스트리 (Multilingual Registry for MPEG-21 RDD)

  • 정상원;오원근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1467-1470
    • /
    • 2003
  • 이 논문은 디지털 콘텐츠의 권리표현을 위한 용어사전인 MPEG-21 RDD 의 내용과 구조에 대해 설명한 다음, 영어로 표현된 RDD용어를 제 3의 언어로 번역하는 데에서 생기는 상호운용성의 문제점을 해결하기 위한 방법으로서 다중 언어 RDD 레지스트리를 제안하였다. 또, 제안된 레지스트리의 기능과 구조를 설명한 다음 시스템의 설계 구현내용을 기술하였다.

  • PDF

가잠 견장형란에 있어서 유전자의 발현기구 - 특히 미수정란을 중심으로 - (Gene Expression of the Kidney Mutant in Bombyx mori - Biochemical Analysis of Yolk Protein and Template Activity of RNA in Unfertilized Egg.)

  • 노시갑;손해룡;판구문오
    • 한국잠사곤충학회지
    • /
    • 제28권2호
    • /
    • pp.15-20
    • /
    • 1986
  • 가잠 신장형란의 배자형성에 있어서 유전자의 발현기구를 해명하기 위한 연구의 일환으로, 미수정란 난황단백질과 미수정란으로부터 추출한 RAN의 무세포단백질 합성계에서의 번역활성능에 대해 검토했다. 그 결과, ki란 미수정란의 난황단백질은 질적인 면에서 볼 때 정상란과의 차이를 인정할 수 없었다. 또한 in vitro 무세포 단백질 합성계에서 번역활성능을 가진 모성유래의 mRNA 분자종에 있어서도 ki란은 정상란과의 비교에서 이렇다 할 차이가 없었다.

  • PDF

영어 SentiWordNet을 이용하여 구축한 한국어 감성어휘사전의 성능 평가와 한계 연구 (Performance and Limitations of a Korean Sentiment Lexicon Built on the English SentiWordNet)

  • 신동혁;김새롬;조동희;뉘엔 민디오;박순강;어건주;남지순
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.189-194
    • /
    • 2016
  • 본 연구는 다국어 감성사전 및 감성주석 코퍼스 구축 프로젝트인 MUSE 프로젝트의 일환으로 한국어 감성사전을 구축하기 위해 대표적인 영어 감성사전인 SentiWordNet을 이용하여 한국어 감성사전을 구축하는 방법의 의의와 한계점을 검토하는 것을 목적으로 한다. 우선 영어 SentiWordNet의 117,659개의 어휘중에서 긍정/부정 0.5 스코어 이상의 어휘를 추출하여 구글 번역기를 이용해 자동 번역하는 작업을 실시하였다. 그 중에서 번역이 되지 않거나, 중복되는 경우를 제거하고, 언어학 전문가들의 수작업으로 분류해낸 결과 3,665개의 감성어휘를 획득할 수 있었다. 그러나 이마저도 병명이나 순수 감성어휘로 보기 어려운 사례들이 상당수 포함되어 있어 실제 이를 코퍼스에 적용하여 감성어휘를 자동 판별했을 때에 맛집 코퍼스에서의 재현율(recall)이 긍정과 부정에서 각각 47.4%, 37.7%, IT 코퍼스에서 각각 55.2%, 32.4%에 불과하였다. 이와 더불어 F-measure의 경우, 맛집 코퍼스에서는 긍정과 부정의 값이 각각 62.3%, 38.5%였고, IT 코퍼스에서는 각각 65.5%, 44.6%의 낮은 수치를 보여주고 있어, SentiWordNet 기반의 감성사전은 감성사전으로서의 역할을 수행하기에 충분하지 않은 것으로 나타났다. 이를 통해 한국어 감성사전을 구축할 때에는 한국어의 언어적 속성을 고려한 체계적인 접근이 필요함을 역설하고, 현재 한국어 전자사전 DECO에 기반을 두어 보완 확장중인 SELEX 감성사전에 대해 소개한다.

  • PDF