• 제목/요약/키워드: Translation errors

검색결과 81건 처리시간 0.022초

기계번역 사후교정(Automatic Post Editing) 연구 (Automatic Post Editing Research)

  • 박찬준;임희석
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.1-8
    • /
    • 2020
  • 기계번역이란 소스문장(Source Sentence)을 타겟문장(Target Sentence)으로 컴퓨터가 번역하는 시스템을 의미한다. 기계번역에는 다양한 하위분야가 존재하며 APE(Automatic Post Editing)이란 기계번역 시스템의 결과물을 교정하여 더 나은 번역문을 만들어내는 기계번역의 하위분야이다. 즉 기계번역 시스템이 생성한 번역문에 포함되어 있는 오류를 수정하여 교정문을 만드는 과정을 의미한다. 기계번역 모델을 변경하는 것이 아닌 기계번역 시스템의 결과 문장을 교정하여 번역품질을 높이는 연구분야이다. 2015년부터 WMT 공동 캠페인 과제로 선정되었으며 성능 평가는 TER(Translation Error Rate)을 이용한다. 이로 인해 최근 APE에 모델에 대한 다양한 연구들이 발표되고 있으며 이에 본 논문은 APE 분야의 최신 동향에 대해서 다루게 된다.

게임 'Paper, Please'의 번역을 통한 콘텐츠 현지화 사례 연구: 한국어와 문화어 번역의 차이를 중심으로 (Study of Contents Localization Case on the Game 'Paper, Please': Based on the Korean and North Korean Translations)

  • 원호혁;구본혁;김형엽
    • 한국게임학회 논문지
    • /
    • 제19권2호
    • /
    • pp.145-160
    • /
    • 2019
  • 해당 연구는 게임 'Paper, Please'의 한국어(Korean) 번역본과 문화어(North Korean) 번역본에서 나타나는 차이점을 통해 언어와 이미지가 현지화에 끼치는 영향에 대해서 고찰하고자 한다. 'Paper, Please'의 문화어 번역본에 등장하는 북한의 언어와 문화적 개념은 북한의 외래어 사용하고 시대가 다른 각시탈을 비밀조직으로 차용하는 등의 오류가 존재함에도 불과하고 사람들에게 북한의 모습을 적절하게 보여주는 것으로 평가가 되었다. 이를 통해 현지화에서는 심각한 오류가 아닐 경우 사람은 이미지와 모티브로 해당 문화에 몰입하며 재미를 얻게 된다는 사실을 알 수 있다.

MOSES를 이용한 한/일 양방향 통계기반 자동 번역 시스템 (A Bidirectional Korean-Japanese Statistical Machine Translation System by Using MOSES)

  • 이공주;이성욱;김지은
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제36권5호
    • /
    • pp.683-693
    • /
    • 2012
  • 통계기반 자동 번역 시스템은 구현과 유지보수의 용이함으로 최근 많은 관심을 받고 있다. 본 연구의 목적은 MOSES[1] 시스템을 이용하여 통계기반의 한/일 양방향 기계번역시스템을 구축하는 것이다. 한/일 문장단위 병렬 코퍼스를 구축하여 번역모델 학습에 이용하였고, 한/일 각각 대량의 원시 코퍼스를 이용하여 언어모델 학습에 이용하였다. 시스템 구축 결과 기존의 규칙기반 번역 시스템의 성능에 근접하는 결과를 얻었으며, 발생하는 오류의 대부분은 각 처리 단계에서 발생하는 노이즈에 기인하였다.

온톨로지 기반 공공정보 번역 매쉬업 시스템 (Ontology-based Machine Translation Mashup System for Public Information)

  • 오경진;권기영;홍명덕;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권8호
    • /
    • pp.21-29
    • /
    • 2012
  • 본 논문에서는 외국인이 언어적인 문제점 없이 국내 문화정보 서비스를 이용하기 위한 온톨로지 기반의 번역 매쉬업 시스템을 제안한다. 문화정보 서비스를 위해 서울시 모바일 공공정보 Open API가 제공하는 문화정보를 활용하였으며, 번역을 위해서 구글 AJAX 언어 API를 이용하였다. 또한, 발생하는 번역오류를 최소화하기 위해 번역에 온톨로지를 적용하였다. 온톨로지 모델링을 위해 문화정보 도메인을 분석하고, 문화정보 어휘 온톨로지의 클래스 및 관계, 속성을 정의하였다. 문화정보를 번역하여 활용할 경우 가장 많은 번역 오류가 발생하는 제목, 장소, 주최자 등의 내용을 중심으로 온톨로지 인스턴스를 생성하였다. 온톨로지 기반 번역 매쉬업 시스템을 구현하고, 문화정보의 번역의 정확성을 실험을 통해 번역 API와의 정보 제공 정확도를 비교하였다. 실험 결과를 통해 제안하는 온톨로지 기반 번역 매쉬업 시스템의 유효성을 검증하였다.

오류분석을 통한 효율적인 영작문 지도법 (An effective teaching method of English composition through error analysis)

  • 박병제
    • 영어어문교육
    • /
    • 제1호
    • /
    • pp.159-187
    • /
    • 1995
  • The purpose of this study is to investigate common errors made by Korean learners in English composition and to find out what is an effective and appropriate teaching method of English composition in Korea. For these purposes, 197 students on the third grade in high school were selected as the subjects of this research. The students were tested by way of the immediate translation of 31 simple Korean sentences into English which are supposed to be easy for those students to write without any difficulty. About 2 minutes were given for testing each sentence. The results are as follows : First. the whole sum of errors made by 197 students was 2,972 and these types of errors were classified into 13 categories by Duskova's grammatical method and James'. The errors with comparatively high frequency were prepositional errors(17.2%), verbal errors(15.4%), and the errors with low frequency were article errors(1.9%), to-infinitive errors. Second, when Korean students learn English as a target language, overgeneralization(33.6%) and reduction(17.5) influenced the learners much more greatly than language transfer(22.2) did. But the influence of language transfer including interference & overgeneralization(l5.2%) and interference & reduction(10.7%) was no less than 48.1%. The statistics shows that the learners have a tendency to analyze, systematize and regularize the target language when they start to learn a new language.

  • PDF

인터넷 매체 언어의 국어 파괴 현상의 고찰을 통한 표준어 자동 번역 기술에 대한 연구 (Research on Automatic Translation of Standard Language through Contemplation of Korean Destruction Phenomena in Internet Media Language)

  • 박장혁;정재훈;김신령;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.273-281
    • /
    • 2016
  • 본 논문에서는 인터넷 매체 언어상에서 나타나고 있는 국어 파괴 현상의 고찰을 고찰하여, 이에 대한 기술적 개선 방법으로서 표준어 자동 번역 기술을 제안한다. 실생활 속에서 국어 파괴 현상과 관련된 경험 및 피해 사례들을 설문 조사 및 FGI(Focussed Group Interview)를 통하여 수집 및 분석한 결과를 제시하고, 분석결과 자료 기반으로, '국어 파괴도(degree of Korean destruction)'의 지표를 정의하였다. 국어 파괴도는 표준어 자동 번역 기술이 갖고 있는 번역 오류가 가진 한계를 최소화하여, 표준어 자동 번역 기술의 효율성을 최대로 활용하기 위한 척도로서 활용될 수 있음을 인터넷 매체 문장 2,480 개의 분석을 통하여 제시하였다. 본 논문에서 제안된 국어 파괴도 측정 및 표준어 자동 번역 기술은 Java 언어를 사용하여 REST API 형태로 구현하였으며, 웹브라우저상에서 동작을 확인하였다.

한국어 대화체 음성언어 번역시스템에서의 개념기반 번역시스템 (Concept-based Translation System in the Korean Spoken Language Translation System)

  • 최운천;한남용;김재훈
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2025-2037
    • /
    • 1997
  • 대화체 음성언어번역시스템의 일부인 개념기반 번역시스템은 음성인식의 결과를 이용하여 다른 언어로 번역해 주는 시스템이다. 본 논문은 여행계획 영역에 대해 한국어를 해석하여 영어, 일본어, 한국어로 번역해 주는 시스템에 대해 기술한 것이다. 개념기반 번역은 비정형 문장이 많은 대화체 문장을 처리하기 위해 형태소 분석 등의 구문정보를 이용하지 않고, 의미단위의 번역을 시도한 것으로 화자의 의도를 정확히 번역해 주는 것을 목표로 한다. 개념기반 번역은 280여개의 개념과 개념간의 계층구조에 의해, 인식결과를 개념구조로 변환한 후 다른 언어로 생성해 준다. 효율적인 한국어 처리를 위해 기준단어를 이용한 토큰분리기와 문법자동 수정기를 개발하였다. 그리고 자연스러운 생성문을 위해 각 언어에 대한 후처리기를 개발하였다.

  • PDF

이차함수 그래프에 관련된 중학교 3학년 학생들이 범하는 오류와 교정 (A study on the Analysis and the Correction of third-year Middle School Students Error Related to Graph of Quadratic Function)

  • 구영화;강영욱;류현아
    • East Asian mathematical journal
    • /
    • 제30권4호
    • /
    • pp.451-474
    • /
    • 2014
  • The purpose of this study is to analyze error patterns third-year middle school students make on quadratic function graph problems and to examine about the possible correct them by providing supplementary tutoring. To exam the error patterns that occur during problem solving processes, to 82 students, We provided 25 quadratic function graph problems in the preliminary-test. The 5 types of errors was conceptual errors, false intuition errors, incorrect use of conditions in problems, technical errors, and errors from slips or carelessness. Statistical analysis of the preliminary-test and post-test shows that achievement level was higher in the post-test, after supplementary tutoring, and the t-test proves this to be meaningful data. According to the per subject analyses, the achievement level in the interest of symmetry, parallel translation, and general graph, respectively, were all higher in the post-test than the preliminary-test and this is meaningful data as well. However, no meaningful relation could be found between the preliminary-test and the post-test on other subjects such as graph remodeling and relations positions of the parabola. For the correction of errors, try the appropriate feedback and various teaching and learning methods.

데버러 스미스(Deborah Smith)의 『채식주의자』 다시쓰기: 번역 관점에서 본 문제점 및 향후 과제 (Deborah Smith's Rewriting of Ch'aesikjuuija: Thoughts from a Translation Perspective)

  • 신혜정
    • 한국콘텐츠학회논문지
    • /
    • 제17권10호
    • /
    • pp.657-666
    • /
    • 2017
  • 본 논문은 2016년 맨부커 인터내셔널상(The Man Booker International Prize)을 수상한 The Vegetarian을 둘러싼 언론과 학계의 엇갈린 평가와 오역논란을 살펴보았다. 한강의 "채식주의자"와 데버러 스미스(Deborah Smith)의 The Vegetarian을 분석한 결과, The Vegetarian에서 다수의 오역사례를 확인할 수 있었다. 본 논문은 단순 오역 지적을 넘어 스미스가 '오역'하게 된 경위를 역으로 짚어 봄으로써 The Vegetarian 이 번역이 아닌 로컬리제이션(localization)으로 방향을 설정한 영어 현지화 텍스트임을 밝힌 데 의의가 있다. 결론에서는 스미스의 "채식주의자" 다시쓰기(rewriting)인 The Vegetarian의 성과를 논하고 독자 선택을 돕는 번역 방법을 제시함으로써 향후 한국문학의 영어번역이 나아갈 방향을 제안한다.

전이학습 기반 기계번역 사후교정 모델 검증 (The Verification of the Transfer Learning-based Automatic Post Editing Model)

  • 문현석;박찬준;어수경;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.27-35
    • /
    • 2021
  • 기계번역 사후교정 (Automatic Post Editing, APE)이란 번역 시스템을 통해 생성한 번역문을 교정하는 연구 분야로, 영어-독일어와 같이 학습데이터가 풍부한 언어쌍을 중심으로 연구가 진행되고 있다. 최근 APE 연구는 전이학습 기반 연구가 주로 이루어지는데, 일반적으로 self supervised learning을 통해 생성된 사전학습 언어모델 혹은 번역모델이 주로 활용된다. 기존 연구에서는 번역모델에 전이학습 시킨 APE모델이 뛰어난 성과를 보였으나, 대용량 언어쌍에 대해서만 이루어진 해당 연구를 저 자원 언어쌍에 곧바로 적용하기는 어렵다. 이에 본 연구에서는 언어 혹은 번역모델의 두 가지 전이학습 전략을 대표적인 저 자원 언어쌍인 한국어-영어 APE 연구에 적용하여 심층적인 모델 검증을 진행하였다. 실험결과 저 자원 언어쌍에서도 APE 학습 이전에 번역을 한차례 학습시키는 것이 유의미하게 APE 성능을 향상시킨다는 것을 확인할 수 있었다.