• 제목/요약/키워드: 기술번역

검색결과 457건 처리시간 0.038초

기계번역과 인간번역의 혼합적 접근법 (The Blended Approach of Machine Translation and Human Translation)

  • 김양순
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.239-244
    • /
    • 2022
  • 인공신경망기계번역은 점진적으로 인간번역과 기계번역의 경계를 허물어가고 있다. 기계번역의 현재와 미래 그리고 기계번역의 장·단점을 논의하는 가운데 인간번역과 기계번역의 실제 번역사례들을 살펴보고 최근 수년간 놀라운 발전을 이룬 인공신경망기계번역이 왜 인간번역의 손길을 필요로 하는지를 논의하는 것이 본 연구의 목표이다. 번역분야에서 인간이 기계로 대치될 수 있는가? 인공신경망기계번역 시대에 인간번역가는 도태되어야 하는가? 그리고 인공신경망기계번역과 지역의 세계화에 기반을 두고 확장하고 있는 세계영어들이라는 언어다양성 시대에 언어장벽을 없애는 것이 가능한가라는 질문 모두에 대하여 부정적인 결론과 함께 기계번역은 신속성, 정확성, 저비용의 생산성이라는 장점을 갖는 유용한 도구임에도 불구하고, 문화, 차용어, 중의성, (국가)방언, 신조어 등의 분야에서는 인간번역이 요구된다고 제안한다. 기계학습을 기반으로 하는 기계번역과 직관과 습득을 기반으로 하는 인간번역은 협업의 상태로 공생 발전해야할 것이다. 기계번역은 역 번역과 인간의 사후편집과 같은 방법을 활용할 때 도덕적 문제를 야기하지 않는 유용한 번역도구가 될 것이다. 결론적으로 기계번역은 인간번역의 손길 없이는 완성될 수 없다는 혼합적 접근법을 제안한다.

KoCED: 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋 (KoCED: English-Korean Critical Error Detection Dataset)

  • 어수경;최수원;구선민;정다현;박찬준;서재형;문현석;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-231
    • /
    • 2022
  • 최근 기계번역 분야는 괄목할만한 발전을 보였으나, 번역 결과의 오류가 불완전한 의미의 왜곡으로 이어지면서 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. 특히나 오역에 의해 변질된 의미로 인한 경제적 손실 및 위법 가능성, 안전에 대한 잘못된 정보 제공의 위험, 종교나 인종 또는 성차별적 발언에 의한 파장은 실생활과 문제가 직결된다. 이러한 문제를 완화하기 위해, 기계번역 품질 예측 분야에서는 치명적 오류 감지(Critical Error Detection, CED)에 대한 연구가 이루어지고 있다. 그러나 한국어에 관련해서는 연구가 존재하지 않으며, 관련 데이터셋 또한 공개된 바가 없다. AI 기술 수준이 높아지면서 다양한 사회, 윤리적 요소들을 고려하는 것은 필수이며, 한국어에서도 왜곡된 번역의 무분별한 증식을 낮출 수 있도록 CED 기술이 반드시 도입되어야 한다. 이에 본 논문에서는 영어-한국어 기계번역 분야에서의 치명적 오류를 감지하는 KoCED(English-Korean Critical Error Detection) 데이터셋을 구축 및 공개하고자 한다. 또한 구축한 KoCED 데이터셋에 대한 면밀한 통계 분석 및 다국어 언어모델을 활용한 데이터셋의 타당성 실험을 수행함으로써 제안하는 데이터셋의 효용성을 면밀하게 검증한다.

  • PDF

통계적 기계 번역 기술의 연구 동향

  • 김선호;윤준태;임해창
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.76-87
    • /
    • 2004
  • 기계번역은 자연어 처리 및 인공지능 분야에서 가장 어려 운 태스크 중의 하나로 인식되어 왔다. 이는 정확한 번역이란 텍스트에 대한 이해 없이는 불가능하기 때문이다. 그러한 이유로 연구자들은 한때 기계번역에 대한 부정적인 결론에 도달하기도 하였다. 지금까지 기계번역을 위해 다양한 방법이 연구되어 왔으며 이들 연구에서는 주로 두 언어에 대한어휘나 구의 대역사전, 숙어사전, 개별 언어의 문법, 혹은 변환규칙 및 변환사전, 문장생성에 관련된 지식, 의미나 실세계 지식, 도메인에 적합한 지식 등 번역의 방식과 목적에 따라 다양한 형태의 지식과 알고리즘이 적용되었으며 그 대부분은 방대한 양의 수작업에 의존적이었다.(중략)

  • PDF

『그 많던 싱아는 누가 다 먹었을까』의 중국어 번역본 비교 연구 - 4종 번역본의 번역전략을 중심으로 (A Comparative Study of Chinese Translations of 『Who ate all the Shinga?』 - Focusing on the Translation strategy of 4 types of Translations)

  • 양레이;문대일
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.403-408
    • /
    • 2022
  • 본 연구는 『그 많던 싱아는 누가 다 먹었을까』 중국어 번역본 4종의 번역 전략에 대해 분석하였다. 주지하듯, 박완서의 작품은 인물의 심리 묘사, 추상적인 어휘, 관용어, 속담, 방언 등이 많아 중국어로 번역할 때 이역, 해석역, 창조역 등 다양한 번역 전략이 요구된다. 본고에서 연구한 4종 모두 번역자에 따라 다소 상이하긴 하지만 모든 번역 전략을 복합적으로 활용하였다. 연구결과 4종 모두 지명 명사, 인물 호칭 등을 번역할 시에는 한자어를 활용한 이역 전략을 많이 활용하였다. 역사·사회·문화·지리의 배경적 해석이 필요한 어휘 등에 대한 번역은 해석역 전략을 사용하였으며, 중복, 정치·역사적으로 민감한 문제, 한국어 발음 및 문법과 관련된 문제 등을 번역할 때는 창조역 전략을 활용하였다.

영한 자동번역에서의 한국어 분류사의 반자동 구축 방법 (Semi-Automatic Building of Korean Classifiers in English-Korean MT)

  • 이기영;최승권;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.135-139
    • /
    • 2008
  • 본 논문은 영한 기계번역에서 영어 수사가 포함된 영어 명사구를 한국어로 번역할 때, 영어 명사에 대응되는 한국어 명사의 적절한 분류사를 반자동으로 구축하는 방법에 대해 기술한다. 영한 번역의 측면에서, 분류사는 목표언어인 한국어에서만 나타나는 현상이다. 따라서 영어를 한국어로 번역할 때, 적절한 분류사를 생성하지 않으면 한국어 어법에 맞지 않는 부자연스러운 번역 결과를 생성한다. 본 논문에서는 한국어 태그드 코퍼스와 한국어 의미코드 체계에 따라 한국어 분류사를 반자동으로 구축하는 방법을 제안한다. 제안하는 방법에 따라 한국어 명사에 대해서 한국어 분류사가 구축되었으며, 이렇게 구축된 분류사는 영한 기계번역시스템의 번역 사전에 'KCOUNT'라는 자질을 할당하여 부가하였다. 제안하는 방법의 검증을 위해 수동평가와 자동평가를 수행하였으며, 그 결과, 영한 기계번역의 문장 생성에 있어서 자연스러움(fluency)의 측면에서 번역률 향상이 있었다.

  • PDF

대화체 자동번역 시스템에서 대화상대 맞춤 존대표현 생성에 관한 연구 (A Study on Generation of Polite Expressions for Dialogue Participants in Machine Translation System)

  • 최승권;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.399-402
    • /
    • 2011
  • 현재의 자동번역 방식의 문제점은 대화 상대에 상관없이 항상 일정한 존대 표현을 생성하여 자동번역 결과를 부자연스럽게 만들고 앞뒤 대화 문맥을 혼란하게 만든다는 것이다. 예를 들어 대화 상대가 달라지면 동일한 원문에 대해서도 자동번역 결과는 다른 존대 표현을 생성해야 하나, 현재의 자동번역 시스템은 항상 하나의 일관된 존대 표현을 생성한다. 이 이유는 자동 번역 시스템에서 사용하는 번역지식 또는 데이터가 고정되어 있어 유동적으로 변하지 않기 때문이다. 본 논문에서는 이러한 기존 자동번역의 문제점을 해결하기 위하여, 소셜 네트워크(social network)에서 제공하는 디지털 인맥 정보와 같은 비언어적 정보와 발화상의 표현과 같은 언어적 정보로부터 대화 자간의 존대 관계를 계산하여 자동번역 결과에 반영함으로써 언어 문화적 존대 차이를 자동으로 극복하는 대화 상대 맞춤형 존대표현 자동 번역 방법을 기술하는 데 그 목적이 있다.

단어 정렬을 이용한 한국어-영어 비자기회귀 신경망 기계 번역 (Korean-English Non-Autoregressive Neural Machine Translation using Word Alignment)

  • 정영준;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.629-632
    • /
    • 2021
  • 기계 번역(machine translation)은 자연 언어로 된 텍스트를 다른 언어로 자동 번역 하는 기술로, 최근에는 주로 신경망 기계 번역(Neural Machine Translation) 모델에 대한 연구가 진행되었다. 신경망 기계 번역은 일반적으로 자기회귀(autoregressive) 모델을 이용하며 기계 번역에서 좋은 성능을 보이지만, 병렬화할 수 없어 디코딩 속도가 느린 문제가 있다. 비자기회귀(non-autoregressive) 모델은 단어를 독립적으로 생성하며 병렬 계산이 가능해 자기회귀 모델에 비해 디코딩 속도가 상당히 빠른 장점이 있지만, 멀티모달리티(multimodality) 문제가 발생할 수 있다. 본 논문에서는 단어 정렬(word alignment)을 이용한 비자기회귀 신경망 기계 번역 모델을 제안하고, 제안한 모델을 한국어-영어 기계 번역에 적용하여 단어 정렬 정보가 어순이 다른 언어 간의 번역 성능 개선과 멀티모달리티 문제를 완화하는 데 도움이 됨을 보인다.

  • PDF

문틀기반 영한 자동번역 시스템 (Sentence-Frame based English-to-Korean Machine Translation)

  • 최승권;서광준;김영길;서영애;노윤형;이현근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.323-328
    • /
    • 2000
  • 국내에서 영한 자동번역 시스템을 1985 년부터 개발한 지 벌써 15년이 흐르고 있다. 15 년의 영한 자동번역 기술개발에도 불구하고 아직도 영한 자동번역 시스템의 번역품질은 40%를 넘지 못하고 있다. 이렇게 번역품질이 낮은 이유는 다음과 같이 요약할 수 있을 것이다. o 입력문에 대해 파싱할 때 오른쪽 경계를 잘못 인식함으로써 구조적 모호성의 발생문제: 예를 들어 등위 접속절에서 오른쪽 등위절이 등위 접속절에 포함되는 지의 모호성. o 번역 단위로써 전체 문장을 대상으로 한 번역패턴이 아닌 구나 절과 같은 부분적인 번역패턴으로 인한 문장 전체의 잘못된 번역 결과 발생. o 점차 증가하는 대용량 번역지식의 구축과 관련해 새로 구축되는 번역 지식과 기구축된 대용량 번역지식들 간의 상호 충돌로 인한 번역 품질의 저하. 이러한 심각한 원인들을 극복하기 위해 본 논문에서는 문틀에 기반한 새로운 영한 자동번역 방법론을 소개하고자 한다. 이 문틀에 기반한 영한 자동번역 방법론은 현재 CNN뉴스 방송 자막을 대상으로 한 영한 자동번역 시스템에서 실제 활용되고 있다. 이 방법론은 기본적으로 data-driven 방법론에 속하다. 문틀 기반 자동번역 방법론은 규칙기반 자동번역 방법론보다는 낮은 단계에서 예제 기반 자동번역 방법론보다는 높은 단계에서 번역을 하는 번역방법론이다. 이 방법론은 영한 자동번역에 뿐만 아니라 다른 언어쌍에서의 번역에도 적용할 수 있을 것이다.

  • PDF

`X하다`와 'X를 하다'의 상관성에 기반한 한중 자동 번역 시스템에서의 '하다' 동사 번역에 관한 연구 (A Study on Translation of 'Hata' Verb Based on Relation between 'X-hata' and 'X-lul hata')

  • 서영애;황은하;홍문표;최승권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.607-610
    • /
    • 2002
  • 패턴에 기반한 자동번역 시스템에 있어서, 번역률을 결정하는 가장 중요한 요소는 패턴의 양과 질이다. 필요한 대량의 패턴을 단기에 구축하기 위해서 패턴 정보 기술상의 잉여성을 줄일 필요가 있다. '하다' 동사는 한국어에서 가장 빈번하게 사용되는 동사 중의 하나로서, 'X를 하다'와 'X하다'의 2가지 구문 구조를 갖는다. 본 논문에서는 동사구 패턴에 기반한 한중 자동 번역 시스템에서 'X를 하다'와 'X하다' 구문간의 상관성을 이용하여 두 구문이 'X하다' 동사에 대한 동사구 패턴을 공유하도록 함으로써 동사구 패턴 구축 시에 정보의 중복 기술을 피하고, 패턴의 적용 범위를 넓힌다. 패턴의 공유로 인해 발생하는 대역문 생성 시의 문제점은, 'X를 하다' 구문에 대응하는 중국어 대역 형태 별로 분류하여 해결함으로써 패턴을 공유하면서도 번역의 질은 유지시킬 수 있는 방법을 제안한다.

  • PDF

ChatGPT 를 활용한 사용자 맞춤형 영번역 서비스 개발 (A Study on Development of User-Customerized English Translation Service Using ChatGPT)

  • 정래현;박계현;이은진;이상미;신성규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.818-819
    • /
    • 2023
  • 본 연구는 ICT 기술의 발전과 온라인 정보량 증가에 따른 개인화된 통번역 수요를 충족시키기 위한 새로운 AI 번역 서비스를 제안한다. ChatGPT 의 생성 기능을 활용하여 사용자의 요구사항을 반영한 맞춤형 번역을 제공하며, 사용자와 실시간 피드백을 주고받는 것이 가능하다. 이로써 번역 과정의 자동화와 사용자 맞춤형 번역 경험을 실현할 수 있다. 더불어 AI 기술이 2 차적인 서비스 모델 개발을 촉진하고, 다양한 사용자 니즈를 충족하는 신규 시장을 개척할 수 있음을 시사한다.