• 제목/요약/키워드: 번역

검색결과 2,141건 처리시간 0.056초

블록체인 기술을 활용한 보상형 공동 번역 모델 (A Blockchain Based Reward Model for Co-translation)

  • 구본철;남영우;김승수;이건명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.598-601
    • /
    • 2019
  • 최근 딥러닝과 신경망 기술을 바탕으로 한 다양한 번역 시스템이 상용화되고 있다. 그러나 문맥을 고려해야하는 경우나 의료, 법학 등 전문적인 지식을 요구하는 경우, 기존의 번역 시스템으로는 원문 작성자가 의도한 대로 자연스러운 번역 결과물을 얻기 어려운 문제점이 있다. 이로 인해 전문적인 지식을 요구하는 문서는 전문 번역 기관에 의뢰하여 번역이 이루어지고 있으며 소비자의 입장에서는 업체로부터 받은 번역물을 평가 과정 없이 사용할 수밖에 없는 상황이다. 따라서 본 논문에서는 사람이 직접 번역한 결과물을 사용자가 가진 번역 신뢰 점수를 반영하여 평가함으로써 양질의 결과물을 도출하고 번역 활동 기여도에 따라 암호화폐로 보상금을 지급하는 블록체인 기반 보상형 공동 번역 모델을 제안한다. 다수의 번역 평가자들로부터 높은 점수를 받은 우수한 번역 결과물을 도출하고, 번역글 평가에 사용되는 사용자별 신뢰도 점수를 블록체인에 저장하여 조작을 방지함으로써 믿을 수 있는 번역 생태계를 조성할 것으로 기대한다.

극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템 (Automatic English-Korean Address Translation System for Extremely Unpredictable Error Generating Language Environments)

  • 김경식;황명진;이승필
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.239-242
    • /
    • 2016
  • 데이터베이스 기반 자동 주소번역은 입력 오류에 취약하며 범용 기계번역을 이용한 주소번역은 입력 및 번역 주소에 대한 품질 평가가 어렵다. 본 논문에서는 예측할 수 없는 입력 오류에도 대응할 수 있는 자동 주소번역 시스템을 제안한다. 제안 시스템은 n-gram 기반 검색, 미검색/오검색 분류, 번역, 신뢰도 자동평가로 구성된다. 신뢰할 수 있는 입력으로 자동 분류한 영문 국내주소를 국문으로 번역한 결과 95%이상의 정확도를 보였다.

  • PDF

영어학습 도구로서 기계번역기의 가용성 분석 - as구문 역번역을 통하여 (Analysis of the Usability of Machine Translators as an English Learning Tool -Through backtranslation of the as phrase)

  • 박권호;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.259-267
    • /
    • 2021
  • 기계번역기는 1950년대 처음 등장하였고 2010년대 신경망번역시스템을 적용하면서 번역정확성에 비약적인 발전을 하였다. 하지만 아직도 복잡한 문장의 번역에는 어려움을 겪고 있으며 이것은 영어학습 도구로서 기계번역기를 이용하는데 불편함을 주었다. 따라서 본 연구는 고등학교 1학년 수준의 문장들 중 다양한 뜻과 품사를 가지고 있는 as가 포함된 문장들을 분석대상으로 기계번역기를 이용한 역번역실험을 통해서 영어학습 도구로서 기계번역기의 가용성을 분석했다. 분석도구로는 신경망번역시스템을 이용한 대표적인 기계번역기인 구글 번역기, 네이버 파파고, 마이크로소프트 번역기를 이용하였다. 연구결과 기계번역기 사용시 각 as용법에 따라서 가용성이 유의하게 다른 것을 확인하였고 그에 따라 각 문장에 쓰인 as용법을 기계번역기를 사용하여 학습할 시 가용성이 높은 용법, 보통인 용법, 낮은 용법으로 분류하였다. 선행연구와는 다르게 직접 학습도구로서 기계번역기를 분석했고 접속사 as의 용법의 가용성을 수치화 시킨 데 있어서 본 연구는 연구적 공헌점을 가진다.

단말기 내장형 영한 하이브리드 모바일 번역기 (An English-to-Korean Hybrid Mobile Translator for Mobile Devices)

  • 여상화;백영태;채흥석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.25-28
    • /
    • 2011
  • 본 논문에서는 스마트폰과 같은 모바일 단말기 자체에서 동작하는 경량화된 영한 하이브리드 모바일 번역 엔진을 설계 및 구현하였다. 번역 엔진은 자연스러운 번역과 높은 번역 품질을 위해 번역 메모리(Translation Memory)와 규칙기반의 번역 엔진으로 이중화를 하였다. PC에 비해 하드웨어 제약이 심한 스마트폰 자체에서 구동이 원활하도록 주메모리의 사용을 줄이고 분석 시간 단축을 위하여 핵심 번역 엔진을 포함한 번역 지식 DB가 외장메모리에서 구동되도록 하였다. 실험결과 번역 품질은 BLEU와 NIST 평가치를 기준으로 서버 기반의 구글번역기 대비 70.0%로 사용자의 의미전달이 가능한 실용적인 수준으로 평가되었다.

  • PDF

자동 번역용 대용량 번역 지식 DB 관리 시스템 설계 및 구현 (A Knowledge Management Tool for ETRI Korean/English and English/Korean Automatic Translation System)

  • 장현숙;임점미;유원경;홍기형;박상규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.363-365
    • /
    • 2000
  • 본 논문은 영/한, 한/영 자동 번역용 대용량 번역 지식의 효과적인 관리를 위한 시스템 개발이다. 현재 개발 중의 ETRI의 영/한, 한/영 자동 번역 시스템의 개발 환경을 분석하고, gdbm 기반의 번역지식관리의 문제점을 정리하였다. 본 논문에서 제시한 번역 지식 관리 시스템은 클라이언트/서버 구조를 가지는 MS SQL 서버 기반의 시스템이다. 번역 지식은 관계형 DB로 모델링하여 스키마를 설계하고 구현하였다. 관리 시스템에는 기존에 gdbm 파일로 구축해 놓은 지식을 번역지식 DB로 변환하기 위한 이전 도구, 번역지식 DB에 저장된 번역 지식을 검색하기 위한 검색 도구, 번역지식의 삽입, 삭제, 변경을 지원하는 구축도구로 구성된다.

  • PDF

한-영 관용구 기계번역을 위한 NMT 학습 방법 (NMT Training Method for Korean-English Idiom Machine Translation)

  • 최민주;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-356
    • /
    • 2020
  • 관용구는 둘 이상의 단어가 결합하여 특정한 뜻을 생성한 어구로 기계번역 시 종종 오역이 발생한다. 이는 관용구가 지닌 함축적인 의미를 정확하게 번역할 수 없는 기계번역의 한계를 드러낸다. 따라서 신경망 기계 번역(Neural Machine Translation)에서 관용구를 효과적으로 학습하려면 관용구에 특화된 번역 쌍 데이터셋과 학습 방법이 필요하다. 본 논문에서는 한-영 관용구 기계번역에 특화된 데이터셋을 이용하여 신경망 기계번역 모델에 관용구를 효과적으로 학습시키기 위해 특정 토큰을 삽입하여 문장에 포함된 관용구의 위치를 나타내는 방법을 제안한다. 실험 결과, 제안한 방법을 이용하여 학습하였을 때 대부분의 신경망 기계 번역 모델에서 관용구 번역 품질의 향상이 있음을 보였다.

  • PDF

ETRI신기술-한.일 자동번역 기술

  • 한국전자통신연구원
    • 전자통신동향분석
    • /
    • 제14권4호통권58호
    • /
    • pp.131-132
    • /
    • 1999
  • 일본어로 구성된 일본어 웹 정보를 한국어로 자동 번역하여 주는 한.일 자동 번역 시스템으로서 다중 사용자를 지원하는 서버 형태로 구현되었으며, 일본어 어휘 분석, 일-한 변환, 한국어 생성을 수행하는 번역 엔진부와 일-한 자동 번역에 필요한 한.일 자동 번역용 사전(20만 단어), 번역 규칙 등으로 구성되어 있다.

  • PDF

전문번역사들의 기계번역 수용에 관한 연구 (Study on Translators' Acceptance of Machine Translation)

  • 천종성
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.281-288
    • /
    • 2020
  • 본 연구는 구글 번역과 파파고와 같은 신경망 기계번역(NMT)에 대한 수용성을 탐구한다. 기계번역의 도입으로 훈련받은 번역사들이 위협을 느끼리라는 것과 기계와의 협력을 모색해야 한다는 논의가 상충하고 있는 시점에서, 오랫동안 기술수용을 예측해 온 TAM을 적용하여 전문번역사들의 기계번역 수용에 관한 의사결정 과정을 살펴보았다. 결론적으로 번역사들이 기계번역에 대해 위협을 느낄 것이라는 기존의 규범적 논의와 달리 본 연구의 경험적 결과는 번역사들이 자신의 업무의 효율을 높여주는 유용한 도구로 인식하고 있음이 밝혀졌다. 특히 같이 작업하는 동료들의 조언과 사회적 분위기가 우호적일 경우 이러한 경향은 더욱 강해졌다.

단어 수준 한국어-영어 기계번역 품질 예측 (Word-level Korean-English Quality Estimation)

  • 어수경;박찬준;서재형;문현석;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2021
  • 기계번역 품질 예측 (Quality Estimation, QE)은 정답 문장에 대한 참조없이 소스 문장과 기계번역 결과를 통해 기계번역 결과에 대한 품질을 수준별 주석으로 나타내주는 태스크이며, 다양한 활용도가 있다는 점에서 꾸준히 연구가 수행되고 있다. 그러나 QE 모델 학습을 위한 데이터 구성 시 기계번역 결과에 대해 번역 전문가가 교정한 문장이 필요한데, 이를 제작하는 과정에서 상당한 인건비와 시간 비용이 발생하는 한계가 있다. 본 논문에서는 번역 전문가 없이 병렬 또는 단일 말뭉치와 기계번역기만을 활용하여 자동화된 방식으로 한국어-영어 합성 QE 데이터를 구축하며, 최초로 단어 수준의 한국어-영어 기계번역 결과 품질 예측 모델을 제작하였다. QE 모델 제작 시에는 Cross-lingual language model (XLM), XLM-RoBERTa (XLM-R), multilingual BART (mBART)와 같은 다언어모델들을 활용하여 비교 실험을 수행했다. 또한 기계번역 결과에 대한 품질 예측의 객관성을 검증하고자 구글, 아마존, 마이크로소프트, 시스트란의 번역기를 활용하여 모델 평가를 진행했다. 실험 결과 XLM-R을 활용하여 미세조정학습한 QE 모델이 가장 좋은 성능을 보였으며, 품질 예측의 객관성을 확보함으로써 QE의 다양한 장점들을 한국어-영어 기계번역에서도 활용할 수 있도록 했다.

  • PDF

신경망 기반 기계 번역을 위한 역-번역을 이용한 한영 병렬 코퍼스 확장 (Expanding Korean/English Parallel Corpora using Back-translation for Neural Machine Translation)

  • 허광호;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.470-473
    • /
    • 2018
  • 최근 제안된 순환 신경망 기반 Encoder-Decoder 모델은 기계번역에서 좋은 성능을 보인다. 하지만 이는 대량의 병렬 코퍼스를 전제로 하며 병렬 코퍼스가 소량일 경우 데이터 희소성 문제가 발생하며 번역의 품질은 다소 제한적이다. 본 논문에서는 기계번역의 이러한 문제를 해결하기 위하여 단일-언어(Monolingual) 데이터를 학습과정에 사용하였다. 즉, 역-번역(Back-translation)을 이용하여 단일-언어 데이터를 가상 병렬(Pseudo Parallel) 데이터로 변환하는 방식으로 기존 병렬 코퍼스를 확장하여 번역 모델을 학습시켰다. 역-번역 방법을 이용하여 영-한 번역 실험을 수행한 결과 +0.48 BLEU 점수의 성능 향상을 보였다.

  • PDF