• 제목/요약/키워드: 기술번역

검색결과 457건 처리시간 0.044초

C-STAR 인터체인지 포멧을 이용한 다국어 대화체 번역시스템의 성능 (Performance of Multi-Lingual Spoken Language Translation System using C-STAR Interchange Format)

  • 최운천;박준;양재우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-202
    • /
    • 1999
  • ETRI 통신단말연구부에서는 1999년 7월 22일에 C-STAR 회원국이 함께 참여하는 국제간 음성언어번역 시스템 공동 시연을 가졌다. 이 논문은 다국어 대화체 번역시스템인 음성언어번역 시스템의 국제간 공동 시연에 사용된 한국어 번역 시스템의 성능에 대해 기술한다. 번역 시스템의 성능은 전사문장을 이용한 영어, 일본어, 한국어의 번역 결과와 음성인식 결과를 이용한 각 언어의 번역 결과를 평가하여 얻었다. 그리고 세부 시스템의 성능을 알아보기 위해 음성인식의 결과로부터 C-STAR IF(interchange format)까지의 해석 시스템과 C-STAR IF로부터 한국어, 영어, 일본어로 생성해 내는 생성 시스템의 성능으로 나누어서 평가한다.

  • PDF

말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구 (Research about SMT Performance Improvement Through Automatic Corpus Expansion)

  • 최규현;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.296-299
    • /
    • 2016
  • 현재 자동번역에는 통계적 방법에 속하는 통계기반 자동번역 시스템(SMT)이 많이 사용되고 있지만, 학습 데이터로 사용되는 대용량의 병렬 말뭉치를 수동으로 구축하는데 어려움이 있다. 본 연구의 목적은 통계기반 자동번역의 성능을 향상시키기 위해 기존 다른 언어쌍의 말뭉치와 SMT 자동번역 기술을 이용하여 대상이 되는 언어쌍의 SMT 병렬 말뭉치를 자동으로 확장하는 방법을 제안한다. 제안 방법은 서로 다른 언어 B와 C의 병렬 말뭉치를 얻기 위해, A와 B의 SMT 자동번역 시스템을 구축하고 기존의 A-C 말뭉치의 A를 SMT를 통해 B로 번역하여 B와 C의 말뭉치를 자동으로 확장한다. 실험을 통해 확장한 병렬 말뭉치가 통계기반 자동번역 시스템의 성능을 향상시킬 수 있음을 확인한다.

  • PDF

한-영 기계번역 결과물의 오류 유형 및 원인 분석: 형태적·구문적 오류를 중심으로 (Analyzing the Types and Causes of Korean-to-English Machine Translation Errors: Focused on Morphological and Syntactical Errors)

  • 백지연;구혜경
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.199-204
    • /
    • 2022
  • 본 연구의 목적은 기계번역을 활용한 대학교 영어쓰기 수업에서 한-영 기계번역 결과물에 나타난 형태적 및 구문적 오류 유형과 그에 대한 원인을 분석하기 위한 것이다. 한국의 EFL 대학생 7명이 연구에 참여하였으며, 그들은 한 학기동안 총 3회의 영어쓰기 과제를 수행하였다. 본 연구에서는 학생들이 제출한 영어쓰기 결과물 중 기계번역 결과물에 나타난 형태적 및 구문적 오류의 유형을 분석하였으며, 우리말 초고와 비교 분석을 통하여 그 원인을 찾아보고자 하였다. 분석결과, 기계번역 결과물에서 가장 많이 발생한 오류는 문장구조와 표기법 관련 오류였으며, 기계번역 결과물에서 발생한 대부분의 오류는 한국어 원문의 오류로 인하여 발생한 것으로 파악되었다.

불-한 전문분야 기계보조번역 워크벤치 TransFranCo (French-Korean Computer-Assisted Translation Workbench, TransFranCo)

  • 정휘웅;임용석;윤애선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.255-260
    • /
    • 2005
  • 번역 메모리(Translation Memory)는 오늘날 기계번역에 있어 통계기반 접근법이나 형태-통사적 접근법 모두에 있어 가장 중요한 요소로 평가되고 있다. 그러나 번역 메모리는 언어의 자질 및 각 용례를 통합적으로 관리해야 하며, 이를 기계가 자동으로 처리해주어야 하는 어려움이 있다. 최근에는 이러한 문제점을 해결하기 위해 다국적 기업을 중심으로 기계보조번역(Computer Aided Translation) 환경에 대한 연구가 활발히 이루어지고 있으나, 언어적인 특성 보다는 번역 메모리의 저장/대치적 측면에서 주요 연구가 이루어지고 있다. 이 논문에서는 번역 메모리 정보가 보다 높은 재사용성을 보이기 위해서는 다양한 언어자질값을 담을 수 있어야 한다고 보고, 이를 효율적으로 관리/구축할 수 있는 기계보조번역 워크벤치의 framework을 제시한다. 언어분석을 위한 대상언어로는 교역 및 기술 측면에서 영어, 일어, 중국어 다음으로 영향력이 높은 불어를 채택하며, 기존 기계보조번역 방식에 대한 고찰을 통해 개선된 번역 메모리 관리, 자동분석/번역 모듈 및 협업(collaboration) 방안에 대해 소개하고, 향후 발전방향에 대해 논의한다.

  • PDF

인터넷과 자동기계번역 기반 다문화간 협업지원 시스템의 가능성에 관한 고찰 (On the Plausibility of the Internet and Machine Translation Based Intercultural Collaboration Support System)

  • 조대연;이경전
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.487-493
    • /
    • 2003
  • 인터넷의 발전으로 국경을 초월한 팀간의 국제적 협업도 기술적으로 가능하게 되었다. 그러나 공용어가 아닌 각자의 모국어를 사용하는 경우 인터넷과 자동기계번역 (Machine Translation)을 활용하여 협업이 가능하도록 하기 위하여는 아직도 해결되어야 말 문제가 많다. 특히 자동기계번역은 특정 언어 외의 다양산 언어들간의 번역에서는 아직도 의사소통이 원활하게 이루어지지 않는 수준이다. 본 연구는 상이산 문화적 배경을 가지고 서로 다른 모국어를 사용하는 팀 간의 협업이 현재의 기술 수준으로 어느 정도까지 가능한가 하는 것을, 자동기계번역과 인터넷을 기반으로 고안된 ICSS ([nterrultural Collaboration Support System)를 활용한 실험을 통하여, 시스템과 인간의 상호작용을 중심으로 고찰하고자 하였다.

  • PDF

인터넷 매체 언어의 국어 파괴 현상의 고찰을 통한 표준어 자동 번역 기술에 대한 연구 (Research on Automatic Translation of Standard Language through Contemplation of Korean Destruction Phenomena in Internet Media Language)

  • 박장혁;정재훈;김신령;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.273-281
    • /
    • 2016
  • 본 논문에서는 인터넷 매체 언어상에서 나타나고 있는 국어 파괴 현상의 고찰을 고찰하여, 이에 대한 기술적 개선 방법으로서 표준어 자동 번역 기술을 제안한다. 실생활 속에서 국어 파괴 현상과 관련된 경험 및 피해 사례들을 설문 조사 및 FGI(Focussed Group Interview)를 통하여 수집 및 분석한 결과를 제시하고, 분석결과 자료 기반으로, '국어 파괴도(degree of Korean destruction)'의 지표를 정의하였다. 국어 파괴도는 표준어 자동 번역 기술이 갖고 있는 번역 오류가 가진 한계를 최소화하여, 표준어 자동 번역 기술의 효율성을 최대로 활용하기 위한 척도로서 활용될 수 있음을 인터넷 매체 문장 2,480 개의 분석을 통하여 제시하였다. 본 논문에서 제안된 국어 파괴도 측정 및 표준어 자동 번역 기술은 Java 언어를 사용하여 REST API 형태로 구현하였으며, 웹브라우저상에서 동작을 확인하였다.

역사적 변천에 따른 한국수어 번역의 형태와 특성 연구 (A Study on the Forms and Characteristics of Korean Sign Language Translation According to Historical Changes)

  • 이준우
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.508-524
    • /
    • 2021
  • 과학기술의 발달에 힘입은 혁신적인 번역 환경은 수어 번역의 확대 가능성과 실현성을 높이는 요소가 되고 있다. 한국수어 번역도 새로운 도전과 기회를 맞이하고 있다. 본 연구는 첫째, '한국수어 번역은 한국수어의 역사적 변천과정 속에서 언제 어떻게 나타났는가?', 둘째, '한국수어 번역의 결과로 산출된 번역의 형태와 특성은 무엇인가?', 셋째, '한국수어 번역의 현황과 전망은 어떠한가?'라는 연구 질문들을 제기하고 이에 대한 대답을 찾아간다. 이에 따라 본 연구는 통합적 문헌고찰 방법을 사용해 역사적으로 한국수어 번역이 어떻게 형성되었으며 한국수어 번역의 형태와 특성은 어떠한지를 고찰하였다. 연구 결과 첫째, 수어번역 잠재기, 형성기, 확장기로 구분되는 역사적 변천과정에 따른 한국수어 번역의 형태와 특성이 나타났으며, 둘째, 한국수어 말뭉치 사업과 기계번역에 따른 한국수어 번역의 형태와 특성이 도출되었다. 아울러 한국수어 번역의 현황을 파악하고, 향후 전망을 제시하였다.

한국어 대화체 음성언어 번역시스템에서의 개념기반 번역시스템 (Concept-based Translation System in the Korean Spoken Language Translation System)

  • 최운천;한남용;김재훈
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2025-2037
    • /
    • 1997
  • 대화체 음성언어번역시스템의 일부인 개념기반 번역시스템은 음성인식의 결과를 이용하여 다른 언어로 번역해 주는 시스템이다. 본 논문은 여행계획 영역에 대해 한국어를 해석하여 영어, 일본어, 한국어로 번역해 주는 시스템에 대해 기술한 것이다. 개념기반 번역은 비정형 문장이 많은 대화체 문장을 처리하기 위해 형태소 분석 등의 구문정보를 이용하지 않고, 의미단위의 번역을 시도한 것으로 화자의 의도를 정확히 번역해 주는 것을 목표로 한다. 개념기반 번역은 280여개의 개념과 개념간의 계층구조에 의해, 인식결과를 개념구조로 변환한 후 다른 언어로 생성해 준다. 효율적인 한국어 처리를 위해 기준단어를 이용한 토큰분리기와 문법자동 수정기를 개발하였다. 그리고 자연스러운 생성문을 위해 각 언어에 대한 후처리기를 개발하였다.

  • PDF

외국인 관광객을 위한 다국어 통번역 시스템 (Multilingual Speech and Machine Translation System for Foreign Tourists)

  • 최승권;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.665-666
    • /
    • 2016
  • 본 논문은 현재 개발 중에 있는 외국인 관광객을 위한 다국어 통번역 시스템을 기술하는 것을 목표로 한다. 다국어 통번역 시스템에서 개발 중에 있는 언어는 한국어, 일본어, 중국어, 영어, 스페인어, 불어, 독일어, 러시아어이다. 이렇게 개발된 다국어 통번역 시스템은 2018년 평창 동계 올림픽 때 다국어 통번역 서비스를 제공할 예정이다. 현재의 다국어 통번역 시스템의 성능은 번역만 보았을 때, 영한 87.63%, 한영 88.21%, 중한 85.38%, 한중 77.94%, 일한 89.00%, 한일 86.69%, 스한 76.90%, 한스 77.46%, 불한 76.28%, 한불 79.78%이다.

영한 논문 번역시스템의 수동 평가와 자동 평가의 관계 (A Study to Relation between Human Judgment and Automatic Evaluation in English-Korean Scientific Paper MT System)

  • 최승권;황영숙;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.65-68
    • /
    • 2008
  • 본 논문은 영한 과학기술 논문 자동번역 시스템을 대상으로 이루어진 수동 평가와 자동 평가 사이의 상관 관계를 밝힘으로써 수동 평가와 자동 평가 중에 한쪽의 방법에 의해서 평가가 이루어지더라도 다른 쪽의 수치를 파악할 수 있도록 하는데 목표가 있다. 본 논문에서 수행한 수동 평가는 5 인의 전문 번역가가 5 회에 걸쳐 평가한 결과이며, 자동 평가는 영어 원문 1,000 문장에 대한 8 인이 번역한 8,000 문장의 정답문(References)과 자동번역 결과를 어절 단위와 형태소 단위로 N-gram 비교를 통해 평가된 결과이다. 본 논문에서 도출된 식은 사용하는 평가 집합과 대상 번역 시스템 별로 자동 평가와 수동 평가 간의 상관 계수를 만들어내고 수동 번역률을 구하는 식을 동일하게 적용한다면 시스템의 자동 평가 결과로부터 성능을 직관적으로 해석하는데 상당히 도움이 될 것이다.