• 제목/요약/키워드: 번역기준

검색결과 92건 처리시간 0.021초

언어적 특성과 서비스를 고려한 딥러닝 기반 한국어 방언 기계번역 연구 (Deep Learning-based Korean Dialect Machine Translation Research Considering Linguistics Features and Service)

  • 임상범;박찬준;양영욱
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.21-29
    • /
    • 2022
  • 본 논문은 방언 연구, 보존, 의사소통의 중요성을 바탕으로 소외될 수 있는 방언 사용자들을 위한 한국어 방언 기계번역 연구를 진행하였다. 사용한 방언 데이터는 최상위 행정구역을 기반으로 배포된 AIHUB 방언 데이터를 사용하였다. 방언 데이터를 바탕으로 Transformer 기반의 copy mechanism을 적용하여 방언 기계번역기의 성능 향상을 도모하는 모델링 연구와 모델 배포의 효율성을 도모하는 Many-to-one 기반의 방언 기계 번역기를 제안한다. 본 논문은 one-to-one 모델과 many-to-one 모델의 성능을 비교 분석하고 이를 다양한 언어학적 시각으로 분석하였다. 실험 결과 BLEU점수를 기준으로 본 논문이 제안하는 방법론을 적용한 one-to-one 기계번역기의 성능 향상과 many-to-one 기계번역기의 유의미한 성능을 도출하였다.

한국 신문의 영어 번역에 나타난 번역 보편소의 코퍼스 기반 분석 (A Corpus-based Study of Translation Universals in English Translations of Korean Newspaper Texts)

  • 고광윤;이영희
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.109-143
    • /
    • 2016
  • 본 연구는 번역된 텍스트들에 전형적으로 나타나는 언어적 특성들인 번역 보편소(translation universals)에 관한 코퍼스 기반 연구이다. 지금까지의 번역 보편소 연구는 언어계통상 서로 밀접한 관련이 있는 영어와 다른 유럽어 사이의 번역에 집중되어 왔으며, 다른 한편으로 주로 문학 장르의 분석에 치중되어 있다는 아쉬움을 지닌다. 본 연구에서는 관련 연구가 지닌 이러한 두 가지 주요 문제점을 보완하고자 하는 노력의 일환으로 한국어를 원문으로 하는 영어 번역 가운데 비문학 장르인 신문언어 텍스트를 분석대상으로 선택하였다. 먼저, 번역된 신문영어 텍스트와 비번역 신문영어 텍스트를 정해진 기준에 따라 수집하여 번역과 비번역 영어(translated and non-translated English)로 구성된 대응코퍼스(comparable corpora)를 구축하였다. 이렇게 구축된 대응 코퍼스를 바탕으로 기존 문헌에서 논의된 번역 보편소 가설 가운데 가장 대표적인 단순화(simplification), 명시화(explicitation), 규범화(normalization), 평준화(leveling-out) 현상이 한국어 신문의 영어 번역 텍스트에서 어떠한 양상을 보이는지 살펴봄으로써 각 가설들이 지니는 타당성을 검증해보고자 하였다. 본 연구의 분석결과를 종합해보면, 단순화와 규범화를 제외한 나머지 하위가설의 언어적 특성들은 모든 언어쌍과 모든 텍스트 장르에 걸쳐 일반화하기에 다소 한계가 있는 것으로 나타났다. 또한, 번역 보편소의 개념 규정이나 분석지표의 정교화, 그리고 결과의 일반화에는 신중한 접근이 필요할 것으로 보인다.

중국도서관기준

  • 천혜봉
    • 도서관문화
    • /
    • 제9권8호
    • /
    • pp.8-20
    • /
    • 1968
  • 이는 1965년 7월 중국도서관학회가 최종적으로 심의공포한 ‘도서관표준’의 번역임

  • PDF

구절 변환을 위한 한영 동사 사전 구성 (The Construction of Korean-to-English Verb Dictionary for Phrase-to-Phrase Translations)

  • 옥철영;김영택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.44-57
    • /
    • 1991
  • 변환방식의 기계번역은 변환사전에서 제공하는 정보의 종류와 그의 정밀성에 따라서 변환과정의 복잡도와 번역의 질이 결정되어 진다. 사람에 의한 번역은 양국어 사전에서 제공하는 구절 중심의 번역정보를 이용함으로써, 그 번역의 결과는 정확하고 자연스럽다. 본 논문에서는 양국어 사전에서 제공하는 구절 중심의 여러가지 번역정보들을, 한영 기계번역시스템이 이용할 수 있는 형태의 동사 변환사전을 제안하였다. 제안된 변환사전에서는 첫째로, 구절 중심의 번역에서 동사의 역어가 선택되어지는 기준을 제공하여, 변환과정에서 추가적인 의미해석없이도 역어를 효과적으로 선택할 수 있도록 하였다. 둘째로 동사의 역어가 취하는 구체적인 구문구조를 제공하여, 여러 단계의 구조변환의 복잡도를 줄이면서도 두 언어간의 표현방식의 차이점을 해결할 수 있게 하였다.

  • PDF

태평양연안국의 원자력 기술기준 전망

  • W. Edwards Norman
    • 원자력산업
    • /
    • 제7권7호통권53호
    • /
    • pp.32-38
    • /
    • 1987
  • 본 논문은 지난 4월 11일 미국원자력학회(ANS) 한국지부의 월례기술토론회에서 ${\ulcorner}$The Future Outlook for Consistencies in Pacific Basin Codes and Standards${\lrcorner}$라는 제목으로 행한 특별강연문을 번역한 것이다.

  • PDF

영·한 통번역을 위한 성경 텍스트 클리셰(cliche)의 실증적 분석 (Empirical Analysis on the Holy Bible Texts' Cliche for English-Korean Interpretation and Translation)

  • 유선영
    • 한국콘텐츠학회논문지
    • /
    • 제17권10호
    • /
    • pp.54-64
    • /
    • 2017
  • 본 연구는 클리셰(cliche)의 개념화에 주목하여 성경 텍스트에 나타난 클리셰를 분석함으로써 클리셰의 개념과 범주를 올바로 규정짓고자 하였다. 클리셰의 개념을 비롯하여 클리셰와 관용어의 범주를 구분하여 설명하고, 성경 텍스트를 분석함으로써 클리셰의 개념과 정확한 사용을 위한 기준점을 제시하였다. 분석은 신뢰도를 높일 수 있도록 13권의 영어 성경 텍스트를 통해 클리셰를 정리하고 분석하였다. 분석 결과로는 성경 텍스트의 클리셰를 분석에 있어 그 의의를 발견함과 동시에 클리셰의 범주를 확실히 할 수 있었다. 본고는 영 한 통번역을 위해 성경 텍스트에 나타난 클리셰를 분석함으로써 클리셰의 흥미로움을 발견함과 동시에 클리셰의 기능을 모색하고, 이를 통해 통번역 분야에 개념적 발판을 마련한 데에 그 의미가 있다. 영 한 통번역에 있어서 관용어를 비롯하여 클리셰의 개념에 대한 학습과 교육적 가치에 있어서 매우 도움이 될 것으로 생각된다. 클리셰는 어느 언어에서나 다양하게 나타날 수 있는 비유 표현이자, 언어를 특징짓는 일부가 되는 언어 표현 도구로써 사회 문화적인 현실 속에서 사용되면서 그 사회와 문화를 특징짓는 중요한 요소가 되기 때문이다. 따라서 본고에서의 클리셰의 개념 이해와 분석을 토대로 독자로 하여금 영 한 통번역 현장에서의 클리셰 연구의 필요성이 인식되고 클리셰 연구가 더욱 활발해질 것으로 기대한다.

ChatGPT 기반 한국어 Vision-Language Pre-training을 위한 고품질 멀티모달 데이터셋 구축 방법론 (High-Quality Multimodal Dataset Construction Methodology for ChatGPT-Based Korean Vision-Language Pre-training)

  • 성진;한승헌;신종훈;임수종;권오욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.603-608
    • /
    • 2023
  • 본 연구는 한국어 Vision-Language Pre-training 모델 학습을 위한 대규모 시각-언어 멀티모달 데이터셋 구축에 대한 필요성을 연구한다. 현재, 한국어 시각-언어 멀티모달 데이터셋은 부족하며, 양질의 데이터 획득이 어려운 상황이다. 따라서, 본 연구에서는 기계 번역을 활용하여 외국어(영문) 시각-언어 데이터를 한국어로 번역하고 이를 기반으로 생성형 AI를 활용한 데이터셋 구축 방법론을 제안한다. 우리는 다양한 캡션 생성 방법 중, ChatGPT를 활용하여 자연스럽고 고품질의 한국어 캡션을 자동으로 생성하기 위한 새로운 방법을 제안한다. 이를 통해 기존의 기계 번역 방법보다 더 나은 캡션 품질을 보장할 수 있으며, 여러가지 번역 결과를 앙상블하여 멀티모달 데이터셋을 효과적으로 구축하는데 활용한다. 뿐만 아니라, 본 연구에서는 의미론적 유사도 기반 평가 방식인 캡션 투영 일치도(Caption Projection Consistency) 소개하고, 다양한 번역 시스템 간의 영-한 캡션 투영 성능을 비교하며 이를 평가하는 기준을 제시한다. 최종적으로, 본 연구는 ChatGPT를 이용한 한국어 멀티모달 이미지-텍스트 멀티모달 데이터셋 구축을 위한 새로운 방법론을 제시하며, 대표적인 기계 번역기들보다 우수한 영한 캡션 투영 성능을 증명한다. 이를 통해, 우리의 연구는 부족한 High-Quality 한국어 데이터 셋을 자동으로 대량 구축할 수 있는 방향을 보여주며, 이 방법을 통해 딥러닝 기반 한국어 Vision-Language Pre-training 모델의 성능 향상에 기여할 것으로 기대한다.

  • PDF

한국어 명사 의미 부류 체계의 구축과 활용 (Construction and application of semantic classes of Korean nouns)

  • 강범모;박동호;이성헌;박진호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.247-251
    • /
    • 2001
  • 명사 의미 부류 체계는 언어 처리의 다양한 분야에서 그 필요성이 부각되고 있다. 예를 들어, 기계 번역에 있어서의 단어 의미의 중의성 해소(word sense disambiguation), 정보검색 시스템에서도 재현율과 정확률의 향상, 추론 시스템 등을 위하여 명사 의미 부류는 중요한 역할을 한다. 명사 의미 부류 체계의 이러한 중요성 때문에 여러 온톨로지(ontology)가 기존에 구축되어 있다. 그런데 이러한 온톨로지들은 대개 순수한 개념적 기준에 입각한 것이며 단어의 통사적 특성을 별로 고려하고 있지 않다. 정보검색 시스템이나 추론 시스템의 경우에는 통사적 고려가 별로 중요하지 않을 수 있으나 기계번역의 경우 통사적 특성에 대한 고려가 매우 중요하다. 이러한 점에 주목하여 21세기 세종계획 전자사전 분과에서는 개념적 기준과 통사적 기준을 모두 고려하여 명사 의미 부류 체계를 구축하고 있다. 즉, 해당 부류에 속하는 명사들이 결합할 수 있는 술어(적정 술어) 등의 통사적 요인을 중요시하여 명사들을 분류하고 있는 것이다. 이에 따라 세종 체언 사전의 모든 명사들에 대해 의미부류 정보가 주어지고, 용언 사전의 용언의 각 논항에 대한 선택제약 정보도 이 명사 의미부류 체계를 이용하여 제시되고 있다. 이러한 정보들은 한국어 처리에 중요한 자료로 이용될 것이다.

  • PDF

1950년대 한국에서의 미국 도서번역 사업의 전개와 의미 (The U.S. Government's Book Translation Program in Korea in the 1950s)

  • 차재영
    • 한국언론정보학보
    • /
    • 제78권
    • /
    • pp.206-242
    • /
    • 2016
  • 이 연구는 1950년대 미국정부가 문화냉전의 와중에서 공공외교의 일환으로 해외에서 수행했던 도서 프로그램의 전체적인 윤곽을 살펴본 후, 한국에서 시행한 도서번역 사업의 전개 과정과 목적 및 내용을 분석하고, 사업의 성과와 의미를 검토하였다. 분석의 결과로, 한국에서의 미국 도서번역 사업은 미군정기부터 극히 미진한 수준에서 시작되었지만, 한국전쟁을 거치면서 본격화되어 1950년대 후반에 최고조에 도달했던 것으로 밝혀졌다. 1950년대 미국 국무성과 대외공보국(USIA)의 지침에 따라 주한 미공보원(USIS)이 수행했던 도서번역 사업의 목적은 시기에 따라 개별적인 비중이 변화되기는 했어도, 대체로 미국의 자유민주주의와 자본주의 체제의 우월성을 강조하고, 공산주의 사회의 부조리와 모순을 비판하며, 미국의 외교 정책에 대한 이해를 제고하고, 예술 문학 과학 부문에서의 미국의 성취를 전파하려 했던 것으로 확인되었다. 특히 번역 도서를 선정할 때 미국의 대외정책과 모순되거나 국가적 이미지를 훼손할 가능성이 있는 도서는 철저히 배제하였고, 미국정부의 공보정책에 기여할 것으로 판단되는 소수의 한국인 저작물에 대해서는 지원을 아끼지 않았으며, 도서번역 사업의 효과를 극대화하기 위해 일본어 번역서를 활용하는 것도 마다하지 않았다. 이러한 미국정부의 도서번역 사업은 한국이 해방과 분단으로 겪게 된 지식과 정보의 공백 상태를 극복하는 데 일정하게 기여했다고 평가할 수 있지만, 다른 한편으로 미국정부의 정책적 기준에 따른 도서 선정으로 말미암아 한국인들의 대미 인식이나 세계정세 판단에 왜곡을 초래했을 수도 있다고 생각된다.

  • PDF

형태소 분석 기반 전자책 수화 번역 프로그램 (E-book to sign-language translation program based on morpheme analysis)

  • 한솔이;김세아;황경호
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.461-467
    • /
    • 2017
  • 인터넷의 발전과 스마트 디바이스의 확산으로 e-book에 대한 수요가 늘고 있다. 그러나 청각 손실로 정확한 언어를 배우기 어려운 청각장애인은 텍스트로만 이루어진 e-book 서비스를 사용하기 어렵다. 본 논문에서는 e-book의 문장을 읽어 수화 동영상으로 제공하는 안드로이드 기반 애플리케이션 프로그램을 설계하고 구현하였다. e-book의 한국어 문장을 수화 언어로 번역하기 위해 형태소 분석에 기반한 알고리즘을 사용하였다. 제안한 알고리즘은 3단계로 구성된다. 1단계는 수화 표현을 위한 문장 요소 제거, 2단계는 수화 표현의 변환 및 시제 표현, 3단계는 수화 높임말 용어 변경 및 위치 이동이다. 또한 수화 번역 품질에 대한 평가 방안을 제시하고 100개의 기준 문장에 대해 제안한 알고리즘을 통한 번역 결과의 우수성을 확인하였다.