• 제목/요약/키워드: 번역어

검색결과 263건 처리시간 0.033초

인터넷과 자동기계번역 기반 다문화간 협업지원 시스템의 가능성에 관한 고찰 (On the Plausibility of the Internet and Machine Translation Based Intercultural Collaboration Support System)

  • 조대연;이경전
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.487-493
    • /
    • 2003
  • 인터넷의 발전으로 국경을 초월한 팀간의 국제적 협업도 기술적으로 가능하게 되었다. 그러나 공용어가 아닌 각자의 모국어를 사용하는 경우 인터넷과 자동기계번역 (Machine Translation)을 활용하여 협업이 가능하도록 하기 위하여는 아직도 해결되어야 말 문제가 많다. 특히 자동기계번역은 특정 언어 외의 다양산 언어들간의 번역에서는 아직도 의사소통이 원활하게 이루어지지 않는 수준이다. 본 연구는 상이산 문화적 배경을 가지고 서로 다른 모국어를 사용하는 팀 간의 협업이 현재의 기술 수준으로 어느 정도까지 가능한가 하는 것을, 자동기계번역과 인터넷을 기반으로 고안된 ICSS ([nterrultural Collaboration Support System)를 활용한 실험을 통하여, 시스템과 인간의 상호작용을 중심으로 고찰하고자 하였다.

  • PDF

한-중 기계번역 시스템에서의 중간표현에 관한 연구 (A Study on Intermediate Representation for Korean-Chinese Machine Translation System)

  • 송성대;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.168-172
    • /
    • 1994
  • 한국어와 중국어는 상이한 언어적 특성을 보이는 언어쌍으로, 기계번역 시스템을 개발하기 위한 접근 방식으로 중간언어 방식이 타당하다. 본 논문에서는 한-중 기계번역 시스템의 개발과 관련하여, 의미표현 구조로서의 중간언어에 대하여 논한다. 기존의 중간언어들을 비교, 분석하여 문제점을 파악하고 개선하며, 한국어의 특성을 반영함으로써 한-중 기계번역 시스템을 위한 중간언어를 제안한다. 본 논문을 통하여 국내적으로 미진한 중간언어 연구를 활성화하며, 더욱 효율적인 중간언어를 설계하기 위한 원형을 마련한다. 앞으로 의미 체계의 보완, 개선 등을 통하여, 본 논문에서 제안된 원형은 다언어 기계번역 시스템을 위한 중간언어로 확장, 개선될 것이다.

  • PDF

사용자에 의한 문형 확장 방식을 이용한 다국어 채팅 시스템의 설계 및 구현 (The Design and Implementation of Multilingual Chatting System Using Exapansion of Sentence Patterns By User)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-220
    • /
    • 1999
  • 본 연구에서는 정해진 주제내에서 높은 번역율과 빠른 처리 시간을 동시에 수용할 수 있는 효과적인 다국어 채팅 시스템을 구현하기 위해 사용자가 어절 단위로 단어를 입력하거나 선택하여 이미 구축되어 있는 문형에 접근하도록 유도하는 사용자 문형확장 방식을 제안하였다. 사용자 문형확장 방식을 사용하여 다국어 채팅 시스템을 구현할 경우 사용자 입력과 동시에 구문분석, 변환, 생성등 일련의 번역과정을 최소한의 처리시간으로 처리할 수 있으므로 매우 용이하게 실시간 번역 시스템을 구현할 수 있다는 장점이 있다. 사용자 문형확장 방식과 더불어 이와 함께 사용될 수 있는 통합 문형코드와 통합 품사체계도 제안하였다. 이는 번역의 대상이 되는 한국어, 영어, 일본어 각각에 대해 문형코드와 품사코드를 따로 설정하지 않고 통일된 하나의 코드체계를 적용함으로써 기계번역에서의 변환과정을 최소화하기 위해 고안하였다.

  • PDF

병렬 말뭉치를 이용한 도메인 특화 사전 자동 추출 연구 (A Study of Automatic Extraction of Domain Specified Dictionary)

  • 박은진;황금하;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.237-241
    • /
    • 2009
  • 본 논문에서는 도메인별 병렬 말뭉치를 이용하여 해당 도메인에 특화된 한영 대역쌍을 Moses Toolkit을 이용하여 자동 추출하였다. 이렇게 추출된 대역쌍은 도메인 특화 자동 번역 시스템의 번역 사전으로 사용하기에는 많은 오류가 포함되어 있기 때문에, 본 논문에서는 이를 효율적으로 제거할 수 있는 식을 제안하였다. 본 논문에서 제안한 식으로 오류를 제거한 결과, 임계값 0.5를 기준으로 추출된 한영 대역쌍이 1,098개였고, 이는 실험에 사용한 기업 분야 병렬 말뭉치 42,200문장 중에서 29,292문장(69.4%)에 영향을 주었다. 자동으로 추출한 도메인 특화 번역 지식을 기존 자동 번역 시스템의 번역 지식에 적용한 결과 BLEU가 0.0054 향상되었다.

  • PDF

동의어와 용어에 대한 번역 신뢰도 개선 방법 (The Way to Improve Credibility of Translation for Synonyms and Terms)

  • 임지연;윤재열;김이준;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1095-1096
    • /
    • 2012
  • 인터넷의 비약적인 발전으로 우리는 생활에 필요한 많은 것들을 인터넷을 통해 얻는다. 날씨, 뉴스, 만화, 나아가서는 전공 공부까지 많은 정보를 인터넷에서 얻을 수 있다. 또한 이러한 여러 서비스를 제공하고 있는 포털사이트에서는 무료 번역기 또한 무료로 제공하고 있다. 하지만 무료로 제공하는 만큼 번역기의 신뢰도가 높지 않아, 실제 사용함에 있어 실제 번역에 제약이 있기 마련이다. 이러한 점에서 본 논문에서는 수많은 사람들이 작성한 정보를 통해 문맥 속에서 쉽게 틀릴 수 있는 전공 용어의 올바른 해석을 위해 오피니언 마이닝 기법 중 PMI-IR 수식을 이용하여 번역기의 신뢰도를 개선하는 방법을 제안한다.

아바타수어 서비스를 위한 한국수어 스크립트 기술 (A Script Format of Korean Sing Language for Animated Signing Avatar Service)

  • 이한규;최지훈;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.456-458
    • /
    • 2020
  • 한국수화언어(한국수어)는 농인들이 사용하는 언어이며, 농인이라 함은 청각장애를 가진 사람으로서 한국수어를 일상어로 사용하는 사람을 말한다. 수어를 하나의 언어로써 다른 언어로의 번역 또는 상호번역을 위하여 기계학습 기반의 기술이 연구개발 되고 있으나, 수어는 영상 기반의 언어이고 한국수어의 문법 및 사전체계의 구축이 진행 중인 이유로 한국수어의 번역기술은 상대적으로 다른 이종언어 간의 번역기술에 비하여 발전속도가 느리다. 본 논문에서는 한국어를 한국수어로 번역하여 표현하기 위하여 필요한 수어 스크립트 포맷 및 데이터 인터페이스 규격을 제안한다.

  • PDF

DaMaN: 좌우접속정보를 이용한 한국어 생성기 (A Korean Generator using Left-Right Connectivity Information)

  • 장원;여상화;정한민;김태완;황도삼;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-130
    • /
    • 1995
  • 기계번역은 대상 언어를 해석하고 변환하여 목적언어의 대역어를 선정한 후, 목적언어를 생성하는 과정을 거친다. 이때, 대상언어의 분석 단위에 따라 대역어의 생성 단위 또는 깊이가 다르다. 그러므로, 특정한 시스템을 위한 생성기는 그 시스템의 해석 또는 변환단계에서 추출되는 대역어에 의존하게 되어 시스템 호환성을 상실한다. 따라서, 중복된 생성기의 개발을 피하기 위하여 번역시스템 특성에 국한되지 않고 독립적으로 이용될 수 있는 한국어 형태소생성기 개발이 필요하다. 본 논문에서는 한국어 해석에 사용되는 한국어 형태소 좌우인접정보를 이용하여 한국어형태소를 생성하는 시스템인 DaMaN을 소개한다. 세분류된 형태소의 활용과 접속, 조사의 변동, 띄어쓰기를 고려한 형태소 좌우접속 정보를 임의 조합 가능한 복합형태 (합성어)에도 적용할 수 있도록 확장하였다. 따라서, 대상언어의 분석단위에 제한 받지 않으므로 시스템 호환성이 있다.

  • PDF

위키피디아를 이용한 영-한 개체명 대역어 쌍 구축 (Extracting English-Korean Named-Entity Word-pairs using Wikipedia)

  • 김은경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2009
  • 본 논문은 공통적으로 이용할 수 있는 웹 환경에서의 한국어 정보로 획득할 수 있는 정보의 양이 영어권 정보의 양보다 상대적으로 적다는 것을 토대로, 웹정보 이용의 불균형을 해소하고자 하는 목적으로부터 출발하였다. 최근에는 지식 정보의 세계화, 국제화에 따라 동일한 정보를 각국 언어로 제공하고자하는 연구가 꾸준히 증가하고 있다. 온라인 백과사전인 위키피디아 역시 현재 다국어로 제공이 되고 있지만 한국어로 작성된 문서는 영어로 작성된 문서의 5% 미만인 것으로 조사되었다. 본 논문에서는 위키피디아 내에서 제공하는 다국어간의 링크 정보와 인포박스 데이터를 활용하여 위키피디아 문서 내에서 개체명을 인식하고, 자동으로 개체명의 영-한 대역어 쌍을 추출하는 것을 목표로 한다. 개체명은 일반 사전에 등재 되지 않은 경우가 많기 때문에, 기계번역에서 사전 데이터 등을 활용하여 개체명을 처리하는 것은 쉽지 않으며 일반적으로 음차표기 방식을 함께 사용하여 해결하고 있다. 본 논문을 통해 위키피디아 데이터를 활용해 만들어진 영-한 개체명 대역어 사전을 구축하기 위해 사용된 기술은 추후 위키피디아 문서를 기계번역하는데 있어 동일한 방법으로 사용이 가능하며, 구축된 사전 데이터는 추후 영-한 자동 음차표기 연구의 사전 데이터로도 활용이 가능하다.

  • PDF

영·한 통번역 교육을 위한 클리셰(cliche) 분석 : 셰익스피어 극 텍스트를 중심으로 (Cliche Analysis for English-Korean Interpretation and Translation Training : Mainly on Shakespeare's Works Texts)

  • 유선영
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.626-634
    • /
    • 2015
  • 이 연구는 그 중요성이 인식되지 못하고 깊이 있는 연구가 행해지지 않았던 클리셰(cliche)에 주목하여, 셰익스피어 극에 나타난 클리셰를 분석하고자 했다. 일반적으로 클리셰는 은유의 특성을 가진 관용어로만 여겨져 주목받지 못했으나, 은유라는 인지 기제를 갖춘 언어 표현으로써 관용어를 포함한 광의의 개념이다. 본 연구는 영어에서 클리셰의 개념과 범주를 명확히 하기 위해 먼저 클리셰의 개념과 관용어와의 차이점을 살펴보았다. 아울러 본 연구는 클리셰에 대한 깊이 있는 이론적 논의의 출발점이 되고자 하는 취지에서 영문학 작품의 비조이자 클리셰가 가장 많이 언급된 셰익스피어의 작품을 분석 대상으로 삼아, 셰익스피어의 총 20개의 작품에 나타난 클리셰 분석을 통해 셰익스피어의 작품 속에 쓰인 클리셰가 관용어로만 규정지어 질 수 없음을 증명하고자 했다. 본 연구는 클리셰를 셰익스피어의 작품을 통해 정리하여 실증적으로 분석함으로써 관용어와 클리셰의 개념을 명확히 함과 동시에, 두 용어의 사용에 기준을 마련하고, 클리셰를 효율적으로 이해하고 사용할 수 있도록 발판을 마련했다는 점에서 영어 학습자를 비롯한 영 한 통번역 교육 분야의 연구 확장에 기여할 것으로 기대한다.

PDMT 번역 방법론에 기반한 대화체 음성 언어 번역 시스템 (Spoken language Translation System Based on PDMT)

  • 윤승;유초롱;최미란;오승신;박준;이영직
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.279-283
    • /
    • 2003
  • ETRI가 참여하고 있는 자동 통역 관련 국제 컨소시엄인 C-STAR에서는 여행자 영역의 대규모 다국어 병렬 말뭉치를 공동으로 구축하였고, 현재 각 기관에서는 이를 이용한 대화체 음성 언어 번역 시스템을 개발 중이다. ETRI에서는 핵심어 처리, 통계정보를 이용하는 구 단위 자동 설정, 설정된 구의 자동대응 및 재배치 등을 특징으로 하는 구 기반 직접 번역 방식(PDMT: Phrase-based Direct Machine Translation)의 번역 방법론을 제안하고 관련 연구를 진행하고 있다. 본 논문에서는 ETRI 대화체 음성 언어 번역 시스템의 구성에 대해 알아보고 PDMT 번역 방법론의 등장 배경과 그 구체적인 번역 방법 및 특징에 대해 자세히 논의하기로 한다.

  • PDF