• 제목/요약/키워드: Translation of English

검색결과 357건 처리시간 0.028초

한영 혼용문에서 괄호 안 대역어구의 자동 인식 (Automatic Recognition of Translation Phrases Enclosed with Parenthesis in Korean-English Mixed Documents)

  • 이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.445-452
    • /
    • 2002
  • 한영 혼용문에서 번역된 전문용어 등을 사용할 때, 이해를 돕기 위해 그 뒤의 괄호 안에 원어 풀이를 함께 쓰는 경우가 많다. 본 논문에서는 괄호가 사용된 구가 대역어구 관계인지를 판단하고, 어느 범위까지 대역어구인지를 기본사전을 이용하여 확률적으로 계산하고 인식하는 방법을 제시한다. 특히, 사전에 표제어로서 혹은 대역어로서 존재하지 않는 단어들을 처리하기 위해 음운유사도 일치, 대역어 부분일치의 방법과 복합어 처리를 위해 부분일치 방법을 새로 제안하였다. 각 방법들을 단계별로 실험하여 0.4F값$(\alpha$를 0.4로 설정한 F값)으로 측정한 결과, 기본 실험 방법인 사전 대역어 완전일치방법의 경우 23.8%인데 비해, 대역어 부분일치와 음운유사도 일치를 흔합한 방법이 75.9%, 복합어 처리를 추가한 방법이 77.3%의 값을 보여 성능이 최고 3.25배 향상되었다.

Glossary에 기초한 시스템에서의 적형태 영어문장 생성을 위한 한영 대역에 전자사전구축 (Constructing A Korean-English Bilingual Dictionary For Well-formed English Sentence Generations In A Glossary-based System)

  • 신효필
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.1-13
    • /
    • 2003
  • 본 논문은 자연언어처리 (Natural Language Processing), 특히 한영 기계번역에서 필수적 인 한영 대역어 사전을 구축함에 있어 영어 생성시 정확한 문장형태를 도출하기 위한 방법에 대해 논의한다. 기간의 연구는 주로 한국어와 영어의 의미적 모호성이 해결된 정확한 번역을 위한 대역어 내지 변환사전 구조에 초점이 맞추어져 왔고 상대적으로 형태적 또는 구문적으로 정확한 영어문장을 생성하는 것은 간과되어져 왔다. 기존 자원의 황용이라는 측면에서는 텍스트화된 한영사전을 그대로 이용한다고 하면 그 기술방식과 영어표현은 다양한 형태로 나타나기 때문에 정확한 의미의 대역어 뿐만 아니라 적격한 영어문장의 생성을 위해서는 어떠한 정보들이 대역어 사전에 기술되어야 하는지 고려해 볼 필요가 있다 따라서 본 논의에서는 기존의 인쇄된 한영사전을 구조분석하여 자동으로 변환하여 최소한의 인간의 간섭으로 정확한 영어생성에 필요한 형태적 정보를 자질로 부여하는 방법을 기술한다. 기본적으로 이 방법은 단어 대 단어 번역시스템 둥 glossary에 기초한 얕은 층위의 번역이 필요한 시스템을 위한 사전을 구축에서 시작하며 더 나아가 대규모의 전자사전 구축작업에서 어떻게 응용될 수 있는지 논의한다.

  • PDF

영한 기계번역에서의 영어 품사결정 모델 (A Model of English Part-Of-Speech Determination for English-Korean Machine Translation)

  • 김성동;박성훈
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.53-65
    • /
    • 2009
  • 영한 기계번역에서 영어 단어의 품사결정은 번역할 문장에 사용된 어휘의 품사 모호성을 해소하기 위해 필요하다. 어휘의 품사 모호성은 구문 분석을 복잡하게 하고 정확한 번역을 생성하는 것을 어렵게 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 어휘 분석 이후 구문 분석 이전에 품사 모호성을 해소하려 하였으며 품사 모호성을 해소하기 위한 CatAmRes 모델을 제안하고 다른 품사태깅 방법과 성능 비교를 하였다. CatAmRes는 Penn Treebank 말뭉치를 이용하여 Bayesian Network를 학습하여 얻은 확률 분포와 말뭉치에서 나타나는 통계 정보를 이용하여 영어 단어의 품사를 결정을 한다. 본 논문에서 제안한 영어 품사결정 모델 CatAmRes는 결정할 품사의 적정도 값을 계산하는 Calculator와 계산된 적정도 값에 근거하여 품사를 결정하는 POSDeterminer로 구성된다. 실험에서는 CatAmRes의 동작과 성능을 테스트 하기 위해 WSJ, Brown, IBM 영역의 말뭉치에서 추출한 테스트 데이터를 이용하여 품사결정의 정확도를 평가하였다.

  • PDF

Ranking Translation Word Selection Using a Bilingual Dictionary and WordNet

  • Kim, Kweon-Yang;Park, Se-Young
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.124-129
    • /
    • 2006
  • This parer presents a method of ranking translation word selection for Korean verbs based on lexical knowledge contained in a bilingual Korean-English dictionary and WordNet that are easily obtainable knowledge resources. We focus on deciding which translation of the target word is the most appropriate using the measure of semantic relatedness through the 45 extended relations between possible translations of target word and some indicative clue words that play a role of predicate-arguments in source language text. In order to reduce the weight of application of possibly unwanted senses, we rank the possible word senses for each translation word by measuring semantic similarity between the translation word and its near synonyms. We report an average accuracy of $51\%$ with ten Korean ambiguous verbs. The evaluation suggests that our approach outperforms the default baseline performance and previous works.

번역: 대응과 평가 (Translation:Mapping and Evaluation)

  • 장석진
    • 한국언어정보학회지:언어와정보
    • /
    • 제2권1호
    • /
    • pp.1-41
    • /
    • 1998
  • Evaluation of multilingual translation fundamentally involves measurement of meaning equivalences between the formally mapped discourses/texts of SL(source language) and TL(target language) both represented by a metalanguage called IL(interlingua). Unlike a usaal uni-directional MT(machine translation) model(e.g.:SL $\rightarrow$ analysis $\rightarrow$ transfer $\rightarrow$ generation $\rightarrow$ TL), a bi-directional(by 'negotiation') model(i.e.: SL $\rightarrow$ IL/S $\leftrightarrow$ IL $\leftrightarrow$ IL/T \leftarrow TL) is proposed here for the purpose of evaluating multilingual, not merely bilingual, translation. The IL, as conceived of in this study, is an English-based predicate logic represented in the framework of MRS(minimal recursion semantics), an MT-oriented off-shoot of HPSG(Head-driven Phrase Structure Grammar). In addition, a list of semantic and pragmatic checkpoints are set up, some being optional depending on the kind and use of the translation, so sa to have the evaluation of translation fine-grained by computing matching or mismatching of such checkpoints.

  • PDF

실용적인 영한 기계번역을 위한 전처리기의 설계 및 구현 (A Preprocessor for Practical English-to-Korean Machine Translation)

  • 여상화;정한민;채영숙;김태완;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.313-321
    • /
    • 1996
  • 본 논문에서는 실용적인 기계번역 시스템을 위하여 다양한 입력 형태에서 나타나는 여러 현상을 전처리하는 기법을 설명한다. 전처리기는 문장 분리, Title 및 나열문 인식, HTML Tag의 처리, 하이픈처리, 숫자 표현 처리, 대소문자의 정규화, 고유명사 인식, 복합단위 인식 등을 수행하여 형태소 분석기의 처리 부담을 줄인다.

  • PDF

넷플릭스 <오징어 게임> 폐쇄자막 연구 (A Case Study on Closed Captions: Focusing on on Netflix)

  • 정수아;이지민
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.279-285
    • /
    • 2024
  • 본 연구는 넷플릭스의 <오징어 게임>을 대상으로 한국어와 영어 폐쇄자막(closed caption)의 정확성과 완전성을 평가하고 이에 따른 시사점을 제시하는 것을 목적으로 한다. 이를 위해 미연방통신위원회(FCC), DCMP, 한국방송통신위원회의 페쇄자막 지침을 파악하고 분석 항목을 분류하였다. <오징어 게임> 전편의 자막을 추출해 비교 분석한 결과, 정확성 측면의 경우 한국어 폐쇄자막은 비속어와 호칭은 정확하게 제시하고 있으나, 화자 식별에서는 존재하지 않는 정보를 미리 제시하는 문제점이 관찰되었다. 영어 폐쇄자막의 경우 화자 식별 지침은 준수하고 있으나 비속어 생략과 호칭 오역의 문제가 있었다. 완전성 측면에서는 한국어와 영어 폐쇄자막 모두 일부가 생략되는 문제가 관찰되었다. 이러한 문제 해결을 위해서는 검수 과정을 강화하고, 번역 과정에서 발견한 원문의 문제점을 소통하는 체계를 마련하며, 영어 일반자막을 활용할 것을 제안한다.

영·한 통번역 교육을 위한 클리셰(cliche) 분석 : 셰익스피어 극 텍스트를 중심으로 (Cliche Analysis for English-Korean Interpretation and Translation Training : Mainly on Shakespeare's Works Texts)

  • 유선영
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.626-634
    • /
    • 2015
  • 이 연구는 그 중요성이 인식되지 못하고 깊이 있는 연구가 행해지지 않았던 클리셰(cliche)에 주목하여, 셰익스피어 극에 나타난 클리셰를 분석하고자 했다. 일반적으로 클리셰는 은유의 특성을 가진 관용어로만 여겨져 주목받지 못했으나, 은유라는 인지 기제를 갖춘 언어 표현으로써 관용어를 포함한 광의의 개념이다. 본 연구는 영어에서 클리셰의 개념과 범주를 명확히 하기 위해 먼저 클리셰의 개념과 관용어와의 차이점을 살펴보았다. 아울러 본 연구는 클리셰에 대한 깊이 있는 이론적 논의의 출발점이 되고자 하는 취지에서 영문학 작품의 비조이자 클리셰가 가장 많이 언급된 셰익스피어의 작품을 분석 대상으로 삼아, 셰익스피어의 총 20개의 작품에 나타난 클리셰 분석을 통해 셰익스피어의 작품 속에 쓰인 클리셰가 관용어로만 규정지어 질 수 없음을 증명하고자 했다. 본 연구는 클리셰를 셰익스피어의 작품을 통해 정리하여 실증적으로 분석함으로써 관용어와 클리셰의 개념을 명확히 함과 동시에, 두 용어의 사용에 기준을 마련하고, 클리셰를 효율적으로 이해하고 사용할 수 있도록 발판을 마련했다는 점에서 영어 학습자를 비롯한 영 한 통번역 교육 분야의 연구 확장에 기여할 것으로 기대한다.