• 제목/요약/키워드: 번역어

검색결과 263건 처리시간 0.022초

한영 혼용문에서 괄호 안 대역어구의 자동 인식 (Automatic Recognition of Translation Phrases Enclosed with Parenthesis in Korean-English Mixed Documents)

  • 이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.445-452
    • /
    • 2002
  • 한영 혼용문에서 번역된 전문용어 등을 사용할 때, 이해를 돕기 위해 그 뒤의 괄호 안에 원어 풀이를 함께 쓰는 경우가 많다. 본 논문에서는 괄호가 사용된 구가 대역어구 관계인지를 판단하고, 어느 범위까지 대역어구인지를 기본사전을 이용하여 확률적으로 계산하고 인식하는 방법을 제시한다. 특히, 사전에 표제어로서 혹은 대역어로서 존재하지 않는 단어들을 처리하기 위해 음운유사도 일치, 대역어 부분일치의 방법과 복합어 처리를 위해 부분일치 방법을 새로 제안하였다. 각 방법들을 단계별로 실험하여 0.4F값$(\alpha$를 0.4로 설정한 F값)으로 측정한 결과, 기본 실험 방법인 사전 대역어 완전일치방법의 경우 23.8%인데 비해, 대역어 부분일치와 음운유사도 일치를 흔합한 방법이 75.9%, 복합어 처리를 추가한 방법이 77.3%의 값을 보여 성능이 최고 3.25배 향상되었다.

기계 번역 의미 대역 패턴을 이용한 한국어 복합 명사 의미 결정 방법 (A Method of Word Sense Disambiguation for Korean Complex Noun Phrase Using Verb-Phrase Pattern and Predicative Noun)

  • 양성일;김영길;박상규;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.246-251
    • /
    • 2003
  • 한국어의 언어적 특성에 의해 빈번하게 등장하는 명사와 기능어의 나열은 기능어나 연결 구문의 잦은 생략현상에 의해 복합 명사의 출현을 발생시킨다. 따라서, 한국어 분석에서 복합 명사의 처리 방법은 매우 중요한 문제로 인식되었으며 활발한 연구가 진행되어 왔다. 복합 명사의 의미 결정은 복합 명사구 내 단위 명사간의 의미적인 수식 관계를 고려하여 머리어의 선택과 의미를 함께 결정할 필요가 있다. 본 논문에서는 정보 검색의 색인어 추출 방법에서 사용되는 복합 명사구 내의 서술성 명사 처리를 이용하여 복합 명사의 의미 결정을 인접 명사의 의미 공기 정보가 아닌 구문관계에 따른 의미 공기 정보를 사용하여 분석하는 방법을 제시한다. 복합 명사구 내에서 구문적인 관계는 명사구 내에 서술성 명사가 등장하는 경우 보-술 관계에 의한 격 결정 문제로 전환할 수 있다. 이러한 구문 구조는 명사 의미를 결정할 수 있는 추가적인 정보로 활용할 수 있으며, 이때 구문 구조 파악을 위해 구축된 의미 제약 조건을 활용하도록 한다. 구조 분석에서 사용되는 격틀 정보는 동사와 공기하는 명사의 구문 관계를 분석하기 위해 의미 정보를 제약조건으로 하여 구축된다. 이러한 의미 격틀 정보는 단문 내 명사들의 격 결정과 격을 채우는 명사 의미를 결정할 수 있는 정보로 활용된다. 본 논문에서는 현재 개발중인 한영 기계 번역 시스템 Tellus-KE의 단문 단위 대역어 선정을 위해 구축된 의미 대역패턴인 동사구 패턴을 사용한다. 동사구 패턴에 기술된 한국어의 단문 단위 의미 격 정보를 사용하는 경우, 격결정을 위해 사용되는 의미 제약 조건이 복합 명사의 중심어 선택과 의미 결정에 재활용 될 수 있으며, 병렬말뭉치에 의해 반자동으로 구축되는 의미 대역 패턴을 사용하여 데이터 구축의 어려움을 개선하고자 한다. 및 산출 과정에 즉각적으로 활용될 수 있을 것이다. 또한, 이러한 정보들은 현재 구축중인 세종 전자사전에도 직접 반영되고 있다.teness)은 언화행위가 성공적이라는 것이다.[J. Searle] (7) 수로 쓰인 것(상수)(象數)과 시로 쓰인 것(의리)(義理)이 하나인 것은 그 나타난 것과 나타나지 않은 것들 사이에 어떠한 들도 없음을 말한다. [(성중영)(成中英)] (8) 공통의 규범의 공통성 속에 규범적인 측면이 벌써 있다. 공통성에서 개인적이 아닌 공적인 규범으로의 전이는 규범, 가치, 규칙, 과정, 제도로의 전이라고 본다. [C. Morrison] (9) 우리의 언어사용에 신비적인 요소를 부인할 수가 없다. 넓은 의미의 발화의미(utterance meaning) 속에 신비적인 요소나 애정표시도 수용된다. 의미분석은 지금 한글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\ulcorner$한국어사전$\lrcorner$ 등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다.반인과 다르다는 것이 밝혀졌다. 이 결과가 옳다면 한국의 심성 어휘집은 어절 문맥에 따라서 어간이나 어근 또는 활용형 그 자체로 이루어져 있을 것이다.으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함에 따라 단백질(蛋白質) 함량(含量)도 증가(增加)하였다. 7. CHS-13 균주(菌株)의 RNA 함량(

  • PDF

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 (Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering)

  • 문현석;박찬준;어수경;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-7
    • /
    • 2021
  • 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.

단어의 음성학적 특징을 이용한 한국어 기계 번역 데이터 세트 구축 방안 (Proposed Methodology for Building Korean Machine Translation Data sets Considering Phonetic Features)

  • 장칭하오;양홍진;김세린;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.592-595
    • /
    • 2022
  • 한국어에서 한자어와 외래어가 차지하는 비중은 매우 높다. 일상어의 경우 한자어와 외래어의 비중이 약 53%, 전문어의 경우 약 92%에 달한다. 한자어나 외래어는 중국이나 다른 나라로부터 영향을 받아 한국에서 쓰이는 단어들이다. 한국어에서 사용되는 한자어와 외래어의 한글 표기과 원어 표기를 발음해보면, 발음이 상당히 유사하다는 것을 알 수 있다. 한자어인 도서관(图书馆)을 중국어로 발음해보면 thu.ʂu.kwan'로 해당 단어에 대한 한국 사람의 발음과 상당히 유사하다. 본 논문에서는 Source Length, Source IPA Length, Target Length, Target IPA Length, IPA Distance 등 총 5가지의 음성학적 특징을 고려한 한국어-중국어 한국어-영어 단어 기계번역 데이터 세트를 구축하고자 한다.

  • PDF

1950년대 한국에서의 미국 도서번역 사업의 전개와 의미 (The U.S. Government's Book Translation Program in Korea in the 1950s)

  • 차재영
    • 한국언론정보학보
    • /
    • 제78권
    • /
    • pp.206-242
    • /
    • 2016
  • 이 연구는 1950년대 미국정부가 문화냉전의 와중에서 공공외교의 일환으로 해외에서 수행했던 도서 프로그램의 전체적인 윤곽을 살펴본 후, 한국에서 시행한 도서번역 사업의 전개 과정과 목적 및 내용을 분석하고, 사업의 성과와 의미를 검토하였다. 분석의 결과로, 한국에서의 미국 도서번역 사업은 미군정기부터 극히 미진한 수준에서 시작되었지만, 한국전쟁을 거치면서 본격화되어 1950년대 후반에 최고조에 도달했던 것으로 밝혀졌다. 1950년대 미국 국무성과 대외공보국(USIA)의 지침에 따라 주한 미공보원(USIS)이 수행했던 도서번역 사업의 목적은 시기에 따라 개별적인 비중이 변화되기는 했어도, 대체로 미국의 자유민주주의와 자본주의 체제의 우월성을 강조하고, 공산주의 사회의 부조리와 모순을 비판하며, 미국의 외교 정책에 대한 이해를 제고하고, 예술 문학 과학 부문에서의 미국의 성취를 전파하려 했던 것으로 확인되었다. 특히 번역 도서를 선정할 때 미국의 대외정책과 모순되거나 국가적 이미지를 훼손할 가능성이 있는 도서는 철저히 배제하였고, 미국정부의 공보정책에 기여할 것으로 판단되는 소수의 한국인 저작물에 대해서는 지원을 아끼지 않았으며, 도서번역 사업의 효과를 극대화하기 위해 일본어 번역서를 활용하는 것도 마다하지 않았다. 이러한 미국정부의 도서번역 사업은 한국이 해방과 분단으로 겪게 된 지식과 정보의 공백 상태를 극복하는 데 일정하게 기여했다고 평가할 수 있지만, 다른 한편으로 미국정부의 정책적 기준에 따른 도서 선정으로 말미암아 한국인들의 대미 인식이나 세계정세 판단에 왜곡을 초래했을 수도 있다고 생각된다.

  • PDF

DaHae: 일한 기계번역을 위한 일본어 형태소 분석기 (DaHae: Japanese Morphological Analyzer for Japanese to Korean Machine Translation)

  • 여상화;정한민;장원;김태완;황도삼;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.195-207
    • /
    • 1995
  • 일본어는 한자, 히라가나, 가다가나 등 다양한 종류의 문자를 사용하며 이들의 혼용 비율이 매우 높아 띄어쓰기를 하지 않아도 문서의 가독성을 유지한다. ICOT 사전, EDR 사전, ATLAS I/JK사전 등 기존의 전자 사전에서 복합 자종의 표제어가 차지하는 비율(한자+히라가나의 표제어 제외)은 평균 8.8%로 그 수가 매우 작다. 따라서, 문장 내에서 자종의 변화는 단어를 구분하는 하나의 delimiter로 이용될 수 있다. 본 시스템에서는 형태소 분석의 전단계로 전처리기를 두어 자종정보(character type information)에 의한 fragment 분리 및 예외 단어, 정형표현 처리를 수행하며 각 fragment 의 형태소 분석 방법을 제시한다. 형태소 분석기는 전처리기의 처리 결과를 입력받아 각각의 fragment를 전처리기가 제시한 분석 방법에 따라 분석하여 입력 문장의 가능한 모든 분석을 추출한다. 이 방법은 불필요한 사전 탐색과 접속 체크 회수를 줄여 분석 성능을 향상시킨다.

  • PDF

APOD 한국어 서비스 및 반응 조사 (Introduction of the Astronomy Picture of the Day Korea, and public response)

  • 김정환
    • 천문학회보
    • /
    • 제40권1호
    • /
    • pp.88.1-88.1
    • /
    • 2015
  • 우주라이크[WouldYouLike]에서 2014년 9월부터 공식적으로 제공한 APOD 번역서비스를 소개하고 지난 7개월간 대중의 반응에 대하여 논의한다. APOD는 Astronomy Picture of the Day의 약자로 우리말로는 오늘의 천문사진이다. APOD는 1995년 미국 미시건 대학교 교수인 Robert Nemiroff와 미항공우주국 나사의 연구원인 Jerry Bonnell에 의해서 처음 만들어졌다. 2014년 까지 일본어와 중국어를 포함한 세계의 다양한 언어로 제공 되었지만 유독 한국어만은 제외 되었었다. 비영리단체인 우주라이크[WouldYouLike]에서는 영어가 중심이 되는 APOD를 대한민국의 국민에게 한국어로 제공하기 위해서 2013년부터 미국 운영진과 논의을 시작하고 모바일 연동 가능한 홈페이지를 개설한 끝에 공식적인 한국어 서비스를 시작 할 수 있었다. 이번 발표를 통해 APOD가 무엇인지 소개하고 2014년부터 공식 번역이 시작된 이후 관찰되었던 홈페이지 방문자들의 반응에 관한 내용를 보여주고자 한다.

  • PDF

소의 첨단번식기술의 현황과 그 연구과제

  • 류일선
    • 대한수의사회지
    • /
    • 제37권10호
    • /
    • pp.938-948
    • /
    • 2001
  • 최근 대동물임상분야에서도 소의 번식장애뿐만 아니라 첨단번식기술에 대한 연구가 지속적으로 이뤄져오고 있으며, 관련분야에 종사하는 임상가, 연구자들에게도 수정란이식, 체세포복제수정란이식분야 등에 대한 연구가 시급하게 요구되고 있는 실정이다. 따라서 필자는 대동물임상가들과 관련연구자에게 도움이 되었으면 하는 바램을 피력하면서 지난 수의사회지 8월호에 이어<일본 북해도 삿뽀로시 에베츠에 소재하는 낙농학원대학(酪農學園大學:Rakuno Gakuen University)에서 지난 5월 26일(토) 오전 8시 50분부터 오후 6시까지 대동물임상수의사들을 대상으로 한 교육세미나>에서 발표된 자료중 소개를 하지 않은 부분을 다시금 시간의 여유를 내어 번역을 하여 소개하고자 한다. 지난 8월호에 이어 필자가 일본어로 된 자료를 번역하는 과정에서 우리말로 표현하는데 무리가 있는 부분은 알기쉽게 평이하게 정리하였음을 서두에 밝혀 둔다. 또한 우리 임상수의사들도 최근 관심이 증대되고 있는 수정란이식과 체세포복제수정란 등에 대한 전문지식과 연구정보를 입수, 습득하여 나가지 않으면 아니된다 하겠다.

  • PDF

의미론에서 "의미"와 관련된 용어들의 개념과 번역어 (On the Concepts and Translations of Terms Related to "Meaning" in Semantics)

  • 강범모
    • 한국언어정보학회지:언어와정보
    • /
    • 제15권1호
    • /
    • pp.79-92
    • /
    • 2011
  • Some terms related to "meaning" in semantics are reviewed, particularly those used in Lyons' famous semantics book Semantics 1 and Semantics 2 (Cambridge University Press, 1977). Since Lyons' book is so comprehensive that the semantic terms used in that book cover almost every important notions/terms used in contemporary semantics. With relevant interpretation of the terms, we suggest most appropriate Korean translations, trying to give different translations for different English terms. Terms covered include: 'signify, signification; reference/refer/referent, sense; denotation/denote, connotation/connote; extension, intension; implication/imply, implicature/implicate, entailment/entail; designate, demonstrate/demonstrative'.

  • PDF

대화체 번역을 위한 논항 구조에 기반한 한국어 분석 (A Korean Analysis based on Argument Structures for Spoken Language Translation)

  • 정천영;서영훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권4호
    • /
    • pp.380-387
    • /
    • 2001
  • 본 논문에서는 대화체 번역을 위한 논항 구조에 기반한 한국어 분석에 대하여 기술한다. 논항구조 기반 문법은 순서에 관계없이 기술된다. 따라서 한국어 부분 자유 어순 특성으로 문법이 방대해지는 문제점을 해결할 수 있다. 또한, 서술어가 지배하는 논항이 문법으로부터 선택됨으로서 대화체가 갖는 특성인 간투어나 중복 발화 현상 등을 효과적으로 해결할 수 있다. 실험을 위하여 사용된 데이터는 ‘여행 안내’ 영역 중에서 1,335개의 훈련된 발화문과 420개의 훈련되지 않은 발화문이다. 실험 결과 훈련된 발화문에서는 99.7%, 훈련되지 않은 발화문에서는 93.3%의 분석 성공률을 보였다.

  • PDF