• 제목/요약/키워드: 번역기

검색결과 320건 처리시간 0.028초

대상 영역 코퍼스를 이용한 번역사전의 특정 영역화를 위한 워크벤치 (A Workbench Domain Adaptation of an MT Lexicon with a Target Domain Corpus)

  • 노윤형;이현아;김길창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.163-168
    • /
    • 2000
  • 기계번역에서 좋은 품질의 번역 결과를 얻기 위해서는 대상으로 하고 잇는 전문 영역에 맞게 시스템의 번역 지식을 조정해야 한다. 본 연구에서는 대상 영역 코퍼스를 이용하여 기계번역 시스템의 특정 영역화를 지원하는 워크벤치를 설계하고 구현한다. 워크벤치는 대상 영역의 코퍼스에서 대상 영역의 지식을 추출하는 영역 지식 추출기와, 추출된 지식을 사용자에게 제시하여 사용자가 사전을 편집할 수 있는 환경을 제공하는 영역 지식 검색기와 사전 편집기로 구성된다. 구혀된 워크벤치를 이용하여 일반 영역 사전을 군사 정보 영역으로 특정 영역화를 해 본 결과, 효율성과 정확성에서의 향상이 있었다.

  • PDF

Bytecode-to-C 변환기의 설계 및 구현 (Design and Implementation of Bytecode-to-C Converter)

  • 권혜은;김상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.52-54
    • /
    • 2001
  • 자바프로그램이 사용하는 바이트코드는 자바가상머신을 통해 플랫폼에 독립적인 특징을 갖는다. 이러한 장점은 인터프리터를 통해 실행되므로 실행속도의 저하와 플랫폼에 의존적인 작업이 어려운 문제점등을 가진다. 이러한 문제점을 보완하기 위한 기술로 JIT 컴파일러와 JNI 기술이 사용된다. 본 논문에서는 JIT 컴파일러가 가지는 실행속도의 향상과 JNI 프로그램의 편리한 작성에 도움을 주고, JVM에 독립적인 번역기를 설계하고 구현하였다. 번역기는 클래스파일을 읽어들여 이 프로그램을 위한 스텁 자바프로그램과 C 프로그램을 생성하고, 기존 C 컴파일러를 사용하여 번역하고 최적화 시키는 과정으로 이루어진다.

확장된 동사형을 이용한 영어문장 검사기 (English Sentence Critique Using Extended Verb Pattern)

  • 차의영;김영택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.491-501
    • /
    • 1992
  • 변환 방식의 기계 번역에서 가장 중요한 부분은 변환 단계이며 여기서 변환사전이 매우 중요한 역활을 담당한다. 그러므로 인간이나 기계 번역기에 의해 생성되는 영어 문장은 이들이 가지고 있는 동사 사전의 내용과 효율적인 생성 알고리즘에 의해서 문장의 수준이나 정확성이 결정된다. 이렇게 생성된 문장을 검사하는 기존의 영어 문법 검사기들은 영어권의 사람들을 위주로 만들어졌기 때문에 문법적인 중요한 규정들을 포함하지 않고 있어서 비영어권의 사용자가 이용하기에는 부적절하다. 본 논문에서는 인간이 번역하였거나 기계 번역기에 의해 생성된 문장을 검사하고 교정할 수 있도록, 확장된 동사형을 기반으로 한 동사 사전을 제안하고 이를 이용한 영어 문장 검사기를 구현한다.

  • PDF

동의어와 용어에 대한 번역 신뢰도 개선 방법 (The Way to Improve Credibility of Translation for Synonyms and Terms)

  • 임지연;윤재열;김이준;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1095-1096
    • /
    • 2012
  • 인터넷의 비약적인 발전으로 우리는 생활에 필요한 많은 것들을 인터넷을 통해 얻는다. 날씨, 뉴스, 만화, 나아가서는 전공 공부까지 많은 정보를 인터넷에서 얻을 수 있다. 또한 이러한 여러 서비스를 제공하고 있는 포털사이트에서는 무료 번역기 또한 무료로 제공하고 있다. 하지만 무료로 제공하는 만큼 번역기의 신뢰도가 높지 않아, 실제 사용함에 있어 실제 번역에 제약이 있기 마련이다. 이러한 점에서 본 논문에서는 수많은 사람들이 작성한 정보를 통해 문맥 속에서 쉽게 틀릴 수 있는 전공 용어의 올바른 해석을 위해 오피니언 마이닝 기법 중 PMI-IR 수식을 이용하여 번역기의 신뢰도를 개선하는 방법을 제안한다.

Stabs에서 DIL로의 번역기의 구현 (An Implementation of Stabs to DIL Translator)

  • 김성엽;장종현;김선재;김승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.688-690
    • /
    • 2001
  • 교환기 소프트웨어와 같은 통신 시스템은 분산 병렬적인 수행 특성을 가지며, CHILL의 디버깅 환경인 TECH는 이러한 특성을 반영하고 있다. 최근의 교환기 소프트웨어 개발에 C 언어가 많이 사용되고 있는데, C 디버깅 환경은 이러한 특성을 잘 반영하지 못한다. 따라서, C 언어로 작성된 프로그램을 TECH에서 디버깅할 수 있다면 새로운 환경을 구축하지 않고도 기존의 환경을 이용함으로써 비용과 시간을 줄일 수 있다. 그러나, 두 환경의 디버깅 정보인 Stabs와 DIL은 표현 방식이 다르므로 이들간의 번역을 위한 도구가 필요하다. 본 논문에서는 이를 위해 Stabs 정보와 실행 파일을 분석하는 분석기, 분석된 정보를 각각에 해당하는 DIL에 대응시키는 대응기, 대응된 DIL 정보를 생성하는 생성기로 구성된 Stabs에서 DIL로의 번역기를 구현하였다.

  • PDF

용언구에 기반한 한영 기계번역 시스템 : 'CaptionEye/KE' (Korean-to-English Machine Translation System based on Verb-Phrase : 'CaptionEye/KE')

  • 서영애;김영길;서광준;최승권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.269-272
    • /
    • 2000
  • 본 논문에서는 ETRI에서 개발 중인 용언구에 기반한 한영 기계번역 시스템 CaptionEye/KE에 대하여 논술한다. CaptionEye/KE는 대량의 고품질 한-영 양방향 코퍼스로부터 추출된 격틀사전 및 대역패턴, 대역문 연결패턴 등의 언어 지식들을 바탕으로 하여, 한국어의 용언구 단위의 번역을 조합하여 전체 번역을 수행한다. CaptionEye/KE는 변환방식의 기계번역 시스템으로서, 크게 한국어 형태소 분석기, 한국어 구문 분석기, 부분 대역문 연결기, 부분 대역문 생성기, 대역문 선택/정련기, 영어형태소 생성기로 구성된다. 입력된 한국어 문장에 대해 형태소 분석 및 태깅을 수행한 후, 격틀사전을 이용하여 구문구조를 분석하고 의존 트리를 생성해 낸다. 이렇게 생성된 의존 트리로부터 대역문 연결패턴을 이용하여 용언구들간의 연결에 대한 번역을 수행한 후 대역패턴을 이용하여 각 용언구들을 번역하고 문장 정련과정을 거쳐 영어 문장을 최종 생성한다.

  • PDF

n-best 리랭킹을 이용한 한-영 통계적 음성 번역 (Korean-English statistical speech translation Using n-best re-ranking)

  • 이동현;이종훈;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2006
  • 본 논문에서는 n-best 리랭킹을 이용한 한-영 통계적 음성 번역 시스템에 대해 논하고 있다. 보통의 음성 번역 시스템은 음성 인식 시스템, 자동 번역 시스템, 음성 합성 시스템이 순차적으로 결합되어 있다. 하지만 본 시스템은 음성 인식 오류에 보다 강인한 시스템을 만들기 위해 음성 인식 시스템으로부터 n-best 인식 문장을 추출하여 번역 결과와 함께 리랭킹의 과정을 거친다. 자동 번역 시스템으로 구절기반 통계적 자동 번역 모델을 사용하여, 음성 인식기의 발음 모델에서 기본 단어 단위와 맞추어 번역 모델과 언어 모델을 훈련시킴으로써 음성 번역 시스템에서 형태소 분석기를 제거할 수 있다. 또한 음성 인식 시스템에서 상황 별로 언어 모델을 분리하여 처리함으로써 자동 번역 시스템에 비해 부족한 음성 인식 시스템의 처리 범위를 보완할 수 있었다.

  • PDF

자동통번역 시스템의 언어 현상별 자동 평가 (Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points)

  • 최승권;최규현;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1041-1044
    • /
    • 2019
  • 자동통번역의 성능을 평가하는데 가장 잘 알려진 자동평가 기술은 BLEU이다. 그러나 BLEU로는 자동통번역 결과의 어느 부분이 강점이고 약점인지를 파악할 수 없다. 본 논문에서는 자동통번역 시스템의 언어 현상별 자동평가 방법을 소개하고자 한다. 언어 현상별 자동평가 방법은 BLEU가 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자로 하여금 해당 자동통번역 시스템의 언어 현상별 강점과 약점을 직관적으로 파악할 수 있도록 한다. 언어 현상별 정확도 측정은 Google 과 Naver Papago 를 대상으로 실시하였다. 정확률이 40%이하를 약점이라고 간주할 때, Google 영한 자동번역기의 약점은 스타일(32.50%)번역이었으며, Google 영한 자동통역기의 약점은 음성(30.00%)인식, 담화(30.00%)처리였다. Google 한영 자동번역기 약점은 구문(34.00%)분석, 모호성(27.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(30.00%)처리였다. Papago 영한 자동번역기는 대부분 정확률이 55% 이상이었으며 Papago 영한 자동통역기의 약점은 담화(30.00%)처리였다. 또한 Papago 한영 자동번역기의 약점은 구문(38.00%)분석, 모호성(32.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(20.00%)처리였다. 언어 현상별 자동평가의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.

역사적 변천에 따른 한국수어 번역의 형태와 특성 연구 (A Study on the Forms and Characteristics of Korean Sign Language Translation According to Historical Changes)

  • 이준우
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.508-524
    • /
    • 2021
  • 과학기술의 발달에 힘입은 혁신적인 번역 환경은 수어 번역의 확대 가능성과 실현성을 높이는 요소가 되고 있다. 한국수어 번역도 새로운 도전과 기회를 맞이하고 있다. 본 연구는 첫째, '한국수어 번역은 한국수어의 역사적 변천과정 속에서 언제 어떻게 나타났는가?', 둘째, '한국수어 번역의 결과로 산출된 번역의 형태와 특성은 무엇인가?', 셋째, '한국수어 번역의 현황과 전망은 어떠한가?'라는 연구 질문들을 제기하고 이에 대한 대답을 찾아간다. 이에 따라 본 연구는 통합적 문헌고찰 방법을 사용해 역사적으로 한국수어 번역이 어떻게 형성되었으며 한국수어 번역의 형태와 특성은 어떠한지를 고찰하였다. 연구 결과 첫째, 수어번역 잠재기, 형성기, 확장기로 구분되는 역사적 변천과정에 따른 한국수어 번역의 형태와 특성이 나타났으며, 둘째, 한국수어 말뭉치 사업과 기계번역에 따른 한국수어 번역의 형태와 특성이 도출되었다. 아울러 한국수어 번역의 현황을 파악하고, 향후 전망을 제시하였다.

XML 데이타 처리를 위한 XML-QL to SQL 번역기 (An XML-QL to SQL Translator for Processing XML Data)

  • 장경자;이기호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.1-8
    • /
    • 2002
  • XML이 다양한 유형의 웹 데이타를 구성하고 교환하기 위한 국제적인 표준으로 제안되었다. 다양한 애플리케이션에서 필요로 하는 데이타가 XML 문서에 저장되어 있을 때, 그 데이타를 검색하는 것은 중요한 일이다. 본 논문에서는 XML 문서를 관계형 데이타베이스 시스템에 저장하는 방법과 저장된 XML 데이타를 XML-QL로 질의하여 검색하는 방법을 제안한다. 즉, XML의 저장 방법을 제안하고 저장된 XML 데이타를 검색하기 위해 XML-QL로 들어온 질의를 관계형 데이터베이스 시스템의 전용 질의 언어인 SQL로 변환시켜 주는 번역기를 설계 및 구현한다. 본 논문의 의의는 번역기에 대한 설계와 구현을 자세히 기술하므로 번역기의 가능성을 보여주고 XML 질의의 포괄적인 분류와 그에 대한 SQL 관계형 질의로의 매핑을 보여주고 있다는 점이다.