• 제목/요약/키워드: 원시 언어

검색결과 99건 처리시간 0.023초

`단어-의미 의미-단어` 관계에 기반한 번역어 선택 (Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship)

  • 이현아
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.71-76
    • /
    • 2006
  • 기계번역에서 올바른 번역 문장을 구성하기 위해서는 원시 문장의 의미를 올바르게 표현하면서 자연스러운 목적 문장을 구성하는 번역어를 선택해야 한다. 본 논문에서는 '단어-의미 의미-단어' 관계, 즉 원시언어의 한 단어는 하나 이상의 의미를 가지고 각 의미는 각기 다른 목적언어 단어로 표현된다는 점에 기반하여, 원시 단어의 의미 분별과 목적 단어 선택을 결합하여 번역어를 선택하는 방식을 제안한다. 기존의 번역방식은 원시 단어에 대한 목적단어를 직접 선택하는 '단어-단어' 관계에 기반하고 있기 때문에, 원시언어를 목적 언어로 직접 대응시키기 위한 지식을 필요로 하여 지식 획득에 어려움이 있었다. 본 논문의 방식에서는 원시 단어의 의미 분별과 목적 언어의 단어 선택의 결합을 통해 번역어를 선택함으로써, 손쉽게 획득할 수 있는 원시 언어와 목적 언어 각각의 지식원에서 번역어 선택을 위한 지식을 자동으로 추출할 수 있다. 또한 원시 언어의 의미와 목적 언어의 쓰임새를 모두 반영하여 충실도와 이해도를 모두 만족시키는 보다 정확한 번역어를 선택할 수 있다.

두단계 대역어선택 방식을 이용한 구단위 패턴기반 한영 기계번역 시스템 (Phrase-Pattern-based Korean-to-English Machine Translation System using Two Level Word Selection)

  • 김정재;박준식;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-214
    • /
    • 1999
  • 패턴기반기계번역방식은 원시언어패턴과 그에 대한 대역언어패턴들의 쌍을 이용하여 구문분석과 변환을 수행하는 기계번역방식이다. 패턴기반 기계번역방식은 번역할 때 발생하는 애매성을 해소하기 위해 패턴의 길이를 문장단위까지 늘이기 때문에, 패턴의 수가 급증하는 문제점을 가진다. 본 논문에서는 패턴의 단위를 구단위로 한정시킬 때 발생하는 애매성을 해소하는 방법으로 시소러스를 기반으로 한 두단계 대역어 선택 방식을 제안함으로써 효과적으로 애매성을 감소시키면서 패턴의 길이를 줄이는 모델을 제시한다. 두단계 대역어 선택 방식은 원시언어의 한 패턴에 대해 여러 가능한 목적언어의 대역패턴들이 있을 때, 첫 번째 단계에서는 원시언어 내에서의 제약조건에 맞는 몇가지 대역패턴들을 선택하고, 두번째 단계에서는 목적언어 내에서의 제약조건에 가장 적합한 하나의 대역패턴을 선택하는 방식이다. 또한 본 논문에서는 이와 같은 모델에서 패턴의 수가 코퍼스의 증가에 따른 수렴가능성을 논한다.

  • PDF

한영 자동 번역을 위한 동사구 번역패턴의 활용 (Design of Verb-Phrase Patterns for Korean-to-English MT)

  • 양성일;김영길;서영애;김창현;홍문표;최승권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.178-180
    • /
    • 2001
  • 원시언어 문장의 구조 분석을 기반으로 하는 기계번역 시스템에서 원시언어의 최소 의미 단위는 동사를 중심으로 한 단문으로 생각할 수 있다. 단문 단위 대역어를 지정하기 위해서는 동사구 번역패턴의 사용이 요구된다. 본 논문에서는 한국어 단문 내 격 정보와 번역을 위한 의미 제약조건을 기술하여 한영 기계번역 시스템에서 사용하는 동사구 번역패턴을 정의하고, 문장 정규화를 통한 동사구 번역패턴의 활용방법을 제안한다. 동사구 번역패턴은 단문 구조 파악을 위한 제약 조건부와 대역어 선정부로 나뉜다. 제약 조건부는 단문 구조 번역을 위한 최소한의 의미 제약만으로 기술되며, 격조사로 구분되는 격 정보를 갖는다. 이러한 격 정보는 원시언어인 한국어의 단문 분석을 위해 사용되며 분석결과에 대해 단문 단위 대역어를 지정한다. 동사구 번역 패턴은 실제 말뭉치에서의 사용을 반영하기 위해 병렬 말뭉치로부터 구축되며 실험을 통해 예측되는 패턴의 규모를 알아볼 수 있다.

  • PDF

21세기 세종계획 원시 말뭉치의 유니코드와 코드 변환 (Unicode and Code Conversion for Sejong 21 Raw Corpus)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-265
    • /
    • 2009
  • 21세기 세종계획은 국어정보화를 위한 범국가적 사업으로서 국어 기초 자원을 구축하는데 매우 큰 기여를 하였으며, 그 주요 결과물로 배포된 세종 말뭉치는 많은 연구자들에게 꼭 필요한 가치있는 결과물이다. 이처럼 소중한 국어 자원을 실제 연구자들이 활용하고자 할 때 불편함을 느끼는 경우가 있는데 그 이유는 균형 말뭉치의 구축이라는 말뭉치의 특성 및 원문 자료의 내용을 최대한 보존하기 위한 노력의 일환으로 사용자 정의 영역에 정의된 문자들이 다수 포함되어 있기 때문이다. 본 논문에서는 자연언어 처리, 정보검색 분야 연구자들이 세종계획 최종 결과물 중에서 원시 말뭉치를 활용하는데 있어서 말뭉치에 사용된 문자코드의 유형을 중심으로 코드 변환 문제점과 그 해결 방안을 모색하고자 한다.

  • PDF

Annotation을 가지는 함수언어의 설계 및 번역기 전반부 구현 (The Design of a Functional Language which has an Annotation Syntax and Implmentation of the Front-end of the Translator for the Language)

  • 최관덕
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.25-34
    • /
    • 1998
  • 함수 언어에서 병렬성을 표현하는 주된 기법으로는 스트릭트니스 분석과annotation이 있다. 스트릭트니스 분석은 번역기가 병렬성 탐색을 수행하여 탐색된 정보를 목적 프로그램에 표현하는 기법이며, annotation은 프로그래머에게 병렬성 탐색을 맡겨서 원시프로그램에 표현하도록 하는 기법이다. 본 연구는 annotation에 관한 것으로 annotation 구문을 가지는 원시함수 언어와 이를 위한 번역기의 전반부를 설계하고 구현하는 것을 목적으로 한다. 번역기의 전반부는 원시함수언어 프로그램을 중간 언어인 확장 람다계산 프로그래프로 번역한다 번역기는 UNIX 환경에서 컴파일러 자동화 도구인 YACC, Lex를 사용하여 C로 구현한다. 본 논문에서는 번역기에 사용된 구현기법에 대해서 기술한다.

  • PDF

ASN.1 원시 코드 자동 생성기 (ASN.1 Source Code Auto-Generator)

  • 정진영;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.28-34
    • /
    • 2003
  • ASN.1은 망 관리에 필요한 기초적인 제반기술이다. ASN.1의 개발에는 ASN.1 명세 언어를 파싱하는 컴파일러 작업과 컴파일 결과 생성된 자료들을 DB에 입력하고, 입력된 자료를 사용자에게 프리티프린팅하여 보여주는 작업이 요구된다. 본 논문에서는 ASN.1 명세를 객체지향 언어인 C++로 자동적으로 변환하여 주는 원시 코드 자동 생성기를 설계하고 구현한다. 이와 함께 ASN.1 개발환경에 필요한 그래픽 사용자 인터페이스, DB 인터페이스 및 ASN.1 브라우저를 포함하는 통합 환경을 제공한다. 본 시스템의 구현은 Objectivity 데이타베이스를 이용하였고, 컴파일러 작업에서는 컴파일러 보조 도구인 flex와 byacc을 이용하였으며, 인터페이스 언어로는 Tcl/Tk를 사용하였다.

  • PDF

종교언어로서의 '원시반본(原始返本)' 개념 재검토 (Re-examining the Concept of 'Seeking Out the Original Root (原始返本)' as an Example of Religious Language)

  • 차선근
    • 대순사상논총
    • /
    • 제29집
    • /
    • pp.171-207
    • /
    • 2017
  • 대순진리회에서 사용되는 여러 종교언어들의 개념을 확립하는 연구는 아직 미완이다. 이 글은 이에 대한 문제 제기로서, 그 첫 사례로 대순진리회의 종교언어 가운데 하나인 원시반본(原始返本)을 설명한 기존 연구들을 비판적으로 검토하고 새로운 관점에서의 개념을 다시 제기해 본 것이다. 원시반본은 대순진리회가 구축하는 종교적 세계를 설명한다는 점에서 그 중요도가 높다. 그런데 원시반본에 대한 기존 연구들은 거의 모두가 '복귀(Returning)'라는 관점과 '순환사관'을 견지하고 있어서, 그 종교언어가 구축해내는 종교적 세계는 과거를 지향점으로 삼는다거나 혹은 우주의 순환법칙에 따라 저절로 구현되는 것이라는 오해를 만들어내고 있다. 이러한 연구 결과들은 대순진리회 세계관을 제대로 설명해내지 못한다. 왜냐하면 대순진리회는 상제께서 행하신 개벽공사와 그 결과물인 후천 지상선경이 운수에 없던 것이자 과거에 존재한 적이 없었던 유일무이한 것이라고 규정하기 때문이다. 원시반본 개념은 복귀와 순환사관의 틀에서 탈피하여 대순사상의 고유성을 확보하는 방향으로 설정되어져야만 한다. 그러한 관점에서 이 글이 제시했던 원시반본 개념을 요약하면 다음과 같다: "후천 개벽을 이루기 위한 천지공사의 원리 가운데 하나인 원시반본은 문명·문화·도법 등 모든 것의 근본과 근원을 찾아가는 것이다. 찾았다면 그 뿌리와 시작점에 대한 사실 관계를 인정하는 것으로부터 출발하여, 그 인정했던 것을 유지·계승·사용하거나, 철폐하거나, 해소·보수·수정하게 된다. 그리고 대개 그 근본은 보은의 입장에서 다루어진다. 이 모두는 상제의 결정과 공사에 이루어지는 일이며, 이렇게 만들어진 그 결과물은 후천 지상선경의 문화를 건설하기 위한 기초로 활용된다." 이러한 개념 설정은 복귀 및 운도론적 순환사관을 배제시킨 것이며, 역동적 구조주의 관점에 입각하여 단계를 따라가는 유동적인 틀로써 원시반본의 개념을 담아내었다는 점에서 원시반본에 대한 기존 연구들과는 차별된다고 할 수 있다.

중간언어에 기반한 기계 번역시스템의 설계 (Design of a Multilingual Translation System Based on Interlingual Approach)

  • 김상국;박창호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.521-526
    • /
    • 1993
  • 다언어간 번역을 지향하는 기계번역시스템의 개발을 위해서는, 의미 이해기반의 해석기술과 언어에 독립적인 생성기술의 설계가 기본이므로 원시언어와 목표언어가 어느 한쪽의 언어지식에 의존하지 않고 언어형식화가 가능한 중간언어 구조를 설정하는 것이 중요하다. 따라서, 한국어를 중심으로 하는 다언어 번역의 설계에서는 비교적 문구조의 정형화가 이루어진 영어와는 달리 어순 배열의 자유도가 높고 조사의 격표시로 문장구조가 결정되는 한국어의 특성을 고려한 해석 및 생성 메카니즘이 필요하다. 본 논문에서는 문장에 내포된 심층의미의 중간 표현으로써, 단어의 의미를 개념화시킨 개념소(Conceptual Primitive)간의 의미적 결합관계를 나타내는 개념 그래프(Conceptual Graph)를 채택하고 설계한 다언어 번역지향의 중간언어기반 번역시스템에 대하여 기술한다.

  • PDF

프로그램 변환 및 클래스추출기법의 설계 (Program Transformation and Design of Class Extraction Technique)

  • 진영배
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권3호
    • /
    • pp.63-71
    • /
    • 1998
  • 원시 코드로부터 이 언어들을 충분히 다시 표현할 수 있는 공통의 언어 즉 메타 언어를 설계하여 역공학 시스템의 내부 표현으로 사용하였다. 이것을 입력으로 하여 변수와함수 사이의 관계에 기반한 유사도 공식을 사용하여 가장 적절한 클래스를 추출하고, 추출된 클래스의 가시성을 자동적으로 분류한다.

  • PDF