• Title/Summary/Keyword: 동사정보

Search Result 275, Processing Time 0.021 seconds

Design of Verb-Phrase Patterns for Korean-to-English MT (한영 자동 번역을 위한 동사구 번역패턴의 활용)

  • 양성일;김영길;서영애;김창현;홍문표;최승권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.178-180
    • /
    • 2001
  • 원시언어 문장의 구조 분석을 기반으로 하는 기계번역 시스템에서 원시언어의 최소 의미 단위는 동사를 중심으로 한 단문으로 생각할 수 있다. 단문 단위 대역어를 지정하기 위해서는 동사구 번역패턴의 사용이 요구된다. 본 논문에서는 한국어 단문 내 격 정보와 번역을 위한 의미 제약조건을 기술하여 한영 기계번역 시스템에서 사용하는 동사구 번역패턴을 정의하고, 문장 정규화를 통한 동사구 번역패턴의 활용방법을 제안한다. 동사구 번역패턴은 단문 구조 파악을 위한 제약 조건부와 대역어 선정부로 나뉜다. 제약 조건부는 단문 구조 번역을 위한 최소한의 의미 제약만으로 기술되며, 격조사로 구분되는 격 정보를 갖는다. 이러한 격 정보는 원시언어인 한국어의 단문 분석을 위해 사용되며 분석결과에 대해 단문 단위 대역어를 지정한다. 동사구 번역 패턴은 실제 말뭉치에서의 사용을 반영하기 위해 병렬 말뭉치로부터 구축되며 실험을 통해 예측되는 패턴의 규모를 알아볼 수 있다.

  • PDF

ARGUMENT STRUCTURE ALTERNATIONS IN ENGLISH AND KOREAN

  • 김미숙
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2001.06a
    • /
    • pp.59-73
    • /
    • 2001
  • 이 논문은 영어와 한국어에서 논 항구조의 교체를 허용하는 처소격 동사들의 통사구조와 의미를 비교 분석해 보려고 한다. 지금까지 연구가 논항구조의 교체를 허용하는 이런 동사들이 통사적 유사성에만 국한되어 연구가 되었을 뿐 여러 다른 통사적 형식에서 보여지는 차이점이나 논항 교체 동사들의 의미적 차이점과 같은 중요한 현상들에 대한 많은 연구가 되어지지 않았다. 따라서 첫 번째로 이 논문에서는 Pinker (1989)에 제시한 논항 교체 동사들의 의미적 분석을 구체적으로 소개하고, 이런 교체 동사들의 의미적 유사성과 차이점으로 구분한 Pinker의 의미분류들을 자세히 알아본다. 또한 Pinker가 교체동사들의 의미적 분류를 위해 사용한 통사적 기준인 논항 생략 (PP-omission test)을 소개한다. 두 번째로 영어의 논항 교체 동사들에 해당하는 한국어 동사들의 통사적 형태를 알아봄으로써 영어와 한국어에서의 통사적 유사성과 차이점을 알아본다. 세 번째로 영어와 한국어에서 나타나는 통사적 차이점의 설명을 위해 Pinker가제시한 의미 분류들을 수정한 새로운 분류를 제시한다 마지막으로 Jackendoff (1996)에서 제시된 의미적 설명이 영어의 논항 교체 동사에 해당하는 한국어 동사들의 통사적 형태들의 다양성을 설명할 수 있음을 보여준다

  • PDF

A Study on Translation of 'Hata' Verb Based on Relation between 'X-hata' and 'X-lul hata' (`X하다`와 'X를 하다'의 상관성에 기반한 한중 자동 번역 시스템에서의 '하다' 동사 번역에 관한 연구)

  • Seo, Young-Ae;Huang, Yinxia;Hong, Mu-Xyo;Choi, Sung-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.607-610
    • /
    • 2002
  • 패턴에 기반한 자동번역 시스템에 있어서, 번역률을 결정하는 가장 중요한 요소는 패턴의 양과 질이다. 필요한 대량의 패턴을 단기에 구축하기 위해서 패턴 정보 기술상의 잉여성을 줄일 필요가 있다. '하다' 동사는 한국어에서 가장 빈번하게 사용되는 동사 중의 하나로서, 'X를 하다'와 'X하다'의 2가지 구문 구조를 갖는다. 본 논문에서는 동사구 패턴에 기반한 한중 자동 번역 시스템에서 'X를 하다'와 'X하다' 구문간의 상관성을 이용하여 두 구문이 'X하다' 동사에 대한 동사구 패턴을 공유하도록 함으로써 동사구 패턴 구축 시에 정보의 중복 기술을 피하고, 패턴의 적용 범위를 넓힌다. 패턴의 공유로 인해 발생하는 대역문 생성 시의 문제점은, 'X를 하다' 구문에 대응하는 중국어 대역 형태 별로 분류하여 해결함으로써 패턴을 공유하면서도 번역의 질은 유지시킬 수 있는 방법을 제안한다.

  • PDF

Noun Link Relation Research Of Verb '-Kata (가다)' for Korean Syntactic Analysis (한국어 구문 해석을 위한 동사 '가다'의 명사 결합 관계 연구)

  • Park, Keon-Sook
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.207-216
    • /
    • 1998
  • 본 논문에서는 한국어 구문 해석을 위해 동사 중심의 구문 틀 정보를 구축하고, 나아가 결합 빈도가 높은 명사와의 결합 관계를 하나의 네트워크로 구성하는 구문 해석의 방법을 제안한다. 동사 중심의 구문 틀과 명사의 의미 자질은 구문 해결에서 아주 중요한 역할을 하는 것으로, 구문의 비문 여부를 가리는 데 도움을 준다. 그러나 명사의 의미 자질은 경계가 모호하여 구문의 적격성(wellformedness)을 가리기에는 부족한 점이 많다. 따라서 동사와 명사의 결합 관계를 이용하면 구문의 의미적 적격성을 좀 더 명시적으로 가릴 수 있다. 한국어에서 기본 동사이고, 초등학교 교과서에서 사용된 빈도가 아주 높은 동사 '가다'를 가지고 구체적으로 구문 틀 정보와 결합 명사의 의미 자질 및 결합 관계를 정리하였다.

  • PDF

Korean Verb Senses Disambiguation Using Distributional Information from Corpora (분포 정보를 이용한 의미 중의성을 지닌 한국어 동사의 의미 분별)

  • Cho, Jeong-Mi;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.56-61
    • /
    • 1995
  • 본 논문에서는 말뭉치로부터의 분포 정보를 이용하여, 의미 중의성을 지닌 한국어 동사의 의미를 분별하고자 한다. 분포 정보란 말뭉치내에서 목적어-서술어 관계에 있는 명사와 동사의 분포를 의미한다. 이 분포 정보는 명사 분포와 동사 분포로 나누어 생각할 수 있는데, 본 논문에서는 이 두가지 분포 정보를 사용함으로써 명사 분포만을 이용하였을 때 나타나는 자료 부족 현상을 등사 분포 정보를 이용하여 보완하였다. 분포 정보간의 유사도 계산은 정보 이론에서 사용하는 상대 엔트로피를 이용한다. 품사가 태깅된 50만 단어의 한국어 말뭉치로부터 분포 정보들을 추출하여 한국어 동사 10개에 대해 실험하였다.

  • PDF

A Description Method of Korean Auxiliary Verbs (한국어 보조동사의 개념그래프적 기술 방안)

  • Lee, Byeong-Hui;Gwon, O-Seok
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.373-380
    • /
    • 2001
  • 본 논문은 한국어 보조동사의 의미를 Sowa에 의해 제안되고 국제표준이 되고있는 개념그래프를 이용하여 형식적으로 기술하는 방법을 제안한다. 이를 위해 영어의 양상과 상에 관한 개념그래프를 알아보고 한국어 보조동사를 통사/의미론적으로 고찰한다. 한국어 보조동사의 개념그래프적 기술을 위해, 각종 논문과 국어사전에서 한국어 보조동사 40개의 여러 예문들을 수집하여 완료, 진행, 봉사, 시도, 강세, 원망, 지속, 추정의 8가지 의미로 분류하고 이들을 개념그래프로 기술한다. 실험에서는 이들 8가지 의미들을 인공지능언어의 일종인 LIPS과 유사한 KIF로 작성하고 C++를 이용하여 한국어 보조동사가 포함된 문장을 입력받아 개념그래프로 변환하는 프로그램을 구현한다. 문장 내의 모든 범주들의 개념과 개념 관계가 자연어의 모든 의미관계를 표시할 수 있는 개념그래프는 한국어 보조동사의 다양한 의미를 기술하는데 적합함을 알 수 있었다.

  • PDF

Korean Verb Clustering Using Self-Organizing Maps (Self-Organizing Map을 이용한 한국어 동사 클러스터링)

  • 박성배;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.183-184
    • /
    • 1998
  • 본 논문에서는 목적어-동사 관계의 분포에 따라 한국어 동사를 자동적으로 클러스터링하는 방법을 제시한다. SOM(Self-Organizing Map)이 입력 패턴을 분석하고 가시화하는데 뛰어난 성능을 보이므로, 본 논문에서는 클러스터링하는 방법으로 SOM을 채택하였다. 일단 맵(map)이 만들어지고 나면 학습하는 동안 경험하지 못한 동사도 쉽게 적당한 클러스터로 분류될 수 있고 클러스터들 간의 의미 거리도 맵을 이용하여 쉽게 계산할 수 있다. 본 논문에서 제안한 방법을 명사 확률 분포의 상대 엔트로피(relative entropy)에 기반한 클러스터링 방법과 비교해 본 결과, SOM에 의해 만들어진 동사 클러스터가 상대 엔트로피를 이용해서 만들어진 클러스터를 잘 반영한다는 것을 알 수 있었다.

  • PDF

Implementation of a [parser for news summarization (신문 기사 요약문 생성을 위한 구문 분석기 구현)

  • 정영규;이현주;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.379-381
    • /
    • 2001
  • 본 논문은 문서요약 시스템의 일부로써 신문기사의 문장을 효율적으로 구문 분석할 수 있는 구문 분석기를 구현한다. 요약의 대상인 신문기사의 문장은 보조동사, 화용조사, 인용동사 등 많은 동사들을 가지며, 이와 같은 동사들은 구문분석을 할 때 많은 문제점을 발생시킨다. 본 논문은 이러한 동사들을 단위화하고, 여기서 발생하는 주어 생략과 모호성 문제를 해결하는 방법을 제시한다. 그리고 단위화의 결과로 나온 의미적 중심용언을 이용하여 문장의 필수 성분을 추출한다.

  • PDF

Implementation of SENKVO and Its Application to the Selectional Restriction for Semantic Analysis of Korean Verbs (한국어 동사 의미처리를 위한 SENKOV의 구축과 공기제약 관계에의 활용)

  • 고병수;정성훈;문유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.177-179
    • /
    • 1998
  • 본 논문은 의미론적 어휘개념에 기반한 한국어 동사 Isa 계층구조 시스템을 이용한 Semantic Network을 구축하며, 이를 활용하여 부사와 동사 간의 공기제약관계 설정에 유효한 개념 분류를 수행한다. 일반적으로 많이 쓰이는 한국어 동사 658개를 대상으로 semantic network을 구축한 결과, SENKOV는 44개의 top node를 가지고 있으며 depth 는 약 2.35이었다. 한국어 동사의 semantic network은 영어에서와 마찬가지로 명사보다 top node의 개수가 많고 depth가 훨씬 더 얕았다. 그리고 성상부사의 selectional restriction에 유효한 개념분류를 하는데 SENKOV를 활용하였다.

  • PDF