• Title/Summary/Keyword: 동사정보

Search Result 275, Processing Time 0.021 seconds

word-sense Disambiguation based on Semantic Informations extracted from Definitions in Dictonary (사전 뜻말이에서 추출한 의미 정보에 기반한 의미 중의성 해결)

  • Hur, Jeong;Ock, Cheol-Young
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.269-276
    • /
    • 2000
  • 본 연구에서는 사전의 뜻말이에서 의미 정보를 추출하고, 이 의미 정보를 확률 통계적 방법에 적용하여 의미 중의성을 해결하는 모델을 제안한다. 사전의 뜻풀이말에 동형이의어를 포함하고 있는 표제어와 뜻풀이말을 구성하는 보통 명사, 형용사와 동사를 의미 정보로 추출한다. 비교적 중의성이 자주 발생하는 9개의 동형이의어 명사를 대상으로 실험하였다. 학습에 이용된 데이터로 정확률을 실험하는 내부 실험의 결과, 체언류(보통 명사)와 용언류(동사, 형용사)의 가중치를 0.9/0.1로 주는 것이 가장 정확률이 높았다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 1,796문장을 실험하였는데, 평균 79.73%의 정확률을 보였다.

  • PDF

Resolving structural ambiguity of Chinese V+NP$_1$+的+NP$_2$syntactic pattern (중국어 V+NPl+的+NP2 구문 패턴의 애매성 해소)

  • Cui, Zheng;Kim, Mi-Young;Kim, Dong-Il;Lee, Jong-Hyuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.667-669
    • /
    • 2002
  • 중국어 V+NP$_1$+的+NP$_2$형 패턴은 동사구와 명사구로 분석이 가능하여 중국어 구문분석의 결과에 중요한 영향을 미친다. 본 논문은 중국어 V+NP$_1$+的+NP$_2$형 패턴의 구조적 중의성 문제를 해결하기 위한 방법을 제안한다. 제안하는 방법은 통계정보로 보완된 동사의 결합가 정보, 두 명사간의 결합도 정보 및 휴리스틱으로 구조적 애매성을 해소하고자 한다.

  • PDF

Text Chunking by Rule and Lexical Information (규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking))

  • Kim, Mi-Young;Kang, Sin-Jae;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.103-109
    • /
    • 2000
  • 본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.

  • PDF

A Study on Corpusgram Experiment and Development (코퍼스그람 실험과 개발에 대한 연구)

  • Lee, Ho Suk
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.145-149
    • /
    • 2007
  • 코퍼스그람에서 실험이 필요한 부분은, 첫 번째는 변수 d와 dust의 정의 부분이다. 즉, 변수 d만을 이용한 경우, 변수 dist만을 이용한 경우, 그리고 변수 d와 dist를 모두 이용한 경우를 실험해 보아야 한다. 두 번째는 코퍼스그람에서 거리가 가까운 단어들의 조합, 예를 들어 명사와 명사, 동사와 명사, 형용사와 명사, 동사와 부사를, 조사하여 그 의미를 해석하여 보는 것이다. 세 번째로는 코퍼스그람의 단어들에 대하여 거리를 중심으로 단어 연결(connection) 네트워크를 구성하고 의미 네트워크와 비교하여 보는 것이다. 네 번째로는 연결 네트워크를 정보 검색 등의 응용에 적용하여 효과를 확인하는 것이다. 그리고 언어 처리, 온톨로지 등에 중요한 요소인 부분-전체 관계에 대하여 소개하였다.

  • PDF

Automatic Extraction of Collocations based on Corpus using mutual information (말뭉치에 기반한 상호정보를 이용한 연어의 자동 추출)

  • Lee, Ho-Suk
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.4
    • /
    • pp.461-468
    • /
    • 1994
  • This paper describes the automatic extraction of collocations based on corpus. The collocations are extracted from corpus using cooccurrence frequency and mutual information between words. In English, 5 types of collocations are defined. These collocations are transitive verb and object, intransitive verb and subject, adjective and noun, verb and adverb, and adverb and adjective. In this paper another type of collocation is recognized and extracted, which consists of verb and preposition. So 6 types of collocations are extracted based on corpus.

  • PDF

Optimization of Transitive Verb-Objective Collocation Dictionary based on k-nearest Neighbor Learning (k-최근점 학습에 기반한 타동사-목적어 연어 사전의 최적화)

  • Kim, Yu-Seop;Zhang, Byoung-Tak;Kim, Yung-Taek
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.3
    • /
    • pp.302-313
    • /
    • 2000
  • In English-Korean machine translation, transitive verb-objective collocation is utilized for accurate translation of an English verbal phrase into Korean. This paper presents an algorithm for correct verb translation based on the k-nearest neighbor learning. The semantic distance is defined on the WordNet for the k-nearest neighbor learning. And we also present algorithms for automatic collocation dictionary optimization. The algorithms extract transitive verb-objective pairs as training examples from large corpora and minimize the examples, considering the tradeoff between translation accuracy and example size. Experiments show that these algorithms optimized collocation dictionary keeping about 90% accuracy for a verb 'build'.

  • PDF

A Discourse-Pragmatic Study of Preposing and Inversion in English. (전치문과 도치문의 담화화용론적인 비교)

  • 박원경
    • Korean Journal of English Language and Linguistics
    • /
    • v.3 no.1
    • /
    • pp.37-54
    • /
    • 2003
  • The purpose of this paper is to investigate the phenomena of preposing and inversion in English from the discourse-pragmatic perspectives. We claim that different types of preposing can be unified to a single process of topicalization. We also show that diverse discourse functions of inversion can be subsumed under the ‘linking’ function with the prior discourse. It is followed a comparative discussion between preposing and inversion to find what similarities the two constructions share and what differences there exist between the two. It is concluded that the choice of a syntactic forms ultimately depends on the speaker's evaluation of the information status of the knowledge store of the hearer.

  • PDF

The Order and the Representation of the Arguments (논항의 배열 순서와 실현 양상)

  • Shin, Seo-In
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.137-141
    • /
    • 2003
  • 본고에서는 동사 '주다'의 논항에 대해 논항의 배열 순서와 논항의 실현 양상을 살펴보고, 이를 바탕으로 논항을 추정하는 원리를 도출하는 것을 목적으로 한다. '주다' 동사의 경우 요구되는 세 개의 논항 중 두 개의 논항이 실현되는 경우가 가장 많으며, 논항이 생략되는 경향은 GOL>AGT>THM 순이다. 논항들 간의 배열에는 지배적인 순서가 있는데, 대개의 경우 [AGT-GOL-THM]의 순서를 따른다. 모든 논항을 추정하기 어려운 경우는 사실 많지 않으며 논항들간의 배열 순서와 실현 양상을 고려하면 기준이 되는 표지를 바탕으로 논항을 추정할 수 있다. 논항 추정 원리는 구문 분석에 있어서 어순 변이와 논항 생략을 처리는 근거를 마련할 수 있을 것이다.

  • PDF

Cause' and the Acquisition and Processing of Object Ellipsis by Young Korean-speaking Children (원인'(cause)과 아동의 공목적어 정보처리)

  • Ryu, Jung;Cho, Sook-Whan
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.72-75
    • /
    • 2002
  • 본 연구는 '원인'의 개념과 타동사성에 대한 아동의 민감성이 공대명사 처리에 어떻게 반영되는지에 대해 검토하였다. 한국어뿐만 아니라 여러 언어에서 관찰되었듯이, '원인'은 서술부 중심의 어휘정보 이론에서 이용되는 핵심적인 개념으로서, 타동사와 목적어 사이에 잠재적으로 함유된 '원인'의 정도에 따라 목적어의 생략이 허용된다. 본 연구는 세명의 한국 아동 (0;10-3;7)의 발화자료를 토대로 한국어의 공대명사화 구조를 검토하여 다음과 같은 관찰을 하였다. 한국아동은 습득 초기에는 주로 옛정보, 새정보 등의 담화화용적 제약에 따른 발화를 하지만, 3세경부터는 동사의 습득양상이 점차적으로 다양해지는데, 이때부터는 논항의 생략과 동사의 타동사성과 상호관계를 보인다.

  • PDF