• 제목/요약/키워드: 동사정보

검색결과 275건 처리시간 0.021초

사전 뜻말이에서 추출한 의미 정보에 기반한 의미 중의성 해결 (word-sense Disambiguation based on Semantic Informations extracted from Definitions in Dictonary)

  • 허정;옥철영
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.269-276
    • /
    • 2000
  • 본 연구에서는 사전의 뜻말이에서 의미 정보를 추출하고, 이 의미 정보를 확률 통계적 방법에 적용하여 의미 중의성을 해결하는 모델을 제안한다. 사전의 뜻풀이말에 동형이의어를 포함하고 있는 표제어와 뜻풀이말을 구성하는 보통 명사, 형용사와 동사를 의미 정보로 추출한다. 비교적 중의성이 자주 발생하는 9개의 동형이의어 명사를 대상으로 실험하였다. 학습에 이용된 데이터로 정확률을 실험하는 내부 실험의 결과, 체언류(보통 명사)와 용언류(동사, 형용사)의 가중치를 0.9/0.1로 주는 것이 가장 정확률이 높았다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 1,796문장을 실험하였는데, 평균 79.73%의 정확률을 보였다.

  • PDF

중국어 V+NPl+的+NP2 구문 패턴의 애매성 해소 (Resolving structural ambiguity of Chinese V+NP$_1$+的+NP$_2$syntactic pattern)

  • 최정;김미영;김동일;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.667-669
    • /
    • 2002
  • 중국어 V+NP$_1$+的+NP$_2$형 패턴은 동사구와 명사구로 분석이 가능하여 중국어 구문분석의 결과에 중요한 영향을 미친다. 본 논문은 중국어 V+NP$_1$+的+NP$_2$형 패턴의 구조적 중의성 문제를 해결하기 위한 방법을 제안한다. 제안하는 방법은 통계정보로 보완된 동사의 결합가 정보, 두 명사간의 결합도 정보 및 휴리스틱으로 구조적 애매성을 해소하고자 한다.

  • PDF

규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking) (Text Chunking by Rule and Lexical Information)

  • 김미영;강신재;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-109
    • /
    • 2000
  • 본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.

  • PDF

코퍼스그람 실험과 개발에 대한 연구 (A Study on Corpusgram Experiment and Development)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-149
    • /
    • 2007
  • 코퍼스그람에서 실험이 필요한 부분은, 첫 번째는 변수 d와 dust의 정의 부분이다. 즉, 변수 d만을 이용한 경우, 변수 dist만을 이용한 경우, 그리고 변수 d와 dist를 모두 이용한 경우를 실험해 보아야 한다. 두 번째는 코퍼스그람에서 거리가 가까운 단어들의 조합, 예를 들어 명사와 명사, 동사와 명사, 형용사와 명사, 동사와 부사를, 조사하여 그 의미를 해석하여 보는 것이다. 세 번째로는 코퍼스그람의 단어들에 대하여 거리를 중심으로 단어 연결(connection) 네트워크를 구성하고 의미 네트워크와 비교하여 보는 것이다. 네 번째로는 연결 네트워크를 정보 검색 등의 응용에 적용하여 효과를 확인하는 것이다. 그리고 언어 처리, 온톨로지 등에 중요한 요소인 부분-전체 관계에 대하여 소개하였다.

  • PDF

말뭉치에 기반한 상호정보를 이용한 연어의 자동 추출 (Automatic Extraction of Collocations based on Corpus using mutual information)

  • 이호석
    • 한국정보처리학회논문지
    • /
    • 제1권4호
    • /
    • pp.461-468
    • /
    • 1994
  • 본 논문은 말뭉치에 기반한 연어의 자동 추출에 관한 연구이다. 연어는 말뭉치로 부터 단어의 동시발생빈도(cooccurrence frequency)와 상호정보 (mutual informaton) 를 이용하여 추출하였다. 영어에는 5가지 종류의 연어가 정의 되어 있다. 이들은 타동 사와 목적어, 자동사와 주어, 형용사와 명사, 동사와 부사 그리고 형용사와 부사이다. 여기에 동사와 전치사의 단어쌍을 새롭게 연어로 파악하여 6가지 종류의 연어를 추출 하였다.

  • PDF

k-최근점 학습에 기반한 타동사-목적어 연어 사전의 최적화 (Optimization of Transitive Verb-Objective Collocation Dictionary based on k-nearest Neighbor Learning)

  • 김유섭;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권3호
    • /
    • pp.302-313
    • /
    • 2000
  • 영한 기계번역에서 영어 문장의 동사구를 한국어로 정확하게 번역하기 위해서는 일반적으로 타동사와 목적어의 연어 관계를 이용한다. 본 논문에서는 k-최근점(k-nearest neighbor) 학습을 연어 관계에 적용하여 동사 번역을 선택하는 알고리즘을 제시하였는데 k-최근점 학습을 위해서 워드넷에서의 의미거리를 정의하여 사용하였다. 그리고 실시간 번역 시스템에 사용될 사전을 구성하기 위하여, 말뭉치로부터 타동사-목적어 쌍을 추출하여 학습예제를 구축하고, 이 예제의 크기를 번역률과 연관시켜 최적화시키는 알고리즘을 제시한다. 본 논문에서는 위의 알고리즘들을 사용하여 동사 'build'의 번역률을 약 90%로 유지하면서 사전의 크기를 최적화하였다.

  • PDF

전치문과 도치문의 담화화용론적인 비교 (A Discourse-Pragmatic Study of Preposing and Inversion in English.)

  • 박원경
    • 한국영어학회지:영어학
    • /
    • 제3권1호
    • /
    • pp.37-54
    • /
    • 2003
  • 본 논문에서는 문장의 어떤 구성성분을 앞으로 이동한 후 주어-동사의 표준어순으로 나타나는 전치문과 동사-주어의 비표준어순으로 나타나는 도치문에 대하여 각각의 통사적 특징과 담화 화용론적 기능을 살펴보고, 전치문과 도치문을 비교하여 그 차이점과 공통점을 알아보았다. 다양한 구성요소의 이동에 따라 명사구 전치, 전치사구 전치, 형용사구 전치, 동사구 전치, 분사구 전치 등으로 구별되어 고려되어왔던 다양한 전치문들을 주제화라는 하나의 통합된 규칙으로 설명하였으며, 모든 전치 구성성분은 현 담화를 이전담화에 연결시키며, 이전 담화로부터 주어진 요소임과 동시에 현 담화의 틀을 제공한다는 점에서 그 문장 또는 그 담화의 주제라고 보았다. Ward(1990)가 논의한 동사구 전치의 네 가지 기능, 즉 독립적 명제확인, 양보적확인, 정도확인, 명제유보의 기능을 하나로 일반화하여 주제에 대한 논평을 첨가하는 ‘주제+논평’ 구조로 보았다. 전치와 후치를 모두 포함하고 있는 도치문에서 전치되는 요소들은 문장 또는 담화 내에서 구정보를, 후치된 성분은 신정보를 표시한다. 즉, 문장요소의 담화상의 친숙도가 이동하는 구성성분의 문장내의 위치를 결정하는데 결정적이다. 도치문에서 전치된 요소는 문장 내에서 ‘실용’, ‘연결’, ‘강조’, ‘소개’ 등의 다양한 기능을 하는데 이를 전치성분은 후치된 명사구를 이전 담화에 명시적으로 나타났거나 추론가능한 정보와 연결하는 ‘연결’기능을 하는 것으로 설명하였다. 전치문과 도치문은 이전 담화와 어떻게든 연결관계를 갖는다는 것이 공통적인데, 전치문에서 전치요소는 절대적인 구정보를 표시하나, 도치문에서는 담화상 상대적 구정보를 표시하기만 하면 된다. 이것으로 화자가 발화시 전치시키는 요소는 그 요소가 청자의 지식 내에서 어떤 정보상태에 있다고 화자가 평가하는가에 따라 전치문을 선택할지 도치문을 선택할지가 결정됨을 알 수 있다.

  • PDF

논항의 배열 순서와 실현 양상 (The Order and the Representation of the Arguments)

  • 신서인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.137-141
    • /
    • 2003
  • 본고에서는 동사 '주다'의 논항에 대해 논항의 배열 순서와 논항의 실현 양상을 살펴보고, 이를 바탕으로 논항을 추정하는 원리를 도출하는 것을 목적으로 한다. '주다' 동사의 경우 요구되는 세 개의 논항 중 두 개의 논항이 실현되는 경우가 가장 많으며, 논항이 생략되는 경향은 GOL>AGT>THM 순이다. 논항들 간의 배열에는 지배적인 순서가 있는데, 대개의 경우 [AGT-GOL-THM]의 순서를 따른다. 모든 논항을 추정하기 어려운 경우는 사실 많지 않으며 논항들간의 배열 순서와 실현 양상을 고려하면 기준이 되는 표지를 바탕으로 논항을 추정할 수 있다. 논항 추정 원리는 구문 분석에 있어서 어순 변이와 논항 생략을 처리는 근거를 마련할 수 있을 것이다.

  • PDF

원인'(cause)과 아동의 공목적어 정보처리 (Cause' and the Acquisition and Processing of Object Ellipsis by Young Korean-speaking Children)

  • 유정;조숙환
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.72-75
    • /
    • 2002
  • 본 연구는 '원인'의 개념과 타동사성에 대한 아동의 민감성이 공대명사 처리에 어떻게 반영되는지에 대해 검토하였다. 한국어뿐만 아니라 여러 언어에서 관찰되었듯이, '원인'은 서술부 중심의 어휘정보 이론에서 이용되는 핵심적인 개념으로서, 타동사와 목적어 사이에 잠재적으로 함유된 '원인'의 정도에 따라 목적어의 생략이 허용된다. 본 연구는 세명의 한국 아동 (0;10-3;7)의 발화자료를 토대로 한국어의 공대명사화 구조를 검토하여 다음과 같은 관찰을 하였다. 한국아동은 습득 초기에는 주로 옛정보, 새정보 등의 담화화용적 제약에 따른 발화를 하지만, 3세경부터는 동사의 습득양상이 점차적으로 다양해지는데, 이때부터는 논항의 생략과 동사의 타동사성과 상호관계를 보인다.

  • PDF