• 제목/요약/키워드: 동사정보

검색결과 275건 처리시간 0.02초

한국어 영형 대명사의 식별 알고리듬 (An algorithm for identification of zero pronouns in Korean)

  • 이춘숙;노용균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-357
    • /
    • 1998
  • 이 논문은 대용어의 한 유형으로 인정되는 영형 대명사를 식별하기 위한 것이다. 이를 위해서는 한국어 통사 규칙들과 사전 항목들이 필요하다. 사전 항목들은 각각 자질과 값을 갖고, 통사 규칙 내부에는 이런 자질과 값들이 명세된다. 이 통사 규칙들을 토대로 하여, 발화체에 통사 구조들을 부여한다. 영형 대명사는 자질과 값을 명세한 통사 규칙을 씀으로써 식별이 가능하다. 영형 대명사는 주어와 보충어로 나뉘는데, 영형 주어는 동사가 머리인 S의 subj 자질 값이 cov(covert)일 때 식별된다. 영형 보충어는 다시 명사구와 동사구의 covc (covert complement) 자질 값이 0이 아닐 때 식별된다. 이러한 자질과 값으로 영형 대명사를 식별하는 하나의 알고리듬을 제안한다.

  • PDF

로봇 동화 구연을 위한 동화 상 발화문의 화자 자동파악 (Automatic Speaker Identification in Fairytales towards Robot Storytelling)

  • 민혜진;김상채;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-83
    • /
    • 2012
  • 본 연구에서는 로봇의 자동 동화구연을 목표로 발화문장 상의 감정 파악 및 등장인물 별 다앙한 TTS 보이스 선택에 활용 가능한 발화문장의 화자 파악문제를 다룬다. 본 연구에서는 기존 규칙기반 방법론에서 많이 활용되어온 자질인 후보의 위치, 화자 후보의 주격/목적격 여부, 발화동사 존재 여부를 비롯하여 동화에 자주 나타나는 등장인물의 의미적 분류 및 등장인물의 등장/퇴장과 관련된 동사들을 추가 자질로 활용한다. 사람 및 동식물, 무생물이 모두 화자가 될 수 있는 동화 코퍼스에서 제안한 자질들을 활용하여 의사결정트리로 학습 및 검증한 결과 규칙기반의 베이스라인 방법에 비해 최대 49%의 정확도가 향상되었고, 제안한 방법론이 데이터의 변화에도 강인한 것을 확인할 수 있었다.

  • PDF

목적어 생략에 대한 동사의 의미표상 및 추론의 역할 (The Role of Semantic Representation of Verbs and Inference in the Interpretation of Missing Objects in Korean Discourse)

  • 조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.457-461
    • /
    • 2001
  • 본 논문은 동사의 의미표상과 명사의 한정성의 강호관계를 중심으로 목적어의 생략현상을 검토하였다. 한국어는 영어 같은 언어와 달리 주어, 목적어 등이 자주 생략된다. 이 연구는 한국어의 목적어 생략이 단순히 인간성 (humanness), 주체성 (agency), 한정성(definiteness) 등 명사의 의미자질에 의해서만 결정되는 것이 아니라, 다음 두 가지 제약이 결정적으로 작용함을 제안하고자 한다. 첫째, 목적어 생략은 행동양상 (mold of agent act)과 원인 (cause)을 심층적으로 포함하는 소위 '핵심 타동사 (core transitive)'와 선행사의 한정성 정도에 의해 결정되는데, 구체적으로 목적어 생략은 한정성 자질을 가진 선행사가 없는 담화에서는 허용되지 않는다는 제약이다. 둘째, 타동사와 명사의 한정성과는 독립적으로, 한국어의 목적어 생략은 또한, 추론에 의거하여 보다 더 적절히 해석될 수 있는 경우를 실증적으로 보이고자 한다.

  • PDF

한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용 (Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique)

  • 배장성;오준호;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-47
    • /
    • 2014
  • 한국어 의미역 결정(Semantic Role Labeling)은 주로 기계 학습에 의해 이루어지며 많은 말뭉치 자원을 필요로 한다. 그러나 한국어 의미역 결정 시스템에서 사용되는 Korean PropBank는 의미역 부착 말뭉치와 동사 격틀이 영어 PropBank의 1/8 수준에 불과하다. 따라서 본 논문에서는 한국어 의미역 결정 시스템을 위해 의미역 부착 말뭉치와 동사 격틀을 확장하여 Korean PropBank를 확장 시키고자 한다. 의미역 부착 말뭉치를 만드는 일은 많은 자원과 시간이 소비되는 작업이다. 본 논문에서는 도메인 적응 기술을 적용해보고 기존의 학습 데이터를 활용하여, 적은 양의 새로운 학습 말뭉치만을 가지고 성능 하락을 최소화 할 수 있는지 실험을 통해 알아보고자 한다.

  • PDF

문장의 종결정보와 예문을 이용한 핵심개념 기반의 한국어 대화체 파싱 (Core Concept-based Korean Spoken Language Parsing Using Ending Information and Example Sentences)

  • 김홍국;서영훈
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.279-284
    • /
    • 2000
  • 핵심개념 기반의 분석 시스템은 기존의 CFG형태로 기술된 문법의 양을 현저히 줄이고 간투어, 중복발화등과 같은 파싱 불필요 성분을 처리하는 루틴을 개선해 파서의 부담을 줄인 분석 방법이다. 핵심개념 기반 분석 시스템은 동사를 기준으로 문법을 기술한다. 따라서 발화자의 사투리 등에 의해서 동사 정보를 상실한 문장은 분석이 되지 않는 문제점을 가지고 있으며 또한, 문장 분석시 분석 문법을 구성할 수 없는 짧은 발화문같은 경우에도 분석을 하지 못하는 문제점을 가지고 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 발화문의 예를 작성해 놓은 예문사전과 발화문이 가지고 있는 종결형 정보를 이용해서 그러한 문제를 해결하고 분석의 정확성을 높였다.

  • PDF

한국어 동사와 명사 관용구 인식 알고리즘 (A recognition algorithm of Korean verb and noun idiomatic phrases)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

낱말.패러다임 형태론에서의 굴절 부류 설정 (Deciding on Inflectional Classes in a Word-and-Paradigm Morphology)

  • 노용균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.405-411
    • /
    • 1993
  • 한국어 동사의 굴절은 (1) 접사의 누적 (2) 어간과 접사의 변이형 (allomorphy) (3) 원격한 접사의 꼴이 어간에 민감한 점 등의 이유로 단순한 접사 추출(affix-stripping)에 의한 형태소 분석이 감당하기 어려운 부분을 갖고 있다. 따라서 형태소에 바탕을 둔 형태이론보다 더 세련된, 낱말에 바탕을 둔 형태이론이 요구되는데, 이 논문에서는 "낱말 패러다임 형태이론 (Word and Paradigm Morphology)"에서 실현규칙(rules of realization)이 언급하는 요소 중의 하나인 굴곡 부류(inflectional classes)가 어떻게 설정되어야 할 것인가를 다룬다. 특정한 형태 통사적 속성들(morpho-syntactic properties)이 실현될 때 (1) 주요 어간(primary stem)이 요구되느냐 아니면 부차 어간 (secondary stem)이 요구되느냐, 그리고 (2) 접사의 어떤 꼴이 요구되느냐에 바탕을 두고 한국어의 동사를 열 다섯개의 굴절 부류로 분류한다.

  • PDF

말모둠에서 동사 분포 연구 (A Study on Verbs Statistics in Corpus)

  • 최용석;이운재;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.169-175
    • /
    • 2000
  • 말모둠은 특성에 따라서 여러 성격을 나타내게 된다. 하지만 말모둠의 특성을 자동적으로 알아내는 방법은 간단하지 않다. 중요 단어를 가지고 있으면 말모둠에서 통계적으로 많은 부분에 적용시켜 말모둠의 특성을 파악할 수 있다. 본 논문에서는 한국어 말모둠에서 나타나는 동사류 단어들의 빈도를 분석한다. 또한, 사람이 직접 중요도를 평가한 사전의 단어들과 말모둠에 나타나는 단어들을 비교해서 통계적 차이점을 알아보고, 그 차이점을 통해 앞으로 연구할 일에 대해서 토론한다. 간단한 실험을 통해 사람의 평가한 중요도 점수의 효용성도 알아본다.

  • PDF

개체유형 명사와 동사 ′하-′의 결합에 관한 생성어휘부 이론적 접근 (Combination of the Verb ha- ′do′ and Entity Type Nouns in Korean: A Generative Lexicon Approach.)

  • 임서현;이정민
    • 한국언어정보학회지:언어와정보
    • /
    • 제8권1호
    • /
    • pp.77-100
    • /
    • 2004
  • This paper aims to account for direct combination of an entity type noun with the verb HA- 'do' (ex. piano-rul ha- 'piano-ACC do') in Korean, based on Generative Lexicon Theory (Pustejovsky, 1995). The verb HA-'do' coerces some entity type nouns (e.g., pap 'boiled rice') into event type ones, by virtue of the qualia of the nouns. Typically, a telic-based type coercion supplies individual predication to the HA- construction and an agentive-based type coercion evokes a stage-level interpretation. Type coercion has certain constraints on the choice of qualia. We further point out that qualia cannot be a warehouse of pragmatic information. Qualia are composed of necessary information to explain the lattice structure of lexical meaning and co-occurrence constraints, distinct from accidental information. Finally, we seriously consider co-composition as an alternative to type coercion for the crucial operation of type shift.

  • PDF

FCA 기반 계층적 구조 표현을 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure Representation based on the Formal Concept Analysis)

  • 김태환;박제현;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.388-392
    • /
    • 2006
  • 가공해서 사용하는 정보량이 많아질수록 원하는 정보를 찾는 데 더 많은 노력이 필요하게 마련이다. 따라서 사람들은 대대로 정보를 구조화하는 방법들을 고안해왔으며, 여러 가지 계층적 구조화 방법들을 사용했었다. 이렇게 구현된 정보의 계층 구조는 키워드 검색을 바탕으로 수평적 계층 구조만을 가지는 구조였다. 자료가 전문화되고 정보를 검색하는 사용자 또한 검색된 정보와 관련된 정보를 더 원하는 현 시점에서 정보의 수평적 계층 구조만으로 사용자의 만족도를 충족할 수 없다. 이러한 문제점을 해결하기 위해 이 논문에서는 특정 도메인의 문서를 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 체크하여 그 단락의 계층적 트리를 구성하고, 단락별 트리를 이용하여 문서의 내용을 트리로 재구성할 수 있게 된다. 이렇게 만들어진 문서의 트리들은 트리의 구조를 보고 특정 문서에 더 구체적인지 아니면 더 일반적인지 측정하여 문서와 문서간의 관계 또한 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색해 주는 자동화 문서 계층 구조를 제안한다.

  • PDF