• Title/Summary/Keyword: 의미역 처리

Search Result 145, Processing Time 0.023 seconds

Automatic Processing of Predicative Nouns for Korean Semantic Recognition. (한국어 의미역 인식을 위한 서술성 명사의 자동처리 연구)

  • Lee, Sukeui;Im, Su-Jong
    • Korean Linguistics
    • /
    • v.80
    • /
    • pp.151-175
    • /
    • 2018
  • This paper proposed a method of semantic recognition to improve the extraction of correct answers of the Q&A system through machine learning. For this purpose, the semantic recognition method is described based on the distribution of predicative nouns. Predicative noun vocabularies and sentences were collected from Wikipedia documents. The predicative nouns are typed by analyzing the environment in which the predicative nouns appear in sentences. This paper proposes a semantic recognition method of predicative nouns to which rules can be applied. In Chapter 2, previous studies on predicative nouns were reviewed. Chapter 3 explains how predicative nouns are distributed. In this paper, every predicative nouns that can not be processed by rules are excluded, therefore, the predicative nouns noun forms combined with the case marker '의' were excluded. In Chapter 4, we extracted 728 sentences composed of 10,575 words from Wikipedia. A semantic analysis engine tool of ETRI was used and presented a predicative nouns noun that can be handled semantic recognition language.

Similarity Estimation between Verbs Using Semantic Information of their Argument (논항의 의미 정보를 이용한 동사의 유사도 추정)

  • Lee, Chae-Hun;Seok, Mi-Ran;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.197-200
    • /
    • 2014
  • 한국어의 경우 동사와 형용사는 문장에서의 역할이 명사와는 다르며, 동사의 의미는 동반하는 논항의 의미적, 통사적 특성에 따라 분화되므로 근본적으로 논항과 함께 고려되어야 한다. 논항이라 함은 명제를 표시하는 방법 중 하나로 관계와 논항으로 표시하는 방법이 있는데, 여기서 관계는 문장의 동사, 형용사 또는 다른 관계항에 해당하며, 논항은 특정시간, 장소, 사람, 대상을 지칭하는 것으로서 흔히 명사에 해당한다. 본 논문에서는 동사간의 의미 유사도를 추정하기 위하여, 수동으로 구축한 의미역 표지부착 말뭉치인 한국어 PropBank의 의미역인 ARG1에 해당하는 명사들을 동사의 주요 논항으로 보았다. 그리고 이들 주요 논항간의 의미 거리를 '코어넷 한국어 명사편'에서 계산하여 동사별로 이를 합산함으로써 이 계산한 값을 동사의 유사도로 추정하였다. 또한 본 연구에서 제안된 방식과 '코어넷 한국어 동사편'에서 동사간의 거리를 계산한 값 사이의 상관계수를 구하여 보았다.

  • PDF

Korean Semantic Tagged Corpus Construction working (한국어 의미 표지 부착 말뭉치 구축 작업)

  • Lee, Min-Ji;Lee, Yoon-Jeong;Lee, Jung-Kuk;Kim, Jong-Dae;Park, Chan-Young;Song, Hae-Jung;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.99-103
    • /
    • 2012
  • 의미 역 결정 (Semantic Role Labeling)은 문장 내의 술어-논항 요소들의 의미 관계를 결정하는 과정이다. 이를 위해서는 의미 표지 부착 말뭉치가 필요하지만 한국어의 경우 이 데이터가 매우 부족한 상황이다. 본 논문에서는 한국어 Proposition Bank(이하 PropBank) 말뭉치와 세종 용언 격틀 말뭉치 구축을 위한 의미 표지 부착 작업에 대해 설명한다. 표지 부착 작업은 말뭉치의 의존 관계를 사람이 파악하여 적절한 의미 역 태그를 다는 과정이고, 이 과정으로부터 얻은 말뭉치는 의미 역 결정을 위한 기계 학습 방법론의 훈련 자료로 이용된다. 이 과정에서 필요한 구문 표지 부착 밀뭉치로는 한국전자통신연구원의 구문표지 부착 말뭉치를, 그리고 언어자원으로는 한국어 PropBank의 frame file과 세종 용언 격틀 사전을 사용한다.

  • PDF

Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network (한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식)

  • Park, Seo-Yeon;Ock, Cheol-Young;Shin, Joon-Choul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

Design and Implementation of Watermarked Packet Creation System for the Intruder Traceback (침입자 역추적을 위한 워터마크 패킷 생성 시스템 설계 및 구현)

  • Han, Seung-Wan;Seo, Dong-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.2249-2252
    • /
    • 2003
  • 역추적 기술은 해킹이 발생했을 때 해커의 실제적인 위치를 추적하는 기술이다. 해커의 위치를 추적하기 위해 현재 가장 널리 사용되는 방법은 시스템 관리자의 시스템 로그 분석과 시스템 관리자 사이의 상호 정보 교환을 통한 수동적인 역추적 방법이다. 그러나 수동적인 역추적 방법은 수작업으로 수행되는 시스템 로그 분석과 관리자의 개입으로 인하여 땀은 비용이 요구되고 추적 시간의 지연이 발생하기 때문에 이러한 수동적인 방법으로는 해커의 위치를 실시간으로 추적할 수 없다. 만약, 네트워크의 특정 패킷을 식별 가능한 형태로 가공할 수 있다면, 특정 패킷의 이동 경로를 효과적으로 추적할 수 있어 공격자의 위치를 실시간 역추적 하는데 활용될 수 있다. 본 논문에서는 네트워크의 특정 패킷에 의미적인 워터마크를 삽입하여 워터마크 패킷을 생성하는 워터마크 패킷 생성 시스템을 설계하고 구현한다. 이 시스템은 중간 경유지를 활용하여 우회 공격하는 공격자의 실제 위치를 실시간 역추적 하는 ACT 역추적 기법의 구현에 활용되었다.

  • PDF

Unsupervised Semantic Role Labeling for Korean Adverbial Case (비지도 학습을 기반으로 한 한국어 부사격의 의미역 결정)

  • Kim, Byoung-Soo;Lee, Yong-Hun;Na, Seung-Hoon;Kim, Jun-Gi;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.32-39
    • /
    • 2006
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미 관계로 사상하는 의미역 결정 문제에 대해 다루고 있다. 한국어의 경우 대량의 학습 말뭉치를 구하기 힘들며, 이를 구축하기 위해서는 많은 시간과 노력이 필요한 문제점이 있다. 따라서 본 논문에서는 학습 말뭉치를 직접 태깅하지 않고 격틀사전을 이용하여 자동으로 학습 말뭉치를 구축하고 간단한 확률모델을 적용하여 점진적으로 모델을 학습하는 수정된 self-training 알고리즘을 사용하였다. 실험 결과, 4개의 부사격 조사에 대해 평균적으로 81.81%의 정확률을 보였으며, 수정된 self-training 방법은 기존의 방법에 비해 성능 및 실행시간에서 개선된 결과를 보였다.

  • PDF

Wastewater Treatment and Recovery Using Membrane Separation Processes (막분리 공정을 이용한 폐수처리 및 회수)

  • 김정학
    • Membrane Journal
    • /
    • v.3 no.3
    • /
    • pp.83-93
    • /
    • 1993
  • 1950년대 이후 이온교환막이 실용화됨으로써 분리막이 산업분야에 처음으로 활용되기 시작하였으며 1960년대에는 혈액투석막, 정밀여과막, 역삼투막 및 한외여과막이 개발되었고, 특히 이 시대에 Loeb와 Soruirajan이 개발한 비대칭막 제조기술은 매우 큰 의미를 가지며 막분리 기술에 대한 상품화의 기초가 되었다. 1970년대초 Pilot 규모의 Test가 성행하였으며, 특히 1970년대말 미국의 Arizona지역에서 콜로라도강 지류의 염분을 제거하는 방법으로서 역삼투막 처리기술을 채택함으로써 대형 Plant에 대한 막분리 기술의 성능이 입증되었다. 1980년대 이후에도 고도의 분리기능을 가지는 막의 개발과 고효율 System의 개발 및 새로운 용도가 개척되고 있다.

  • PDF

Design and Implementation of an Instance Access Handling System for Supporting Schema Evolution (스키마 진화를 지원하는 인스턴스 접근처리시스템의 설계 및 구현)

  • Jin, Min;Kim, Bong-Jin
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.12
    • /
    • pp.3753-3761
    • /
    • 2000
  • There exist several versions of schema and instances created under different versions of the schema concurrently in the database in schema evolution environments. This paper proposes a mechanism for accessing instances regardless of versions in schema evolution environments in object relational databases. Access handling routines are used in accessing to the instances through the undefined attributes in the versions in which they were created. The change of semantic information of attributes is supported. Access handling routines are defined for each pair of semantics rather than defining backdate/update functions for each pair of versions of a class. A query language that accommodates version and semantic information is defined through the extension of the primitive SQL format.

  • PDF

Generation of a Semantic Structure on a Conventional Goods Search System (대화형 상품 검색 시스템에서 의미 구조 생성에 관한 연구)

  • Jung, Hae-Kyung;Bae, Woo-Jung;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.197-204
    • /
    • 2006
  • 인터넷 쇼핑몰 분야에서 한국어 인터페이스에 대한 필요성이 대두되면서 이와 관련한 연구가 진행되어 왔다. 이러한 기존 연구들의 문제점은 다른 응용 분야에 대한 확장성이 떨어지고, 대화식 질의 문장을 처리하기 위해 필요한 상황 지식을 사용할 수 없다는 것이다. 확장성을 위해 한국어 인터페이스는 내부 구현의 변경 없이 도메인 지식의 교체만으로 다른 분야에 대한 적용이 쉬워야 한다. 아울러, 한국어 질의 문장을 SQL이나 ACL과 같은 여러 응용 분야의 인공 언어에 쉽게 변환할 수 있으려면 모호성이 전혀 없는 의미 구조로 표현되어야 한다. 이렇게 표현된 의미 구조는 상황 지식의 표현과 적용을 용이하게 한다. 본 논문은을 Sowa의 개념 구조를 이용하여 의사 의미 구조를 유형 정의, 관계형 정의, 액터와 같은 도메인 지식베이스를 이용하여 표준 의미 구조로 변환하는 시스템을 제안한다. 본 논문은 먼저 필요한 도메인 지식베이스의 종류와 역할 등을 설명하고, 상황 지식을 이용하여 불완전한 의미 구조를 완전한 의미 구조로 변환하는 방법을 보인다. 아울러, 같은 의미를 갖는 여러 형태의 의사 의미 구조가 하나의 표준 의미 구조로 변환됨으로서 시스템의 일관성을 유지하는데 용이함을 보일 것이다. 본 시스템에서 생성한 의미구조는 중간 언어의 역할을 하므로, 제안하는 한국어 인터페이스 시스템은 데이터베이스 분야뿐만 아니라 에이전트 분야, 시맨틱 웹 분야 등에서도 손쉽게 적용할 수 있다는 장점을 가진다.

  • PDF

Implementation of the System Dividing Simple Sentences from Embedded Sentence in Korean (한국어 내포문을 단문으로 분리하는 시스템의 구현)

  • Kim, Kwang-Jun;Song, Young-Hoon;Lee, Jung-Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.25-34
    • /
    • 1993
  • 한국어의 내포문은 컴퓨터에 의한 자연어 이해 및 처리에 많은 어려운 문제점의 원인이 되고 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어 내포문을 단문으로 분리하는 시스템을 설계 및 구현한다. 내포문에서 생략성분을 효율적으로 복원하기 위해 안긴문장의 생략된 부분을 통제할 수 있도록 용언을 유형별로 분류한다. 내포문을 단문으로 분리할 때 내포문에 비해 분리된 단문의 의미가 결여 될 수 있다. 이러한 문제점을 해결하기 위해 대용어를 첨가시키는 방법을 사용한다. 그리고 명사 의미표지로부터 용언의 하위범주의미역으로의 변환 테이블을 구성하여 문맥적으로 틀린 문장을 검색, 처리할 수 있는 방법을 제안한다.

  • PDF