• 제목/요약/키워드: 동사정보

검색결과 275건 처리시간 0.023초

사전 뜻풀이말에서 추출한 의미 정보에 기반한 의미 중의성 해결 (Word-Sense Disambiguation based on Semantic Informations extracted from Definitions in Dictionary)

  • 허정;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.269-276
    • /
    • 2000
  • 본 연구에서는 사전의 뜻풀이말에서 의미 정보를 추출하고, 이 의미 정보를 확률 통계적 방법에 적용하여 의미 중의성을 해결하는 모델을 제안한다. 사전의 뜻풀이말에 동형이의어를 포함하고 있는 표제어와 뜻풀이말을 구성하는 보통 명사, 형용사와 동사를 의미 정보로 추출한다. 비교적 중의성이 자주 발생하는 9개의 동형이의어 명사를 대상으로 실험하였다. 학습에 이용된 데이터로 정확률을 실험하는 내부 실험의 결과, 체언류(보통 명사)와 용언류(동사, 형용사)의 가중치를 0.9/0.1로 주는 것이 가장 정확률이 높았다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 1,796문장을 실험하였는데, 평균 79.73%의 정확률을 보였다.

  • PDF

이동동사의 인지 도식에 관한 비교 연구 (Comparative Study on Cognitive Scheme of Movement Verbs)

  • 오현금;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.59-64
    • /
    • 2002
  • 인지심리학 및 인지언어학 분야에서 시도한 어휘 표상, 특히 움직임과 관련된 동사의 인지도식에 관한 연구들을 비교해보고자 한다. 인간의 언어학적인 지식을 도식적으로 표상 하고자 하는 노력은 언어의 통사적인 외형에만 치중하는 연구에서는 언어의 의미구조를 파악하기 힘들다고 판단하고 의미적인 범주화를 중요시하게 되었다. 본 연구에서는 시각적 이미지 도식을 중점적으로 살펴보기로 한다. 이미지 도식은 공간적 위치 관계, 이동, 형상 등에 관한 지각과 결부되어 있다. 이미지로 나타낸 표상은 근본적으로 세상의 인식과 세상에 대한 행동방법을 사용하게 하는 유추적이고 은유적인 원칙에 기초하고 있다. 이러한 점에 있어서, 언술을 발화한 화자는 어느 정도 주관적인 행동의 능력과 그가 인식한 개념화에서부터 문자화시킨 표상을 구성한다. 인지 원칙에 입각한 의미 표상에 중점을 둔 도식으로는, Langacker, Lakoff, Talmy의 도식이 있다. 프랑스에서 톰 R. Thom과 같은 수학자들은 질적인 현상에 관심을 가져 형역학(morphodynamique)이론을 확립하였는데, 이 이론은 요즘의 인지 연구에 수학적 기초를 제공하였다. R. Thom, J. Petitot-Cocorda의 도식 및 구조 의미론의 창시자라고 불리는 B.Pottier의 도식이 여기에 속한다 J.-P. Descles가 제시한 인지연산문법(Grammaire Applicative et Cognitive)은 다른 인지문법과는 달리 정보 자동처리과정에서 사용할 수 있는 연산자와 피연산자의 관계에 기초한 수학적 연산작용을 발전시켰다. 동사의 의미는 의미-인지 도식으로 설명되는데, 이것은 서로 다른 연산자와 피연산자로 구성된 형식화된 표현이다. 인간의 인지 기능은 언어로 표현되며, 언어는 인간의 의사소통, 사고 행위 및 인지학습의 핵심적 기능을 담당한다. 인간의 언어정보처리 메카니즘은 매우 복잡한 과정이기 때문에 언어정보처리와 관련된 언어심리학, 인지언어학, 형식언어학, 신경해부학 및 인공지능학 등의 관련된 분야의 학제적 연구가 필요하다.

  • PDF

사건 탐지/추적을 위한 시간 정보 추출 (Temporal Information Extraction from Korean News for Event Detection and Tracking)

  • 김평;성기윤;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.22-29
    • /
    • 2003
  • 시간정보는 사건 탐지/추적 시스템은 물론 정보 추출, 질의/응답 시스템 등에서 매우 중요한 역할을 한다. 본 연구에서는 한국어 신문 기사를 대상으로 시간 표현을 추출하고 정규화한 후 사건 관련 동사와 연결하는 자동화된 방법들을 제안하였다. 시간 표현을 추출하기 위해서 품사정보로 구축된 패턴과 시간 표현 어휘가 사용되었고, 정규화 과정과 사건 관련 동사와의 연결을 위한 규칙이 만들어졌다. 한국어 신문을 대상으로 제안한 방법의 단계별 평가를 수행하였고, 제안하는 방법의 확장성을 보이기 위해 서로 다른 도메인에도 실험을 하였다.

  • PDF

동사정보를 이용한 자연어 질의 분석 (Natural Language Query Analysis using Verb Information)

  • ;김옥형;박기선;이용석;이말례
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.92-97
    • /
    • 2006
  • 본 논문에서는 검색엔진을 한번도 접해보지 않은 초보자나 초등학생과 같이 어휘력이 부족하여 키워드 선정에 어려움이 있는 사용자들이 의문대명사가 포함된 질의 문장을 통해 보다 쉽게 웹 문서의 검색이 가능하도록 하기 위하여 의문대명사가 포함된 의문형 구문정보에 기반한 질의 분석 방법을 제안한다. 따라서 정보 검색을 위한 의문대명사형 자연어 질의에 대하여 구문 정보 및 술어 정보에 기반한 질의 분석 및 확장을 통하여 의문대명사를 구체적인 의미의 키워드로 대체하여 사용자의 질의 의도가 보다 명확해 지도록 함으로써 사용자가 원하는 정답 문서가 상위에 랭크되도록 하고자 한다.

  • PDF

구문 분석 결과를 이용한 한국어 무제한 정보추출 (A Syntax-Based Hybrid System for Korean Open Information Extraction)

  • 김병수;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

구조화된 상세 정보를 제공하는 한국어 형태소 분석기: KMM (KMM: A Detailed Morphological Analysis for Korean)

  • 김수라
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.202-206
    • /
    • 2010
  • 이 논문에서는 한국어 형태소 분석기 KMM(Korean Malaga Morphology)을 소개하고자 한다. KMM의 개발 동기는 이후 자연언어 처리 단계의 기반으로 사용될 수 있을 뿐 아니라 이론 형태론 연구의 도구로도 사용될 수 있도록 상세한 형태 동사 의미 정보를 제공하는 것이었다. 이론적 틀은 좌연접 문법(Left-Associative Grammar)에 기초한 LA-MORPH이며, 좌연접 기반 문법 개발 도구인 MALAGA로 구현되었다. LA-MORPH에 기반한 KMM은 분석 실행중이 아닐 때에는 사전의 규모를 최소한으로 유지하다가 분석에 필요할 때에만 분석용 사전을 자동으로 생성한다. 형태소 분석은 분석용 사전에 근거하여, 매칭과 결합이라는 단순한 알고리즘만을 사용한다. KMM의 분석은 동사 어절의 경우, 시제, 서법, 문형, 대우법, 명사 어절의 경우 격정보, 수사 결합어절의 경우 추출된 수랑 정보 등과 같은 상세한 정보를 제시한다. 세종 말뭉치와 KIBS 말뭉치를 KMM 을 이용해서 분석한 결과 각각의 94.96%와 94.59%의 분석률과 88.4%와 90.7%의 정확도를 보였다.

  • PDF

문장의 종결정보와 예문을 이용한 핵심개념 기반의 한국어 대화체 파싱 (Core Concept-based Korean Spoken Language Parsing Using Ending Information and Example Sentences)

  • 김홍국;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.279-284
    • /
    • 2000
  • 핵심개념 기반의 분석 시스템은 기존의 CFG형태로 기술된 문법의 양을 현저히 줄이고 간투어, 중복발화등과 같은 파싱 불필요 성분을 처리하는 루틴을 개선해 파서의 부담을 줄인 분석 방법이다. 핵심개념 기반 분석 시스템은 동사를 기준으로 문법을 기술한다. 따라서, 발화자의 사투리 둥에 의해서 동사 정보를 상실한 문장은 분석이 되지 않는 문제점을 가지고 있으며 또한, 문장 분석시 분석 문법을 구성할 수 없는 짧은 발화문같은 경우에도 분석을 하지 못하는 문제점을 가지고 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 발화문의 예를 작성해 놓은 예문사전과 발화문이 가지고 있는 종결형 정보를 이용해서 그러한 문제를 해결하고 분석의 정확성을 높였다.

  • PDF

보이스 피싱 행동 패턴 분석을 통한 상황 인지 및 사용자 의도 파악 시스템 (Situational Awareness and User Intention system with Behavior patterns Analysis of Voice Phishing)

  • 조단비;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.855-857
    • /
    • 2019
  • 개인 정보의 확산 및 유출의 문제점으로 인해 보이스 피싱의 피해 건수가 증가하고 있다. 이러한 보이스 피싱의 사회적 문제에 대하여 상황 인지 및 사용자 의도 파악 시스템을 적용하여 해결책으로 제안하고자 한다. 이 시스템은 음성 전화로 이루어지는 순차 정보를 텍스트 데이터에 기반하여 사기범의 문맥적 흐름에서 행위 동사를 추출한다. 추출된 행위 동사의 순차 정보를 통해 보이스 피싱의 상황임을 인지하고, 흐름의 행동 패턴을 분석하여 사기범의 의도를 파악한다. 이러한 상황 인지 및 사용자 의도 파악 시스템은 개인 정보의 문제뿐만 아니라 경제적 피해 규모를 축소시킬 것으로 예상된다.

개념간 상호 정보를 이용한 효율적인 개념기반 한국어 대화체 파싱 (An Efficient Concept-based Spoken Language Parsing for Korean using Mutual Information between Concepts)

  • 노서영;정천영;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.365-369
    • /
    • 1998
  • 개념기반 한국어 대화체 분석 시스템에서 어려운 점으로 대두될 수 있는 것 중의 하나가 대화체 파싱에서 과다한 탐색공간의 생성이다. 과다한 탐색공간의 생성은 대화체 발화문으로부터 불필요한 탐색공간을 제거하는 메커니즘의 결여 때문이다. 따라서 본 논문에서는 이러한 문제점을 해결하고자 개념에 기반 되어서 작성된 문법을 통해서 얻어진 동사정보를 구성하여 단일 최상위 레벨 개념들로 분리하고 이를 가장 최소 개수의 최상위 레벨 개념으로 제한해서 제한된 개념으로 대화체 토큰열을 전사시키는 방법을 제시하였다. 그 결과 기존 탐색공간의 40%정도의 탐색공간을 제약할 수 있었다.

  • PDF