• Title/Summary/Keyword: 언어 분석

Search Result 4,689, Processing Time 0.031 seconds

Evaluation Method for Korean Morphological Analysis System and it's Application to MATEC99 (한국어 형태소 분석 시스템에 대한 평가 방법 및 적용 사례 분석)

  • Kim, Jin-Dong;Rim, Hae-Chang;Park, Jay-Duke;Lee, Jae-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.44-49
    • /
    • 1999
  • 언어계통상 교착어에 속하는 한국어는 형태소 분석 결과가 복잡하게 주어지기 때문에 형태소 분석 시스템에 대한 효과적인 평가가 쉽지 않다. 본 논문에서는 한국어 형태소 분석 시스템에 대한 평가 방법을 제시한다. 또한 이를 MATEC99에 적용한 사례를 분석하여 이에 대한 타당성을 입증하고 보완점을 기술한다.

  • PDF

Question Similarity Analysis in dialogs with Automatic Feature Extraction (자동 추출 자질을 이용한 대화 속 질의 문장 유사성 분석)

  • Oh, KyoJoong;Lee, DongKun;Lim, Chae-Gyun;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.347-351
    • /
    • 2018
  • 이 논문은 대화 시스템에서 질의를 이해하기 위해 딥 러닝 모델을 통해 추출된 자동 추출 자질을 이용하여 문장의 유사성을 분석하는 방법에 대해 기술한다. 문장 간 유사성을 분석하기 위한 자동 추출 자질로써, 문장 내 표현 순차적 정보를 반영하기 위한 RNN을 이용하여 생성한 문장 벡터와, 어순에 관계 없이 언어 모델을 학습하기 위한 CNN을 이용하여 생성한 문장 벡터를 사용한다. 이렇게 자동으로 추출된 문장 임베딩 자질은 금융서비스 대화에서 입력 문장을 분류하거나 문장 간 유사성을 분석하는데 이용된다. 유사성 분석 결과는 질의 문장과 관련된 FAQ 문장을 찾거나 답변 지식을 찾는데 활용된다.

  • PDF

Stack-Pointer Network for Korean Dependency Parsing (Stack-Pointer Network를 이용한 한국어 의존 구문 분석)

  • Cha, Da-Eun;Lee, Dong-Yub;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.685-688
    • /
    • 2018
  • 의존 구문 분석은 자연어 문장에 포함된 단어들 간의 의존 관계를 분석하는 과제로 다양한 자연어 이해 과제에 요구되는 핵심 기술 중 하나이다. 본 연구에서는 단어와 문자 자질을 적용한 기존 Stack-Pointer Network의 인코더의 입력 단어 표상을 확장하여, 한국어를 비롯한 형태적으로 복잡한 언어(morphologically rich language)에 적합하도록 음절-태그 단위, 형태소 단위, 형태소 품사 정보 자질을 보강한 의존 구문 분석 모델을 제안한다. 실험 결과 제안하는 모델은 의존 구조로 변환된 세종 구문 분석 말뭉치에서 UAS 90.58%, LAS 88.35%의 성능을, 2018 국어 정보 처리 시스템 경진 대회 평가 데이터에서 UAS 84.69%, LAS 82.02%의 성능을 보였다. 더불어 제안하는 모델은 포함된 문장의 전체 길이가 긴 의존 관계, 의존소와 지배소의 거리가 먼 의존 관계, 의존소를 구성하는 형태소의 개수가 많은 의존 관계에서 기존 Stack-Pointer Network보다 향상된 성능을 보였다.

  • PDF

한일양언어의 음운조직과 일본어청취의 상관분석

  • 정혜경
    • Proceedings of the KSPS conference
    • /
    • 1996.10a
    • /
    • pp.534-534
    • /
    • 1996
  • 본 연구는 한국인 일본어학습자의 일본어 청취상의 난점을 한일 양언어의 음운 조직의 차이를 비교.분석함으로써, 문제의 소지와 그 해결점을 제시하는 것을 목적으로 한다. 연구방법으로서는, 초급일본어 학습자인 일어일문학 전공학생 1학년 30명을 대상으로 두재의 다른 종류의 청취태스트를 2회에 걸쳐 실시, 그 자료를 통계적으로 분석.고찰하는 방법을 취하였다. 분석내용은, 첫째 청취테스트의 결과로부터 한국인 일본어학습자의 일본어 청취에 있어서 나타나는 전형적인 오류의 패턴을 분석하고, 둘째 그 오류의 패턴의 원인을 한일 양언어의 음운조직의 상이함을 대조.분석하므로써 구조적 원인을 이론적인 측면에서 보다 명백히 밝혀냈다. 끝으로, 한국인 일본어학습자의 일본어 청취상의 난점과 문제점을 미리 예측하고 제시할 수 있는 항목들을 구체적으로 제시하여, 효과적인 일본어 교육은 물론 동시에 한국어교육에 있어서도 이 연구의 결과가 적용.응용될 수 있도록 하였다.

  • PDF

Morphological Analyzer using Adjacent Attribute and Near Word Information (형태소 접속 특성과 인접 말마디 정보를 이용한 형태소 분석기)

  • Kim, Byung-Hi;Lim, Kwon-Mook;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.395-404
    • /
    • 1993
  • 본 논문은 형태소간의 접속 특성과 대형 말뭉치(Corpus)에서 추출된 인접 말마디의 정보를 이용해서 한국어 형태소 분석기를 구현한다. 언어는 단지 규칙으로만 처리하기에는 불가능한 복잡한 구조와 중의성을 갖고 있기 때문에 과거에 주로 연구되었던 형태소들간의 접속 특성과 규칙을 이용한 형태소 분석은 실제로 구문분석 단계에서 사용될 수 있는 실용성을 제시하지 못했다. 따라서 형태소 접속 특성뿐만 아니라 인접 말마디와의 관계를 사전에 기술함으로써 보다 실용성 있는 형태소 분석기의 구현을 시도한다. 아울러 본 형태소 분석기의 효능은 정착하고 풍부한 정보를 사전에 효율적으로 수록함으로써 이룩될 것이며, 이를 위해 기존 사전의 보강에 필요한 정보들을 대형 말뭉치로부터 추출하여 사전에 첨가시킨다.

  • PDF