• Title/Summary/Keyword: 자연언어처리

Search Result 429, Processing Time 0.021 seconds

Form-based Natural Langauge Dialogue Interface in a Restricted Domain (제한된 영역에서의 폼 기반 자연언어 대화 인터페이스)

  • Kim, Yong-Jae;Seo, Jung-Yun;Park, Jae-Duk
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.463-468
    • /
    • 1997
  • 자연언어 대화는 사람들이 사용하는 가장 자연스러운 의사소통 수단이다. 따라서, 자연언어 대화 인터페이스를 통해서 사용자와 시스템이 편리하고 자연스러운 방법으로 의사를 교환할 수 있다. 본 논문에서는 대화 인터페이스의 필요성과 폼에 기반한 대화 인터페이스 기법에 대해서 설명한다, 폼 기반 인터페이스란 데이터베이스 검색을 위해서 질의어를 생성할 때 검색에 대한 제한 조건을 폼(form)의 형태로 나타내어, 사용자와의 대화를 통해서 폼 정보를 추출하고, 이렇게 완성된 폼을 이용하여 질의어를 생성하는 것을 말한다. 본 논문에서는 이러한 폼 기반 대화 인터페이스에서 시스템이 대화를 적절히 유도하고 사용자의 응답이나 질문에 대해 적절히 대응하기 위한 폼과 재귀적 대화 전이망(recursive dialogue transition networks)을 이용한 대화 모델에 대해 제안한다.

  • PDF

User goal and plan recognition using plan recognition system in natural language Dialogue (자연언어 대화 (NL Dialogue)에서 플랜 인지 시스템을 이용한 사용자의 목표 (Goal) 도출)

  • Kim, Do-Wan;Park, Jae-Deuk;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.393-399
    • /
    • 1996
  • 자연언어 대화에서 사용자의 정확한 의도(Intention)를 인지함에 있어서 나타나는 문제는, 자연언어 대화체의 생략성이 강한 문장의 불완전성 외에도, 여러 연속되는 대화체 문장에 분산되어 나타나는 사용자의 의도를 정확히 파악하는 것이다. 이러한 불완전한 대화체 문장 속에 산재되어 있는 사용자의 의도를 빠르고 신뢰성 있게 인지하여, 사용자와 시스템간의 원활한 자연언어 대화 상호작용 (Interaction)을 가능하게 하기 위하여 플랜 인지 시스템의 이용은 매우 효과적으로 보인다. 현재까지 개발된 대부분의 플랜 인지시스템들은 사용자의 액션 분석 및 플랜의 인지를 통하여 HCI를 지원하는 측면에 (예: 지능형 도움말) 집중되어 있다. 본 논문은 지역 광고 신문에 실린 매입-매도광고 데이타베이스의 검색을 위한 Natural language dialogue user interface에서 사용자 의도를 인지할 수 있는 플랜 인지 시스템을 기술하고 있다.

  • PDF

A design and implementation of query processor for travel information retrieval system (관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현)

  • Kim, Myong-Cheol;Seo, Kwang-Jun;Jeon, Kyong-Hun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

An Optimal Hangul Code System For The Korean Language Processing (한국어 정보처리를 위한 최적화 한글 코드에 관한 연구)

  • Byun, Jeong-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.39-43
    • /
    • 1989
  • 컴퓨터에 의한 한글정보처리의 주체는 한글이며, 객체는 그 처리도구인 컴퓨터라는 전제하에서 한글문자의 개별성에 의한 주체적 파악을 통하여, 한국어 정보처리에 최적한 코드로의 개선안을 제안한다. 개선안의 구체적 대상 범주로서 최근의 한국어 정보처리의 응용분야인 자연언어처리, 문자인식, 음성 인식 및 합성, 전자출판등이 점차 확대되어 가고 있다는 관점에서 보아서 기존의 코드가 가지고 있는 문제점을 분석하고 이들에 최적한 코드는 무엇이며 어떠한 성격을 가져야 하며, 그들이 기존의 코드가 중요시하던 처리효율이나 저장 효율의 문제에 어떠한 영향을 미치는지에 대하여 해당 알고리즘을 개발하고 이들에 대한 평가를 해보인다.

  • PDF

Detecting errors on Korean POS tagged corpus using GMM (GMM을 이용한 품사 부착 말뭉치의 오류 탐지)

  • Choi, Min-Seok;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Ho-Min;Yoon, Ho;Namgoong, Young;Kim, Jae-Kyun;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.246-251
    • /
    • 2019
  • 품사 부착 말뭉치란 문장에 포함된 각 단어에 품사 표지를 부착한 말뭉치를 말한다. 이런 말뭉치에는 다양한 형태의 오류들이 포함되어 있으며, 오류가 포함된 말뭉치를 학습 자료로 사용하는 자연언어처리 시스템의 좋은 성능을 기대할 수 없다. 따라서 말뭉치의 일관성이나 정확도는 자연언어처리 시스템의 성능에 많은 영향을 준다. 하지만 말뭉치 구축 과정에서 작업자의 실수가 발생하고 여러 작업자가 작업을 수행하다 보니 일관성을 유지하기가 쉽지 않다. 본 논문에서는 이러한 문제를 해결하기 위해서 GMM을 이용한 군집화를 수행하여 오류 후보를 추출한다. 이를 통해서 말뭉치 구축 과정에서 작업자의 실수를 방지하고 일관성을 유지하고자 한다. 세종품사부착 말뭉치를 대상으로 임의로 오류를 유발시켜 실험한 결과, 재현율 84.74%의 성능으로 오류를 탐지하였다. 향후에 좀 더 높은 재현율을 위해서 자질 확장이나 회귀 분석 방법 등을 추진할 계획이다.

  • PDF

Word Sense Disambiguation Method Using Co-occurrence Information (공기정보를 이용한 단어 의미 중의성 해결 방안)

  • Park, Yo-Sep;Kim, Gyeong-Im;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.177-178
    • /
    • 2010
  • 단어 의미 중의성은 자연언어처리 분야에서의 주요 관심 분야이다. 한국어에서의 단어 의미 중의성 문제는 다른 언어에 비하여 연구가 미흡한 상태이다. 기존 연구에서는 빈도 수에 기반한 공기 정보 벡터를 이용한 방법에서 처리되지 못하는 경우가 발생하였다. 또한 사전에 기반한 상위어 추출 시에 정형화된 형태가 아닌 경우에 어려움이 발생하였다. 본 논문에서는 상호정보량을 추가하여 공기 정보 처리 과정 시에 발생하는 오류를 최소화 하였다. 또한 대상 명사의 상위어 추출 문제를 해결하기 위해 어휘 지식 베이스를 적용하였다.

  • PDF

Relation between Locutionary Act and Illocutionary Act in Restricted Domain Natural Language Dialogues (제한 영역 대화에 나타난 언표적 행위와 언표내적 행위의 상관관계 연구)

  • Song, Do-Gyu;Cha, Keon-Hoe;Park, Jay-Duke
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.370-375
    • /
    • 1998
  • 본 논문에서는 화행처리를 기반으로 한 중고자동차 매매 영역 대화시스템 구축 과정에서 활용한 자연언어 대화체 발화의 언표적 행위와 언표내적 행위 간의 관계를 살펴보고자 한다. 하나의 언표적 행위는 여러 상이한 언표내적 행위를 수행할 수 있으며 또 역으로 여러 언표적 행위가 동일한 언표내적 행위를 구성하기도 한다. 이처럼 언표적 행위와 언표내적 행위 간에는 획일적이고 일률적인 상관관계를 설정하기가 어렵다. 그럼에도 불구하고 대화에 나타나는 발화들은 어떤 행위를 구성하는 경향이 강하고 이 행위들은 각 발화의 언표내적 행위로 결정되며 단일 발화들이 모여서 이루는 대화에는 화행의 흐름이 있기 마련이다. 따라서 우리는 본 논문에서 대화시스템의 효율적인 대화관리를 위해서 실제 자연언어 발화와 그에 따른 언표적 행위, 언표내적 행위를 올바로 분석하고 그 관계를 규명하여 대화를 자연스럽게 유도하도록 한다.

  • PDF

Information Processing of the Korean Language as a World Language (세계어로서의 한국어 정보처리)

  • Lee, Dong-Han
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.377-384
    • /
    • 1992
  • 보편적으로 일반 문법의 질서에 부합될 수 있는 자연언어들이 상호 번역이라는 수단을 통해 언어 변환이 가능하다면 이들 언어는 세계어이다. 한국어도 그 하나에 속한다. 본 논문에서는 한국어를 세계어라고 하는 보다 넓은 관점에서 보아 가면서, 이에 따라 고려해야할 문제들을 검토함으로서 한국어 정보처리의 개념을 정립하고, 나아가 세계 속의 한국어 위치를 다듬어 보고자 하는 것이 본 논문의 목표이다.

  • PDF

On Correction Guideline of Tagged Corpus (품사 부착 코퍼스 수정 방안에 대하여)

  • Kim, Eun-Hye;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.361-367
    • /
    • 2000
  • 품사 부착 코퍼스를 구축하기 위해서는 일반적으로 형태소 분석, 자동 품사 태깅 수동 또는 자동 오류 수정의 단계를 거친다. 이 글은 그 마지막 단계의 일환인 수동으로 오류를 수정하는 과정에서 요구되는 여러 가지 정보의 필요성과 문제점에 대해 기술하고자 한다. 조사와 어미의 처리 문제, 접두사/접미사 처리 문제, 다품사 문제 등은 정밀도 높은 코퍼스를 구축하는 데 중요한 열쇠가 되기 때문이다. 자연 언어 자료인 코퍼스에 일관성 있는 품사 정보가 부착된다면 정보 검색이나 사전 구축 등 언어 정보 처리 연구에 중요한 자료로 사용될 수 있을 것이다.

  • PDF

Language Modeling based on Inter-Word Dependency Relation (단어간 의존관계에 기반한 언어모델링)

  • Lee, Seung-Mi;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.239-246
    • /
    • 1998
  • 확률적 언어모델링은 일련의 단어열에 문장확률값을 적용하는 기법으로서 음성인식, 확률적 기계번역 등의 많은 자연언어처리 응용시스템의 중요한 한 요소이다. 기존의 접근방식으로는 크게 n-gram 기반, 문법 기반의 두가지가 있다. 일반적으로 n-gram 방식은 원거리 의존관계를 잘 표현 할 수 없으며 문법 기반 방식은 광범위한 커버리지의 문법을 습득하는데에 어려움을 가지고 있다. 본 논문에서는 일종의 단순한 의존문법을 기반으로 하는 언어모델링 기법을 제시한다. 의존문법은 단어와 단어 사이의 지배-피지배 관계로 구성되며 본 논문에서 소개되는 의존문법 재추정 알고리즘을 이용하여 원시 코퍼스로부터 자동적으로 학습된다. 실험 결과, 제시된 의존관계기반 모델이 tri-gram, bi-gram 모델보다 실험코퍼스에 대해서 약 11%에서 11.5%의 엔트로피 감소를 보임으로써 성능의 개선이 있었다.

  • PDF