• Title/Summary/Keyword: 대화처리

Search Result 740, Processing Time 0.028 seconds

A Out-of-vocabulary Processing Technology for the Spoken Language Understanding Module of a Dialogue Based Private Secretary Software (대화형 개인 비서 시스템의 언어 인식 모듈(SLU)을 위한 미등록어(OOV) 처리 기술)

  • Lee, ChangSu;Ko, YoungJoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.3-8
    • /
    • 2014
  • 대화형 개인 비서 시스템은 사람의 음성을 통해 인식된 음성 인식 결과를 분석하여 사용자에게 제공할 정보가 무엇인지 파악한 후, 정보가 포함되어 있는 앱(app)을 실행시켜 사용자가 원하는 정보를 제공하는 시스템이다. 이러한 대화형 개인 비서 시스템의 가장 중요한 모듈 중 하나는 음성 대화 인식 모듈(SLU: Spoken Language Understanding)이며, 발화의 "의미 분석"을 수행하는 모듈이다. 본 논문은 음성 인식결과가 잘못되어 의미 분석이 실패하는 것을 방지하기 위하여 음성 인식 결과에서 잘못 인식된 명사, 개체명 단어를 보정 시켜주는 미등록어(OOV:Out-of-vocabulary) 처리 모듈을 제안한다. 제안하는 미등록어 처리 모듈은 미등록어 탐색 모듈과 미등록어 변환 모듈로 구성되며, 미등록어 탐색 모듈을 통해 사용자의 발화에서 미등록어를 분류하고, 미등록어 변환 모듈을 통해 미등록어를 사전에 존재하는 유사한 단어로 변환하는 방법을 제안한다. 제안한 방법을 적용하였을 때의 실험 결과, 전체 미등록어 중 최대 52.5%가 올바르게 수정되었으며, 음성 인식 결과를 그대로 사용했을 경우 "원본 문장"과 문장 단위 67.6%의 일치율을 보인 것에 반해 미등록어 처리 모듈을 적용했을 때 17.4% 개선된 최대 85%의 문장 단위 일치율을 보였다.

  • PDF

A Study on Building Korean Dialogue Corpus for Restaurant reservation and recommendation (식당예약 및 추천을 위한 한국어 대화 코퍼스 구축 연구)

  • So, Aram;Park, Kinam;Lim, HeuiSeok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.630-632
    • /
    • 2018
  • 최근 딥러닝(Deep Learning)기반 연구가 활발해짐에 따라 딥러닝 모델 기반의 대화 시스템 연구가 활성화되고 있다. 하지만 이러한 연구는 다량의 데이터를 기반으로 이루어지기 때문에 데이터 구축 연구의 필요성이 증가하고 있다. 기존에 공개된 대화 코퍼스는 대부분 영어로 이루어져있어 한국어 대화 시스템에는 적용하기 어렵다. 본 논문에서는 한국어 대화 코퍼스 구축을 위하여 식당예약 및 추천을 위한 한국어 대화를 수집하였으며, 총 498개의 대화를 수집하였다. 대화는 식당 예약 및 추천을 위한 12개의 정보를 수집할 수 있도록 구성하였다. 또한 데이터의 활용성을 높이기 위하여 데이터 후처리 작업으로 12개의 정보를 태깅작업을 하였다.

  • PDF

Efficient Presentation of Messages on Tree-based Conversation Interface (트리기반 대화 인터페이스에서 메시지의 효율적인 프레젠테이션)

  • Kim Kyungdeok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.943-946
    • /
    • 2004
  • 본 논문에서는 트리기반 대화 인터페이스에서 대화 메시지의 효율적인 프레젠테이션 방법을 제안한다. 대화 인터페이스는 교육, 오락, 비즈니스 등에서 유용한 도구로서 활용이 되고 있지만, 형식적인 대화를 지원하기 위한 방법이 아직 미흡한 편이다. 기존 트리기반 대화 인터페이스는 응답 관계를 체계적으로 나타낼 수는 있지만 메시지가 수신될 때마다 메시지의 창의 이동이 발생하며, 또한 다양한 메시지의 주제에 따라 다중으로 수신되는 메시지의 프레젠테이션으로 인한 메시지 뷰의 이동으로 대화 내용의 파악이 어렵다. 그러므로 본 논문에서는 트리기반 대화 인터페이스에서 대화 메시지에 해당하는 노드의 폴딩(folding)을 이용하여 효율적인 프레젠테이션을 위한 방법을 제안한다. 응용 분야로는 게임, 협업, 원격교육 등이다.

  • PDF

Speech Act Flow in Natural Language Dialogues (제한 영역 대화에 나타난 화행 흐름에 관한 연구)

  • 송도규;차건회;박재득
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.168-170
    • /
    • 1998
  • 본 논문에서는 화행처리를 기반으로 한 중고자동차 매매 영역 대화시스템[1] 구축 과정에서 참조한 대화 시나리오에 나타난 화행의 흐름을 살펴보고자 한다. 자연언어 특히 대화에 나타나는 발화들은 어떤 행위를 구성하는 경향이 강하고 이 행위들은 각 발화의 언표내적 행위로 결정되며 대화의 흐름은 이 언표내적 행위를 교환함으로써 이루어진다. 다라서 단일 발화들이 모여서 이루는 대화에는 화행의 흐름이 있기 마련이다. 우리는 본 논문에서 대화시스템의 효율적이 대화관리를 위해서 제한 영역 대화에 나타난 화행의 흐름을 올바로 분석하고 규명하여 대화를 자연스럽게 유도하도록 한다.

  • PDF

English Tutoring System Using Chatbot and Dialog System (챗봇과 대화시스템을 이용한 영어 교육 시스템)

  • Choi, Sung-Kwon;Kwon, Oh-Woog;Lee, Kiyoung;Roh, Yoon-Hyung;Huang, Jin-Xia;Kim, Young-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.958-959
    • /
    • 2017
  • 본 논문은 챗봇과 대화시스템을 이용한 영어 교육 시스템을 기술하는 것을 목표로 한다. 본 논문의 시스템은 학습자의 대화 흐름을 제한하지 않고 주제를 벗어난 자유대화를 허용하며 문법오류에 대한 피드백을 한다. 챗봇과 대화시스템을 이용한 영어 교육 시스템은 대화턴 성공률로 평가되었는데, 평균 대화턴 성공률은 80.86%였으며, 주제별로는 1) 뉴욕시티투어 티켓 구매 71.86%, 2) 음식주문 71.06%, 3) 건강습관 대화 85.41%, 4) 미래화폐에 대한 생각 조사 95.09%였다. 또한 영어 문법 오류 교정도 측정되었는데 문법 오류 정확률은 66.7%, 재현율은 31.9%였다.

Relation between Locutionary Act and Illocutionary Act in Restricted Domain Natural Language Dialogues (제한 영역 대화에 나타난 언표적 행위와 언표내적 행위의 상관관계 연구)

  • Song, Do-Gyu;Cha, Keon-Hoe;Park, Jay-Duke
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.370-375
    • /
    • 1998
  • 본 논문에서는 화행처리를 기반으로 한 중고자동차 매매 영역 대화시스템 구축 과정에서 활용한 자연언어 대화체 발화의 언표적 행위와 언표내적 행위 간의 관계를 살펴보고자 한다. 하나의 언표적 행위는 여러 상이한 언표내적 행위를 수행할 수 있으며 또 역으로 여러 언표적 행위가 동일한 언표내적 행위를 구성하기도 한다. 이처럼 언표적 행위와 언표내적 행위 간에는 획일적이고 일률적인 상관관계를 설정하기가 어렵다. 그럼에도 불구하고 대화에 나타나는 발화들은 어떤 행위를 구성하는 경향이 강하고 이 행위들은 각 발화의 언표내적 행위로 결정되며 단일 발화들이 모여서 이루는 대화에는 화행의 흐름이 있기 마련이다. 따라서 우리는 본 논문에서 대화시스템의 효율적인 대화관리를 위해서 실제 자연언어 발화와 그에 따른 언표적 행위, 언표내적 행위를 올바로 분석하고 그 관계를 규명하여 대화를 자연스럽게 유도하도록 한다.

  • PDF

Multi-domain Dialog Framework using Domain Switching Strategy (영역 전환 전략을 사용한 다 영역 대화 프레임워크)

  • Choi, Wonseok;Kang, Sangwoo;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.152-154
    • /
    • 2010
  • 다 영역 대화 시스템 개발에서는 영역 확장이 쉬워야 하며 처리하는 대화 영역이 늘어나더라도 대화 과정에서 사용자 편의성을 유지해야 하는 점이 중요하다. 본 논문에서는 이런 특성을 가지는 다 영역 대화 시스템을 작성하기 위한 프레임워크를 제안한다. 이 프레임워크는 공통의 인터페이스를 구현하는 영역 전문가(Domain Expert) 기반으로 동작하므로 영역 확장이 용이하다. 또한 진행 중이던 대화를 종료하지 않은 채 타 대화 영역으로 이동하는 영역 전환(Domain Switching) 현상은 다 영역 대화를 복잡하게 만드는 주요한 원인 중 하나로써 이를 효과적으로 관리할 수 있는 영역 전환 전략을 사용하여 사용자 편의성을 확보하였다.

  • PDF

Supporting Media using XML-based Messages on Online Conversational Activity (온라인 대화 행위에서 XML 기반 메시지를 이용한 미디어 지원)

  • Kim, Kyung-Deok
    • The KIPS Transactions:PartB
    • /
    • v.11B no.1
    • /
    • pp.91-98
    • /
    • 2004
  • This paper proposes how to support various media on online conversational activity using XML(extensible Markup Language). The method converts media information into XML based messages and handles alike conventional text based messages. The XML based messages are unified to an XML document, and then a HTML document is generated using the XML and an XSLT documents in a server. A user in each client can play or present media through the hyperlink that is associated media information on the HTML document. The suggested method supports use of various media (text, image, audio, video, documents, etc) and efficient maintenance of font size, color, and style on messages according to extension and modification of XML tags. For application, this paper implemented the system to support media that has client and server architecture on online conversational activity. A user in each client inputs text or media based message using JAVA applet and servlet on the system, and conversational messages on every users' interfaces are automatically updated whenever a user inputs new message. Media on conversational messages are played or presented according to a user's click on hyperlink. Applications for the media presentation are as follows : distance learning, online game, collaboration, etc.

Study on Method Constructing Dialog Act Tagged Corpus for Dialog System in Car (차량용 대화 시스템을 위한 Dialog Act 태깅 코퍼스 구축 방법 연구)

  • Choi, Sung-Kwon;Kwon, Oh-Woog;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.181-184
    • /
    • 2012
  • 본 논문에서는 한국전자통신연구원 언어처리연구팀에서 개발하고 있는 차량용 대화 시스템을 위한 Dialog Act 태깅 코퍼스 구축 방법에 대해 기술하는 것을 목표로 한다. 차량용 태깅 코퍼스 구축 방법은 크게 차량용 대화 코퍼스 수집과 수집된 대화 코퍼스에 Dialog Act를 반자동으로 태깅하는 방법으로 나눌 수 있다. 차량용 대화 코퍼스 수집은 1) 대화플랜 맵 구축, 2) 표준대화 구축, 3) 자유대화 구축, 4) 사용자 발화에 패러프래징 발화 구축의 순으로 구축되었다. Dialog Act 태깅은 수집된 대화코퍼스로부터 슬롯 후보를 추출하여 슬롯 체계를 구축한 후 반자동 슬롯 태깅을 실시하고, 슬롯 태깅 결과와 Dialog Act Type을 조합하여 Dialog Act 태깅 코퍼스를 구축하였다. 이렇게 구축된 Dialog Act 태깅 코퍼스는 차량 공조시스템(에어컨, 히터 등) 및 차량 응급 조치 정보 서비스와 같은 차량용 대화 시스템에 적용 중에 있다.

  • PDF

OK-KGD:Open-domain Korean Knowledge Grounded Dialogue Dataset (OK-KGD:오픈 도메인 한국어 지식 기반 대화 데이터셋 구축)

  • Seona Moon;San Kim;Jinyea Jang;Minyoung Jeung;Saim Shin
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.342-345
    • /
    • 2023
  • 최근 자연어처리 연구 중 오픈 도메인 지식 기반 대화는 많은 관심을 받고 있다. 연구를 위해서는 오픈 도메인 환경을 갖추고 적절한 지식을 사용한 대화 데이터셋이 필요하다. 지금까지 오픈 도메인 환경을 갖춘 한국어 지식 기반 대화 데이터셋은 존재하지 않아 한국어가 아닌 데이터셋을 한국어로 기계번역하여 연구에 사용하였다. 이를 사용할 경우 두 가지 단점이 존재한다. 먼저 사용된 지식이 한국 문화에 익숙하지 않아 한국인이 쉽게 알 수 없는 대화 내용이 담겨있다. 그리고 번역체가 남아있어 대화가 자연스럽지 않다. 그래서 본 논문에서는 자연스러운 대화체와 대화 내용을 담기 위해 새로운 오픈 도메인 한국어 지식 기반 대화 데이터셋을 구축하였다. 오픈 도메인 환경 구축을 위해 위키백과와 나무위키의 지식을 사용하였고 사용자와 시스템의 발화로 이루어진 1,773개의 대화 세트를 구축하였다. 시스템 발화는 크게 지식을 사용한 발화, 사용자 질문에 대한 답을 주지 못한 발화, 그리고 지식이 포함되지 않은 발화 3가지로 구성된다. 이렇게 구축한 데이터셋을 통해 KE-T5와 Long-KE-T5를 사용하여 간단한 실험을 진행하였다.

  • PDF