Search | Korea Science

Dialogue based multimodal dataset including various labels for machine learning research (대화를 중심으로 다양한 멀티모달 융합정보를 포함하는 동영상 기반 인공지능 학습용 데이터셋 구축)

Shin, Saim;Jang, Jinyea;Kim, Boen;Park, Hanmu;Jung, Hyedong
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.449-453
- /
- 2019
미디어방송이 다양해지고, 웹에서 소비되는 콘텐츠들 또한 멀티미디어 중심으로 재편되는 경향에 힘입어 인공지능 연구에 멀티미디어 콘텐츠를 적극적으로 활용하고자 하는 시도들이 시작되고 있다. 본 논문은 다양한 형태의 멀티모달 정보를 하나의 동영상 콘텐츠에 연계하여 분석하여, 통합된 형태의 융합정보 데이터셋을 구축한 연구를 소개하고자 한다. 구축한 인공지능 학습용 데이터셋은 영상/음성/언어 정보가 함께 있는 멀티모달 콘텐츠에 상황/의도/감정 정보 추론에 필요한 다양한 의미정보를 부착하여 활용도가 높은 인공지능 영상 데이터셋을 구축하여 공개하였다. 본 연구의 결과물은 한국어 대화처리 연구에 부족한 공개 데이터 문제를 해소하는데 기여하였고, 한국어를 중심으로 다양한 상황 정보가 함께 구축된 데이터셋을 통하여 다양한 상황 분석 기반 대화 서비스 응용 기술 연구에 활용될 것으로 기대할 수 있다.
PDF

Design of Interactive Operations using Prefetching in VoD System (VoD 시스템에서 선반입 기법을 이용한 대화식 동작의 설계)

Kim, Soon-Cheol
- Journal of Korea Society of Industrial Information Systems
- /
- v.15 no.2
- /
- pp.31-39
- /
- 2010
VoD(Video-on-Demand) servers have to provide timely processing guarantees for continuous media and reduce the storage and bandwidth requirements for continuous media. The compression techniques make the bit rates of compressed video data significantly variable from frame to frame. A VoD system should be able to provide the client with interactive operations such as fast forward and fast rewind in addition to normal playback of movie. However, interactive operations require additional resources such as storage space, disk bandwidth, memory and network bandwidth. In a stored video application such as VoD system, it is possible that a priori disk access patterns can be used to reserve the system resources in advance. In addition, clients of VoD server spend most of their time in playback mode and the period of time spent in interactive mode is relatively small. In this paper, I present the new buffer management scheme that provides efficient support for interactive operations in a VoD server using variable bit rate continuous media. Simulation results show that our strategy achieves 34% increase of the number of accepted clients over the LRU strategy.
https://doi.org/10.9723/jksiis.2010.15.2.031 인용 PDF KSCI

Keyword Based Conversation Generation using Large Language Model (Large Language Model을 활용한 키워드 기반 대화 생성)

Juhwan Lee;Tak-Sung Heo;Jisu Kim;Minsu Jeong;Kyounguk Lee;Kyungsun Kim
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.19-24
- /
- 2023
자연어 처리 분야에서 데이터의 중요성이 더욱 강조되고 있으며, 특히 리소스가 부족한 도메인에서 데이터 부족 문제를 극복하는 방법으로 데이터 증강이 큰 주목을 받고 있다. 이 연구는 대규모 언어 모델(Large Language Model, LLM)을 활용한 키워드 기반 데이터 증강 방법을 제안하고자 한다. 구체적으로 한국어에 특화된 LLM을 활용하여 주어진 키워드를 기반으로 특정 주제에 관한 대화 내용을 생성하고, 이를 통해 대화 주제를 분류하는 분류 모델의 성능 향상을 입증했다. 이 연구 결과는 LLM을 활용한 데이터 증강의 유의미성을 입증하며, 리소스가 부족한 상황에서도 이를 활용할 수 있는 방법을 제시한다.
PDF

Attentive Knowledge Selection Model for Knowledge-Grounded Multi-turn Dialogue System (지식 기반 다중 대화 시스템을 위한 주의 집중 지식 선택 모델)

Lee, Dohaeng;Jang, Youngjin;Huang, Jin-Xia;Kwon, Oh-Woog;Kim, Harksoo
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.361-364
- /
- 2021
지식 기반 다중 대화 시스템은 지식 정보를 포함한 응답을 생성하는 대화 시스템이다. 이 시스템은 응답 생성에 필요한 지식 정보를 찾아내는 지식 선택 작업과 찾아낸 지식 정보를 바탕으로 문맥을 고려한 응답을 생성하는 응답 생성 작업으로 구성된다. 본 논문에서는 지식 선택 작업을 기계독해 프레임워크에 적용하여 해결하는 방법을 제안한다. 지식 선택 작업은 여러 개의 발화로 이루어진 대화 기록을 바탕으로 지식 문서 내에 존재하는 지식을 찾아내는 작업이다. 본 논문에서는 대화 기록 모델링 계층을 활용해 마지막 발화와 관련 있는 대화 기록을 찾아내고, 주의 집중 풀링 계층을 활용해 긴 길이의 지식을 효과적으로 추출하는 방법을 제안한다. 실험 결과, 목적지향 지식 문서 기반 대화 데이터 셋인 Doc2dial 데이터의 지식 선택 작업에서 F1 점수 기준 76.52%, EM 점수 기준 66.21%의 성능을 기록해 비교 모델 보다 높은 성능을 기록하는 것을 확인할 수 있었다.
PDF

Conversation Context-Aware Backchannel Prediction Model (대화 맥락을 반영한 백채널 예측 모델)

Yong-Seok Choi;Yo-Han Park;Wencke Liermann;Kong Joo Lee
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.263-268
- /
- 2023
백채널은 화자의 말에 언어 및 비언어적으로 반응하는 것으로 상대의 대화 참여를 유도하는 역할을 한다. 백채널은 보편형 대화 참여와 반응형 대화 참여로 나뉠 수 있다. 보편형 대화 참여는 화자에게 대화를 장려하도록 하는 단순한 반응이다. 반면에 반응형 대화 참여는 화자의 발화 의도를 파악하고 그에 맞게 반응하는 것이다. 이때 발화의 의미를 파악하기 위해서는 표면적인 의미뿐만 아니라 대화의 맥락을 이해해야 한다. 본 논문에서는 대화 맥락을 반영한 백채널 예측 모델을 제안하고 예측 성능을 개선하고자 한다. 대화 맥락을 요약하기 위한 방법으로 전체 요약과 선택 요약을 제안한다. 한국어 상담 데이터를 대상으로 실험한 결과는 현재 발화만 사용했을 때보다 제안한 방식으로 대화 맥락을 반영했을 때 성능이 향상되었다.
PDF

Korean Restaurant Reservation System Model Using Hybrid Code Network (Hybrid Code Network를 이용한 한국어 식당 예약 시스템 모델)

Lee, Dong-Yub;Hur, Yun-A;Lim, Heui-Seok
- Proceedings of The KACE
- /
- 2017.08a
- /
- pp.57-59
- /
- 2017
대화 시스템(dialogue system)은 텍스트나 음성을 통해 다양한 분야에서 특정한 목적을 수행할 수 있는 시스템이다. 대화 시스템을 구현하기 위한 방법으로 인공 신경망(neural network)을 기반으로한 end-to-end learning 방식이 제안되었다. End-to-end learning 방식을 이용한 식당 예약 시스템 모델의 학습을 위해 페이스북은 영어로 이루어진 식당 예약에 관련된 학습 대화 데이터셋(The 6 dialog bAbI tasks)을 구축하였다. 하지만 end-to-end learning 방식의 학습은 많은 학습 데이터가 필요하다는 단점이 존재하는데, 액션 템플릿(action template)의 정의를 통해 도메인 지식을 표현함으로써 일반적인 end-to-end learning 방식보다 적은 학습량으로 좋은 성능의 모델을 학습할 수 있는 Hybrid Code Network 구조를 제안한 연구가 있다. 본 논문에서는 Hybrid Code Network 구조를 이용하여 한국어 식당 예약 시스템을 구축할 수 있는 방법을 제안하고, 한국어로 이루어진 식당 예약에 관련한 학습 대화 데이터를 구축하는 방법을 제안한다.
PDF

An Effect of AI Characteristics on the Intention to Continuous use the Chatbot Service (AI특성이 챗봇 서비스 지속사용의도에 미치는 영향)

Lee, Sae Bom;Park, Arum
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2020.07a
- /
- pp.203-204
- /
- 2020
챗봇이란 인공지능 기반으로 인간과 대화하는 로봇을 일컬으며, 요청과 응답구조로 운영되는 인공지능 프로그램을 말한다. 챗봇은 사용자와 상호작용하기 위해 대화형 인터페이스를 사용하는 소프트웨어로 기존 사용자의 언어를 이해하고 학습하여 인간이 대화하듯이 대화를 하도록 설계되어있다. 챗봇을 사용하는 회사는 인건비를 줄이고 빅데이터를 기반으로 전문적이고 정확한 답변을 제공할 수 있어 활용 효율성이 높은 편이다. 그러나 회사가 챗봇을 적극적으로 도입하고 사용자에게 긍정적인 영향을 줄 것이라는 기대와 달리 사용자는 챗봇을 계속 사용하지 않고있다. 따라서 본 논문은 챗봇 서비스의 지속사용의도에 영향을 미치는 요인들을 파악하고자 한다. 특히 인공지능 특성이 챗봇 서비스 지속적 사용의도에 미치는 영향을 연구한다.
PDF

Memory Attention-based Breakdown Detection for Natural Conversation in Dialogue System (대화 시스템에서의 자연스러운 대화를 위한 Memory Attention기반 Breakdown Detection)

Lee, Seolhwa;Park, Kinam;Lim, Heuiseok
- Annual Conference on Human and Language Technology
- /
- 2018.10a
- /
- pp.31-34
- /
- 2018
대화 시스템에서 사람과 기계와의 모든 발화에서 발생하는 상황들을 모두 규칙화할 수 없기 때문에 자연스러운 대화가 단절되는 breakdown 현상이 빈번하게 일어날 수 있다. 이런 현상이 발생하는 이유는 다음과 같다. 첫째, 대화에서는 다양한 도메인이 등장하기 때문에 시스템이 커버할 수 있는 리소스가 부족하며, 둘째, 대화 데이터에서 학습을 위한 annotation되어 있는 많은 양의 코퍼스를 보유하기에는 한계가 있으며, 모델에 모든 대화 흐름의 히스토리를 반영하기 어렵다. 이런 한계점이 존재함에도 breakdown detection은 자연스러운 대화 시스템을 위해서는 필수적인 기능이다. 본 논문은 이런 이슈들을 해소하기 위해서 memory attention기반의 새로운 모델을 제안하였다. 제안한 모델은 대화내에 발화에 대해 memory attention을 이용하여 과거 히스토리가 반영되기 때문에 자연스러운 대화흐름을 잘 detection할 수 있으며, 기존 모델과의 성능비교에서 state-of-the art 결과를 도출하였다.
PDF

A study on the categories and characteristics of depressive moods in chatbot data (챗봇 데이터에 나타난 우울의 범주와 특성에 관한 연구)

Chin, HyoJin;Baek, Gum-hee;Cha, Chiyoung;Choi, Jeonghoi;Im, Hyunseung;Cha, Meeyoung
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.11a
- /
- pp.993-996
- /
- 2021
챗봇의 사용 용도는 일상 대화와 소비자 응대를 넘어서 심리 상담 용도로 확장하고 있다. 이 연구에서는 챗봇-사람 채팅에서 무작위로 추출한 '우울'과 관련된 대화 데이터를 텍스트마이닝 기법으로 분석하여 채팅에서의 우울 관련 담론 주제를 파악하였다. 더불어 정성 분석을 통해 사용자들이 챗봇에 털어놓고 있는 '우울' 의 종류를 범주화하고 분류하여, 트위터의 '우울' 데이터와의 차이점을 비교하였다. 이를 통해 챗봇 데이터의 '우울' 대화만의 특징을 파악하고, 우울 증상 탐지와 그에 따른 적절한 심리지원 정보를 제공하는 서비스 디자인의 착안점을 제시한다.
https://doi.org/10.3745/PKIPS.y2021m11a.993 인용 PDF

MPEG-4/7 기술과 대화형 방송

김진웅
- Information and Communications Magazine
- /
- v.18 no.10
- /
- pp.75-87
- /
- 2001
방송 서비스는 이제 디지털 시대를 맞이하여 일대 패러다임의 변화를 겪고 있다. 전 세계는 본격적인 디지털 방송 시대를 맞이하고 있으며, 새로운 반송 환경에서는 기존의 서비스와는 비교할 수 없을 정도로 향상된 품질의 오디오비쥬얼 데이터를 제공할 뿐만 아니라, 시청자의 요구에 적절히 대응하는 대화형 멀티미디어 방송 서비스 제공이 가능해 진다. 이러한 방송 분야의 눈부신 발전에는 국제 표준화 기구인 ISO/IEC 산하의 동영상 전문가 그룹인 MPEG의 표준기술 개발이 큰 원동력이 되고 있다. 본 고에서는 대화형 방송의 개념과 기술을 중심으로 현재 진행되고 있는 방송 기술의 변화를 살펴보고, 객체 지반의 데이터 압축, 처리, 전송을 가능하게 하는 MPEG-4 및 내용 기반 검색 및 필터링을 가능하게 하는 MPEG-7 기술의 개념 및 방송 서비스 적용에 대해 검토해보기로 한다.
PDF

Search Result 582, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)