Search | Korea Science

Software Implementation for Interactive Broadcasting for PC-based T-DMB Receivers (PC 기반 지상파 DMB 수신기의 대화형 방송 순신 SW 구현)

Park Bum Chul;Kim Yong Han
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2004.11a
- /
- pp.85-88
- /
- 2004
본 논문에서는 PC 기반 지상파 DMB(Terrestrial Digital Multimedia Broadcasting, T-DMB) 수신기를 위한 대화형 방송 수신 SW 구현에 대해 설명한다. T-DMB 표준에 의하면, MPEG-4 BIFS(Binary Format for Scene)를 옵션으로 사용한 수 있게 되어 있는데, 이를 이용하면, 여러 가지 형태의 대화형 방송 기능을 실현할 수 있다. 본 논문에서는 이러한 BIFS 데이터가 포함된 비트스트림을 수신하여 이를 복호한 후, 화면에 동영상과 함께 디스플레이 하는 대화형 방송 수신 기능을 구현하였다. 또한 이를 활용하여 쉽게 구현할 수 있는, 화면상의 클릭 가능한 객체, 즉 "핫 스팟(hot-spot)"을 이용한 대화형 방송 시나리오와 예제 구현에 대해 설명한다.
PDF

Intelligent Classification and Context Analysis System of Voice Data (음성 데이터의 지능적 분류 및 컨텍스트 분석 시스템 구현)

Choi, HyeonSeok;Joo, SungHwan;Kim, DaeCheon;Park, YeChan;Yeom, Sanggil;Choo, HyeonSeung
- Proceedings of the Korea Information Processing Society Conference
- /
- 2016.10a
- /
- pp.162-163
- /
- 2016
사람은 의사소통을 위해 음성, 글자, 몸짓 등 다양한 매개체를 활용한다. 오늘날 스마트폰의 발달로 문자의 비중이 높아지고 있지만 음성 대화는 여전히 사람들 사이에서 가장 많이 사용되어지는 의사소통 수단이다. 음성 대화는 녹음해서 음성 데이터로 남길 수 있다. 음성을 녹음하는 과정은 간편하지만 녹음파일에서 원하는 데이터를 찾는 것은 많은 시간이 소모된다. 본 논문에서는 음성 데이터를 인식하여 텍스트화 시키고 문자화 된 데이터를 분석하여 사용자에게 효율적으로 분류하는 시스템을 제안한다. 이 시스템으로 사용자는 음성 데이터의 내용을 들어보지 않고 파악할 수 있으며 원하는 내용을 찾을 수도 있다.
https://doi.org/10.3745/PKIPS.y2016m10a.162 인용 PDF

Temporal Segmentation of Mobile Text Message (시간정보에 기반한 핸드폰 문자의 대화 구분)

Jung, Hun-Young;Lee, Jong-Hyeok
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06b
- /
- pp.306-308
- /
- 2012
핸드폰 사용이 보편화되고 핸드폰의 문자 사용량이 늘어감에 따라 대량의 핸드폰 문자 메시지를 구축하는 건이 가능해졌다. 이러한 문자 데이터를 처리에 기반이 되는 대화 구분 방법을 제안하였다. 이 방법론은 기존 문서분류 방식을 적용하는데 발생하는 문제를 피하기 위해 시간정보를 사용하는 비지도학습 방법론이다. 해당 방법을 실제 핸드폰 메시지 데이터에 적용한 결과 정확율과 재현율에서 0.9를 넘는 높은 성능을 보였다.

Building Open Domain Chatbot based Language Model (언어모델 기반 오픈 도메인 챗봇 구현)

Kim, Seung-Tae;Koo, Jahwan;Kim, Ung-Mo
- Proceedings of the Korea Information Processing Society Conference
- /
- 2020.11a
- /
- pp.931-933
- /
- 2020
자연어 처리는 인공지능의 핵심기술 중 하나이다. 그 중 오픈 도메인 챗봇 구현은 NLP 에서 어려운 태스크로 꼽힌다. 명확한 목표, FAQ 가 존재하는 기능형 챗봇과 달리 오픈 도메인 챗봇은 연속적 대화, 방대한 양의 상식 등 구현에 어려움이 많았다. 짧은 질문과 대답으로 이루어진 데이터로 학습한 모델을 대화 데이터로 학습시켜 좀더 자연스러운 챗봇을 구현해보고자 한다.
https://doi.org/10.3745/PKIPS.y2020m11a.931 인용 PDF

A Recovery Method Supporting User-Interactive Undo in Database Management Systems (데이타베이스 관리 시스템에서 대화식 UNDO를 지원하는 회복 기법)

Kim, Won-Yeong;Hwang, Gyu-Yeong;Kim, Sang;Kim, Jang
- Journal of KIISE:Software and Applications
- /
- v.26 no.1
- /
- pp.1-15
- /
- 1999
대화식 UNDO는 수행된 연산을 철회시키거나 재실행시킴으로서 사용자의 오류를 쉽게 교정할 수 있도록 허용하기 위한 일종의 회복기능이다. 소프트웨어 개발, 하이퍼미디어 CAD 등과 같은 새로운 데이터베이스응용 분야에서는 편리한 저작 및 편집 과정으르 위하여 대화식 UNDO 기능의 지원이 필수적이다. 상용 DBMS들이 제공하는 세이브포인트를 이용한 부분 철회는 수행된 연산의 철회만을 허용하는 것으로 대화식 UNDO의 제한적 기능이다. 기존의 응용 시스템들은 데이터 관리를 위해서는 DBMS를 사용하면서도 이러한 대화식 UNDO 기능은 응용시스템에서 직접 제공하고 있다. 대화식 UNDO 기능의 구현은 매우 복잡하기 때문에 응용 프로그래머에게 상당한 개발 오버헤드를 요구한다. 본 연구의 목적은다양한 응용 시스템개발을 위하여 공통적으로 필요한 고급 기능을 응용 프로그래머가 쉽게 이용할 수 있도록 대화식 UNDO 기능을 DBMS에서 직접 지원하는 새로운 회복 기법을 제안하는 것이다. 제안된 기법에서는 트랜잭션 철회시 대화식 UNDO에 의해 UNDO된 연산들을 스킵함으로써 빠른 철회를 보장하고 여러 연산을 한번에 철회할 수 있는 벌크 UNDO 연산 (bulk undo)을 제공한다. 벌크들도 다시 재실행될수 있다는 점에서 부분 철회와 구별된다. 특히,일반 DBMS에서 회복을 위하여 관리해야 하는 정보를 최대한 활용함으로써 새로운 기능의 추가에도 불구하고 제안된 기법의 성능은 이러한 기능을 제공하지 않는 기존의 회복 기법과 비교할만한 좋은 성능을 보인다.

Unethical Expressions in Messenger Talks for Interactive Artificial Intelligence (대화형 인공지능을 위한 메신저 대화의 비윤리적 표현 연구)

Yelin Go;Kilim Nam;Hyunju Song
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.22-25
- /
- 2022
본 연구는 대화형 인공지능이 비윤리적 표현을 학습하거나 생성하는 것을 방지하기 위한 기초적 연구로, 메신저 대화에 나타나는 단어 단위, 구 단위 이상의 비윤리적 표현을 수집하고 그 특성을 분석하였다. 비윤리적 표현은 '욕설, 혐오 및 차별 표현, 공격적 표현, 성적 표현'이 해당된다. 메신저 대화에 나타난 비윤리적 표현은 욕설이 가장 많은 비중을 차지했는데, 욕설에서는 비표준형뿐만 아니라 '존-', '미치다' 등과 같이 맥락을 고려하여 판단해야 하는 경우가 있다. 가장 높은 빈도로 나타난 욕설 '존나류, 씨발류, 새끼류'의 타입-토큰 비율(TTR)을 확인한 결과 '새끼류'의 TTR이 가장 높게 나타났다. 다음으로 메신저 대화에서는 공격적 표현이나 성적인 표현에 비해 혐오 및 차별 표현의 비중이 높았는데, '국적/인종'과 '젠더' 관련된 혐오 및 차별 표현이 특히 높게 나타났다. 혐오 및 차별 표현은 단어 단위보다는 구 단위 이상의 표현의 비중이 높았고 문장 단위로 떨어지기 보다는 대화 전체에 걸쳐 나타나는 것을 확인하였다. 따라서 혐오 및 차별 표현을 탐지하기 위해서는 단어 단위보다는 구 단위 이상 표현의 탐지에 대한 필요성이 있음을 학인하였다.
PDF

Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features (이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템)

Jungwoo Lim;Yoonna Jang;Junyoung Son;Seungyoon Lee;Kinam Park;Heuiseok Lim
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.253-257
- /
- 2023
최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.
PDF

Proposal for the Dataset Structure for Developing Emotionally Intelligent Chatbots with Integrated Counseling Strategies (상담 전략을 통합한 정서 교감형 챗봇 개발을 위한 데이터셋 구조 제안)

Dong-Hyok Shin;Jae Hee Yang;Jin Yea Jang;Saim Shin
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.179-184
- /
- 2023
본 연구는 우울감을 느끼거나 대화 상대 부재로 어려움을 겪는 사용자와 정서 교감형 시스템간의 대화로 구성된 한국어 데이터 셋을 구축하고 이때 시스템이 사용할 수 있는 효과적인 응대 전략을 제안하는데 목적이 있다. 데이터셋은 사용자와 시스템 간의 대화 쌍을 기본 단위로 하며, 사용자의 7가지 기본 감정(행복, 슬픔, 공포, 놀람, 분노, 혐오, 중립)과 시스템의 4가지 응대 전략(명료화, 공감적 응대, 제안, 페르소나)에 따라 주석이 된다. 이 중, 공감적 응대 전략은 10가지 독특한 반응 유형(수용적 경청, 후행 발화 요청, 승인/동의, 비승인/재고 요청, 놀람, 격려, 느낌 표시, 상대 발화 반복, 인사, 의견 제시) 및 4가지 후행 발화 요청 유형(무엇, 왜, 어떻게, 그밖에)을 포함하는 구조로 구체화되었다. 이러한 주석은 시스템이 사용자의 다양한 감정을 식별하고 적절한 공감 수준을 나타내는 응답을 생성하는 데 있어 연구적인 의의가 있으며, 필요시 사용자가 부정적 감정을 극복할 수 있는 활동을 제안하는 데 도움을 줄 수 있다는 점에서 실제적인 의의가 있다.
PDF

Empirical study on BlenderBot 2.0's errors analysis in terms of model, data and dialogue (모델, 데이터, 대화 관점에서의 BlendorBot 2.0 오류 분석 연구)

Lee, Jungseob;Son, Suhyune;Shim, Midan;Kim, Yujin;Park, Chanjun;So, Aram;Park, Jeongbae;Lim, Heuiseok
- Journal of the Korea Convergence Society
- /
- v.12 no.12
- /
- pp.93-106
- /
- 2021
Blenderbot 2.0 is a dialogue model representing open domain chatbots by reflecting real-time information and remembering user information for a long time through an internet search module and multi-session. Nevertheless, the model still has many improvements. Therefore, this paper analyzes the limitations and errors of BlenderBot 2.0 from three perspectives: model, data, and dialogue. From the data point of view, we point out errors that the guidelines provided to workers during the crowdsourcing process were not clear, and the process of refining hate speech in the collected data and verifying the accuracy of internet-based information was lacking. Finally, from the viewpoint of dialogue, nine types of problems found during conversation and their causes are thoroughly analyzed. Furthermore, practical improvement methods are proposed for each point of view, and we discuss several potential future research directions.
https://doi.org/10.15207/JKCS.2021.12.12.093 인용 PDF KSCI

KoDialoGPT2 : Modeling Chit-Chat Dialog in Korean (KoDialoGPT2 : 한국어 일상 대화 생성 모델)

Oh, Dongsuk;Park, Sungjin;Lee, Hanna;Jang, Yoonna;Lim, Heuiseok
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.457-460
- /
- 2021
대화 시스템은 인공지능과 사람이 자연어로 의사 소통을 하는 시스템으로 크게 목적 지향 대화와 일상대화 시스템으로 연구되고 있다. 목적 지향 대화 시스템의 경우 날씨 확인, 호텔 및 항공권 예약, 일정 관리 등의 사용자가 생활에 필요한 도메인들로 이루어져 있으며 각 도메인 별로 목적에 따른 시나리오들이 존재한다. 이러한 대화는 사용자에게 명확한 발화을 제공할 수 있으나 자연스러움은 떨어진다. 일상 대화의 경우 다양한 도메인이 존재하며, 시나리오가 존재하지 않기 때문에 사용자에게 자연스러운 발화를 제공할 수 있다. 또한 일상 대화의 경우 검색 기반이나 생성 기반으로 시스템이 개발되고 있다. 검색 기반의 경우 발화 쌍에 대한 데이터베이스가 필요하지만, 생성 기반의 경우 이러한 데이터베이스가 없이 모델의 Language Modeling (LM)으로 부터 생성된 발화에 의존한다. 따라서 모델의 성능에 따라 발화의 품질이 달라진다. 최근에는 사전학습 모델이 자연어처리 작업에서 높은 성능을 보이고 있으며, 일상 대화 도메인에서도 역시 높은 성능을 보이고 있다. 일상 대화에서 가장 높은 성능을 보이고 있는 사전학습 모델은 Auto Regressive 기반 생성모델이고, 한국어에서는 대표적으로 KoGPT2가 존재한다. 그러나, KoGPT2의 경우 문어체 데이터만 학습되어 있기 때문에 대화체에서는 낮은 성능을 보이고 있다. 본 논문에서는 대화체에서 높은 성능을 보이는 한국어 기반 KoDialoGPT2를 개발하였고, 기존의 KoGPT2보다 높은 성능을 보였다.
PDF

Search Result 587, Processing Time 0.024 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)