• Title/Summary/Keyword: 대화의 방식

Search Result 431, Processing Time 0.027 seconds

A Study on Generation of Polite Expressions for Dialogue Participants in Machine Translation System (대화체 자동번역 시스템에서 대화상대 맞춤 존대표현 생성에 관한 연구)

  • Choi, Sung-Kwon;Kim, Young-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.399-402
    • /
    • 2011
  • 현재의 자동번역 방식의 문제점은 대화 상대에 상관없이 항상 일정한 존대 표현을 생성하여 자동번역 결과를 부자연스럽게 만들고 앞뒤 대화 문맥을 혼란하게 만든다는 것이다. 예를 들어 대화 상대가 달라지면 동일한 원문에 대해서도 자동번역 결과는 다른 존대 표현을 생성해야 하나, 현재의 자동번역 시스템은 항상 하나의 일관된 존대 표현을 생성한다. 이 이유는 자동 번역 시스템에서 사용하는 번역지식 또는 데이터가 고정되어 있어 유동적으로 변하지 않기 때문이다. 본 논문에서는 이러한 기존 자동번역의 문제점을 해결하기 위하여, 소셜 네트워크(social network)에서 제공하는 디지털 인맥 정보와 같은 비언어적 정보와 발화상의 표현과 같은 언어적 정보로부터 대화 자간의 존대 관계를 계산하여 자동번역 결과에 반영함으로써 언어 문화적 존대 차이를 자동으로 극복하는 대화 상대 맞춤형 존대표현 자동 번역 방법을 기술하는 데 그 목적이 있다.

대화형 TV 서비스 기술 및 전망

  • 강정훈
    • Information and Communications Magazine
    • /
    • v.11 no.10
    • /
    • pp.120-138
    • /
    • 1994
  • 최근에 정보 고속도로 사업계획과 관련하여 세계 여러나라들이 실시하거나 실시 예정인 VOD 시험서비스에 많은 관심이 일고 있다. VOD서비스와 같은 대화형 TV 서비스(I-TV, Interactive-TV Service)는 컴퓨터, 통신 가전업체 그리고 영화 제작사등이 함께 참여하고 있다. 본 기고에서는 차세대 통합 멀티미디어 사업이라는 대화형 TV서비스의 개요와 요소기술, 그리고 서비스의 동향 및 전망을 알아보기로 한다. 1. 대화형 TV 서비스(Interactive TV Service)의 개요 현재까지 대부분의 TV 시청자들은 방송국으로부터 송신되는 공중파나 CATV서비스를 통해 프로그램 서비스를 받아보는 방송(broadcasting)방식 형태의 서비스를 이용해 왔다. 그러나 이러한 일방적인 수신방식은 최근 미국의 클린턴 행정부가 미국의 차세대 기반 통신망 구축 정책(정보 고속도로 사업; Information Super High-way)의 일환으로, CATV 사업자뿐만 아니라 지역 전화회사까지도 참여하고 있는 VOD(Video On Demand) 시험서비스가 시행됨에 따라서 미국은 물론, 우리나라를 비롯한 여러나라에서 대화형식의 TV서비스를 시행하려는 움직임이 일어나고 있다. 이러한 움직임은 지난 ‘92년 7월 16일 미 연방통신위원회(FCC. Federal Communication Committee)가 그동안 전화회사에 대해 CATV 시업진출을 금지하였던 정책을 바꿔서, CATV에 대항한 경쟁도입과 기반 정보통신망 정비를 목표로 하여 비디오 다이얼톤(VDT(주), Video Dial Tone)이라는 이름하에 공중통신 사업자에게도 영상신호를 전송을 인가함에 따라 시작되었다. VOD서비스와 같은 대화형 TV서비스는 가입자가 원하는 서비스를 시간에 관계없이 댁내의 통신회선(일반전화망, 케이블망, 광화이버망, 위성망)을 통해서 요구 즉시 실시간에 서비스를 받아볼 수 있는 멀키미디어의 통합서비스 방식이다. 도한 이 서비스는 음성통신과 방송의 통합형 서비스로서, 방송국, 전화회사 혹은 서비스 제공업자(ISP ; Information Service Provider)에 의해 제공된 디지탈 영상 및 일반 데이터 등을 압축하여 서버에 저장한 후, 소비자의 요청이 있을 경우에 통신회선을 통해 즉시 서비스 해준다. 이와 같은 대화형 TV 서비스의 구성요소로는 다양한 영상정보 및 데이타를 보유하고 있는 정보제공자, 전화선이나 CATV 또는 위성방송과 연결해 주는 지역별 비디오 서버 및 교환장치, 통신회선을 통해 전송된 서비스를 영상정보로 만들어주고 또한 가입자의 요구를 즉시 정보제공자에게 알려줄 수 있는 가정용 단말기 (STB. Set Top Box)로 이루어진다. 여기서, 비디오 서버는 다양한 대화형 TV 서비스를 제공해 주는 중계자로서, 영화, 홈쇼핑, 홈뱅킹, 대화형 교육, 비디오 게임 등을 가정에서도 가능하게 해 줄 뿐 아니라, 가입자를 관리하는 기능을 가지고 있어서 가입자 정보는 물론, 각종 서비스 사용료, 개인 통계자료 분석 등도 집계할 수 있는 기능을 가지고 있다.(그림1) 본 기고에서는 이러한 대화형 TV서비스 중에 대표적 응용서비스인 VOD 서비스에 사용되는 기술요소와 각국에서 진행되고 있는 VOD 서비스 동향 및 전망에 대해 알아보고자 한다. (주) VDT(Video Dial Tone) : FCC가 ‘92년 7월 16일에 인가한 지역 전화회사에 의한 가정용 영상 전송서비스 및 CATV에 대항한 경쟁도입과 Infrastructure의 정비를 목표로 하여 결정한 내용은 다음과 같다. 지역 전화회사에 대하여 (1) 공중통신사업자에 대하여 서비스 제공자에 대한 영상신호의 전송을 인가(기본서비스), (2) Video Gateway 서비스, 비디오 기기 제공, 서비스 제공사업자에 대한 과금, 요금징수 대행을 인가(고도서비스), (3) 프로그램 제공자에 대하여 자본출자율을 5%로 높이는 외에 (종래는 1%) 업무 관계의 확대(합병회사 설립 및 consultant 계약 등)를 인가. (4) Rural 지역(영업지역의회의 지방)에 대한 직접 프로그램 제공의 특별인가(주민이 1만세데 미만의 지방 공공 단체만 가능, 영업지역내에서는 제한없음), (5) 지방공공 사업체에 의한 영업면허의 불요(지역 전화회사가 직접 사용자에 서비스를 제공하지 않기 때문에 CATV 서비스로는 보지 않기 때문). (6)의 회로의 권고(케이블 정책법으로 결정되어 있는 통신사업자와 CATV회사 자본의 상호보유 금지의 해제) 등이다.

  • PDF

A Seamless Adaptive Streaming Scheme for Interactive Multimedia Service in HTTP Adaptive Streaming (HTTP 적응적 스트리밍에서 끊김 없는 대화형 멀티미디어 스트리밍을 위한 전송 기법)

  • Kim, Heekwang;Chung, Kwangsue
    • Journal of KIISE
    • /
    • v.44 no.5
    • /
    • pp.545-552
    • /
    • 2017
  • Because of the explosive growth of mobile devices and development of network technologies, HTTP (Hypertext Transfer Protocol) adaptive streaming has become a new trend in video delivery to provide efficient multimedia streaming services. As interest in personalized broadcasting grows, the study of interactive multimedia has been actively pursued. The interactive multimedia service is a method of playing media according to a scenario selected by the user. Providing the interactive multimedia service with the existing HTTP adaptive streaming causes switching delay and buffer underflow according to the point in time when the user selects the scenario while the client streams the interactive multimedia and therefore decreases the user QoE (Quality of Experience). In this paper, we propose an adaptive streaming scheme for interactive multimedia service in HTTP adaptive streaming to provide seamless playback. We design the architecture and prefetching scheme for interactive multimedia streaming.

Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity (대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용)

  • Jung-Won Lee;Il Im
    • Journal of Intelligence and Information Systems
    • /
    • v.29 no.3
    • /
    • pp.267-286
    • /
    • 2023
  • The conversational agents such as AI speakers utilize voice conversation for human-computer interaction. Voice recognition errors often occur in conversational situations. Recognition errors in user utterance records can be categorized into two types. The first type is misrecognition errors, where the agent fails to recognize the user's speech entirely. The second type is misinterpretation errors, where the user's speech is recognized and services are provided, but the interpretation differs from the user's intention. Among these, misinterpretation errors require separate error detection as they are recorded as successful service interactions. In this study, various text separation methods were applied to detect misinterpretation. For each of these text separation methods, the similarity of consecutive speech pairs using word embedding and document embedding techniques, which convert words and documents into vectors. This approach goes beyond simple word-based similarity calculation to explore a new method for detecting misinterpretation errors. The research method involved utilizing real user utterance records to train and develop a detection model by applying patterns of misinterpretation error causes. The results revealed that the most significant analysis result was obtained through initial consonant extraction for detecting misinterpretation errors caused by the use of unregistered neologisms. Through comparison with other separation methods, different error types could be observed. This study has two main implications. First, for misinterpretation errors that are difficult to detect due to lack of recognition, the study proposed diverse text separation methods and found a novel method that improved performance remarkably. Second, if this is applied to conversational agents or voice recognition services requiring neologism detection, patterns of errors occurring from the voice recognition stage can be specified. The study proposed and verified that even if not categorized as errors, services can be provided according to user-desired results.

A Korean to English Dialogue Machine Translation System Using Speech Acts (문장의 화행을 반영한 한-영 대화체 기계번역)

  • Lee, Hyun-Jung;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.271-276
    • /
    • 1997
  • 대화체는 문어체와는 달리 화자와 청자 사이의 질의/응답으로 이루어진 형태의 문장들을 가지며, 생략과 대용어가 빈번히 발생하는 특징을 갖는다. 이러한 대화 형태에서 어떠한 한 문장에는 화자가 전달하고자 하는 의도를 포함하고 있다. 이러한 대화체 문장들을 번역하는 것은 단순한 언어적 분석에 의한 번역으로서는 많은 번역상의 오류가 발생하게 된다. 따라서 대화체 문장들의 올바른 번역을 위해서는 대화의 상황을 반영하는 문맥 정보가 부가적으로 요구된다. 본 연구에서는 이러한 문맥 정보로서 화행을 사용하여 대화체 기계번역을 수행하고자 한다. 화행(Speech Act)이란 화자에 의해 의도되어 발화 속에 포함된 언어적 행위를 나타내며, 이러한 화행을 분석함으로써 화자의 의도를 파악하고 이를 통해 올바른 번역을 수행할 수 있게 된다. 본 기계번역 시스템에 포함된 화행 분석 과정에서는 대화를 화행으로 모델링한 담화 문법과 유사한 형태의 재귀적 대화 전이망(Recursive Dialog Transition Network)을 사용하게 된다. 본 논문에서는 호텔 예약 영역에서의 기계번역 시스템에 대한 간단한 소개와 화행의 종류 및 분석 방법과 이를 통한 기계번역 방식에 대해 살펴보도록 하겠다.

  • PDF

Knowledge-Grounded Dialogue Generation Using Prompts Combined with Expertise and Dialog Policy Prediction (전문 지식 및 대화 정책 예측이 결합된 프롬프트를 활용한 지식 기반 대화 생성)

  • Eojin Joo;Chae-Gyun Lim;DoKyung Lee;JunYoung Youn;Joo-Won Sung;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.409-414
    • /
    • 2023
  • 최근 지식 기반 대화 생성에 많은 연구자가 초점을 맞추고 있다. 특히, 특정 도메인에서의 작업 지향형 대화 시스템을 구축하는 것은 다양한 도전 과제가 있으며, 이 중 하나는 거대 언어 모델이 입력과 관련된 지식을 활용하여 응답을 생성하는 데 있다. 하지만 현재 거대 언어 모델은 작업 지향형 대화에서 단순히 정보를 열거하는 방식으로 응답을 생성하는 경향이 있다. 이 논문에서는 전문 지식과 대화 정책 예측 모델을 결합한 프롬프트를 제시하고 작업 지향형 대화에서 사용자의 최근 입력에 대한 정보 제공 및 일상 대화를 지원하는 가능성을 탐구한다. 이러한 새로운 접근법은 모델 파인튜닝에 비해 비용 측면에서 효율적이며, 향후 대화 생성 분야에서 발전 가능성을 제시한다.

  • PDF

A mixed-initiative conversational agent using hierarchical Bayesian networks for ubiquitous home environments (유비쿼터스 가정환경을 위한 계층적 베이지안 네트워크 기반 상호주도형 대화 에이전트)

  • Song In-Jee;Hong Jin-Hyuk;Cho Sung-Bae
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.157-160
    • /
    • 2005
  • 유비쿼터스 환경에서 다양한 서비스를 사용자에게 제공하기 위해 지능형 에이전트는 먼저 사용자의 의도를 정확히 파악해야 한다. 명령어 기반의 기존 사용자 인터페이스와는 달리, 대화는 인간과 에이전트 사이의 유연하고 풍부한 의사소통에 유용하지만, 사용자의 배경지식이나 대화의 문맥에 따라 그 표현이 매우 다양하기 때문에 본 논문에서는 '상호주도형' 의사소통을 위한 계층적 베이지안 네트워크를 이용하여 사용자와 에이전트 사이에 발생하는 대화의 모호성을 해결한다. 서비스 추론 시 정보가 부족할 경우에는 계층적 베이지안 네트워크를 이용하여 추가로 필요한 정보를 분석하고 사용자로부터 수집한다. 제안하는 방법을 유비쿼터스 가정환경에 적용하고 시뮬레이션 환경을 구축하여 그 유용성을 확인하였다.

  • PDF

An Implementation of Interactive 3D Audio Broadcasting Terminal (대화형 3차원 오디오 방송단말 구현)

  • Park Gi Yoon;Lee Taejin;Kang Kyeongok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.211-214
    • /
    • 2004
  • 본 논문에서는 사용자의 입력에 따라 3차원 오디오 장면을 재구성하여 전달할 수 있는 대화형 오디오 방송단말의 구현 예를 제시한다. MPEG-4 AudioBIFS 규격에 따라 계층적으로 표현한 오디오 장면의 속성을 사용자의 입력에 따라 갱신하고, 주어진 속성을 참조하여 오디오 데이터를 3차원 공간상에 재합성하는 방식을 취한다 속성을 갱신하는 모듈은 MPEG-4 Audio 프로파일을 지원하게 하되 AudioBIFS 노드 유형에 따른 사용자 인터페이스를 미리 정의하여 단말 측에 저장해 두고 이용함으로써 대화형 방송 서비스를 구현했다. 3차원 오디오 데이터를 재생하는 기능은 사용자의 입력에 대한 피드백을 풍부하게 하여 대화형 방송의 효과를 극대화하고, 사실감을 제고하는 데 중요한 역할을 담당한다. 요소기술로 음상의 위치, 지향성, 모양, 잔향특성 등을 구현하기 위한 3차원 오디오 기술에 대해 소개한다. 또한 대화형 3차원 오디오 방송단말을 이용한 서비스의 예로 대화형 합주 및 합창 프로그램을 소개한다.

  • PDF

High efficiency & Low cost PCM Backlight Inverter for Large Area LCD TV (대화면 LCD TV를 위한 고효율 및 저가형 PCM 방식 백라이트 인버터)

  • Jang, Young-Su;Han, Sang-Kyoo;Roh, Chung-Wook;Hong, Sung-Soo;SaKong, Sug-Chin;Kim, Jong-Duck;Lee, Hyo-Bum
    • Proceedings of the KIPE Conference
    • /
    • 2007.07a
    • /
    • pp.378-380
    • /
    • 2007
  • 대화면 LCD TV (40인치 이상 LCD TV)에서 LCD 인버터의 가격 경쟁력을 위해 인버터 하나로 다수의 램프를 병렬 구동하면서 Two Stage System 구조인 Super IP Board 형태의 인버터 회로가 많이 사용되고 있다. 본 논문에서는 기존 Super IP Board의 인버터 구동 방식인 PWM 제어 방식을 분석하고, 문제점으로 제기되었던 Half-Bridge단 스위치의 하드 스위칭과 과도한 Circulating Energy 등의 문제를 해결한 새로운 Pulse Count Modulation (PCM) 방식을 적용한 인버터를 제안하고 이론적 및 실험적 검증을 통해 제안된 방식의 우수성을 확인하였다.

  • PDF

Development of Korean Dialogue Dataset for Restaurant Reservation System (식당 예약 대화 시스템 개발을 위한 한국어 데이터셋 구축)

  • Kim, GyeongMin;Lee, DongYub;Hur, YunA;Lim, HeuiSeok
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.267-269
    • /
    • 2017
  • 대화 시스템(dialogue system)은 사용자의 언어를 이해하고 그 의도를 분석하여 사용자가 원하는 목적을 달성할 수 있게 도와주는 시스템이다. 인간과 비슷한 수준의 대화를 위해서는 대량의 데이터가 필요하며 데이터의 양질에 따라 그 결과가 달라진다. 최근 페이스북에서 End-to-end learning 방식을 기반으로 한 영어로 구성된 식당 예약 학습 대화 데이터셋(The 6 dialog bAbI tasks)을 구축하여 해당 모델에 적용한 연구가 있다. 대화 시스템에서 활용 가능한 연구가 활발히 진행되고 있지만 영어 기반의 데이터와는 다르게 식당 예약 시스템에서 다른 연구자들의 연구 목적으로 공유한 한국어 데이터셋은 아직까지도 미흡하다. 본 논문에서는 페이스북에서 구축한 영어로 구성된 식당 예약 학습 대화 데이터셋을 이용하여 한국어 기반의 식당 예약 대화 시스템에서 활용 가능한 한국어 데이터셋을 구축하고, 일상생활에서 발생 가능한 발화(utterance)에 따른 형태 변화를 통해 한국어 식당 예약 시스템 데이터셋 구축 방법을 제안한다.

  • PDF