• 제목/요약/키워드: 대화 서비스

검색결과 505건 처리시간 0.026초

모바일 미디어 플레이어를 위한 대화형 멀티미디어 언어 (Interactive Multimedia Language for Mobile Media Player)

  • 김미하;류은석;정진환;유혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.19-22
    • /
    • 2003
  • 빨라진 프로세서와 충분한 메모리로 인하여 MPEG-1 MPEG-4 등의 동영상 표준을 기반으로 한 컨텐츠를 PDA 와 같은 모바일 단말기에서 단순히 플레이 시키는 일은 더 이상 문제가 되지 않는다. 이제는 사용자가 자신의 단말기에서 미디어를 감상하는 차원을 넘어서 사용자가 참여 할 수 있는 다양한 컨텐츠를 원한다. 이에 이 논문에서는 SMIL2.0 을 기반으로 하는 대화형 멀티미디어 언어를 연구하고, 여기에 벡터 그래픽스(Vector Graphics)를 추가 시켰다. 또한, 트랜스래이터(Translator)를 구현하여 markup language 를 바이너리 포맷(Binary format)으로 변환시킴으로써 좀 더 모바일 환경에 적합하도록 하였다. 본 논문에서 연구한 대화형 멀티 미디어 언어를 이용하여 대화형 미디어 컨텐츠를 제작하고 자체적으로 제작한 PDA 용 통합 미디어 플레이어에서 재생시킴으로써 대화형 멀티미디어 언어를 이용한 무선 환경에서 다양한 서비스의 가능성을 제시하여 준다.

  • PDF

기계학습을 이용한 한국어 대화시스템 도메인 분류 (Machine Learning Based Domain Classification for Korean Dialog System)

  • 정영섭
    • 융합정보논문지
    • /
    • 제9권8호
    • /
    • pp.1-8
    • /
    • 2019
  • 대화시스템은 인간과 컴퓨터의 상호작용에 새로운 패러다임이 되고 있다. 자연어로써 상호작용함으로써 인간은 보다 자연스럽고 편리하게 각종 서비스를 누릴 수 있게 되었다. 대화시스템의 구조는 일반적으로 음성 인식, 자연어 이해, 문맥 파악 등의 여러 모듈의 파이프라인으로 이뤄지는데, 본 연구에서는 자연어 이해 모듈의 도메인 분류 문제를 풀기 위해 convolutional neural network, random forest 등의 기계학습 모델을 비교하였다. 사람이 직접 태깅한 총 7개 서비스 도메인 데이터에 대하여 각 문장의 도메인을 분류하는 실험을 수행하였고 random forest 모델이 F1 score 0.97 이상으로 가장 높은 성능을 달성한 것을 보였다. 향후 다른 기계학습 모델들을 추가 실험함으로써 도메인 분류 성능 개선을 지속할 계획이다.

비휘발적 소셜 큐레이션 서비스가 가능한 대화형 상거래 플랫폼 개발 (Chatting-based Commerce Platform Enabling Non-Volatile Social Curation Service)

  • 유기동
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.145-157
    • /
    • 2018
  • 동일한 관심사를 갖는 개인 또는 그룹에서 생성 및 공유한 정보를 선별하여 제공하는 소셜큐레이션 서비스는, 최근 많이 사용되고 있는 SNS 기반 채팅 기능과 접목될 경우 시너지적 효과를 기대할 수 있다. 특히 이러한 기술이 제품 및 서비스를 판매하는 인터넷 쇼핑몰에 적용될 경우, 구매자는 채팅을 통해 보다 신뢰할 수 있는 정보를 실시간으로 제공받을 수 있으며, 판매자는 자사 제품 및 서비스에 관심을 갖는 고객에게 차별적이고 풍부한 정보를 지속적으로 제공할 수 있다. 본 연구는 소셜 큐레이션 서비스를 채팅 기반으로 제공하는 대화형 상거래 플랫폼을 제시한다. 제시된 상거래 플랫폼은 상점 및 상품별로 채팅 채널을 구성하여 상점 및 브랜드, 그리고 세부 상품에 대한 신규 및 기존 고객의 문의에 실시간으로 대응할 수 있고, 해당 채널에 가입된 고객에게 차별화된 판매전략을 지속적으로 구사할 수 있도록 구성되었다. 특히 MongoDB를 이용하여 채널별 수록된 정보와 채팅 내역이 반영구적으로 저장 및 보관되도록 하여, 구매자가 언제든 해당 채널에 수록된 제품 정보와 채팅 내역을 검색 및 참고할 수 있도록 구성하였다.

UML을 이용한 화상 대화 시스템의 설계 (A Design of Video Conversation System Using the UML)

  • 장재명;김윤호
    • 한국정보통신학회논문지
    • /
    • 제9권3호
    • /
    • pp.561-569
    • /
    • 2005
  • 현재 소프트웨어 개발의 주요한 패러다임인 객체지향 설계를 많은 시스템들이 채택하고 있으나, 화상 대화를 대상으로 한 연구들에서 본격적인 객체지향 설계의 적용은 그리 많지 않은 실정이다. 따라서 본 논문에서는 화상 대화 시스템에 대한 객체지향 설계를 위한 UML을 이용한 체계적인 아키텍처의 설계를 제시한다. 화상 대화 시스템에 대하여 체계적인 기능/비기능적 요구사항을 포착하고, '4+1 View Model'을 적용하여 객체지향 설계를 함으로써, 컴포넌트들은 재사용성을 담보하며, 이후 필요에 따라 컴포넌트들을 추가하여 시스템을 확장하는 것이 가능하다. 또한, 본 논문에서 설계한 화상 대화 애플리케이션의 컴포넌트들은 다른 여러 화상 대화 시스템에 활용 가능하며, 웹 환경에서의 서비스로도 확장될 것으로 기대된다.

음성을 이용한 감정 정보 추출 방법 (An acoustic study of feeling information extracting method)

  • 이연수;박용범
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.51-55
    • /
    • 2010
  • 최근 콜센터 등에서는 고객을 음성 미디어를 통하여 서비스하고 있다. 이런 콜 센터에서 제공하는 다양한 서비스의 품질 측정 방법 중 음성 대화 속 화자의 감정에 따른 측정 방법이 있다. 본 연구에서는 화자의 음성을 이용하여 그 사람의 감정을 알아내고자 하였다. 이를 위하여 음성 신호로부터 여러 가지 파라미터를 추출하고 분석함으로써 인간의 감정을 분류하였다. 사람의 감정은 크게 기쁨, 슬픔, 흥분, 보통 등 4가지 상태로 나눌 수 있다. 대부분의 음성 서비스 품질은 흥분 또는 분노의 상태가 중요하다. 본 논문에서는 이와 같은 감정을 Pitch와 Amplitude를 기초로 한 5가지 요소를 통하여 효율적으로 대화자간의 문제가 되는 대화를 선별해 내는 방법을 연구 하였다.

개방형 분산처리 환경에서의 다자간 대화형 응용서비스 및 다중 세션 관리 서비스 설계 (Design of Cooperative Interactive Application Service and Session Management Service in ODP Systemns)

  • 이종화
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1140-1150
    • /
    • 1998
  • 본 논문의 목적은 여러 다른 유형의 정보를 사용하고 다자간에 공동작업을 지원하는 응용의 요구사항을 분석하고, 이러한 특성을 갖는 응용이 필요로 하는 유용한 공통 서비스를 제공함으로 개발 환경을 지원하는 데 있다. 응용 계층의 수평 서비스로서 다자간 대화형 응용 서비스와 기반 구조 계층의 지원 서비스로서 다중 세션 관리 서비스가 정의되었으며, 개방형 분산 처리 시스템의 개념과 규칙에 따라 설계되었다. 따라서, 응용 개발자들은 이 두 서비스를 이용하여 본 논문에서 고려한 특성을 갖는 응용을 구축할 수 있을 것이다.

  • PDF

대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용 (Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity)

  • 이정원;임일
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.267-286
    • /
    • 2023
  • 인공지능 스피커로 대표되는 대화형 에이전트는 사람-컴퓨터 간 대화형이기 때문에 대화 상황에서 오류가 발생하는 경우가 잦다. 에이전트 사용자의 발화 기록에서 인식오류는 사용자의 발화를 제대로 인식하지 못하는 미인식오류 유형과 발화를 인식하여 서비스를 제공하였으나 사용자가 의도한 바와 다르게 인식된 오인식오류 유형으로 나뉜다. 이 중 오인식오류의 경우, 서비스가 제공된 것으로 기록되기 때문에 이에 대한 오류 탐지가 별도로 필요하다. 본 연구에서는 텍스트 마이닝 기법 중에서도 단어와 문서를 벡터로 바꿔주는 단어 임베딩과 문서 임베딩을 이용하여 단순 사용된 단어 기반의 유사도 산출이 아닌 단어의 분리 방식을 다양하게 적용함으로써 연속 발화 쌍의 유사도를 기반으로 새로운 오인식오류 및 신조어 탐지 방법을 탐구하였다. 연구 방법으로는 실제 사용자 발화 기록을 활용하여 오인식오류의 패턴을 모델 학습 및 생성 시 적용하여 탐지 모델을 구현하였다. 그 결과, 오인식오류의 가장 큰 원인인 등록되지 않은 신조어 사용을 탐지할 수 있는 패턴 방식으로 다양한 단어 분리 방식 중 초성 추출 방식이 가장 좋은 결과를 보임을 확인하였다. 본 연구는 크게 두 개의 함의를 가진다. 첫째, 인식오류로 기록되지 않아 탐지가 어려운 오인식오류에 대하여 다양한 방식 별 비교를 통해 최적의 방식을 찾았다. 둘째, 이를 실제 신조어 탐지 적용이 필요한 대화형 에이전트나 음성 인식 서비스에 적용한다면 음성 인식 단계에서부터 발생하는 오류의 패턴도 구체화할 수 있으며, 오류로 분류되지 않더라도 사용자가 원하는 결과에 맞는 서비스가 제공될 수 있음을 보였다.

울트라 와이드 뷰잉 서비스를 위한 공간 유사도 맵 생성 및 울트라 와이드 뷰잉 콘텐츠 저장 방법 (Generation of Spatial Adjacency Map and Contents File Format for Ultra Wide Viewing Service)

  • 이의상;강동진;김규헌
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.473-483
    • /
    • 2017
  • 최근 들어, 3D 서비스, UHD 비디오, 가상현실(Virtual Reality, VR) 등의 다양한 서비스에 대한 공급 및 수요가 증가하고, 이러한 시장의 동향에 따라, 고품질 및 대화면의 콘텐츠에 대한 수요도 함께 증가하고 있다. UWV 서비스는 기존 파노라마보다 넓은 시야각을 이용하여 사용자들에게 생동감 있는 경험을 제공하고 해당 이벤트에 대한 이해도를 증진하는 서비스이며, 본 논문에서는 UWV 서비스를 제공하기 위한 공간 유사도 맵 생성 방법 및 UWV 파일 저장 포맷 기술을 제안한다. 공간 유사도 맵은 영상의 유사도를 측정하고, 측정된 유사도를 기반으로 하여 영상의 위치 정보를 생성하고 기록한 것으로, 이를 이용하여 영상의 정합 시간을 단축해, 대화면 콘텐츠의 생성시간을 단축시킬 수 있다. UWV 파일 포맷은 ISOBMFF를 기반으로 한 공간 유사도 맵 및 대화면을 구성하는 각 콘텐츠를 함께 처리할 수 있는 파일 포맷이며, 랜덤 액세스를 지원한다. 본 논문에서는 공간 유사도 맵 및 UWV 파일 포맷 검증하기 위해 UWV 플레이어를 설계하였고, 실험을 통한 결과를 보였다.

전화망을 통한 자동음성번역 서비스 시스템 설계 (Design of an Automatic Speech translation system on the Telephone Line)

  • 이성주;이영직;양재우
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.57-60
    • /
    • 2002
  • 본 논문에서는 현재 ETRI에서 개발 중인 유/무선 전화망을 통한 다국어간 대화체 음성번역서비스 시스템에 대해서 소개한다. 전화망을 통한 자동음성번역서비스 시스템은 여행대화영역을 서비스 대상영역으로 하고 있고 자동음성번역서비스를 필요로 하는 사용자들은 동일한 장소에서 대면하고 있으며 서로 다른 언어를 사용하기 때문에 서로 의사 소통에 어려움을 겪고 있다고 가정한다. 따라서 여기서 말하는 자동음성번역 시스템의 특징은 인간과 기계간의 인터페이스를 그 대상으로 하는 것이 아니라 인간과 인간사이의 인터페이스를 그 대상으로 하고 있다는 정이다. 인간과 인간사이의 인터페이스 상황에서는 인간의 이해력이 시스템 오류를 정정할 수 있는 여지를 지니고 있다. 따라서 시스템이 사용자의 말하는 의도 혹은 개념만 잘 전달할 수 있다면 서로 다른 언어를 사용하는 사용자들 사이에서도 이러한 시스템을 통한 의사소통이 가능하다. 자동음성번역서비스 시스템은 크게 음성인식모듈 문장해석 및 번역 모듈, 음성합성모듈, 시스템통합 모듈 그리고 전화망 인터페이스 모듈로 나뉜다. 여기서는 자동음성번역 서비스 시스템의 각 모듈들의 주요 특징과 상호 인터페이스 방법에 대해서 소개한다.

  • PDF

MPEG-4 기반 대화형 방송 시스템 (Interactive Broadcasting System based on MPEG-4)

  • 안상우;조용주;신기선;최진수;김진웅
    • 방송공학회논문지
    • /
    • 제7권1호
    • /
    • pp.28-36
    • /
    • 2002
  • 본 논문에서는 디지털 TV 방송에서 대화형 방송 서비스를 제공하기 위한 MPEG-4 기반 대화형 방송 시스템을 제안한다. 제안한 시스템은 ATSC(Advanced Television Systems Committee) 플랫폼 기반 데이터 방송 시스템에 MPEG-4 데이터를 저작하는 기능. MPEG-4 데이터를 MPEG-2 TS(Transport Stream)로 캡슬화하는 기능, MPEG-4 데이터를 MPEG-2 프로그램과 동기화하는 기능. MPEG-4 데이터를 MPEG-2 TS에서 역다중화하는 기능, MPEG-4 데이터를 복호화/출력하는 기능 및 IP 망을 통한 대화형 기능을 지원할 수 있도록 설계하였다. MPEG-4 기반 대화형 방송 시스템은 사용자에게 강력한 대화형 기능을 제공할 수 있으며. 데이터 방송 국제 규격인 ATSC. DVB 플랫폼(platform)을 대체할 수 있는 장점이 있다.