• Title/Summary/Keyword: 대화 데이터

검색결과 587건 처리시간 0.025초

Attention 기반의 대화 발화 예측 모델 (Attention-based Next Utterance Classification in Dialogue System)

  • 황태선;이동엽;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-43
    • /
    • 2018
  • 대화 발화 예측(Next Utterance Classification)은 Multi-turn 대화에서 마지막에 올 발화를 정답 후보들 중에서 예측을 하는 연구이다. 기존에 제안된 LSTM 기반의 Dual Encoder를 이용한 모델에서는 대화와 정답 발화에 대한 관계를 고려하지 않는 문제와 대화의 길이가 너무 길어 중간 정보의 손실되는 문제가 존재한다. 본 연구에서는 이러한 두 문제를 해결하기 위하여 ESIM구조를 통한 단어 단위의 attention, 대화의 turn별 문장 단위의 attention을 제안한다. 실험 결과 총 5000개의 검증 대화 데이터에 대하여 1 in 100 Recall@1의 성능이 37.64%로 기존 모델 대비 약 2배 높은 성능 향상을 나타내었다.

  • PDF

대화체 자동번역 시스템에서 대화상대 맞춤 존대표현 생성에 관한 연구 (A Study on Generation of Polite Expressions for Dialogue Participants in Machine Translation System)

  • 최승권;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.399-402
    • /
    • 2011
  • 현재의 자동번역 방식의 문제점은 대화 상대에 상관없이 항상 일정한 존대 표현을 생성하여 자동번역 결과를 부자연스럽게 만들고 앞뒤 대화 문맥을 혼란하게 만든다는 것이다. 예를 들어 대화 상대가 달라지면 동일한 원문에 대해서도 자동번역 결과는 다른 존대 표현을 생성해야 하나, 현재의 자동번역 시스템은 항상 하나의 일관된 존대 표현을 생성한다. 이 이유는 자동 번역 시스템에서 사용하는 번역지식 또는 데이터가 고정되어 있어 유동적으로 변하지 않기 때문이다. 본 논문에서는 이러한 기존 자동번역의 문제점을 해결하기 위하여, 소셜 네트워크(social network)에서 제공하는 디지털 인맥 정보와 같은 비언어적 정보와 발화상의 표현과 같은 언어적 정보로부터 대화 자간의 존대 관계를 계산하여 자동번역 결과에 반영함으로써 언어 문화적 존대 차이를 자동으로 극복하는 대화 상대 맞춤형 존대표현 자동 번역 방법을 기술하는 데 그 목적이 있다.

외부 상황 정보를 활용하는 적응적 대화 모델의 구현 (Developing an Adaptive Dialogue System Using External Information)

  • 장진예;정민영;박한무;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.456-459
    • /
    • 2019
  • 대화 행위는 단순한 발화 문장들의 교환을 넘어 발화자들의 다양한 주변 정보를 고려한 종합적인 판단의 결과로 볼 수 있다. 본 논문은 여섯 가지 유형의 외부 상황 정보를 기반으로 적응적 발언을 생성하는 딥러닝 기반 대화 모델을 소개한다. 직접 구축한 상황 정보들이 태깅된 대화 데이터를 바탕으로, 외부 상황 정보를 사용자 발화와 더불어 활용하는 다양한 구조의 신경망 구조를 가지는 모델과 더불어 외부 상황 정보를 사용하지 않는 모델과의 성능에 대해 비교한다. 실험 결과들은 대화 모델의 발화 생성에 있어서 상황 정보 활용의 중요성을 보여준다.

  • PDF

대화 내 엔티티 언급 순서 고려한 대화형 추천 방법 (A New Method to Consider the Order of Mentioned Entities in Conversational Recommender Systems)

  • 유주원;김태호;이현영;임지희;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.464-465
    • /
    • 2023
  • 대화형 추천 시스템은 대화를 통해 사용자의 현재 선호도를 파악하고 상품을 추천해주는 시스템이다. 대화의 맥락은 변화하기 때문에 대화 중 최근 언급된 엔티티가 사용자의 현재 선호와 더 관련이 있다. 그러나, 기존 방법들은 언급된 엔티티들의 순서를 고려하지 않았기 때문에 사용자의 현재 선호도를 표현하는데 한계가 존재한다. 본 논문에서는, 대화 내 언급된 엔티티들의 순서를 고려하는 아키텍처를 제안하고, 실세계 데이터를 활용해 다음 상품을 예측하는데 엔티티 순서를 고려하는 것이 효과적인지 실험을 통해 보여준다.

대화형 AI 시스템에서 윤리적 UX 접근 방식의 개념 모델 (Conceptual Model of Ethical UX Approach in Conversational AI System)

  • 안성희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.572-573
    • /
    • 2022
  • 본 논문은 메타버스 환경에서 문제가 대두되고있는 AI 윤리(ethic)를 배경으로 인터랙션을 통해 사람들의 온라인과 오프라인의 결정요소에 직접적으로 영향을 미치는 대화형 AI가 어떻게 윤리적으로 진화될 수 있을지에 대한 공학적 솔루션을 UX 관점으로 찾아보는 기술 전략 연구라고 할 수 있다. 연구의 가설은 AI 의 머신러닝과정에 개별 사용자 그룹의 경험데이터가 반드시 포함되고 고려되어야 AI 는 오류값을 줄이고 윤리적으로 대응할 수 있다는 전제이다. 이를 위하여 본 논문은 기존의 머신러닝과 대화형 AI 의 UX 관점의 다이아로그 플로우 등을 연구 분석하고 사용자 데이터들을 실험하여 메타버스 서비스 환경에서의 기존에 논의되고 있는 컨택스트기반의 AI 머신러닝 과정에 사용자의 정성적 경험데이터를 추가한 윤리적 UX 접근 개념 모델을 제안 하였다. 아직은 개념모델 단계이고 시스템에서는 지금까지 다르지 않았던 비정량적인 감정과 융합적경험을 어떻게 문화적으로 코드화 하고 시스템적인 랭귀지와 연결시킬 수 있을지에 대한사용자 연구가 후속연구로 진행될 예정이다.

  • PDF

대화 데이터셋의 클래스 불균형 문제 보정을 위한 적대적 학습 기법 (Adversarial Training Method for Handling Class Imbalance Problems in Dialog Datasets)

  • 조수필;최용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.434-439
    • /
    • 2019
  • 딥러닝 기반 분류 모델에 있어 데이터의 클래스 불균형 문제는 소수 클래스의 분류 성능을 크게 저하시킨다. 본 논문에서는 앞서 언급한 클래스 불균형 문제를 보완하기 위한 방안으로 적대적 학습 기법을 제안한다. 적대적 학습 기법의 성능 향상 여부를 확인하기 위해 총 4종의 딥러닝 기반 분류 모델을 정의하였으며, 해당 모델 간 분류 성능을 비교하였다. 실험 결과, 대화 데이터셋을 이용한 모델 학습 시 적대적 학습 기법을 적용할 경우 다수 클래스의 분류 성능은 유지하면서 동시에 소수 클래스의 분류 성능을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

감성대화 말뭉치로 보는 청소년의 문제 도출 (Identifying issues facing youth through emotional dialogue corpus)

  • 김상민;이병천;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.331-332
    • /
    • 2022
  • 현대사회에서는 다양한 방법, 통로로 자신들의 의견을 표현하고 또한 감정들을 표출한다. 이렇게 표출된 다양한 문장 및 감정들을 통해 각 연령별로 어떤 문제를 가지고 있는지, 무슨 상황에 놓여있는지 등을 알 수 있다. 본 논문에서는 이렇게 모여진 감성대화 말뭉치를 이용해 청소년들이 문장에서 추출한 단어들과 감정, 상황과 어떠한 연관성을 보이는지 확인해보고자 연구를 진행하였다. 청소년들이 남성의 경우 학교폭력 및 따돌림과 관련한 문제, 여성의 경우 가족관계와 관련한 문제와 연관성이 크다는 것을 확인하였다.

  • PDF

지상파 DMB 대화형 서비스를 위한 MPEG-4 바이너리 컨버터 설계 몇 구현 (Design and Implementation of MPEG-4 binary Converter for Interactive T-DMB Service)

  • 이인재;김기완;유원혁;김중규;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.89-92
    • /
    • 2004
  • 방송과 통신의 융합, 방송서비스의 다양화와 더불어 방송의 디지털화는 기존의 아날로그 방식에 비해 고화질 및 고음질의 방송 서비스 제공 및 타 매체와의 호환성 그리고 다양한 부가 서비스의 제공 등에 있어서 많은 이전을 제공할 수 있다. 또한, 디지털방송 방식은 기존 아날로그 방식의 이동수신 문제점을 해결하고자 디지털 오디오 방송(DAB: Digital Audio Broadcasting)에 멀티미디어 서비스를 .제공하는 디지털 멀티미디어 방송(DMB: Digital Multimedia Broadcasting)을 제안하였다. 지상파 DMB 방송은 유럽의 Eureka-147 방식의 DAB를 기반으로 하며 디지털 라디오방송과 함께 오디오 외에도 다양한 멀티미디어를 전송하고, 콘텐츠에 대화형 기능을 포함하는 서비스 형태를 목표로 하고 있다. 현재 지상파 DMB 서비스에서는 기본적인 AV 서비스를 위해 비디오는 AVC, 오디오는 BSAC에 대해 규정하고 있다. 또한 AV 규격 외에 대화형 서비스를 제공하기 위한 보조 데이터로서 장면기술 데이터와 그래픽 데이터를 지원하고 있다. 따라서 본 논문에서는 지상파 DMB를 이용한 대화형 서비스를 제공하기 위해 요구되는 초기 객체 정보, 객체 정보, 장면 구성 정보를 바이너리 형태로 생성해 주는 MPEG-4 바이너리 컨버터를 설계하고 구현하였다.

  • PDF

영화 클라이맥스 패턴의 데이터시각화를 통해 분석한 장면 배열 (Scene Arrangement Analyzed through Data Visualization of Climax Patterns of Films)

  • 임양미;엄주언
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권8호
    • /
    • pp.1621-1626
    • /
    • 2017
  • 본 연구에서는 국내에서 성공한 영화들의 쇼트 분석을 통해 흥행한 영화의 클라이맥스부분에서 공통된 편집 패턴 분석을 찾아 씬(작은 이야기 단위)의 구성이 잘 기획되어 있는지 데이터 시각화 연구를 한다. 이 연구는 편집패턴들의 모형을 참조하여 영화 전체에 클라이맥스 표현 패턴이 몇 개로 구성되어 있는지 분석하는 것으로 쇼트이미지들의 자동 수집과 수집된 데이터들의 샷사이즈 자동 분류 시스템을 설계하고 이 시스템을 통해 클라이맥스 패턴 중심으로 하나의 씬을 이루고 있음을 증명한다. 작은 이야기인 씬의 구성이 클라이맥스 패턴으로만 판단하기 어려워 배우들의 대화를 통해 씬을 찾아 비교분석을 하였다. 배우들 간의 대화 기반 씬 예측을 위한 character-net은 등장인물들 간의 대화 내용을 추적하여 인물들 간의 대화 형성을 네트워크 망 모양으로 시각화할 수 있다. 망 모양의 시각화를 통해 큰 이야기와 작은 이야기의 구성을 분석할 수 있으며, 씬 수에 따른 밀집도로 영화의 흥행 여부를 예측할 수 있다. 이 두 가지 연구를 비교하여 영화의 기획 구성 및 제작 방법에 기여를 할 것이라 판단한다.

CERES: 백본망 로그 기반 대화형 웹 분석 시스템 (CERES: A Log-based, Interactive Web Analytics System for Backbone Networks)

  • 서일현;정연돈
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권10호
    • /
    • pp.651-657
    • /
    • 2015
  • 웹 응용 프로그램의 급격한 증가와 함께 웹 트래픽이 증가하고 있다. 웹에 대한 요청과 그 응답에 대한 기록인 웹 로그 또한 폭발적으로 증가하고 있다. 웹 로그로부터 가치 있는 정보를 취득하기 위해서는 매우 큰 용량의 데이터를 효과적이고 다양한 방법으로 다룰 수 있는 시스템이 필요하다. 본 논문에서는 백본망 로그 기반 대화형 웹 분석 시스템인 CERES를 소개한다. 기존의 웹 분석 시스템들과 달리, CERES는 하나의 웹 서버에 대한 분석이 아닌 백본망에서 생성되는 모든 웹 로그의 분석을 목적으로 한다. CERES는 하둡 분산 파일 시스템 (HDFS)을 저장소로 하는 서버 클러스터에 배포되며, 대용량의 로그에 기반한 분석을 분산 처리를 통해 지원한다. CERES는 백본망에서 생성된 웹 로그 데이터를 관계형 데이터로 변환하고, 사용자는 변환된 관계형 데이터에 대해 SQL을 이용하여 질의를 요청할 수 있다. 내부적으로 CERES는 웹 로그의 통계적 분석에 대한 질의를 효과적으로 처리하기 위해 데이터 큐브를 활용한다. 또한, CERES는 다양한 통계적 분석을 지원하기 위해 대화형 SQL 질의 인터페이스를 포함한 세 가지 형태의 웹 인터페이스를 제공하며 사용자는 이를 통해 쉽게 질의를 요청할 수 있고 그 결과를 시각적으로 확인할 수 있다.