• 제목/요약/키워드: 모델 발화

검색결과 204건 처리시간 0.023초

신경망을 이용한 영역 행위 예측 (Prediction of Domain Action Using a Neural Network)

  • 이현정;서정연;김학수
    • 인지과학
    • /
    • 제18권2호
    • /
    • pp.179-191
    • /
    • 2007
  • 목적 지향 대화에서 사용자의 의도는 화행과 개념열의 쌍으로 구성된 영역행위로 표현될 수 있다. 사용자 발화에 대한 영역행위 예측은 음성 인식 오류를 보정하는데 유용하며, 시스템 발화에 대한 영역행위 예측은 유연한 응답 생성에 유용하다. 본 논문에서는 신경망을 이용하여 영역행위를 예측하는 모델을 제안한다. 제안 모델은 대화 이력 벡터와 현재 영역행위를 신경망의 입력으로 사용하여 다음 영역행위를 예측한다. 실험 결과, 제안 모델은 화행 예측과 개념열 예측에서 각각 80.02%, 82.09%의 정확률을 보였다.

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

단일 레이블 분류를 이용한 종단 간 화자 분할 시스템 성능 향상에 관한 연구 (A study on end-to-end speaker diarization system using single-label classification)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.536-543
    • /
    • 2023
  • 다수의 화자가 존재하는 음성에서 "누가 언제 발화했는가?"에 대해 레이블링하는 화자 분할은 발화 중첩 구간에 대한 레이블링과 화자 분할 모델의 최적화를 위해 심층 신경망 기반의 종단 간 방법에 대해 연구되었다. 대부분 심층 신경망 기반의 종단 간 화자 분할 시스템은 음성의 각 프레임에서 발화한 모든 화자의 레이블들을 추정하는 다중 레이블 분류 문제로 분할을 수행한다. 다중 레이블 기반의 화자 분할 시스템은 임계값을 어떤 값으로 설정하는지에 따라 모델의 성능이 많이 달라진다. 본 논문에서는 임계값 없이 화자 분할을 수행할 수 있도록 단일 레이블 분류를 이용한 화자 분할 시스템에 대해 연구하였다. 제안하는 화자 분할 시스템은 기존의 화자 레이블을 단일 레이블 형태로 변환하여 모델의 출력으로부터 레이블을 바로 추정한다. 훈련에서는 화자 레이블 순열을 고려하기 위해 Permutation Invariant Training(PIT) 손실함수와 교차 엔트로피 손실함수를 조합하여 사용하였다. 또한 심층 구조를 갖는 모델의 효과적인 학습을 위해 화자 분할 모델에 잔차 연결 구조를 추가하였다. 실험은 Librispeech 데이터베이스를 이용해 화자 2명에 대한 시뮬레이션 잡음 데이터를 생성하여 사용하였다. Diarization Error Rate(DER) 성능 평가 지수를 이용해 제안한 방법과 베이스라인 모델을 비교 평가했을 때, 제안한 방법이 임계값 없이 분할이 가능하며, 약 20.7 %만큼 향상된 성능을 보였다.

생성적 적대적 신경망을 이용한 생성기반 멀티턴 챗봇 (Generative Multi-Turn Chatbot Using Generative Adversarial Network)

  • 김진태;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-30
    • /
    • 2018
  • 기존의 검색 기반 챗봇 시스템과 다르게 생성 기반 챗봇 시스템은 사전에 정의된 응답에 의존하지 않고 채팅 말뭉치를 학습한 신경망 모델을 사용하여 응답을 생성한다. 생성 기반 챗봇 시스템이 사람과 같이 자연스러운 응답을 생성하려면 이전 문맥을 반영해야 할 필요가 있다. 기존 연구에서는 문맥을 반영하기 위해 이전 문맥과 입력 발화를 통합하여 하나의 벡터로 표현했다. 이러한 경우 이전 문맥과 입력 발화가 분리되어 있지 않아 이전 문맥이 필요하지 않는 경우 잡음으로 작용할 수 있다. 본 논문은 이러한 문제를 해결하기 위해 입력 발화와 이전 문맥을 각각의 벡터로 표현하는 방법을 제안한다. 또한 생성적 적대적 신경망을 통해 챗봇 시스템을 보강하는 방법을 제안한다. 채팅 말뭉치(55,000 개의 학습 데이터, 5,000개의 검증 데이터, 5,260 개의 평가 데이터)를 사용한 실험에서 제안한 문맥 반영 방법과 생성적 적대적 신경망을 통한 챗봇 시스템 보강 방법은 BLEU와 임베딩 기반 평가의 성능 향상에 도움을 주었다.

  • PDF

다중모드 대화 시스템에서 이중 캐시 모델의 센터링 알고리즘을 이용한 명사 대용어구 처리 (Resolution of Anaphoric Noun Phrases using a Centering Algorithm with a Dual Cache Model in a Multimodal Dialogue System)

  • 김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권11호
    • /
    • pp.1133-1140
    • /
    • 2000
  • 다중모드 대화에서 나타나는 대용어는 언어만을 사용하는 대화에서 나타나는 것과 비교하여 매우 다른 형태와 특징을 가진다. 그것은 행위나 시각이 대용 행위로 사용될 수 있기 때문이다. 본 논문에서는 터치스크린 인터페이스를 이용한 홈쇼핑 가구점 영역의 다중모드 대화 시스템에서 나타나는 다양한 대용어의 처리 방법을 알아본다. 먼저, 화면 대용어와 참조 대용어를 정의하여 다양한 형태의 대용어를 분류한다. 그리고 각 대용어를 처리할 수 있는 두 가지의 일반적인 방법을 제안한다. 하나는 지시 행위를 수반하거나 생략한 채 발화되어 현재 화면에 나타나 있는 아이템을 참조하는 대용어를 처리하는 단순한 매핑 알고리즘이다. 다른 하나는 다중 모드 대화 시스템을 위해 워커(Walker)의 센터링 알고리즘을 확장한 이중 캐시 구조의 센터링 알고리즘이다. 확장된 센터링 알고리즘은 발화와시각 정보 그리고 화면 전환 시간을 유지할 수 있기 때문에 다중모드 대화에서 발생하는 다양한 대용어를 처리하기에 적합하다. 실험에서 제안된 시스템은 40개의 대화에서 나타난 402개의 대용어(발화당 0.54)중에서 387개를 처리하여 96.3%의 정확도를 보였다.

  • PDF

샐룰라 오토마타 기법을 이용한 신경망의 자동설계에 관한 연구 (A Study on Automatic Design of Artificial Meural Networks using Cellular Automata Techniques)

  • 이동욱;심귀보
    • 전자공학회논문지S
    • /
    • 제35S권11호
    • /
    • pp.88-95
    • /
    • 1998
  • 본 논문은 인공생명 기법을 이용하여 생물의 정보처리 시스템을 구현하고자 하는 것이다. 자연계의 생물은 그 자체로 훌륭한 정보처리 시스템이다. 생물체는 하나의 생식 세포로부터 발생된다. 또한 이 개체의 종은 진화의 과정을 통해 환경에 적응한다. 본 논문에서는 이와 같은 생물학적인 발생과 진화의 개념을 이용하여 신경망을 설계하는 방법을 제안한다. 생물체의 개체발생은 발생모델의 하나인 셀룰라 오토마다(CA)를 통하여 구현하였고 진화과정은 진화 알고리즘(EAs)을 사용하였다. 우리는 이와 같이 구현한 '진화하는 셀룰라 오토마타 신경망'을 줄여서 ECANS1이라 명명하였다. 셀 사이의 연결은 CA 법칙에 의하여 결정되며, 셀의 초기 패턴이 진화함으로써 유용한 신경망을 찾아낸다. 신경망의 각 셀 즉 뉴런은 생물의 발화 ${\cdot}$ 비발화의 특성을 갖는 카오스 뉴런 모델을 사용하였다. 그리고 신경마의 최종 출력값은 뉴런의 발화 빈도로서 나타내었다. 제안한 방법은 Exclusive-OR 문제 및 패리티 문제에 적용함으로써 그 유효성을 검증하였다.

  • PDF

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

학생들의 미분방정식 개념에 대한 수학적 은유의 분석: 개념적 모델의 이중성에 대한 사회문화적 관점 (Students' Conceptual Metaphor of Differential Equations: A Sociocultural Perspective on the Duality of the Students' Conceptual Model)

  • 주미경;권오남
    • 대한수학교육학회지:학교수학
    • /
    • 제5권1호
    • /
    • pp.135-149
    • /
    • 2003
  • 대학 미분방정식 수업 개발의 일환으로서 본 연구는 학생들의 미분방정식에 관한 개념적 모델을 탐구하는 것에 초점을 두고 진행되었다. 본 연구가 이루어진 미분방정식 수업은 해석적, 질적, 그래프적, 수치적 방법 등의 다양한 수학적 방법의 적용에 기초하여 학생들이 능동적인 수학적 토의를 통해 미분방정식 주요 개념의 재발명해 가는 것을 강조하였다. 이러한 수업 맥락에서 본 연구는 학생들의 수학적 토의 과정에 나타나는 개념적 은유의 사용패턴을 탐구하였다. 본 논문에서는 발화 분석을 통해 추출된 미분방정식에 관한 학생들의 개념적 모델을 구성하는 주요한 개념적 은유인 '기계은유'와 '가상적 운동 은유'와 이들 각 개념적 은유의 수학적 특성을 제시한다. 끝으로, 본 연구의 수학적 발화 분석 결과에 기초하여 학생들의 개념적 모델의 이중성의 의미를 사회문화적 시각에서 해석하고 학교 수학에 주는 시사점에 대해 논의한다.

  • PDF

CPD 모델을 이용한 국내수입탄 성상에 따른 탈휘발 특성에 관한 실험 및 해석적 연구 (An Experimental and Numerical Study on the Characteristics of Devolatilization Process for Coals Utilized in Korea Using CPD Model)

  • 김량균;이병화;전충환;송주헌;장영준
    • 대한기계학회논문집B
    • /
    • 제33권8호
    • /
    • pp.613-621
    • /
    • 2009
  • Coal is the energy resource which is important with the new remarking energy resource. Coal combustion produces more NOx per unit of energy than any other major combustion technology. Pollutant emission associated with coal combustion will have a huge impact on the environment. Coal conversion has three processes which are drying, coal devolatilization and char oxidation. Coal devolatilization process is important because it has been shown that HCN which is converted from volatile N contributes 60 to 80% of the total NOx produced. This paper addresses mass release behavior of char, tar, gas and HCN in an experiment of Laminar Flow Reactor with two coals such as Roto middle coal (Sub-bituminous) and Anglo coal (Bituminous). The experiment is compared with the data predicted by CPD model for mass release of HCN about Roto south, Indominco, Weris creek and China orch coals. The results show that HCN increases as a function of decreasing the ratio of fixed carbon(FC)/ volatile matter(VM of the coals contain.)