• 제목/요약/키워드: 모델 발화

검색결과 205건 처리시간 0.027초

자유대화의 음향적 특징 및 언어적 특징 기반의 성인과 노인 분류 성능 비교 (Comparison of Classification Performance Between Adult and Elderly Using Acoustic and Linguistic Features from Spontaneous Speech)

  • 한승훈;강병옥;동성희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.365-370
    • /
    • 2023
  • 사람은 노화과정에 따라 발화의 호흡, 조음, 높낮이, 주파수, 언어 표현 능력 등이 변화한다. 본 논문에서는 이러한 변화로부터 발생하는 음향적, 언어적 특징을 기반으로 발화 데이터를 성인과 노인 두 그룹으로 분류하는 성능을 비교하고자 한다. 음향적 특징으로는 발화 음성의 주파수 (frequency), 진폭(amplitude), 스펙트럼(spectrum)과 관련된 특징을 사용하였으며, 언어적 특징으로는 자연어처리 분야에서 우수한 성능을 보이고 있는 한국어 대용량 코퍼스 사전학습 모델인 KoBERT를 통해 발화 전사문의 맥락 정보를 담은 은닉상태 벡터 표현을 추출하여 사용하였다. 본 논문에서는 음향적 특징과 언어적 특징을 기반으로 학습된 각 모델의 분류 성능을 확인하였다. 또한, 다운샘플링을 통해 클래스 불균형 문제를 해소한 뒤 성인과 노인 두 클래스에 대한 각 모델의 F1 점수를 확인하였다. 실험 결과로, 음향적 특징을 사용하였을 때보다 언어적 특징을 사용하였을 때 성인과 노인 분류에서 더 높은 성능을 보이는 것으로 나타났으며, 클래스 비율이 동일하더라도 노인에 대한 분류 성능보다 성인에 대한 분류 성능이 높음을 확인하였다.

시각 피질의 발화 특성 추출을 위한 포아송 모델의 부공간 해석 (Subspace analysis of Poisson Model to extract Firing Characteristics in Visual Cortex)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2022
  • 인간의 시각 피질을 구성하고 있는 시각 뉴런은 모든 시각적 자극에 반응하는 것이 아니라 특정한 조건을 갖춘 시각적 자극에 반응한다는 것이 생리학적 실험을 통하여 밝혀졌다. 본 연구에서는 이와 같은 생리학적 실험을 해석하기 위하여 랜덤한 이득을 갖는 선형 필터를 포함하는 뉴런의 발화 특성을 시뮬레이션하고 설명할 수 있는 모델을 제안하였고 또한 제안한 모델의 선형 필터의 출력이 전체 자극 데이터의 부공간을 형성하고 있음을 실험을 통하여 증명하였다. 구현된 모델의 타당성을 검증하기 위하여 서로 다른 4개의 시각적 자극 데이터들로부터 임의로 추출한 2개의 화소에 대한 값의 분포를 관찰하였다. 전체 자극 데이터와 스파이크 발화 자극 데이터의 분포로부터 중심 좌표 값 즉, 가장 많은 값이 분포하는 좌표 값을 추출하여 두 분포 사이의 차이를 확인할 수 있었고 구현된 모델이 전형적인 LNP 모델과 동일하게 전체 자극 데이터가 전체 집합일 경우 스파이크를 발생시키는 자극 데이터가 전체 자극 데이터의 부공간 임을 실험을 통하여 증명하였다. 본 연구는 시각적 자극에 대한 스파이크의 발생기전과 관련된 기초 연구로 활용할 수 있다.

문장 따라말하기에서 말속도, 발화길이 및 통사적 복잡성에 따른 말더듬 아동과 일반아동의 비유창성 비교 (The influences of speech rate, utterance length and sentence complexity of disfluency in preschool children who stutter and children who do not stutter)

  • 김예슬;심현섭
    • 말소리와 음성과학
    • /
    • 제13권1호
    • /
    • pp.53-64
    • /
    • 2021
  • 요구용량 모델에 의하면 말더듬 아동의 비유창성은 외적, 내적 환경에 영향을 받아 나타나는 것으로 알려져 있다. 본 연구의 목적은 외적 환경 중 언어적인 환경(말속도, 발화길이 및 통사적 복잡성)의 변화에 따른 말더듬 아동과 일반아동의 비유창성 차이를 비교 분석하려고 한다. 연구대상은 4-6세 말더듬 아동 9명, 일반아동 9명이었다. 연구 과제로 문장 따라말하기 과제를 실시하여 말더듬 아동과 일반 아동의 비유창성 빈도를 구하였다. 두 그룹의 비유창성 차이를 분석한 결과, 발화길이를 조절했을 때 평균 말속도에서 말더듬 아동은 발화길이와 상관없이 일반 아동보다 비유창성이 더 많이 나타났다. 말속도를 조절 때 말더듬 아동은 빠른 말속도에서 일반아동보다 많은 비유창성을 보였다. 그리고 말속도와 발화길이를 조절했을 시 빠른 말속도에서 말더듬 아동은 발화길이와 상관없이 일반아동보다 높은 비유창성을 보였다. 통사적 복잡성을 조절했을 때는 복문에서 말더듬 아동이 일반아동보다 더 많은 비유창성을 보였다. 말더듬 아동은 말속도, 발화길이 그리고 통사적 복잡성에 따라 비유창성에 영향을 받는 것으로 나타났다. 이는 말더듬 아동은 말운동 조절 그리고 언어처리 능력이 일반아동보다 취약한 것으로 보인다. 따라서 임상에서 말더듬 아동 치료 시 치료사와 부모가 말속도와 발화길이를 아동의 수준에 맞춰 진행하는 것이 중요한 것으로 확인되었다.

산(Acid)류의 자연발화온도와 방화지연시간의 관계 (Relationship between Autoigniton Temperature(AIT) and Ignition Delay Time for Acids)

  • 하동명
    • 한국화재소방학회논문지
    • /
    • 제18권2호
    • /
    • pp.27-33
    • /
    • 2004
  • 화학물질의 최소자연발화온도의 정확한 지식은 산업화재를 예방하고 제어하는데 중요하다. 최소자연발화온도(AIT)는 화염이나, 스파크 없이 주위로부터 충분한 에너지를 받아서 스스로 점화할 수 있는 최저온도를 말한다. AIT는 실험 개시온도, 압력, 농도, 용기의 크기, 양론혼합비, 촉매, 증기의 농도, 발화지연시간 등 많은 인자에 영향을 받는다. 본 연구에서는 1994년에 제작된 ASTM E659-78 장치를 이용하여 산류(Acids) 발화지연시간과 AIT관계를 측정하였고, 실험에서 얻은 자료는 본 연구에서 제시한 예측 모델과 적은 오차 범위에서 일치하였다.

멀티턴 대화를 활용한 레퍼런스 기반의 발화 생성 모델 (Reference-based Utterance Generation Model using Multi-turn Dialogue)

  • 박상민;손유리;금빛나;김홍진;김학수;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-91
    • /
    • 2022
  • 디지털 휴먼, 민원 상담, ARS 등 칫챗의 활용과 수요가 증가함에 따라 칫챗의 성능 향상을 위한 다양한 연구가 진행되고 있다. 특히, 오토 인코더(Auto-encoder) 기반의 생성 모델(Generative Model)은 높은 성능을 보이며 지속적인 연구가 이루어지고 있으나, 이전 대화들에 대한 충분한 문맥 정보의 반영이 어렵고 문법적으로 부적절한 답변을 생성하는 문제가 있다. 이를 개선하기 위해 검색 기반의 생성 모델과 관련된 연구가 진행되고 있으나, 현재 시점의 문장이 유사해도 이전 문장들에 따라 의도와 답변이 달라지는 멀티턴 대화 특징을 반영하여 대화를 검색하는 연구가 부족하다. 본 논문에서는 이와 같은 멀티턴 대화의 특징이 고려된 검색 방법을 제안하고 검색된 레퍼런스(준정답 문장)를 멀티턴 대화와 함께 생성 모델의 입력으로 활용하여 학습시키는 방안을 제안한다. 제안 방안으로 학습된 발화 생성 모델은 기존 모델과 비교 평가를 수행하며 Rouge-1 스코어에서 13.11점, Rouge-2 스코어에서 10.09점 Rouge-L 스코어에서 13.2점 향상된 성능을 보였고 이를 통해 제안 방안의 우수성을 입증하였다.

  • PDF

계층적 어탠션 구조와 트랜스포머를 활용한 알츠하이머 진단과 생성 기반 챗봇 (Alzheimer's Diagnosis and Generation-Based Chatbot Using Hierarchical Attention and Transformer)

  • 박준영;최창환;신수종;이정재;최상일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.333-335
    • /
    • 2022
  • 본 논문에서는 기존에 두 가지 모델이 필요했던 작업을 하나의 모델로 처리할 수 있는 자연어 처리 아키텍처를 제안한다. 단일 모델로 알츠하이머 환자의 언어패턴과 대화맥락을 분석하고 두 가지 결과인 환자분류와 챗봇의 대답을 도출한다. 일상생활에서 챗봇으로 환자의 언어특징을 파악한다면 의사는 조기진단을 위해 더 정밀한 진단과 치료를 계획할 수 있다. 제안된 모델은 전문가가 필요했던 질문지법을 대체하는 챗봇 개발에 활용된다. 모델이 수행하는 자연어 처리 작업은 두 가지이다. 첫 번째는 환자가 병을 가졌는지 여부를 확률로 표시하는 '자연어 분류'이고 두 번째는 환자의 대답에 대한 챗봇의 다음 '대답을 생성'하는 것이다. 전반부에서는 셀프어탠션 신경망을 통해 환자 발화 특징인 맥락벡터(context vector)를 추출한다. 이 맥락벡터와 챗봇(전문가, 진행자)의 질문을 함께 인코더에 입력해 질문자와 환자 사이 상호작용 특징을 담은 행렬을 얻는다. 벡터화된 행렬은 환자분류를 위한 확률값이 된다. 행렬을 챗봇(진행자)의 다음 대답과 함께 디코더에 입력해 다음 발화를 생성한다. 이 구조를 DementiaBank의 쿠키도둑묘사 말뭉치로 학습한 결과 인코더와 디코더의 손실함수 값이 유의미하게 줄어들며 수렴하는 양상을 확인할 수 있었다. 이는 알츠하이머병 환자의 발화 언어패턴을 포착하는 것이 향후 해당 병의 조기진단과 종단연구에 기여할 수 있음을 보여준다.

  • PDF

작업수행영역에서 계획에 기반한 대화 시스템의 설계 (The design of Plan based dialogue system in Task execution domain)

  • 오종건;서정연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.450-452
    • /
    • 2000
  • 대화 시스템이란 자연어를 이용하여 인간과 정보를 교환하거나 업무를 수행하는 프로그램이다. 자연언어는 인간이 사용할 수 있는 쉽고 효율적인 인터페이스이기 때문에 이를 이용한 대화 시스템의 필요성이 증대되고 있다. 본 논문에서는 지금까지 주로 인식에 초점이 맞추어져 연구되어 왔던 계획 기반 대화 모델을 이용하여 발화하여 생성하는 시스템을 설계하고자 한다. 본 논문에서 설계하고자 하는 대화 시스템은 사용자의 질의에 응답할 뿐 아니라 자신의 행위를 능동적으로 수행할 수 있는 협조적 대화 시스템이다. 또한 대화의 효율성을 고려하여 사용자가 필요로 하는 정보를 능동적으로 제공하는 시스템이다. 대화의 효율성을 고려한 발화를 위해 본 논문에서는 새로운 시스템의 행위를 정의하여 실제 가능한 대화 예를 보이고자 한다.

  • PDF

셀룰라 오토마타 신경망의 특성 (A Characteristics of Cellulra Automata Neural Systems)

  • 이동욱;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.267-273
    • /
    • 1998
  • 셀룰라 오토마타 신경망은 저자에 의하여 개발된 신경망으로써 주변의 셀과 국소적인 연결을 가지며 셀룰라 오토마타의 발생규칙에 따라 생성되는 신경망이다. 셀룰라 오토마타 신경망을 간단히 줄여서 ECANS라고 한다. 본 신경망은 카오스 뉴런 모델을 사용하며 뉴런사이의 연결강도는 흥분성 또는 억제성 결합을 갖는다. 신호의 전달방식은 펄스의 형태로서 뉴런이 발화하면 '1' 발화하지 않으면 '0'이 된다. 본 논문에서는 셀룰라 오토마타를 구성하는 요소별 특징을 살펴보고 주어진 문제에 적합한 셀룰라 오토마타 신경망을 얻어내기 위한 진화방법으로서 DNA 코딩방법을 제안한다. 제안한 방법의 유효성을 시뮬레이션을 통하여 검증한다.

  • PDF

심층신경망을 이용한 짧은 발화 음성인식에서 극점 필터링 기반의 특징 정규화 적용 (Applying feature normalization based on pole filtering to short-utterance speech recognition using deep neural network)

  • 한재민;김민식;김형순
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.64-68
    • /
    • 2020
  • 가우스 혼합 모델-은닉 마코프 모델(Gaussian Mixture Model-Hidden Markov Model, GMM-HMM)을 이용하는 전통적인 음성인식 시스템에서는, 극점 필터링 기반의 켑스트럼 특징 정규화 방식이 잡음 환경에서 짧은 발화의 인식 성능을 향상시키는데 효과적이었다. 본 논문에서는 심층신경망(Deep Neural Network, DNN)을 이용하는 최신의 음성인식 시스템에서도 이 방식의 유용성이 있는지 검토한다. AURORA 2 DB에 대한 실험 결과, 특히 훈련 및 테스트 환경 사이의 불일치가 클 때에, 극점 필터링 기반의 켑스트럼 평균 분산 정규화 방식이 극점 필터링을 사용하지 않는 방식에 비해 매우 짧은 발화의 인식 성능을 개선시킴을 보여 준다.

제한된 영역의 대화에서 체언구 형태의 발화 이해를 위한 계획기반 생략 처리 (Plan-based Ellipsis Resolution for Utterances in Noun-Phrase-Form in Restricted Domain Dialogues)

  • 윤철진;서정연
    • 인지과학
    • /
    • 제11권1호
    • /
    • pp.81-92
    • /
    • 2000
  • 인간의 자연스러운 대화에서는 생략 현상이 빈번하게 일어난다. 생략 어구로부터 화자의 의도를 파악하는 것은 쉽지가 않다. 생략 어구 자체만 가지고는 그것의 의미와 화자의 의도를 파악하기 힘들며 이전 발화들로부터 구성된, 혹은 영역에 내재된 맥락과의 연관성을 살펴보아야 하기 때문이다. 본 연구에서는 Lambert가 제안한 3단계 계획기반 대화이해모델을 확장함으로써 한국어 대화에서 나타나는 생략 어구로부터 화자의 의도를 인식하는 모델을 제안한다. 먼저 Lambert의 모델에서 고려하지 않은, 생략 어구 형태의 발화를 통해 화자가 의도하는 담화 행위를 새로운 담화 recipe로 정의하여 추가하였다. 한국어에서는 조사가 화자의 의도를 나타내므로 이러한 특성을 이용하여 생략어구를 표층 화행으로 표현할 때, 조사 정보를 포함하여 화자의 의도 인식을 용이하게 함을 볼 수 있었다. 또한 객체와 초점화 이론을 제안하여, 생략 어구를 통해서 화자가 두 개의 계획을 비교하여 고려하는 의도를 인식할 수 있도록 했다.

  • PDF