• 제목/요약/키워드: 음성 감성 인식

검색결과 52건 처리시간 0.026초

성별 구분을 통한 음성 감성인식 성능 향상에 대한 연구 (A Study on The Improvement of Emotion Recognition by Gender Discrimination)

  • 조윤호;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.107-114
    • /
    • 2008
  • 본 논문은 남/여 성별에 기반해 음성을 평상, 기쁨, 슬픔, 화남의 4가지 감성 상태로 분류하는 감성인식 시스템을 구축하였다. 제안된 시스템은 입력 음성으로부터 1차적으로 남/여 성별을 분류하고, 분류된 성별을 기반으로 남/여 각기 최적의 특징벡터 열을 적용하여 감성인식을 수행함으로써 감성인식 성공률을 향상시켰다. 또한 음성인식에서 주로 사용되는 ZCPA(Zero Crossings with Peak Amplitudes)를 감성인식용 특징벡터로 사용하여 성능을 향상시켰으며, 남/여 각각의 특징 벡터 열을 최적화하기 위해 SFS(Sequential Forward Selection) 기법을 사용하였다. 감성 패턴 분류기로는 k-NN과 SVM을 비교하여 실험하였다. 실험결과 제안 시스템은 4가지 감성상태에 대해 약 85.3%의 높은 감성 인식 성공률을 달성할 수 있어 향후 감성을 인식하는 콜센터, 휴머노이드형 로봇이나 유비쿼터스(Ubiquitous) 환경 등 다양한 분야에서 감성인식 정보를 유용하게 사용될 수 있을 것으로 기대된다.

영상과 음성의 출력 데이터를 이용한 감성 인식 (Emotion Recognition Using Output Data of Image and Speech)

  • 주영훈;오재흥;박창현;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.275-280
    • /
    • 2003
  • 본 논문에서는 영상과 음성의 출력 데이터를 이용한 사람의 감성을 인식하는 방법을 제안한다. 제안된 방법은 영상과 음성의 인식률에 기반하여 인간의 감성을 인식하는 방법이다. 영상이나 음성 중 하나의 출력 데이터만을 이용할 경우에는 잘못된 인식에 대한 결과를 해결하기가 힘들다. 이를 보완하기 위해서 영상과 음성의 출력을 이용하여 인식률이 높은 감성 상태에 가중치를 인가함으로써 잘못된 인식의 결과를 줄일 수 있는 방법을 제안한다. 제안된 방법을 실험하기 위해 영상과 음성에 의한 감정 인식 방법이 간단히 제안되었다. 마지막으로 본 논문에서 제안한 방법은 실험을 통해 응용가능성을 제시하였다.

이동통신 환경에서 강인한 음성 감성특징 추출에 대한 연구 (A Study on Robust Speech Emotion Feature Extraction Under the Mobile Communication Environment)

  • 조윤호;박규식
    • 한국음향학회지
    • /
    • 제25권6호
    • /
    • pp.269-276
    • /
    • 2006
  • 본 논문은 이동전화 (Cellular phone)를 통해 실시간으로 습득된 음성으로부터 사람의 감성 상태를 평상 혹은 화남으로 인식할 수 있는 음성 감성인식 시스템을 제안하였다. 일반적으로 이동전화를 통해 수신된 음성은 화자의 환경 잡음과 네트워크 잡음을 포함하고 있어 음성 신호의 감성특정을 왜곡하게 되고 이로 인해 인식 시스템에 심각한 성능저하를 초래하게 된다. 본 논문에서는 이러한 잡음 영향을 최소화하기 위해 비교적 단순한 구조와 적은 연산량을 가진 MA (Moving Average) 필터를 감성 특정벡터에 적용해서 잡음에 의한 시스템 성능저하를 최소화하였다. 또한 특정벡터를 최적화할 수 있는 SFS (Sequential Forward Selection) 기법을 사용해서 제안 감성인식 시스템의 성능을 한층 더 안 정화시켰으며 감성 패턴 분류기로는 k-NN과 SVM을 비교하였다. 실험 결과 제안 시스템은 이동통신 잡음 환경에서 약 86.5%의 높은 인식률을 달성할 수 있어 향후 고객 센터 (Call-center) 등에 유용하게 사용될 수 있을 것으로 기대된다.

ARM 플랫폼 기반의 음성 감성인식 시스템 구현 (Implementation of the Speech Emotion Recognition System in the ARM Platform)

  • 오상헌;박규식
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1530-1537
    • /
    • 2007
  • 본 논문은 마이크로폰을 통해 실시간으로 습득된 음성으로부터 사람의 음성 감성상태를 평상, 기쁨, 슬픔, 화남 등 4가지로 구별할 수 있는 ARM 플랫폼 기반의 음성 감성인식 시스템 구현에 관한 것이다. 일반적으로 마이크로폰으로 수신된 음성은 화자 주변의 환경 잡음과 마이크로폰의 시스템 특성 때문에 입력 음성 신호가 왜곡되고 이로 인해 시스템의 성능이 저하된다. 본 논문에서는 이러한 잡음 영향을 최소화하기 위해 비교적 단순한 구조와 적은 연산 량을 가진 이동평균(MA, Moving Average) 필터를 입력 음성의 특징벡터 열에 적용하였다. 또한, 효율적으로 감성 특징벡터를 최적화할 수 있는 SFS(Sequential Forward Selection)기법을 적용해 제안 시스템의 성능을 최적화하였으며 감성 패턴 분류기로는 SVM(Support Vector Machine)을 사용하였다. 실험 결과 제안 감성인식 시스템은 모의실험에서 약 65%, ARM 플랫폼에서 약 62%의 인식률을 보였다.

  • PDF

음성인식을 이용한 주관평가 시스템 구현 (The Subjective Evaluation System Implementation Using Speech Recognition)

  • 한화영;고한우;윤용현;조택동
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2001년도 춘계학술대회 논문집
    • /
    • pp.276-279
    • /
    • 2001
  • 환경이나 작업부하 등이 인간에게 주는 피로나, stress 또는 쾌, 불쾌감 등의 감성을 평가하기 위한 정신물리학적인 방법의 하나으로 설문지에 의한 주관적인 평가법이 많이 사용되고 있다. 기존의 수작업으로 이루어지던 설문 방식을 자동화하여 PC 기반으로 설문양식을 자동 생성하고 음성을 통해 응답할 수 있는 프로그램을 개발하였다. 주관평가 자동화 시스템은 주관평가 데이터를 효율적으로 처리를 할 수 있고 음성을 이용함으로써 피험자의 정신적 부담을 경감시키며 생리신호와 주관평가와의 경시적인 변화를 효과적으로 평가할 수 있다. 설문 형식으로는 5점 척도와 7점 척도를 선택하였으며 평가어는 “매우 아니다”∼“매우 그렇다”로 구성되었다. 평가어를 인식함에 있어 좋은 인식률을 얻기 위한 특징벡터의 치수와 기본 프레임 개수를 대상으로 인식실험을 하였다.

  • PDF

음성인식을 이용한 주관평가의 자동화에 관한 기초연구 (A Basic Study on Automation of the Subjective Evaluation using Speech Recognition)

  • 한화영;고한우;윤용현;조택동
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2000년도 추계학술대회 논문집
    • /
    • pp.113-117
    • /
    • 2000
  • 수작업으로 이루어지고 있는 환경의 영향이나 작업의 영향에 따른 정신피로나 신체피로의 주관적인 평가를 자동화하기 위한 방법에 대하여 논하였다. 사람의 가장 자연스러운 의사소통인 평가어를 척도로 하여 평가가 이루어지는 음성인식기술을 응용한 주관평가법에 대하여 연구하였다. 주관평가의 자동화를 위하여 우선, 평가어에 대한 음성 인식을 한 후 인식된 평가 결과 데이터를 이용하여 설문지를 자동 생성시킴과 동시에 파일 형태로 저장시켰다. 음성 인식 알고리즘으로는 DTW(Dynamic Time Warping)인식 알고리즘을 사용하였고. 설문지 질의 내용은 집중도 평가를 이용하였다. 인식실험은 설문에 대한 응답에 필요한 평가어를 대상으로 하였다.

  • PDF

음향적 요소분석과 DRNN을 이용한 음성신호의 감성 인식 (Analyzing the Acoustic Elements and Emotion Recognition from Speech Signal Based on DRNN)

  • 심귀보;박창현;주영훈
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.45-50
    • /
    • 2003
  • 최근 인간형 로봇에 대한 개발이 괄목할 만한 성장을 이루고 있고, 친근한 로봇의 개발에 중요한 역할을 담당하는 것으로써 감성/감정의 인식이 필수적이라는 인식이 확산되고 있나. 본 논문은 음성의 감정인식에 있어 가장 큰 부분을 차지하는 피치의 패턴을 인식하여 감정을 분류/인식하는 시뮬레이터의 개발과 시뮬레이션 결과를 나타낸다. 또한, 피치뿐 아니라 음향학적으로 날카로움, 낮음 등의 요소를 분류의 기준으로 포함시켜서 좀더 신뢰성 있는 인식을 할 수 있음을 보인다. 주파수와 음성의 다양한 분석을 통하여, 음향적 요소와 감성의 상관관계에 대한 분석이 선행되어야 하므로, 본 논문은 사람들의 음성을 녹취하여 분석하였다 시뮬레이터의 내부 구조로는 음성으로부터 피치를 추출하는 부분과 피치의 패턴을 학습시키는 DRNN 부분으로 이루어져 있다.

감성인식과 핵심어인식 기술을 이용한 고객센터 자동 모니터링 시스템에 대한 연구 (A Study on the Automatic Monitoring System for the Contact Center Using Emotion Recognition and Keyword Spotting Method)

  • 윤원중;김태홍;박규식
    • 인터넷정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.107-114
    • /
    • 2012
  • 본 논문에서는 고객의 불만관리 및 상담원의 상담품질 관리를 위한 고객센터 자동 모니터링 시스템에 대한 연구를 진행하였다. 제안된 시스템에서는 평상/화남의 2가지 감성에 대한 음성 감성인식 기술과 핵심어인식 기술을 사용하여 상담내역에 대한 보다 정확한 모니터링이 가능하고, 욕설, 성희롱 등의 언어폭력을 일삼는 고객에 대한 전문상담 및 관리가 가능하다. 서로 다른 환경에서 구축된 이종 음성 DB를 이용하여 불특정 고객들의 질의 음성에 안정적으로 동작할 수 있는 알고리즘을 개발하였으며, 실제 고객센터 상담내역 데이터를 이용하여 성능을 검증하였다.

로봇 감성 기술 (Robot Emotion Technology)

  • 박천수;류정우;손주찬
    • 전자통신동향분석
    • /
    • 제22권2호통권104호
    • /
    • pp.1-9
    • /
    • 2007
  • 공공 서비스, 홈 서비스, 엔터테인먼트, 매개치료, 개호 등의 다양한 분야에서 인간과 로봇간의 상호작용을 통한 감성적인 교류에 대한 연구가 활발히 진행되고 있다. 점차시각, 음성 인식을 통한 사용자 중심의 감성 인식에서 촉각 기반의 상호 작용을 통한감성을 생성하고 다양한 형태로 감성을 표현하는 로봇들에 대한 개발이 이루어질 것이다. 이에, 본 고에서는 내.외부 센서들을 통한 감성에 영향을 주는 감성적 문맥 인식기술과 로봇 감성 및 행동 표현에 대한 기술 개발 동향에 대하여 살펴 보도록 한다.

이종 음성 DB 환경에 강인한 감성 분류 체계에 대한 연구 (A Study on Robust Emotion Classification Structure Between Heterogeneous Speech Databases)

  • 윤원중;박규식
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.477-482
    • /
    • 2009
  • 고객센터 (call-center)와 같은 기업환경의 감성인식 시스템은 감성 훈련용 음성과 불특정 고객들의 질의 음성간의 녹취 환경차이로 인해 상당한 시스템 성능 저하와 불안정성을 겪게 된다. 본 논문에서는 이러한 문제점을 극복하기 위해 기존의 전통적인 평상/화남 감성 분류체계를 남 녀 성별에 따른 감성별 특성 변화를 적용하여 2단계 분류체계로 확장하였다. 실험 결과, 제안한 방법은 녹취 환경 차이로 인한 시스템 불안정성을 해소할 수 있을 뿐 아니라 약 25% 가까운 인식 성능 개선을 가져올 수 있었다.