• 제목/요약/키워드: 음성 정서 인식

검색결과 8건 처리시간 0.023초

자연스러운 정서 반응의 범주 및 차원 분류에 적합한 음성 파라미터 (Acoustic parameters for induced emotion categorizing and dimensional approach)

  • 박지은;박정식;손진훈
    • 감성과학
    • /
    • 제16권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 본 연구는 음성 인식기에서 일반적으로 사용되는 음향적 특징인 MFCC, LPC, 에너지, 피치 관련 파라미터들을 이용하여 자연스러운 음성의 정서를 범주 및 차원으로 얼마나 잘 인식할 수 있는지 살펴보았다. 자연스러운 정서 반응 데이터를 얻기 위해 선행 연구에서 이미 타당도와 효과성이 밝혀진 정서 유발 자극을 사용하였고, 110명의 대학생들에게 7가지 정서 유발 자극을 제시한 후 유발된 음성 반응을 녹음하여 분석에 사용하였다. 각 음성 데이터에서 추출한 파라미터들을 독립변인으로 하여 선형 판별 분석(LDA)으로 7가지 정서 범주를 분류하였고, 범주 분류의 한계를 극복하기 위해 단계별 다중회귀(stepwise multiple regression) 모형을 도출하여 4가지 정서 차원(valence, arousal, intensity, potency)을 가장 잘 예측하는 음성 특징 파라미터를 산출하였다. 7가지 정서 범주 판별율은 평균 62.7%이었고, 4 차원 예측 회귀모형들도 p<.001수준에서 통계적으로 유의하였다. 결론적으로, 본 연구 결과는 자연스러운 감정의 음성 반응을 분류하는데 유용한 파라미터들을 선정하여 정서의 범주와 차원적 접근으로 정서 분류 가능성을 보였으며 논의에 본 연구의 개선방향에 대해 기술하였다.

  • PDF

다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템 (Multidimensional Affective model-based Multimodal Complex Emotion Recognition System using Image, Voice and Brainwave)

  • 오병훈;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.821-823
    • /
    • 2016
  • 본 논문은 다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템을 제안한다. 사용자의 얼굴 영상, 목소리 및 뇌파를 기반으로 각각 추출된 특징을 심리학 및 인지과학 분야에서 인간의 감정을 구성하는 정서적 감응요소로 알려진 다차원 정서모델(Arousal, Valence, Dominance)에 대한 명시적 감응 정도 데이터로 대응하여 스코어링(Scoring)을 수행한다. 이후, 스코어링을 통해 나온 결과 값을 이용하여 다차원으로 구성되는 3차원 감정 모델에 매핑하여 인간의 감정(단일감정, 복합감정)뿐만 아니라 감정의 세기까지 인식한다.

음성인식기술의 노인간병 적용을 위한 정책연구 (A policy study for the voice recognition technology based on elderly health care)

  • 조병철;전수영;김갑년;육현승
    • 디지털융복합연구
    • /
    • 제16권2호
    • /
    • pp.9-17
    • /
    • 2018
  • 본 연구는 음성인식기술이 급격한 고령화를 맞고 있는 우리 사회의 노인문제 해결을 위해 어떻게 활용될 수 있는지를 목표로 삼았다. 국내에서도 본격적으로 고령자들을 위한 공공지원서비스나 민간간병 서비스 등이 확대될 것으로 예상된다. 이 때 음성인식기술은 미디어인터페이스에 익숙하지 못한 노인들에게 다양하게 활용될 수 있다. 이를 위해 본 연구진은 국내의 음성인식기술의 활용가능성과 일본 방문시 노인 간병에서 음성인식기술을 통해 이룬 성과를 조사했다. 특히 간병인들이 보고서를 작성할 때 음성인식기술을 이용해 수기로 작성하던 보고를 대체하여 업무시간을 크게 축소한 바 있는데, 이러한 방법은 국내에서도 쉽게 정책적으로 실행될 수 있다고 판단했으며, 음성인식기술이 탑재된 로봇의 개발을 통해 노인부양의 사회적 비용을 줄여야 한다는 결론 역시 도달했다. 아울러 음성인식기술이 다양한 정서인식기능의 인공지능기반 프로그램과 결합을 통한 다양한 정책이 도모되어야 한다는 사실 역시 제안할 수 있게 되었다.

한국형 감정 음성 데이터베이스 구축을 위한 타당도 연구 (Development and validation of a Korean Affective Voice Database)

  • 김예지;송혜선;전예솔;오유림;이영미
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.77-86
    • /
    • 2022
  • 본 연구는 운율을 기반으로 감정을 인식하는 능력을 측정할 때 이용할 수 있는 한국형 감정 음성 데이터베이스(Korean Affective Voice Database, 이하 KAV DB)를 개발하고, 해당 DB가 의사소통장애 관련 임상과 연구에서 활용될 수 있는지를 점검하기 위하여 신뢰도, 민감도, 특이도를 산출하여 그 타당성을 살펴보았다. 본 연구에서는 배우 2명(남 1명, 여 1명)이 의미적으로 중립적인 문장 10개를 행복, 분노, 공포, 슬픔, 놀람, 중립의 6개 정서로 표현하도록 하여 음성을 녹음하였다. 녹음된 음성 중에서 목표 정서가 잘 표현된 문장을 선별하여 타당도 점검을 위한 음성파일 세트를 구성하였으며, 청자 31명(남 14명, 여 17명)이 시각적 아날로그 평정법을 이용하여 각 음성에서 6개의 정서가 얼마나 반영되었는지 평정하도록 하였다. 그 결과, KAV DB에 대한 청자의 내적 일관성 신뢰도는 .872, 전체 민감도 82.8%, 전체 특이도 83.8%였다. 이를 통하여, 타당도가 확보된 KAV DB는 감정 음성 인식 및 산출과 관련된 연구와 임상 콘텐츠 제작 등에 활용될 수 있을 것으로 기대된다.

오디오 기반 인간로봇 상호작용 기술 (Audio-Based Human-Robot Interaction Technology)

  • 곽근창;김혜진;배경숙;윤호섭
    • 전자통신동향분석
    • /
    • 제22권2호통권104호
    • /
    • pp.31-37
    • /
    • 2007
  • 인간로봇 상호작용 기술(human-robot interaction)은 다양한 의사소통 채널인 로봇카메라, 마이크로폰, 기타 센서를 통해 인지 및 정서적으로 상호작용할 수 있도록 로봇시스템 및 상호작용 환경을 디자인하고 구현 및 평가하는 지능형 서비스 로봇의 핵심기술이다. 본 고에서는 오디오 기반 인간로봇 상호작용 기술 중에서 음원 추적(sound localization)과 화자인식(speaker recognition) 기술의 국내외 기술동향을 살펴보고 최근 ETRI 지능형로봇연구단에서 상용화를 추진중인 시청각 기반 음원 추적(audio visual sound localization)과 문장독립 화자인식(text-independent speaker recognition)기술들을 다룬다. 또한 이들 기술들을 가정환경에서 효과적으로 사용하기 위해 음성인식, 얼굴검출, 얼굴인식 등을 결합한 시나리오에 대해서 살펴본다.

힘 센서를 이용한 접촉감지부에서 신경망기반 인간의 접촉행동 인식 (Human Touching Behavior Recognition based on Neural Network in the Touch Detector using Force Sensors)

  • 류정우;박천수;손주찬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.910-917
    • /
    • 2007
  • 인간-로봇 상호작용에서 접촉은 인간에게 정서적 안정을 줄 수 있는 중요한 상호작용 방법 중 하나이다. 그러나 지금까지 음성과 영상을 기반으로 인간-로봇 상호작용이 이루어지는 연구가 대부분이었다. 본 논문에서는 접촉을 통한 인간-로봇 상호작용을 위해 인간의 접촉행동을 인식하는 방법을 제안한다. 제안한 인식 방법에서 인식 과정은 전처리 단계와 인식 단계로 나뉜다. 전처리 단계는 접촉감지부에서 생성된 데이타로부터 인식할 수 있는 특징들을 계산하는 단계이고 인식 단계는 인식기를 통해 접촉행동으로 분류하는 단계이다. 접촉감지부는 힘 센서인 FSR 센서를 이용하여 제작하였고 인식기는 신경망 모델인 다층퍼셉트론을 사용하였다. 실험은 남자 여섯 명에 의해 생성된 세 가지 접촉행동; '때리다', '쓰다듬다', '간질이다' 데이타를 가지고, 사람별로 인식기를 생성하여 cross-validation으로 평가한 결과 82.9%의 평균인식률을 보였고, 사람별 구분 없이 한 개의 인식기로 실험한 결과는 74.5%의 평균 인식률을 보였다.

교사 및 성악가의 VHI, V-RQOL, 음향학적 특성 비교 (VHI, V-RQOL, and vocal characteristics of teacher and singer)

  • 홍주혜;황영진
    • 한국산학기술학회논문지
    • /
    • 제13권7호
    • /
    • pp.3048-3056
    • /
    • 2012
  • 본 연구의 목적은 교사 및 성악가에 대한 음성장애지수(VHI), 음성관련 삶의 질 평가(V-RQOL), 음향음성학적 평가에 대한 특성을 연구하였다. 본 연구는 56명(성대결절이 있는 교사 20명 및 성악가, 그리고 정상화자 16명)을 대상으로 하였다. 모든 대상자에게 VHI, V-RQOL를 평가하였고, 음향학적 평가는 CSL 4500(Kay Pantax, USA)으로 측정하였다. 21명의 대상자에게 VHI, VRQOL, CSL을 이용한 음향적 평가에 대한 검사-재검사를 위해 두 번 실시하였다. 본 연구의 자료처리는 SPSS 18.0(SPSS Inc, Chicago, IL)을 사용하였다. 본 실험 결과, VHI 및 V-RQOL 결과, 교사 및 성악가 집단의 신체적, 기능적, 정서적 점수가 정상집단에 비해 유의하게 높았다(p<0.05). 음향학적 특성은 기본주파수 관련 변수, 기본주파수 변이 관련 변수, 음성강도 변이 관련 변수, 잡음 관련 변수, 진전 관련 변수) 범주에서 실험집단이 정상집단에 비해 유의하게 높았다(p<0.05). 결론적으로 교사 및 성악가들은 신체-기능영역에서 자신의 음성문제를 심각하게 인식하는 것 같다.

청소년들의 이동전화 이용행태와 사회심리적 변인에 관한 연구: 부산.울산 지역 이용자들을 중심으로 (Mobile Phone Uses and Social-Psychological Variables of Teen-Agers)

  • 이준호;안수근;정용조
    • 한국언론정보학보
    • /
    • 제27권
    • /
    • pp.247-282
    • /
    • 2004
  • 본 연구의 연구목적으로는 국내 이동전화 서비스의 최대 이용자들인 10대 청소년들의 이동전화 서비스 이용의 동기와 이용량 등의 이용행태적 특성을 규명하고, 이들의 이동전화 서비스 이용에 영향을 미칠 수 있는 요인들로서 사회심리적 특성들의 역할과 이용행태간의 관계에 관한 실증적 분석을 하는 것이다. 이와 관련한 가설을 세 가지로 설정하여 검증하는 설문조사를 고교생들을 대상으로 실시했는데, 주요 설문내용은 첫째, 이동전화의 음성통화와 문자 서비스의 빈도와 대상 및 기타 부가서비스의 이용 관련 설문과, 둘째, 8개 차원의 사회심리적 특성을 묻는 질문, 그리고 셋째는, 이용동기를 일반적 통화와 문자메시지 이용 부분으로 구분하여 충족의 유형별로 3-4개씩 구성했다. 연구결과로는, 첫째, 문자서비스를 더 많이 이용하나 가족들에게는 음성통화를 더 빈번히 하는데, 부모들의 연령대에서 문자메시지보다 음성통화에 더 익숙한 데 기인한 것이라고 볼 수 있으며, 친구들간에는 문자메시지 이용이 지배적인 이동전화 커뮤니케이션 양식이다. 둘째, 금전적 부담이 가는 부가서비스에 대한 이용은 매우 제한적이며 이용을 회피 또는 자제하는 경향이 있으며, 셋째, 문자서비스를 도구적 목적보다는 사교/오락적인 목적에 더 비중을 두고 이용하며, 전화의 이용동기의 양대축을 이론적으로 형성해 온 "업무/도구적 이용"과 "사회성(사교)/오락성 추구"는 청소년들이 이동전화를 통한 음성통화를 하게 되는 동기로서 동일한 비중을 두고 있다. 넷째, 응답자들의 사회심리적 특성과 이동전화 이용빈도의 관계는, "개인중심성"이 부가서비스 이용빈도와 상관관계가 있고, "집단중심성"은 음성통화와 문자서비tm 이용빈도를 높이는데 기여하고 있다. 마지막으로 "즉시성", "직접성", "혁신성", "타인지향형" 등의 특성은 이동전화 이용과 정적 상관관계 나타내는 반면 "내적지향형"과 "전통지향형" 성격은 부적 관계를 보인다. 결론적으로 청소년에 있어서 이동전화 서비스 이용의 다양화와 일반화된 기능적 도구로서의 인식이 주목할 만하다. 문자메시지 이용은 음성통화를 기능적으로 대체하고 있고 그 동기의 강도가 더 높으므로 기능적 우월성까지도 전제할 수 있다. 그리고 전통적인 전화와 이동전화 음성통화의 이용동기 간에는 본질적인 차이가 없는 가운데 도구적 이용과 인간적/정서적 이용의 동기가 이동전화의 타 미디어에 대한 차별성 내지 특수성에 기인하는 동기들에 비해 전체적으로 강하다. 또한 기존 이론과 연구들에서 유의미한 이동전화 이용의 요인으로 제기된 사회심리적 특성들은 조사대상인 청소년들에 있어서도 큰 차이 없이 일반화가 가능한 것으로 보이며, 그 중에서도 "혁신성"과 "타인지향성"이 미치는 영향이 주목된다.

  • PDF