• 제목/요약/키워드: 음성분석

검색결과 3,082건 처리시간 0.027초

감정 음성의 음향학적 모델링에 관한 연구 (A Study on the Acoustic Modeling of the Emotional Speech)

  • 천희진;이양희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.815-818
    • /
    • 2000
  • 본 논문에서는 감정 표현 음성 합성 시스템을 구현하기 위해서, 감정 음성 데이터베이스의 음향학적 특징인 피치, 에너지, 지속시간, 스펙트럼 포락에 대해 분석한 결과와 문법적 요소인 품사에 따른 감정 음성 데이터의 피치 변화를 분석하였다. 분석 결과, 기본 주파수, 에너지, 지속시간, 스펙트럼 포락은 감정 표현에 중요한 영향을 미치는 것으로 나타났으며, 전반적으로 화남과 기쁨의 감정이 평상과 슬픔의 감정 보다 피치 및 에너지의 변화가 크게 나타났으며, 특히 기쁜 감정의 경우 부사, 관형사, 연결어미, 조사, 접미사에서 피치 변화가 많았으며, 화난 감정의 경우, 관형사, 명사, 용언, 접미사에서 피치 변화가 높게 나타났다. 이러한 분석 결과를 적용해 감정 음성을 합성하기 위하여, 평상 음성에 각 감정 음성의 운율 요소를 적용하여 감정 음성을 합성하여 평가한 결과, 기쁜 감정은 기본 주파수의 변화에 의해 86.7%, 화난 감정은 에너지의 변화에 의해 91%, 슬픈 감정은 음절지속시간의 변화에 의해 76.7%가 각각 올바른 감정으로 인지되었다.

  • PDF

자기상관을 이용한 음성 신호의 MIDI 변환 (Speech-to-MIDI Conversion with Autocorrelation)

  • 박상보;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.439-441
    • /
    • 2004
  • 효율적인 멀티미디어 검색의 필요성이 증대됨에 따라 내용기반 멀티미디어의 검색에 대한 다양한 기법들이 소개되고 있다. 그 중에서 친숙한 멜로디를 가지고 사용자가 직접 마이크를 통해 생성한 음성 질의에 대한 분석에 대해 다루고자 한다. 음성 질의에 사용되는 음성 데이터를 분석함으로써 검색에 이용하는 것이다. 음성데이터를 분석하기 위한 방법으로 시간영역에서 가장 많이 쓰이는 기법 중의 하나인 자기상관함수를 사용한다. 자기상관 함수를 이용하여 특정구간에서 발생하는 일정한 주기 즉 기본주기를 검출할 수 있다. 자기상관함수에 의해 분석된 결과를 가지고, 음의 높낮이를 구하기 위한 기본주파수 검출 알고리즘과 음의 길이, 음의 세기를 결정하기 위한 방법을 제안한다.

  • PDF

음성질환별 MDVP, Phonetogram의 특징 연구

  • 안철민;김성태
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.143-143
    • /
    • 2003
  • 음성에 대한 청각적 판단으로는 차이점과 공통점을 느낄 수 있으나, 개별적인 음향 분석에서는 차이점이나 공통점을 밝혀 내지 못한 경우가 많았다 따라서 음성에 대한 청각적 판단처럼 음향 분석 변수를 종합적으로 분석할 수 있는 MDVP와 Phonetogram을 이용하여 음성질환별로 나타나는 소견을 관찰하여 청각적 판단과 종합적인 음향학적 분석간에 연관성이 있는지 알아보고자 하였다. 음성변화를 주소로 본원에 내원하였던 환자 중 화상회선경술 검사상 양성성대질환이 관찰되었던 102명을 대상으로 하였고, 성대질환이 없었던 정상군과 비교하였다. 각 대상들은 화상회선경술 검사에서 질환의 종류를 확인하였고, 질환별 청각적 분석을 GRBAS로 확인하였다. 또한 MDVP를 시행하여 질환별로 변수들의 특징적인 변화를 종합적으로 도식화하여 확인하였고, Phonetogram을 시행하여 질환별로 감소된 부분이 있는지 확인하였다. (중략)

  • PDF

정준 상관 분석을 이용한 잡음 섞인 음성 신호의 분리 (Segaration of Corrupted Speech Signals using Canonical Correlation Analysis)

  • 김선일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.164-167
    • /
    • 2012
  • 음성 신호와 함께 섞인 자동차 배기 소음을 서로 분리해 내는 기술은 점점 음성을 중심으로 발전해가는 인터페이스를 현실화하는데 실질적으로 필요한 기술이다. 따라서 자동차 배기음이 섞인 음성신호를 두 신호간의 독립성이 보장되지 않고 두 신호에 대한 사전 정보가 없는 상태에서 분리해 내기 위해 정준 상관 분석을 사용하여 두 신호를 분리해 내는 연구를 진행하였다. 정준 상관 분석을 이용하여 음성을 분리해 내기 위해서는 분석에 쓰이는 신호의 구성이 중요하다. 정준 상관 분석에 대해 알아보고 음성과 자동차 배기 소음이 섞인 두 개의 신호를 받아서 이를 재구성하여 정준 상관분석을 이용하여 자동차 소음과 음성을 분리해 내었다. Blind Source Separation에 쓰이는 다른 방법과 비교했을 때 독립성이 보장되지 않는 신호에 대해서도 분리가 가능하므로 응용 대상이 상대적으로 넓어 실용적 응용이 가능하다고 할 수 있다.

  • PDF

성대구증 환자의 음성기능 분석

  • 한경열;남순열
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1997년도 제8회 학술대회 심포지움
    • /
    • pp.255-255
    • /
    • 1997
  • 서론 : 성대구증은 음성장애를 주소로 외래로 찾아오는 환자에서 드물지 않게 볼 수 있으나, 그 병인이 불명확하고 그간의 치료가 만족스럽지 못한 것으로 알려져 간과하기 쉬운 질환이다. 저자들은 이러한 성대구중 환자들의 음성기능 분석을 통하여 향후의 치료효과를 알아보는데 도움이 되고자 하였다. (중략)

  • PDF

편측 성대마비와 성대폴립 환자의 수술 전후 음성검사와 이미지 화상분석의 상관관계에 대한 객관적 비교연구

  • 김시찬;최홍식;홍정표;오종석
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1999년도 제12회 학술대회
    • /
    • pp.199-199
    • /
    • 1999
  • 각종 음성질환에 있어서 음성검사는 진단뿐 아니라 치료를 위한 중요한 방법으로 알려져 왔다. 특히 수술전후 음성질환의 평가에는 음성검사 뿐 아니라, 후두스트로보스코피를 이용하여 비교함으로써 가능하다. 이중 후두스트로보스코피는 방법이 간단하여 직접 수술전후의 변화를 알 수 있는 장점이 있으나, 객관적인 자료로는 이용하기가 어려운 문제점이 있다. 후두스트로보스코피의 영상자료를 컴퓨터에 연결, 영상신호를 디지털화하여 후두의 움직임을 객관적으로 관찰하려고 시도되어왔다 특히 편측 성대마비 환자에서는 성대의 위치가 외전 될뿐만 아니라 피열연골의 위치가 마비 후 시간이 경과됨에 따라 외회전 하고 성대가 전방으로 위축되어 성대 막성부의 길이가 짧아지는 틀의 후두스트로보스코피의 영상을 보이고, 성대폴립환자에서는 수술전후에 폴립의 크기와 성문면적에 변화를 보이게 된다. 본 연구의 목적은 편측 성대마비와 성대폴립과 같은 각기 다른 두 질병에서 음성경사와 후두스트로보스코피를 이용한 이미지 화상분석을 통해 각 성대의 길이, 각도, 성문틈의 면적과 폴립의 크기등을 측정함으로써 수술전후의 차이를 알아보고, 이미지 화상분석과 음성검사 사이에 어떠한 상관관계가 있는지를 알아보고자 하였다. (중략)

  • PDF

혈압 상승이 성대 진동 및 음성 에너지 크기에 미치는 영향 분석 (Analysis for the Effect of Blood Pressure Increase on Vocal Cord Vibration and Voice Intensity)

  • 김봉현
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.431-437
    • /
    • 2013
  • 건강한 삶의 질이 향상되고 있으나 만성 질환으로 인한 고통은 날로 증가하고 있다. 만성 질환의 주요 요인은 스트레스, 혈압, 비만 등이 있으며 고혈압으로 인한 만성 질환 발병율은 매우 높은 편이다. 따라서 본 논문에서는 혈압 상승에 따른 음성을 분석하여 혈압 상승이 지속적으로 발생되는 현상을 조기에 진단하여 예방하기 위한 방법을 제안하고자 한다. 이를 위해 유산소 운동으로 혈압을 상승시킨 후 음성을 수집하고 음성 분석 기술 중 성대 진동을 측정하는 Pitch와 음성 에너지의 크기를 측정하는 Intensity를 적용하여 혈압 상승에 의해 음성에 미치는 영향을 분석, 연구하였다.

음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석 (Performance Analysis of Speech Recognition in Communication Systems using Speech Coder)

  • 한상욱;정희석;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.179-182
    • /
    • 2002
  • 본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.

  • PDF

후두전적출술 후 Amatsu식 기관식도누공술을 시행한 환자에 대한 음성학적 및 영상학적 분석

  • 이한국;김순곤;유태현;이봉희;이윤우;이강대
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1999년도 제12회 학술대회
    • /
    • pp.185-185
    • /
    • 1999
  • 진행된 후두암종 환자에서는 후두전적출술이 가장 바람직한 치료 방법이다. 후두 기능이 상실된 환자에서 음성재활은 삶의 질을 향상시키기 위해서 필요하며 음성재활법으로 기관식도누공술, 식도발성, 전기후두에 의한 발성이 대표적인 방법이다. 고신대학교 이비인후과에서 후두 편평상피세포암종으로 후두전적출술과 Amatsu식 기관식도 누공술을 시행 받은 환자들 중에 음성분석이 가능한 12명을 대상으로 조사하였다. (중략)

  • PDF

음성언어 번역 시스템을 위한 새로운 형태소 분석 (A New Morphological Analysis for the Spoken Language Translation System)

  • 양승원;김재훈
    • 한국음향학회지
    • /
    • 제18권4호
    • /
    • pp.17-22
    • /
    • 1999
  • 음성 처리부와 기계번역부를 통합하는 음성언어 번역 시스템에서는 각 모듈들이 다루는 자료나 처리단위 등이 서로 달라 통합이 어렵다. 따라서, 전체 시스템의 효율을 제고하면서 각 모듈에서 공통으로 사용할 수 있는 새로운 입출력 단위가 필요하다. 본 논문에서는 음성언어 번역 시스템에서 음성 처리 모듈들과 언어번역 모듈과의 인터페이스 단위로서 의사 형태소를 제안하고, 입력되는 문장을 의사 형태소 단위로 분석하는 형태소 분석기를 구현하였다. 의사형태소를 이용한 음성인식/합성은 어절이나 형태소단위의 음성인식/합성에서 보다 개선된 결과를 얻을 수 있게 해주며, 전체적인 음성언어 번역시스템의 성능도 높일 수 있다. 본 논문에서 구현한 의사 형태소 분석기의 분석율은 약98.9%로 일반 형태소 분석기와 동일한 수준의 성능을 보였다.

  • PDF