• 제목/요약/키워드: 음성 분석

검색결과 3,062건 처리시간 0.028초

자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구 (On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function)

  • 함명규;최성영;박종철;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

담화 정보를 이용한 음성 인식 후처리 (Post Correction of Speech Recognition using Discourse Information)

  • 김주희;강상우;선충녕;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-151
    • /
    • 2010
  • 본 연구는 대화 시스템에서 처리되는 사용자 발화의 의도 분석 기법과 담화 정보를 사용하여 음성 인식 결과로서의 인식 후보 문장들을 재순위하는 방법을 제안한다. 담화 정보는 사용자 발화의 의도 분석에 매우 중요한 자질로 사용되고 있기 때문에 음성 인식 결과들의 후보를 선택하는 문제에서도 담화 정보는 매우 중요한 자질로 사용될 수 있다. 음성 인식 결과의 후보 문장들을 모두 의도 분석 과정을 거치고 각각의 후보 의도들과 이전 담화 정보의 연관성을 이용하여 음성 인식 결과를 재순위화 한다. 실험을 통하여 재순위 과정을 수행한 결과 1순위 음성 인식 결과는 재순위 과정을 거치지 않는 결과에 비해 7.08%의 오류 감소율을 보였다.

  • PDF

비대면 음성 쇼핑의 인지된 가치, 지속이용의도에 미치는 영향 관계에 관한 연구 (The Influence of Perceived Value on Continuance Use Intention in Voice Commerce Context)

  • 김효정
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.225-234
    • /
    • 2022
  • 음성 쇼핑이 새로운 정보 탐색 및 구매 채널로 주목을 받고 있다. 본 논문은 비대면 음성 쇼핑의 지속이용의도에 영향을 미치는 요인들을 가치기반수용모델을 이용하여 살펴보았다. 음성 쇼핑 이용 경험이 있는 소비자들을 대상으로 온라인 조사를 실시하였으며, 총 470명의 응답자료가 최종 분석에 활용되었다. 음성 쇼핑 경험자는 음성 쇼핑으로 물품을 구매하였거나 음식 배달 서비스를 이용한 개인들로 한정하였다. SPSS 23.0과 Amos 23.0 프로그램을 이용하여 기술통계 분석, 상관관계 분석, 확인적 요인분석, 그리고 구조모형 분석을 실시하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, 유용성과 응대 정확성이 음성 쇼핑의 인지된 가치를 증가시키는 것으로 확인되었다. 둘째, 기능적 위험이 음성 쇼핑의 인지된 가치를 감소시키는 것으로 확인되었다. 셋째, 인지된 가치가 음성 쇼핑의 지속이용의도를 향상시키는 것으로 나타났다. 본 연구 결과는 음성 쇼핑을 이용하는 소비자들의 특성을 이해하고, 음성 쇼핑이 이용자들에게 혜택을 제공하는 유용한 서비스로 자리매김하는데 기여할 수 있을 것이다.

정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구 (Analysis of Speech Signals According to the Various Emotional Contents)

  • 조철우;조은경;민경환
    • 한국음향학회지
    • /
    • 제16권3호
    • /
    • pp.33-37
    • /
    • 1997
  • 본 논문은 정서정보를 포함하여 수집된 음성자료를 여러 가지 신호처리 방법으로 분석한 결과에 대하여 기술하고 있다. 정서정보를 포함한 음성은 연극배우로부터 수집하였으며 분석은 주로 피치정보의 변화와 지속시간을 중심으로 행하였다. 수집된 음성에 대한 분석결과 정서정보의 변화에 따른 음성 파라미터의 변화치를 얻을 수 있었으며 이 실험은 앞으로의 정서음성정보의 분석에 필요한 기초적 실험으로 의의가 있다.

  • PDF

음성 합성을 위한 음성 파라미터 분석법의 개선에 관한 연구 (A Study on Improvements of Speech Analysis Methods for Speech Synthesis)

  • 방호균
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.111-114
    • /
    • 1995
  • 포만트 합성에 필요한 음성 파라미터를 분석하는 방법의 개선에 관하여 논한다. 내용은 주로 피치 동기 분석을 위한 피치 위치 추정법의 개선과 포만트 분석시 발생하는 스펙트럼의 왜곡 현상을 기존이 포만트 분석법 및 선형예측분방법과 비교한다.

  • PDF

혈압 상승이 성대 진동 및 음성 에너지 크기에 미치는 영향 분석 (Analysis for the Effect of Blood Pressure Increase on Vocal Cord Vibration and Voice Intensity)

  • 김봉현
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.431-437
    • /
    • 2013
  • 건강한 삶의 질이 향상되고 있으나 만성 질환으로 인한 고통은 날로 증가하고 있다. 만성 질환의 주요 요인은 스트레스, 혈압, 비만 등이 있으며 고혈압으로 인한 만성 질환 발병율은 매우 높은 편이다. 따라서 본 논문에서는 혈압 상승에 따른 음성을 분석하여 혈압 상승이 지속적으로 발생되는 현상을 조기에 진단하여 예방하기 위한 방법을 제안하고자 한다. 이를 위해 유산소 운동으로 혈압을 상승시킨 후 음성을 수집하고 음성 분석 기술 중 성대 진동을 측정하는 Pitch와 음성 에너지의 크기를 측정하는 Intensity를 적용하여 혈압 상승에 의해 음성에 미치는 영향을 분석, 연구하였다.

후두전적출술 후 Amatsu식 기관식도누공술을 시행한 환자에 대한 음성학적 및 영상학적 분석

  • 이한국;김순곤;유태현;이봉희;이윤우;이강대
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1999년도 제12회 학술대회
    • /
    • pp.185-185
    • /
    • 1999
  • 진행된 후두암종 환자에서는 후두전적출술이 가장 바람직한 치료 방법이다. 후두 기능이 상실된 환자에서 음성재활은 삶의 질을 향상시키기 위해서 필요하며 음성재활법으로 기관식도누공술, 식도발성, 전기후두에 의한 발성이 대표적인 방법이다. 고신대학교 이비인후과에서 후두 편평상피세포암종으로 후두전적출술과 Amatsu식 기관식도 누공술을 시행 받은 환자들 중에 음성분석이 가능한 12명을 대상으로 조사하였다. (중략)

  • PDF

말기 신부전 환자에서 혈액투석 치료가 성대 및 강도의 변화에 미치는 영향 (The Influence of Vocal Cords and Intensity by Hemodialysis in End Stage Renal Disease)

  • 김봉현;조동욱;강응택
    • 한국통신학회논문지
    • /
    • 제35권7B호
    • /
    • pp.1066-1072
    • /
    • 2010
  • 신장 질환은 초고령화 사회로 접어들고 있는 현대 사회에서 발병율이 매우 높은 질환이다. 이러한 신장 질환을 초기에 발견하면 약물이나 식이요법으로 막을 수 있지만 악화될 경우 인공투석이나 신장이식을 받아야 한다. 따라서 본 논문에서는 혈액투석에 따른 성대 및 강도의 변화율을 측정, 분석하여 신장과 음성과의 상관성을 분석하였다. 이를 위해 혈액투석 치료를 받는 피실험자를 대상으로 혈액투석 전과 후의 음성을 수집하고 음성 분석학적 요소의 적용을 통해 비교, 분석하였다. 즉, 신장에 이상이 있을 때 목소리가 가라앉는다는 동양의학적 진단 이론에 기반하여 혈액투석 치료 전의 음성과 치료 후의 음성을 각각 수집하고 수집된 음성 자료에 성대의 떨림과 강도 분석을 적용하여 혈액투석 치료 전과 후의 음성 변화를 측정, 분석하였다.

CDMA이동통신환경에서의 음성인식을 위한 왜곡음성신호 거부방법 (Distorted Speech Rejection For Automatic Speech Recognition under CDMA Wireless Communication)

  • 김남수;장준혁
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.597-601
    • /
    • 2004
  • 본 논문에서는 CDMA이동통신 환경에서의 음성인식을 위한 왜곡음성신호의 전처리-지부방법을 소개한다. 먼저, CDMA이동통신 채널에서의 왜곡된 음성신호를 분석하고 분석된 매커니즘을 바탕으로 채널에 의해 왜곡된 음성신호를 음성의 준주기성을 바탕으로 하여 거부하는 알고리즘을 제안한다. 실험을 통해 제안된 전처리-거부방법이 적은 계산량을 가지고 음성인식에 적용되어 효과적으로 CDMA에 환경에서 채널왜곡된 음성신호를 거부-할 수 있음을 알 수 있었다.

한국어 음성 인식 시스템을 위한 MEL-LPC 분석 방법과 LPC-MEL 분석 방법의 비교 (Comparison of MEL-LPC and LPC-MEL Analysis Method for the Korean Speech Recognition Systems.)

  • 김주곤;김범국;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.833-836
    • /
    • 2001
  • 본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.

  • PDF