• Title/Summary/Keyword: 음성 분석

Search Result 3,062, Processing Time 0.031 seconds

On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function (자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구)

  • 함명규;최성영;박종철;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

Post Correction of Speech Recognition using Discourse Information (담화 정보를 이용한 음성 인식 후처리)

  • Kim, Ju-Hee;Kang, Sang-Woo;Seon, Choong-Nyoung;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.147-151
    • /
    • 2010
  • 본 연구는 대화 시스템에서 처리되는 사용자 발화의 의도 분석 기법과 담화 정보를 사용하여 음성 인식 결과로서의 인식 후보 문장들을 재순위하는 방법을 제안한다. 담화 정보는 사용자 발화의 의도 분석에 매우 중요한 자질로 사용되고 있기 때문에 음성 인식 결과들의 후보를 선택하는 문제에서도 담화 정보는 매우 중요한 자질로 사용될 수 있다. 음성 인식 결과의 후보 문장들을 모두 의도 분석 과정을 거치고 각각의 후보 의도들과 이전 담화 정보의 연관성을 이용하여 음성 인식 결과를 재순위화 한다. 실험을 통하여 재순위 과정을 수행한 결과 1순위 음성 인식 결과는 재순위 과정을 거치지 않는 결과에 비해 7.08%의 오류 감소율을 보였다.

  • PDF

The Influence of Perceived Value on Continuance Use Intention in Voice Commerce Context (비대면 음성 쇼핑의 인지된 가치, 지속이용의도에 미치는 영향 관계에 관한 연구)

  • Kim, Hyo-Jung
    • Journal of Digital Convergence
    • /
    • v.20 no.4
    • /
    • pp.225-234
    • /
    • 2022
  • Voice commerce has emerged as a key channel for consumer searches and purchases. This study examines the continuance use intention of voice commerce, applying value-based adoption model. An online survey was conducted with 470 consumers who has experienced with voice commerce. As participants were who buys and purchases goods; or a user who uses food delivery service in voice commerce context. This study used SPSS 23.0 and Amos 23.0 for descriptive analysis, correlation analysis, confirmatory factor analysis, and structul equation modeling analysis. These reaults are as follows. First, usefuleness and response accuracy were significantly influenced the perceived value of voice commerce. Second, functional risk was significantly influenced the the perceived value of voice commerce. Third, perceived value was significantly influenced the continuance use intention of voice commerce. These results enhance understanding of voice commerce users and provide insight into the service provider of voice commerce.

Analysis of Speech Signals According to the Various Emotional Contents (정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구)

  • Jo, Cheol-Woo;Jo, Eun-Kyung;Min, Kyung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.3
    • /
    • pp.33-37
    • /
    • 1997
  • This paper describes experimental results from emotional speech materials, which is analysed by various signal processing methods. Speech materials with emotional informations are collected from actors. Analysis is focused to the variations of pitch informations and durations. From the analysed results we can observe the characteristics of emotional speech. The materials from this experiment provides valuable resources for analysing emotional speech.

  • PDF

A Study on Improvements of Speech Analysis Methods for Speech Synthesis (음성 합성을 위한 음성 파라미터 분석법의 개선에 관한 연구)

  • 방호균
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.111-114
    • /
    • 1995
  • 포만트 합성에 필요한 음성 파라미터를 분석하는 방법의 개선에 관하여 논한다. 내용은 주로 피치 동기 분석을 위한 피치 위치 추정법의 개선과 포만트 분석시 발생하는 스펙트럼의 왜곡 현상을 기존이 포만트 분석법 및 선형예측분방법과 비교한다.

  • PDF

Analysis for the Effect of Blood Pressure Increase on Vocal Cord Vibration and Voice Intensity (혈압 상승이 성대 진동 및 음성 에너지 크기에 미치는 영향 분석)

  • Kim, Bong-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.2
    • /
    • pp.431-437
    • /
    • 2013
  • These days, many people live a healthy life, but suffering caused by chronic diseases. The main factors of chronic diseases are stress, blood pressure and obesity. Chronic diseases which are caused by high blood pressure are very high incidence. Therefore, this paper suggests the ways to prevent as diagnosis a phenomenon that occur rising in blood pressure consistently by analyzing the voice according th rising in blood pressure. For this, I studied some influence on voicing through rising in blood pressure by applying pitch that measure vocal fold vibration and intensity that measure voice energy size that is one of technique. That collect and analyse the voice after rising blood pressure by aerobic exercise.

후두전적출술 후 Amatsu식 기관식도누공술을 시행한 환자에 대한 음성학적 및 영상학적 분석

  • 이한국;김순곤;유태현;이봉희;이윤우;이강대
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.185-185
    • /
    • 1999
  • 진행된 후두암종 환자에서는 후두전적출술이 가장 바람직한 치료 방법이다. 후두 기능이 상실된 환자에서 음성재활은 삶의 질을 향상시키기 위해서 필요하며 음성재활법으로 기관식도누공술, 식도발성, 전기후두에 의한 발성이 대표적인 방법이다. 고신대학교 이비인후과에서 후두 편평상피세포암종으로 후두전적출술과 Amatsu식 기관식도 누공술을 시행 받은 환자들 중에 음성분석이 가능한 12명을 대상으로 조사하였다. (중략)

  • PDF

The Influence of Vocal Cords and Intensity by Hemodialysis in End Stage Renal Disease (말기 신부전 환자에서 혈액투석 치료가 성대 및 강도의 변화에 미치는 영향)

  • Kim, Bong-Hyun;Cho, Dong-Uk;Kang, Eung-Taek
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.35 no.7B
    • /
    • pp.1066-1072
    • /
    • 2010
  • Kidney diseases rates in modern Korean society, which is entering an aging society, are growing. These diseases diagnosed at early stage can be cured with the drug or dietary treatment. If, however, at worsening stage, kidney dialysis or transplant is needed. In this context, we analyzed the relationship between kidney and voice by measuring and analyzing the changing rate of the vocal chord and intensity according to hemodialysis. For this, we collected voice samples before and after hemodialysis, and compared and analyzed them through application of vocal analytical element. Namely, based on oriental medical diagnosis theory that voice is quieted down when kidney is abnormal, we collected voice samples before and after hemodialysis, and applied trembling and intensity analysis of vocal chord.

Distorted Speech Rejection For Automatic Speech Recognition under CDMA Wireless Communication (CDMA이동통신환경에서의 음성인식을 위한 왜곡음성신호 거부방법)

  • Kim Nam Soo;Chang Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.8
    • /
    • pp.597-601
    • /
    • 2004
  • This paper introduces a pre-rejection technique for wireless channel distorted speech with application to automatic speech recognition (ASR) Based on analysis of distorted speech signals over a wireless communication channel. we propose a method to reject the channel distorted speech with a small computational load. From a number of simulation results. we can discover that tile pre-rejection algorithm enhances the robustness of speech recognition operation.

Comparison of MEL-LPC and LPC-MEL Analysis Method for the Korean Speech Recognition Systems. (한국어 음성 인식 시스템을 위한 MEL-LPC 분석 방법과 LPC-MEL 분석 방법의 비교)

  • 김주곤;김범국;정호열;정현열
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.833-836
    • /
    • 2001
  • 본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.

  • PDF