• Title/Summary/Keyword: 음성 분석

Search Result 3,068, Processing Time 0.029 seconds

On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function (자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구)

  • 함명규;최성영;박종철;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

Post Correction of Speech Recognition using Discourse Information (담화 정보를 이용한 음성 인식 후처리)

  • Kim, Ju-Hee;Kang, Sang-Woo;Seon, Choong-Nyoung;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.147-151
    • /
    • 2010
  • 본 연구는 대화 시스템에서 처리되는 사용자 발화의 의도 분석 기법과 담화 정보를 사용하여 음성 인식 결과로서의 인식 후보 문장들을 재순위하는 방법을 제안한다. 담화 정보는 사용자 발화의 의도 분석에 매우 중요한 자질로 사용되고 있기 때문에 음성 인식 결과들의 후보를 선택하는 문제에서도 담화 정보는 매우 중요한 자질로 사용될 수 있다. 음성 인식 결과의 후보 문장들을 모두 의도 분석 과정을 거치고 각각의 후보 의도들과 이전 담화 정보의 연관성을 이용하여 음성 인식 결과를 재순위화 한다. 실험을 통하여 재순위 과정을 수행한 결과 1순위 음성 인식 결과는 재순위 과정을 거치지 않는 결과에 비해 7.08%의 오류 감소율을 보였다.

  • PDF

The Influence of Perceived Value on Continuance Use Intention in Voice Commerce Context (비대면 음성 쇼핑의 인지된 가치, 지속이용의도에 미치는 영향 관계에 관한 연구)

  • Kim, Hyo-Jung
    • Journal of Digital Convergence
    • /
    • v.20 no.4
    • /
    • pp.225-234
    • /
    • 2022
  • Voice commerce has emerged as a key channel for consumer searches and purchases. This study examines the continuance use intention of voice commerce, applying value-based adoption model. An online survey was conducted with 470 consumers who has experienced with voice commerce. As participants were who buys and purchases goods; or a user who uses food delivery service in voice commerce context. This study used SPSS 23.0 and Amos 23.0 for descriptive analysis, correlation analysis, confirmatory factor analysis, and structul equation modeling analysis. These reaults are as follows. First, usefuleness and response accuracy were significantly influenced the perceived value of voice commerce. Second, functional risk was significantly influenced the the perceived value of voice commerce. Third, perceived value was significantly influenced the continuance use intention of voice commerce. These results enhance understanding of voice commerce users and provide insight into the service provider of voice commerce.

Analysis of Speech Signals According to the Various Emotional Contents (정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구)

  • Jo, Cheol-Woo;Jo, Eun-Kyung;Min, Kyung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.3
    • /
    • pp.33-37
    • /
    • 1997
  • This paper describes experimental results from emotional speech materials, which is analysed by various signal processing methods. Speech materials with emotional informations are collected from actors. Analysis is focused to the variations of pitch informations and durations. From the analysed results we can observe the characteristics of emotional speech. The materials from this experiment provides valuable resources for analysing emotional speech.

  • PDF

A Study on Improvements of Speech Analysis Methods for Speech Synthesis (음성 합성을 위한 음성 파라미터 분석법의 개선에 관한 연구)

  • 방호균
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.111-114
    • /
    • 1995
  • 포만트 합성에 필요한 음성 파라미터를 분석하는 방법의 개선에 관하여 논한다. 내용은 주로 피치 동기 분석을 위한 피치 위치 추정법의 개선과 포만트 분석시 발생하는 스펙트럼의 왜곡 현상을 기존이 포만트 분석법 및 선형예측분방법과 비교한다.

  • PDF

Analysis for the Effect of Blood Pressure Increase on Vocal Cord Vibration and Voice Intensity (혈압 상승이 성대 진동 및 음성 에너지 크기에 미치는 영향 분석)

  • Kim, Bong-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.17 no.2
    • /
    • pp.431-437
    • /
    • 2013
  • These days, many people live a healthy life, but suffering caused by chronic diseases. The main factors of chronic diseases are stress, blood pressure and obesity. Chronic diseases which are caused by high blood pressure are very high incidence. Therefore, this paper suggests the ways to prevent as diagnosis a phenomenon that occur rising in blood pressure consistently by analyzing the voice according th rising in blood pressure. For this, I studied some influence on voicing through rising in blood pressure by applying pitch that measure vocal fold vibration and intensity that measure voice energy size that is one of technique. That collect and analyse the voice after rising blood pressure by aerobic exercise.

Analysis of Livestock Vocal Data using Lightweight MobileNet (경량화 MobileNet을 활용한 축산 데이터 음성 분석)

  • Se Yeon Chung;Sang Cheol Kim
    • Smart Media Journal
    • /
    • v.13 no.6
    • /
    • pp.16-23
    • /
    • 2024
  • Pigs express their reactions to their environment and health status through a variety of sounds, such as grunting, coughing, and screaming. Given the significance of pig vocalizations, their study has recently become a vital source of data for livestock industry workers. To facilitate this, we propose a lightweight deep learning model based on MobileNet that analyzes pig vocal patterns to distinguish pig voices from farm noise and differentiate between vocal sounds and coughing. This model was able to accurately identify pig vocalizations amidst a variety of background noises and cough sounds within the pigsty. Test results demonstrated that this model achieved a high accuracy of 98.2%. Based on these results, future research is expected to address issues such as analyzing pig emotions and identifying stress levels.

후두전적출술 후 Amatsu식 기관식도누공술을 시행한 환자에 대한 음성학적 및 영상학적 분석

  • 이한국;김순곤;유태현;이봉희;이윤우;이강대
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.185-185
    • /
    • 1999
  • 진행된 후두암종 환자에서는 후두전적출술이 가장 바람직한 치료 방법이다. 후두 기능이 상실된 환자에서 음성재활은 삶의 질을 향상시키기 위해서 필요하며 음성재활법으로 기관식도누공술, 식도발성, 전기후두에 의한 발성이 대표적인 방법이다. 고신대학교 이비인후과에서 후두 편평상피세포암종으로 후두전적출술과 Amatsu식 기관식도 누공술을 시행 받은 환자들 중에 음성분석이 가능한 12명을 대상으로 조사하였다. (중략)

  • PDF

The Influence of Vocal Cords and Intensity by Hemodialysis in End Stage Renal Disease (말기 신부전 환자에서 혈액투석 치료가 성대 및 강도의 변화에 미치는 영향)

  • Kim, Bong-Hyun;Cho, Dong-Uk;Kang, Eung-Taek
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.35 no.7B
    • /
    • pp.1066-1072
    • /
    • 2010
  • Kidney diseases rates in modern Korean society, which is entering an aging society, are growing. These diseases diagnosed at early stage can be cured with the drug or dietary treatment. If, however, at worsening stage, kidney dialysis or transplant is needed. In this context, we analyzed the relationship between kidney and voice by measuring and analyzing the changing rate of the vocal chord and intensity according to hemodialysis. For this, we collected voice samples before and after hemodialysis, and compared and analyzed them through application of vocal analytical element. Namely, based on oriental medical diagnosis theory that voice is quieted down when kidney is abnormal, we collected voice samples before and after hemodialysis, and applied trembling and intensity analysis of vocal chord.

Distorted Speech Rejection For Automatic Speech Recognition under CDMA Wireless Communication (CDMA이동통신환경에서의 음성인식을 위한 왜곡음성신호 거부방법)

  • Kim Nam Soo;Chang Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.8
    • /
    • pp.597-601
    • /
    • 2004
  • This paper introduces a pre-rejection technique for wireless channel distorted speech with application to automatic speech recognition (ASR) Based on analysis of distorted speech signals over a wireless communication channel. we propose a method to reject the channel distorted speech with a small computational load. From a number of simulation results. we can discover that tile pre-rejection algorithm enhances the robustness of speech recognition operation.