• 제목/요약/키워드: Cepstrum Analysis

검색결과 91건 처리시간 0.033초

일측성 성대마비 환자 평가에서 Cepstral Peak Prominence의 유용성 (Usefulness of Cepstral Peak Prominence (CPP) in Unilateral Vocal Fold Paralysis Dysphonia Evaluation)

  • 이창윤;정희석;손희영
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.84-88
    • /
    • 2017
  • Background and Objectives : The purpose of this study was to compare the usefulness of Cepstral peak prominence (CPP) with parameter of Multiple Dimensional Voice Program (MDVP) in evaluating unilateral vocal fold paraylsis patients with subjective voice impairment. Materials and Methods : From July 2014 to August 2016, 37 patients with unilateral vocal fold paralysis who had been diagnosed with unilateral vocal fold paralysis and had received two or more voice tests before and after the diagnosis were evaluated for maximum phonation time (MPT), MDVP and CPP. Respectively. Voice tests were performed with short vowel /a/ and paragraph reading. Results : The CPP-a (CPP with vowel /a/) and CPP-s (CPP with paragraph reading) of the Cepstrum were statistically negatively correlated with G, R, B, and A before the voice therapy. Jitter, Shimmer, and NHR of MDVP were positively correlated with G, R, B. Jitter, Shimmer, and NHR of the MDVP were significantly correlated with the Cepstrum index. G, B, A and CPP-a and CPP-s showed a statistically significant negative correlation and a somewhat higher correlation coefficient between 0.5 and 0.78. On the other hand, in MDVP index, there was a positive correlation with G and B only with Jitter of 0.4. Conclusion : CPP can be an important evaluation tool in the evaluation of speech in the unilateral vocal cord paralysis when speech energy changes or the cycle is not constant during speech.

  • PDF

Analysis of Speech Signals Depending on the Microphone and Micorphone Distance

  • Son, Jong-Mok
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권4E호
    • /
    • pp.41-47
    • /
    • 1998
  • Microphone is the first link in the speech recognition system. Depending on its type and mounting position, the microphone can significantly distort the spectrum and affect the performance of the speech recognition system. In this paper, characteristics of the speech signal for different microphones and microphone distances are investigated both in time and frequency domains. In the time domain analysis, the average signal-to-noise ration is measure ration is measured for the database we collected depending on the microphones and microphone distances. Mel-frequency spectral coefficients and mel-frequency cepstrum are computed to examine the spectral characteristics. Analysis results are discussed with our findings, and the result of recognition experiments is given.

  • PDF

간 조직 초음파 신호의 cepstrum 분석 (Cepstral Analysis of the Ultrasonic Signal from the liver tissue)

  • 김종원;곽철은;서보석;민병구
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1247-1251
    • /
    • 1987
  • Cepstral analysis was performed on the ultrasonic echo signal from the tissue to achieve improvement on the estmation of the attenuation coefficient. In this paper, the feasibility of the acquiring the structural information of the tissue was also included by same method with band pass lifter.

  • PDF

한국어 음성 인식 시스템을 위한 MEL-LPC 분석 방법과 LPC-MEL 분석 방법의 비교 (Comparison of MEL-LPC and LPC-MEL Analysis Method for the Korean Speech Recognition Systems.)

  • 김주곤;김범국;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.833-836
    • /
    • 2001
  • 본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.

  • PDF

켑스트럼 기반 혼성영역 피치변경법의 처리시간 단축에 관한 연구 (On a Processing Time Reduction of Cepstrum-Based Pitch Alteration in Time-Frequency Hybrid Domain)

  • 조왕래;김종국;배명진
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.41-47
    • /
    • 2010
  • 음성변환을 위한 피치변경법은 시간영역법과 주파수영역법, 혼성영역법이 많이 사용되고 있으며 시간-주파수 혼성영역법은 스펙트럼 왜곡이 적고 명료성과 자연성이 우수하다는 장점이 있는 반면 영역변환을 위한 처리시간이 매우 길다는 단점을 가지고 있었다. 본 논문에서는 시간-주파수 혼성 영역 피치변경법의 처리시간을 단축하는 방법을 제안하였다. 음성신호를 켑스트럼으로 변경하는 과정에서 사용되는 FFT와 IFFT의 비트-재정렬 과정을 생략함으로써 처리시간을 단축하는 방법이다. 이를 적용함으로써 기존의 켑스트럼 피치변경법과 같은 음성품질을 유지하면서도 처리시간은 86.26%로 단축할 수 있었다.

일측 성대마비 환자에 대해 음성치료와 성대주입술의 초기 치료 효과 비교 연구 (Comparison of Initial Therapeutic Effects of Voice Therapy and Injection Laryngoplasty for Unilateral Vocal Cord Paralysis Patients)

  • 이창윤;안수연;장현;손희영
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.112-117
    • /
    • 2017
  • Background and Objectives : The purpose of this study was to classify patients with unilateral vocal fold paralysis according to their fixed location and to analysis the effects of two treatment methods by early voice therapy and injection laryngoplasty. Materials and Methods : Twenty patients who were classified as full abduction and slight abduction according to the position of paralysis were treated injection laryngoplasy, and 23 patients were treated by voice therapy. Twenty patients were treated injection laryngoplasy and 23 patients were treated voice therapy. Results were evaluated by acoustic analysis, electroglottography, cepstrum analysis before and after therapy. The voice therapy was conducted by improving the larynx movement and glottal contact, whilst removing hypertension of the supraglottic and use the breathing. Results : Significant improvement was found in the acoustic parameter, cepstrum parameter, and EGG before and after treatment in both groups. There was no significant difference between the two groups when compared before and after treatment to compare the effects of injection laryngoplasty and voice therapy. Conclusion : The initial treatments for unilateral vocal cord paralysis are injection laryngoplasty and voice therapy. however, there is no precise standard about which method should be applied first. Therefore, in this study, we tried to classify patients according to their paralysis position and then apply two methods. The results of this study suggest that voice therapy and Injection laryngoplasty at the initial stage is a very useful method to improve voice quality of vocal fold paralysis and improve laryngeal function.

  • PDF

진동 데이터 기반 설비고장예지를 위한 신호처리기법 (A Signal Processing Technique for Predictive Fault Detection based on Vibration Data)

  • 송예원;이홍성;박훈석;김영진;정재윤
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.111-121
    • /
    • 2018
  • 항공기 엔진, 풍력발전기, 모터 등 회전기기에서 발생하는 많은 문제들은 진동이나 소음과 같은 신호 데이터를 측정하여 이상감지를 할 수 있으며, 주파수 분석 등 여러 가지 신호처리가 데이터 전처리 단계에서 필요하다. 본 논문에서는 진동 데이터를 분석하여 설비 이상상태를 감지하는 기법을 소개한다. 정상상태 데이터를 기반으로 마할라노비스 거리를 측정하여 이상상태 유무를 모니터링 하는 방식을 사용한다. 특히 신호 데이터의 전처리 기법들을 도입하여 이상상태 감지의 성능을 개선할 수 있음을 보여준다. 전처리 단계에서 신호 데이터 수집 과정에서 발생한 누설오차(leakage)를 없애기 위해 해밍 윈도우(Hamming window)를 적용하고, 신호 데이터의 원신호인 포먼트(formant)를 분리하기 위하여 켑스트럼(cepstrum) 분석을 실시한다. IMS 베어링 진동 공개데이터를 대상으로 시간 구간별로 6가지 통계지표를 추출한 후 마할라노비스 거리 분류기를 적용하여 성능을 검증하였다. 제시된 신호처리 전처리 기법을 적용함으로써 성능이 획기적으로 향상되는 것을 실험에서 보여주었다.

구개상의 형태 변화가 발음에 미치는 영향에 관한 음향학적 연구 -/ㅅ/을 중심으로한 컴퓨터 분석- (AN ACOUSTIC STUDY IN RELATION TO THE SOUND DISTORTION BY THE ALTERATION OF PALATAL PLATE -FOCUSSED ON/ㅅ(s)/. BY COMPUTER ANALYSIS-)

  • 최창규;우이형;박남수
    • 대한치과보철학회지
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 1989
  • This study was done to analyze the sound distortion, before and after insertion of the palatal palates. For this study, 4 healthy subjects (3 males and 1 female, each 24-year-old), who were born in Seoul were recruited from K university, and 3 type palatal plates were fabricated, each palatal thickness being 1.0mm, 2.5mm, dentoalveolar portion 2.5mm and elsewhere 1.0mm, named B,C,D-type repectively, and informants's sounds of /사(sa), 서(se), 소(so), 수(su), 스($s\.{+}$), 시(si)/ were recorded, without plate, and with palatal plates of different types, in succession. A series of analysis were adminstered through a 16 Bit IBM PC/AT using linear combination methods. These experiments were analyzed by the Cepstrum (Weighted and Euclidian), Log Area Ratio, Linear prediction correlation methods The findings led to the following conclusions : 1. It was confirmed that the same consonant, /ㅅ(s)/, variously distorted by the following vowel. 2. By and large, 시($s\.{+}$) was the most distorted in all conditions, and (sa), 소(so) were the least distorted in each condition. 3. There were no persistant correlation of the palatal plate types, and sound distortions of each informant were diverse with no regularities. 4. There were persistent correaltion to the Cepstrum (Weighted, Euclidian), Log Area Ratio. However, Linear prediction correlation has a different alteration pattern.

  • PDF

Development of Software For Machinery Diagnostics by Adaptive Noise Cancelling Method (1St: Cepstrum Analysis)

  • Lee, Jung-Chul;Oh, Jae-Eung;Yum, Sung-Ha
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1987년도 한국자동제어학술회의논문집(한일합동학술편); 한국과학기술대학, 충남; 16-17 Oct. 1987
    • /
    • pp.836-841
    • /
    • 1987
  • Many kinds of conditioning monitoring technique have been studied, so this study has investigated the possibility of checking the trend in the fault diagnosis of ball bearing, one of the elements of rotating machine, by applying the cepstral analysis method using the adaptive noise cancelling (ANC) method. And computer simulation is conducted in oder to identify obviously the physical meaning of ANC. The optimal adaptation gain in adaptive filter is estimated, the performance of ANC according to the change of the signal to noise ratio and convergence of LMS algorithm is considered by simulation. It is verified that cepstral analysis using ANC method is more effective than the conventional cepstral analysis method in bearing fault diagnosis.

  • PDF

숫자음 분석과 인식에 관한 연구 (A Study on Spoken Digits Analysis and Recognition)

  • 김득수;황철준
    • 한국산업정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.107-114
    • /
    • 2001
  • 본 논문에서는 한국어의 음성학적 규칙을 적용한 연속 숫자음 인식에 관하여 연구한다. 연속 숫자음의 인식률은 일반적으로 음성인식 시스템 중에서 낮은 인식률을 나타낸다. 따라서 숫자음에 대하여 강건한 모델을 작성하기 위하여 음성 특징 파라미터와 음성학적 규칙을 적용하고 실험을 통하여 그 유효성을 확인하고자 한다. 이를 위하여 음성자료로는 국어공학센터(KLE)에서 채록한 4연속 숫자음을 사용하며 인식의 기본단위로서는 음성학적 규칙을 적용한 19개의 연속분포 HMM을 유사음소 단위(PLUs)로 사용한다. 또한, 인식실험에 있어서는 일반적인 멜 켑스트럽과 회귀계수를 이용한 경우와 음성학적 규칙과 특징을 확장하여 모델을 작성한 경우에 대해서 유한상태 오토마타(Finite State Automata ; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming) 법으로 인식실험을 수행하여 그 결과를 비교 검토하였다. 그 결과, 멜 켑스트럼만을 사용한 경우 55.4%, 멜 켑스트럼과 회귀계수를 사용한 경우에는 64.6%, 특징 파라미터를 확장한 경우 74.3%, 음성학적 특징까지 고려한 경우 75.4%로 기존의 경우보다 높은 인식률을 보였다. 따라서, 음성 특징 파라미터를 확장하고 음성학적 규칙까지 함께 적용한 경우 비교적 높은 인식률을 보여 제안된 방법이 연속 숫자음 인식에 유효함을 확인하였다.

  • PDF