• 제목/요약/키워드: Perceptual signal analysis

검색결과 21건 처리시간 0.028초

Perturbation and Perceptual Analysis of Pathological Sustained Vowels according to Signal Typing

  • 이지연;최성희;;한민수;최홍식
    • 말소리와 음성과학
    • /
    • 제2권2호
    • /
    • pp.109-115
    • /
    • 2010
  • In this paper, we investigate a signal typing on the basis of visual impression of distinctive spectrogram. Pathological voices are classified into signal type 1, 2, 3, or 4 to estimate perturbation parameters and to mark perceptual rating based on Consensus Auditory-Perceptual Evaluation of Voice (CAPE-V). The results suggest that perturbation analysis can be applied to only type 1 and 2 signals and the perceptual ratings of overall grade increase with each signal type, overall. A good inter-rater reliability is showed among three raters. We recommend that pathological voices should be marked the signal typing and CAPE-V, together, to definitely describe the characteristics of pathological voices.

  • PDF

지각형 컨벌루션 잡음 제어를 통한 음질 개선 방법 (Signal Quality Enhancement using Perceptual Convolutional Noise Suppression)

  • 김헌중;한헌수;홍민철;차형태
    • 방송공학회논문지
    • /
    • 제8권1호
    • /
    • pp.11-18
    • /
    • 2003
  • 본 논문에서는 잡음 에너지에 의한 지각적 간섭현상 해석을 통한 지각적 컨벌루션 잡음 제어에 의한 음질 개선 방법을 연구하였다. 지각적 컨벌루션 잡음은 잡음에 의한 신호의 지각적인 특성 변화 및 잡음 추정오차에 의한 잔여 잡음의 영향을 반영하는 것이다. 실험 결과 임계대역 여기 에너지를 통한 지각적 부가 잡음 제어 필터와 순음도 변화도를 통한 지각적 컨벌루션 잡음 제어 필터가 대등한 음질 개선 성능을 나타내었으며, 다양한 잡음 환경에서도 우수한 음질 개선을 나타냄을 확인 할 수 있었다.

음성 신호 분류에 따른 장애 음성의 변동률 분석, 비선형 동적 분석, 캡스트럼 분석의 유용성 (The Utility of Perturbation, Non-linear dynamic, and Cepstrum measures of dysphonia according to Signal Typing)

  • 최성희;최철희
    • 말소리와 음성과학
    • /
    • 제6권3호
    • /
    • pp.63-72
    • /
    • 2014
  • The current study assessed the utility of acoustic analyses the most commonly used in routine clinical voice assessment including perturbation, nonlinear dynamic analysis, and Spectral/Cepstrum analysis based on signal typing of dysphonic voices and investigated their applicability of clinical acoustic analysis methods. A total of 70 dysphonic voice samples were classified with signal typing using narrowband spectrogram. Traditional parameters of %jitter, %shimmer, and signal-to-noise ratio were calculated for the signals using TF32 and correlation dimension(D2) of nonlinear dynamic parameter and spectral/cepstral measures including mean CPP, CPP_sd, CPPf0, CPPf0_sd, L/H ratio, and L/H ratio_sd were also calculated with ADSV(Analysis of Dysphonia in Speech and VoiceTM). Auditory perceptual analysis was performed by two blinded speech-language pathologists with GRBAS. The results showed that nearly periodic Type 1 signals were all functional dysphonia and Type 4 signals were comprised of neurogenic and organic voice disorders. Only Type 1 voice signals were reliable for perturbation analysis in this study. Significant signal typing-related differences were found in all acoustic and auditory-perceptual measures. SNR, CPP, L/H ratio values for Type 4 were significantly lower than those of other voice signals and significant higher %jitter, %shimmer were observed in Type 4 voice signals(p<.001). Additionally, with increase of signal type, D2 values significantly increased and more complex and nonlinear patterns were represented. Nevertheless, voice signals with highly noise component associated with breathiness were not able to obtain D2. In particular, CPP, was highly sensitive with voice quality 'G', 'R', 'B' than any other acoustic measures. Thus, Spectral and cepstral analyses may be applied for more severe dysphonic voices such as Type 4 signals and CPP can be more accurate and predictive acoustic marker in measuring voice quality and severity in dysphonia.

독립 성분 분석과 지각 필터를 이용한 음질 개선 (Performance Improvement of Speech Enhancement Using Independent Component Analysis and Perceptual Filtering)

  • 구교식;차형태
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.270-277
    • /
    • 2010
  • 본 논문에서는 독립 성분 분석 기법과 적응 지각 필터를 이용하여 잡음에 오염된 신호에서 잡음을 추정 및 제거함으로서 보다 효율적으로 오디오 신호를 개선하는 방법에 대해 제안한다. 기존의 적응 지각 필터는 묵음 구간에서 추정된 고정적인 추정 잡음을 사용하기 때문에 잡음이 시간에 따라 가변적일 경우 성능이 상당히 저하된다. 그러나 제안된 알고리즘은 독립 성분 분석 기법을 이용하여 신호 구간마다 달라지는 잡음을 추정한 후 이를 적응 지각 필터에 적용시켜 준다. 제안된 알고리즘의 성능 분석을 위하여 기존 및 제안된 알고리즘을 이용한 시뮬레이션을 수행하였으며, 그 결과로 제안된 알고리즘은 기존의 알고리즘에 비해 향상된 결과를 생성하였다. 더불어 음질의 열화도 적음을 확인할 수 있었다.

신호 대 마스킹 비 개선을 통한 다채널 보청 알고리즘 (A Novel Multi-Channel Hearing Aid Algorithm with SMR(signal-to-masking ratio) Improvement)

  • 김헌중;홍민철;차형태
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.12-21
    • /
    • 2000
  • 본 논문에서는 심리음향 (psychoacoustics)을 이용한 다채널 동적 음향 압축 알고리즘을 통해 감음신경성 난청 (sensorinural hearing loss)을 보정하여 정상적인 지각 환경을 제공하는 알고리즘을 제안한다. 제안된 알고리즘은 라우드니스 조정 함수 (loudness scaling function)를 통해 난청자에게 적합한 라우드니스 레벨을 보상 시켜 주고, 난청자가 인식하게 되는 신호에 대한 마스킹 특성을 해석하여, 지각 영역 (perceptual domain)에서 각각의 주파수 성분에 대한 음압 레벨과 마스킹 임계치 (masking threshold) 사이의 거리로 정의되어지는 SMR(signal-to-masking ratio)을 통해 주파수 대비 (spectral contrast)를 복원 시켜 줌으로써 정상적인 지각 환경을 제공하는 것이다.

  • PDF

스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법 (Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation)

  • 최재훈;장준혁;김남수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.222-228
    • /
    • 2010
  • 본 논문에서는 비정상적인 배경 잡음 환경에서 음성향상을 위한 신호의 스펙트럼 변이 (Spectral Deviation)을 적용한 Soft Decision 기반의 잡음전력 수정 기법을 제안한다. 기존의 Soft Decision 기반의 잡음전력 추정에 있어서 잡음신호의 정상성(Stationarity)을 가정한 스무딩 파라미터를 사용하여 잡음전력을 추정하고 갱신하였지만, 잡음신호의 주파수적인 특성이 상대적으로 빠르게 변하는 비정상적인 환경에서는 강인하지 못한 단점을 가지게 된다. 본 논문에서는 신호의 스펙트럼 변이를 추정하여 정상적인 잡음 환경과 비정상적인 잡음 환경에 따라 적응적으로 잡음전력을 추정하고 갱신하여 잡음신호에 의해 오염된 음성신호를 향상시킨다. 제안된 알고리즘은 다양한 배경 잡음 환경에서 객관적인 음질측정 방법인 ITU-T P.862 perceptual evaluation of speech quality (PESQ)에 의해서 평가되었으며, 기존의 Soft Decision 기반의 음성 향상 기법과 비교하여 보다 향상된 성능을 보여주었다.

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

잡음에 열화된 오디오 신호의 분석을 통한 효율적인 적응지각필터 반복 수행 계수의 예측 (Prediction of Efficient Adaptive Perceptual Filter Iterate Coefficient through Analysis of Noisy Signal)

  • 류일현;차형태;구교식;서보국
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.238-241
    • /
    • 2005
  • 디지털 미디어 기술의 발전은 코딩 분야를 비롯하여 다양하게 발전하고 있다. 특히 오디오 신호 처리 분야에서는 디지털 오디오 신호의 생성, 압축, 복원의 단계가 다양한 형태로 개발되고 있다. 오디오 신호 처리에서 인간의 청각 기관을 모델링한 심리음향 기법은 이용하여 압축뿐만 아니라 잡음 신호의 개선에서도 효과적으로 이용되고 있다. 이러한 심리음향모델을 기반으로 하여 구성된 적응지각필터는 지각필터를 이용하여 적응적으로 잡음에 열화된 신호를 개선한다. 이때, 적응지각필터 반복 수행 계수의 효과적인 결절은 오디오 신호의 청각적 손실을 줄이는 동시에 정확한 잡음 제거를 수행한다. 성능을 확인하기 위해서 SNR 및 NMR 비교를 수행하였다.

  • PDF

인지에 중요한 음향신호의 위상에 대해 (On the Perceptually Important Phase Information in Acoustic Signal)

    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.28-33
    • /
    • 2000
  • 음성 신호의 효과적인 양자화를 위해서 인간의 청각 인지 특성을 이용하는 방법이 널리 사용되고 있다. 그러나 아직까지는 음성 스펙트럼의 크기 정보에 대한 인지 특성만을 이용하고 있을 뿐, 음성의 위상 정보는 그 중요성에 비해 간과되어 온 것이 사실이다. 본 논문에서는, 음향 신호로부터 청각 인지 측면에서 관련 없는 위상 성분을 추정하는 PIPE(Perceptually Irrelevant Phase Elimination) 방법을 제안하였다. 제안된 방법은 청각 특성이 critical band 대역 내의 상대적인 위상 관계에 민감하다는 관측 결과에 근거하여, 일반적인 stationary 푸리에(Fourier) 신호와 고조파(harmonic) 신호에 대해 각각 인지 측면에서 관련 없는 위상을 판별하는 방법을 제공한다. 제안된 방법을 음성 분석-합성(analysis / synthesis) 시스템에 적용함으로써 일부 위상 정보만을 이용해 음성을 복원하였으며, 청취 실험 결과 제안된 방법의 효율성을 알 수 있었다.

  • PDF

웨이블렛 기반 바크 코히어런스 함수를 이용한 VoIP 음질평가 (Speech Quality Measure for VoIP Using Wavelet Based Bark Coherence Function)

  • 박상욱;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제27권4A호
    • /
    • pp.310-315
    • /
    • 2002
  • 본 논문은 객관적 음질 평가법으로 웨이블렛 변환을 이용한 향상된 바크 코히어런스 함수 (Wavelet based Bark Coherence Function : WBCF)를 제안한다. 바크 코히어런스 함수 (Bark Coherence Function : BCF)는 심리 음향 영역에서 코히어런스 함수를 정의함으로서 음성 통신 시스템의 아날로그 부분에 의하여 발생할 수 있는 선형 왜곡에 강한 객관적 음질 평가법이다. VoIP (Voice over Internet Protocol)와 같은 패킷 기반의 음성 전달 시스템은 가변 지연등이 발생 될 수 있는데, 이것은 원음과 왜곡음의 정확한 시간축 정렬을 불가능하게 하여 기존의 객관적 음질 평가법의 성능을 저하시킨다. 제안된 WBCF는 고주파 영역에서 시간 분해능이 높으며, 저주파 영역에서 주파수 분해능이 높은 웨이블렛 변환을 사용한 후 BCF를 계산하여 VoIP 시스템에서의 객관적 음질을 평가한다. 주/객관적 음질 평가 실험을 통하여 WBCF가 ITU-T 권고안인 Perceptual Speech Quality Measure (PSQM)에 비하여 높은 성능을 가짐을 확인하였다.