• Title/Summary/Keyword: 켑스트럼

Search Result 163, Processing Time 0.022 seconds

Channel Compensation for Cepstrum-Based Detection of Laryngeal Diseases (켑스트럼 기반의 후두암 감별을 위한 채널보상)

  • Kim Young Kuk;Kim Su Mi;Kim Hyung Soon;Wang Soo Geun;Jo Cheol Woo;Yang Byung Gon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.49-52
    • /
    • 2004
  • 본 논문에서는 켑스트럼 기반의 후두질환 음성의 자동감별시, 훈련 및 테스트 마이크 불일치로 인한 채널 왜곡을 보상하기 위한 방법에 대해 연구를 하였다. 특징벡터 영역에서의 채널보상 방법으로 기존의 Cepstral Mean Subtraction (CMS) 방법과 Pole Filtering CMS (FPCMS) 방법을 이용하였다 실험결과 FPCMS를 적용한 경우 기존의 CMS에 비해 우수한 성능을 보이고, $40\%$의 인식 오류 감소를 얻었다.

  • PDF

Robust Speaker Recognition using Independent Component Analysis (독립성분분석을 이용한 강인한 화자인식)

  • 장길진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

On the Classification of Normal, Benign, Malignant Speech Using Neural Network and Cepstral Method (Cepstrum 방법과 신경회로망을 이용한 정상, 양성종양, 악성종양 상태의 식별에 관한 연구)

  • 조철우
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.399-402
    • /
    • 1998
  • 본 논문에서는 환자의 음성을 정상, 양성종양, 악성종양으로 분류하는 실험을 켑스트럼 파라미터를 통한 음원분리와 신경회로망을 이용하여 수행하고 그 결과를 보고한다. 기존의 장애음성 데이터베이스에는 정상음성과 양성종양의 경우만 수록되어 있었고 외국의 환자들을 대상으로 한 경우만 있었기 때문에 국내의 환자들에게 직접 적용할 경우 어떠한 결과가 나올지 예측하기가 어려웠다. 최근 부산대학교 이비인후과팀에서 수집한 국내의 정상, 양성, 악성종양의 경우에 대한 데이터베이스를 분석하고 신경회로망에 의해 분류함으로써 사람의 음성신호만에 의한 후두질환이 식별이 가능하였다. 본 실험에서는 식별 파라미터로 음성신호의 선형예측오차신호에 관한 켑스트럼으로부터 음원비인 HNRR을 구하여 Jitter, Shimmer와 함께 사용하였다. 신경회로망은 입, 출력 층과 한 개의 은닉층을 갖는 다층신경망을 이용하였으며, 식별은 두단계로 나누어 정상과 비정상을 분류한 후 다시 비정상을 양성과 악성으로 분류하였다[1].

  • PDF

Noise Processing for Speech Recognition in the Telephone Line (음성 인식을 위한 전화망에서의 잡음처리)

  • 전원석;신원호;양태영;김원구;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.4-8
    • /
    • 1998
  • 본 논문에서는 다양한 전화선 채널을 통하여 수집된 음성 데이터에 포함된 잡음 및 채널 왜곡을 제거하여 음성인식 시스템의 성능을 향상시키는 방법에 관하여 연구하였다. 전 화선을 통과한 음성에 포함된 채널 잡음 및 왜곡을 제거하는 방법으로는 음성신호를 보상하 는 방법으로 CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)과 SM(Stochastic Matching)의 성능을 비교 평가하였다. 잡음제거 방식의 성능을 평가를 위하 여 음소 단위의 반연속 HMM을 이용한 화자독립 단독음 인식을 수행하였다. 인식 실험 결 과, 멜 켑스트럼을 사용한 경우에 CMS가 가장 우수한 성능을 내었고 다음으로 SM과 SBR 순으로 나타났다. 또한 특징벡터를 주변 잡음에 강인하게 하는 가중함수(RPS, BPL)를 사용 한 켑스트럼 계수와 잡음제거 방식을 함께 사용한 경우에 인식 성능이 더욱 향상되었다.

  • PDF

Faults Detection in Hub Bearing with Minimum Variance Cepstrum (최소 분산 켑스트럼을 이용한 자동차 허브 베어링 결함 검출)

  • 박춘수;최영철;김양한;고을석
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 2004.05a
    • /
    • pp.593-596
    • /
    • 2004
  • Hub bearings not only sustain the body of a car, but permit wheels to rotate freely. Excessive radial or axial load and many other reasons can cause defects to be created and grown in each component. Therefore, vibration and noise from unwanted defects in outer-race, inner-race or ball elements of a Hub bearing are what we want to detect as early as possible. How early we can detect the faults has to do with how the detection algorithm finds the fault information from measured signal. Fortunately, the bearing signal has periodic impulse train. This information allows us to find the faults regardless how much noise contaminates the signal. This paper shows the basic signal processing idea and experimental results that demonstrate how good the method is.

  • PDF

On Codebook Fesign to Improve Speaker Adaptation (화자 적응 성능 향상을 위한 코드북 설계)

  • 양태영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.228-231
    • /
    • 1995
  • 반연속 HMM 음성인식 시스템의 화자 적응 성능 향상을 위해 코드북 변환 알고리즘을 제안하였다. 기존의 화자 적응 알고리즘으로는 새로운 화자의 적응 데이터 특징의 분포와 HMM 모수의 사전밀도를 함께 고려하는 베이시안 화자적응 알고리즘이 있다. 그러나 새로운 화자의 특징분포와 코드북 사전 밀도의 차이가 큰 경우 적응 데이터와 코드북간의 잘못된 대응 관계를 얻을 수 있으며, 기준 코드북에 필요 이상으로 많은 코드워드가 존재하는 경우 적응된 코드북에도 불필요한 코드워드 들이 남아 인식 과정에 혼란을 줄 수 있다. 이 문제점을 해결하기 위하여 제안된 코드북 변환 알고리즘에서는 주파수 영역의 포만트 정보를 이용하였다. 화자 적응을 수행하기 앞서 코드북의 켑스트럼으로부터 포만트를 추출해 내고, 이들의 분포를 적응 화자의 포만트 분포와 일치되도록 변환시켜 주었다. 이 변환된 포만트들로부터 다시 켑스트럼을 구하여 변환된 코드북을 얻고 이를 화자 적응의 초기 코드북으로 사용하였다. 제안된 알고리즘을 이용하였을 경우 코드북과 적응 화자의 음성 간의 정확한 대응관계를 찾을 수 있었고, 불필요한 코드워드들이 인식 과정에서 사용되지 않도록 변환되어 인식률이 향상되는 것을 실험을 통해 확인하였다.

  • PDF

Emotion Recognition using Speech Recognition Information (음성 인식 정보를 사용한 감정 인식)

  • Kim, Won-Gu
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.425-428
    • /
    • 2008
  • 본 논문은 음성을 사용한 인간의 감정 인식 시스템의 성능을 향상시키기 위하여 감정 변화에 강인한 음성 인식 시스템과 결합된 감정 인식 시스템에 관하여 연구하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 인식 시스템의 성능에 미치는 영향에 관한 연구와 감정 변화의 영향을 적게 받는 음성 인식 시스템을 구현하였다. 감정 인식은 음성 인식의 결과에 따라 입력 문장에 대한 각각의 감정 모델을 비교하여 입력 음성에 대한 최종 감정 인식을 수행한다. 실험 결과에서 강인한 음성 인식 시스템은 음성 파라메터로 RASTA 멜 켑스트럼과 델타 켑스트럼을 사용하고 신호편의 제거 방법으로 CMS를 사용한 HMM 기반의 화자독립 단어 인식기를 사용하였다. 이러한 음성 인식기와 결합된 감정 인식을 수행한 결과 감정 인식기만을 사용한 경우보다 좋은 성능을 나타내었다.

  • PDF

Snorer-Dependent Snore Recognition Using LPC Cepstral Coefficients (LPC 켑스트럼 계수를 이용한 특정인의 코골이 인식)

  • 최호선;장원규;이경중
    • The Transactions of the Korean Institute of Electrical Engineers D
    • /
    • v.52 no.9
    • /
    • pp.554-559
    • /
    • 2003
  • In this paper the possibility of snorer-dependent snore recognition using cepstral coefficients was suggested. We assumed that snore and speech sounds have some similarities and we used cepstral coefficients which are widely used for speech recognition. Snoring data were acquired from 18 persons including 5 patients diagnosed as snore patient. To evaluate the performance of proposed method, the distance ratio based on LPC cepstral coefficients was selected as an index for snorer-dependent snore recognition. As a result, distance ratio of 3 was selected as optimal value showing the most efficient snorer-dependent snore recognition, which is high accuracy of 95.05% on average. In conclusion, the proposed method showed the possibilities to be applied in clinical applications for snorer-dependent snore recognition.

Performance Comparison by Characteristic Parameter of Speaker Identification System using Neural Networks (신경회로망을 이용한 화자식별 시스템의 특징 파라미터에 따른 성능비교)

  • 정재룡;유재훈;배현;전병희;김성신
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.345-348
    • /
    • 2002
  • 음성인식 기술은 크게 음성인식과 화자인식 기술의 두 가지로 분류된다. 현재는 음성인식 기술이 널리 연구되고 있지만 점차 화자인식 기술의 중요성이 대두되고 있다. 본 논문에서는 화자인식 기술의 한 가지 분류로 임의 화자를 식별하기 위한 화자식별 기술을 연구 대상으로 하고 있으며, 신경회로망을 이용한 화자식별 시스템의 특징 추출 방법을 제시하고 그에 따른 성능을 비교하고 있다. 식별 단계에서 26명의 78개의 음성 샘플을 신경회로망의 역전파 알고리듬을 이용하여 학습하고, 테스트용으로 한 화자의 음성샘플이 사용되어 식별된다. 신경회로망의 입력 변수는 특징 파라미터로 선형예측계수, Mel-주파수 켑스트럼계수와 웨이블릿을 이용한 켑스트럼 계수를 사용하였다. 그 결과로써 화자식별 시스템의 신경회로망 모델2의 입력으로 혼합된 특징 파라미터를 사용한 경우가 다른 파라미터들을 사용한 경우와 비교하여 8.46~21.53%의 차를 가지고 가장 좋은 성능을 나타내었다.