• 제목/요약/키워드: 켑스트럼

검색결과 163건 처리시간 0.02초

하이브리드 시스템을 이용한 화자인식에 관한 연구 (A Study on the Speaker Recognition using the Hybrid System)

  • 강현규
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.119-122
    • /
    • 1998
  • 본 논문은 MLP, HMM, DTW가 결합된 하이브리드 시스템을 기반으로한 화자인식시스템에 대한 연구이다. 이미 시스템에 등록되어 있는 화자의 인식과 비등록 화자의 등록된 화자 키워드 도용에 대한 시스템 거부, 그리고 등록된 화자의 다른 등록 화자에 대한 키워드 도용에 따른 시스템 거부에 관하여 검토하였다. 키워드는 화자의 이름을 사용하였고, 시스템에 사용된 특징 파라메터는 15차 켑스트럼, 10차 LSF, 10개 대역으로 나뉘어진 주파수 대역별 에너지값(10차 FB)을 사용하였다. 이 세 가지의 특징 파라메터들과 세 개의 인식기를 조합, 모두 아홉 개의 인식 결과값을 누적하여 인식 여부를 결정하도록 하였다. 개별적 시스템에서 발생되는 오인식을 Hybrid model을 이용하여 처리한 본 시스템에서는 실험대상 화자에 대하여 100%의 시스템 신뢰도를 얻었다.

  • PDF

시간-주파수 혼성 피치검출기의 성능개선에 관한 연구 (A Study On a Pitch Detection in Time-Frequency Hybrid Domain)

  • 조왕래;김종국;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.107-110
    • /
    • 2004
  • 본 논문에서는 시간-주파수 혼성 영역 피치 검출법을 제안하였다. 음성신호를 주파수 영역으로 변환하고 주파수 영역에서 위상 성분을 조절하여 시간영역으로 역변환 함으로써 피치 피크가 최대가 되도록 하여 용이한 피치검출이 가능하였다. 또한 처리시간을 단축하기 위하여 FFT와 IFFT의 비트 재정렬을 생략하여 처리할 수 있는 방법을 제안하였다. 성능 측정 결과 기존의 켑스트럼 검출법에 비하여 검출성능은 우수하면서도 처리시간은 $84.8\%$로 단축됨을 알 수 있었다.

  • PDF

피치계수를 이용한 화자인식에 관한 연구 (A study on the Speaker Recognition using the Pitch)

  • 김에녹
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권4호
    • /
    • pp.471-480
    • /
    • 2001
  • 본 연구에서는 적응 공명 이론(ART2) 모델을 이용하여 화자인식 실험을 수행하였으며, 모을 검출을 통하여 미리 등록된 단어가 아닌 경우에도 화자를 인식할 수 있도록 특징 파라메터를 개발하였다. 실험을 위해 0에서 9까지의 숫자 음을 남성화자와 여성화자 각각 5명씩 발음하여 사용하였으며, 이들 음성 데이터로부터 모음을 추출한 다음 얻어진 피치 계수, 선형예측 계수, 선형예측 켑스트럼 계수를 신경망의 입력 패턴으로 입력시켜 인식 성능을 측정하였다. 실험 결과 피치를 사용하는 것이 텍스트-의존, 텍스트-독립 화자인식 모두에서 다른 계수들을 사용하는 것보다 우수한 성능을 보이고 있다.

  • PDF

켑스트럼 거리 기반의 음성/음악 판별 성능 향상 (Performance Improvement of Speech/Music Discrimination Based on Cepstral Distance)

  • 박슬한;최무열;김형순
    • 대한음성학회지:말소리
    • /
    • 제56호
    • /
    • pp.195-206
    • /
    • 2005
  • Discrimination between speech and music is important in many multimedia applications. In this paper, focusing on the spectral change characteristics of speech and music, we propose a new method of speech/music discrimination based on cepstral distance. Instead of using cepstral distance between the frames with fixed interval, the minimum of cepstral distances among neighbor frames is employed to increase discriminability between fast changing music and speech. And, to prevent misclassification of speech segments including short pause into music, short pause segments are excluded from computing cepstral distance. The experimental results show that proposed method yields the error rate reduction of$68\%$, in comparison with the conventional approach using cepstral distance.

  • PDF

음성 스펙트럼 분석에 의한 한국어 단모음 실시간 인식 (Real-Time Recognition of the Korean Spingle Vowels Using the Speech Spectrum Anaysis)

  • 김엄준;성미영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.226-231
    • /
    • 1998
  • 본 연구에서는 짧은 시간에 계산이 가능하며, 음성을 특징 지울 수 있는 파라미터로서 영 교차율(zero crossing rate), 단 구간 에너지(short-term, energy) 그리고 포만트(formant)를 사용하였다. 특정 화자의 음성을 입력 받아서 단모음인 'ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ, ㅡ. ㅣ'에 대한 인식을 위해 위의 세가지 파라미터를 측정하였다. 영 교차율과 단 구간 에너지 파라미터는 유성음과 무성음의 구별과 음성인지 아닌지를 판별하는데 사용하였다. 포만트 파라미터는 10차 켑스트럼(cepstrum)을 이용하여 구하였으며, 각 단모음을 판별하기 위해서 사용하였다. 하나의 단모음을 입력받아 처리하여 텍스트로 출력하는데 평균 0.065sec에 처리하며, 각각의 단모음에 대해 93%, 10개의 테스트 문장에 대해 72%의 인식률을 보이고 있다.

  • PDF

묵음 구간의 평균 켑스트럼 차감법을 이용한 채널 보상 기법 (Channel Compensation technique using silence cepstral mean subtraction)

  • 우승옥;윤영선
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 춘계 학술대회 발표논문집
    • /
    • pp.49-52
    • /
    • 2005
  • Cepstral Mean Subtraction (CMS) makes effectively compensation for a channel distortion, but there are some shortcomings such as distortions of feature parameters, waiting for the whole speech sentence. By assuming that the silence parts have the channel characteristics, we consider the channel normalization using subtraction of cepstral means which are only obtained in the silence areas. If the considered techniques are successfully used for the channel compensation, the proposed method can be used for real time processing environments or time important areas. In the experiment result, however, the performance of our method is not good as CMS technique. From the analysis of the results, we found potentiality of the proposed method and will try to find the technique reducing the gap between CMS and ours method.

  • PDF

영교차점과 켑스트럼 전처리 기술을 이용한 반향환경에서의 음원방향 추정 (Zero-Crossing-Based Source Direction Estimation Using a Cepstral Prefiltering Technique)

  • 박용진;이수연;박형민
    • 대한음성학회지:말소리
    • /
    • 제67호
    • /
    • pp.121-133
    • /
    • 2008
  • To estimate directions of multi-sound sources, we consider an approach based on zero crossings which provided more robust results to diffuse noise than the conventional cross-correlation-based method [6][7]. In reverberant environments, the performance of source direction estimation can be improved by using signal components through direct paths from sources to microphones. Since a cepstral prefiltering technique [8] removes the effect of reverberation, we propose a source direction estimation method which can find out intervals of the direct-path components by comparing original and cepstral-prefiltered envelopes. Simulations demonstrate that the proposed method can improve the performance of source direction estimation in reverberant environments.

  • PDF

수평식 입체영상 카메라의 자동 주시각 제어 연구 (Study on Automatic Vergence Control of Horizontal-Moving Axis Stereo Camera)

  • 이용범;권기철;윤종건;최영수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.1067-1070
    • /
    • 1999
  • 본 논문에서는 수평식 입체영상카메라의 주시각 자동제어를 위한 고속, 고정밀 시차추출 알고리즘을 제안한다. 제안된 알고리듬은 수평식 입체영상 카메라의 초점과 주시각의 선형적 관계에 따라 사람의 눈에서와 같은 자연스럽고도 선명한 입체영상을 획득할 수 있도록 주시각 및 초점제어를 동시에 자동 제어하며, 입체영상에 포함되어 있는 평면 및 상하 불일치 영역을 최소화하기 위한 전처리 과정과 고속, 고정밀 시차추출을 위한 프로젝션 및 켑스트럼(Cepstrum) 필터링 과정이 포함되어 있다. 제안된 알고리듬은 수평식 입체카메라의 실시간 제어를 가능하게 하며 카메라 조작자의 초점 및 주시각 제어에 대한 부담을 줄여 준다.

  • PDF

잡음 속에 묻힌 충격 소음원 위치 추정 (Impact Noise Source Localization in Noise)

  • 최영철;김양한
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 춘계학술대회논문집
    • /
    • pp.774-779
    • /
    • 2004
  • This paper addresses the way in which we can find where impact noise sources are. Specifically, we have an interest in the case that the signal is embedded in noise. We propose a signal processing method that can identify impulsive sources’location. The method is robust with respect to noise; spatially distributed noise. This has been achieved by a beamforming method with regard to cepstrum domain is used. It is noteworthy that the cepstrum has the ability to detect periodic pulse signal in noise. Numerical simulation and experiments are performed to verify the method. Results show that the proposed technique is quite powerful for localizing the faults in noisy environments. The method also required less microphones than conventional beamforming method.

  • PDF

공작기계의 채터진동에 대한 켑스트럼 분석 (Cepstrum analysis on the chatter vibration generated by the machine tool)

  • 김명구;최봉학;이흥식;조종두
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 춘계학술대회논문집
    • /
    • pp.77-82
    • /
    • 2004
  • There were many researches about the chatter vibration occur in the cutting process of machine tools. But there are in sufficient research parts ; the frequency about the chatter vibration and its characteristics and its nonlinear properties. This paper measured signals of vibration that occur before and immediately after and after the chatter vibration. This signals were analyzed through autospectrum obtained by the Fast Fourier Transform(FFT). And then, the nonlinear characteristis were analyzed by cepstrum analysis through FFT of autospectrun.

  • PDF