• 제목/요약/키워드: Cepstrum Analysis

검색결과 91건 처리시간 0.022초

한국어 음소분리에 관한 연구 (A Study on the Phonemic Analysis for Korean Speech Segmentation)

  • Lee, Sou-Kil;Song, Jeong-Young
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권4E호
    • /
    • pp.134-139
    • /
    • 2004
  • It is generally known that accurate segmentation is very necessary for both an individual word and continuous utterances in speech recognition. It is also commonly known that techniques are now being developed to classify the voiced and the unvoiced, also classifying the plosives and the fricatives. The method for accurate recognition of the phonemes isn't yet scientifically established. Therefore, in this study we analyze the Korean language, using the classification of 'Hunminjeongeum' and contemporary phonetics, with the frequency band, Mel band and Mel Cepstrum, we extract notable features of the phonemes from Korean speech and segment speech by the unit of the phonemes to normalize them. Finally, through the analysis and verification, we intend to set up Phonemic Segmentation System that will make us able to adapt it to both an individual word and continuous utterances.

A NEW METHOD FOR NORTH-SOUTH ASYMMETRY OF SUN SPOT AREA ANALYSIS

  • Chang, Heon-Young
    • Journal of Astronomy and Space Sciences
    • /
    • 제24권4호
    • /
    • pp.261-268
    • /
    • 2007
  • We have studied the temporal variation in the North-South asymmetry of the sunspot area during the period from 1874 to 2007. Though the 9-year periodicity is commonly reported, shorter periodicities is still under study. We employ the cepstrum analysis method to analyze the noisy power spectrum of the North-South asymmetry. We demonstrate that the cleaned power spectrum shows reduction of the spurious back-ground noise level. Some of short period peaks in the power spectrum disappear after deconvolution. It should be, however, pointed out that power spectrum might look less noisy because of a filtering process during deconvolution. We conclude by pointing out that a more sophisticate filtering algorithm is required to produce a precise and reliable periodicity estimate.

DHMM과 어휘해석을 이용한 Voice dialing 시스템 (The Voice Dialing System Using Dynamic Hidden Markov Models and Lexical Analysis)

  • 최성호;이강성;김순협
    • 전자공학회논문지B
    • /
    • 제28B권7호
    • /
    • pp.548-556
    • /
    • 1991
  • In this paper, Korean spoken continuous digits are ercognized using DHMM(Dynamic Hidden Markov Model) and lexical analysis to provide the base of developing voice dialing system. After segmentation by phoneme unit, it is recognized. This system can be divided into the segmentation section, the design of standard speech section, the recognition section, and the lexical analysis section. In the segmentation section, it is segmented using the ZCR, O order LPC cepstrum, and Ai, parameter of voice speech dectaction, which is changed according to time. In the standard speech design section, 19 phonemes or syllables are trained by DHMM and designed as a standard speech. In the recognition section, phomeme stream are recognized by the Viterbi algorithm.In the lexical decoder section, finally recognized continuous digits are outputed. This experiment shiwed the recognition rate of 85.1% using data spoken 7 times of 21 classes of 7 continuous digits which are combinated all of the occurence, spoken by 10 man.

  • PDF

Analysis- By-Synthesis/OverLap- Add( ABS/OLA) Sinusoidal Model 을 이용한 음성변환과 연결음성합성 (Speech Modification and Concatenative Speech Synthesis by using Analysis-By-Synthesis/OverLap-Add(ABS/OLA) Sinusoidal Model)

  • 구자형
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.339-343
    • /
    • 1998
  • Sinusoidal model 은 음성신호처리의 넓은 분야에 적용되고 있는 방법으로 고음질의 합성음을 생성해 낼 수 있고, 조작이 용이하다는 장점을 가지고 있다. 본 논문에서는 Analysis-by-synthesis/Overlap-add Sinusoidal model 이라는 방법을 이용하여 시간축 변환과 dam성 변환을 수행하였다. 특히 본 논문에서는 음질향상을 위하여 시간축 변환시에는 정적인 구간과 변화하는 구간을 구별하여 서로 다른 시간축 변환비를 이용하였고, 기존의 LPC 방법에 비해 스펙트럼 포락선을 보다 잘 추정하는 Improved Cepstrum을 이용하여 음정변환에 적용하였다. 또 서로 다른 문맥에서 얻어진 음성단위들을 결합할 때 생기는 위상차이를 극복하기 위하여, 기본주파수 성분이 일치하도록 시간축을 이동하여 합성하였다. 실험결과 본 논문에서 적용한 방법들을 통해 기존 방식에 비해 개선된 음질을 얻을 수 있었다.

  • PDF

움직임 열화 현상이 발생한 영상의 분석과 파라메터 추출 (Analysis and parameter extraction of motion blurred image)

  • 최지웅;최병철;강문기
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1953-1962
    • /
    • 1999
  • 영상을 획득하는 과정에 있어서 영상획득 장치 또는 피사체의 흔들림은 영상에 손상을 가져온다. 이러한 손상은 움직임 열화(motion blur)라 불리며, 영상의 선명도를 크게 떨어뜨리는 주된 원인이 된다. 본 논문에서는 움직임 열화의 각도와 길이를 알아내기 위한 새로운 함수가 정의되며, 이 함수의 영역(domian)인 극점자취(Peak-Trace) 영역으로 가는 과정에서는 노이즈의 분산을 산출해 내기 위한 노이즈 지배영역과, 움직임 열화의 각도와 길이를 추정해내기 위한 신호 지배영역이 설정된다. 신호지배 영역에서의 극점의 자취는 움직임 열화의 방향을, 노이즈에 강하면서도 빠르게 파악할 수 있도록 해주며, 가변가중치(weight)를 적용한 최소자승법(Least Mean Square)은 더욱 정밀한 극점의 자취추정을 가능하게 한다. 움직임 열화의 방향이 얻어지면, 1차원 셉스트럼(Cepstrum)방법을 사용하여 고속으로 움직임 열화의 길이를 구할 수 있게 된다. 이러한 방법으로 얻어진 정보들을 이용하여, 실제 실험에 적용된 손상되어진 영상을 효과적으로 복원할 수 있었다.

  • PDF

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제8권5호
    • /
    • pp.13-17
    • /
    • 2017
  • 음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.

한국어 음성인식에서 음성의 특성을 고려한 음소 경계 검출 (Phoneme Segmentation in Consideration of Speech feature in Korean Speech Recognition)

  • 서영완;송점동;이정현
    • 인터넷정보학회논문지
    • /
    • 제2권1호
    • /
    • pp.31-38
    • /
    • 2001
  • 음소 단위로 구축된 음성 데이터는 음성인식과 음성합성 및 분석 등의 분야에서 매우 중요한 문제이다. 일반적으로 음소는 유성음과 무성음으로 구분된다. 이러한 유성음과 무성음은 많은 특징적 차이가 있지만, 기존의 음소 경계 검출 알고리즘은 이를 고려하지 않고 시간 축을 기준으로 이전 프레임과의 스펙트럼 비교만을 통하여 음소의 경계를 결정한다. 본 논문에서는 음소 경계 검출을 위하여 유성음과 무성음의 특징적 차이를 고려한 블록기반의 분류 알고리즘을 설계하였다. 분류 알고리즘을 사용하기 위한 스펙트럼 비교 방법은 MFCC(kel-Frequency Cepstrum Coefficient)를 기반으로 한 거리 측정 법을 사용하였고 유성음과 무성음의 구분은 에너지 영 교차율, 스펙트럼 비, 포만트 주파수를 이용하였다. 본 논문의 실험결과 3-4음절 고립단어를 대상으로 약 7%,의 정확도를 얻음으로써 기존의 음소 경계 검출 시스템보다 약 8%의 정확도 향상을 보였다.

  • PDF

지면반사효과를 이용한 폭발 소음원의 위치 추정 정밀도 향상법 (An Accuracy Improvement Method on Acoustic Source Localization Using Ground Reflection Effect)

  • 고영주;최동훈;이재형;최종수;하재현;나태흠
    • 한국소음진동공학회논문집
    • /
    • 제26권1호
    • /
    • pp.69-74
    • /
    • 2016
  • A technique for improving estimation accuracy is introduced in order to locate the impact position of artillery shell during the weapon scoring test. Study on localization of impacts using acoustic measurement has been conducted and the usability of sensor array is verified with experiments. When the blast occurs above the ground in the firing range, the acoustic sensor above the ground can measure the directly propagated sound with the ground-reflected one. In this study, a method for reducing estimation error by using the reflection signal measurements based on the time difference of arrival method. Considering the reflection sound works as same as placing a virtual sensor symmetrically through the ground. This idea enables a virtual three-dimensional array configuration with a two-dimensional plane array above the ground as such. The time difference between the direct and the reflected propagations can be estimated using cepstrum analysis. Performance test has been made in the simulation experiment in the football size area.

초음파(超音波)를 이용(利用)한 박막(薄膜)두께 측정(測定)에 관(關)한 연구(硏究) (A Study on the Thickness Measurement of Thin Film by Ultrasonic Wave)

  • 한응교;이재준;김재열
    • 비파괴검사학회지
    • /
    • 제7권2호
    • /
    • pp.27-34
    • /
    • 1988
  • Recently, it is gradually raised necessity that thickness of thin film is measured accurately and managed in industrial circles and medical world. In this study, regarding to the thickness of film which is in opaque object and is beyond distance resolution capacity, thickness measurement was done by MEM-cepstrum analysis of received ultrasonic wave. In measurement results, film thickness which is beyond distance resolution capacity was measured accurately. And within thickness range that don't exist interference, thickness measurement by MEM-ceptrum analysis was impossible.

  • PDF

음향신호의 분석에 의한 후두질환의 진단에 관한 연구 (A Study on the Diagnosis of Laryngeal Diseases by Acoustic Signal Analysis)

  • 조철우;양병곤;왕수건
    • 음성과학
    • /
    • 제5권1호
    • /
    • pp.151-165
    • /
    • 1999
  • This paper describes a series of researches to diagnose vocal diseases using the statistical method and the acoustic signal analysis method. Speech materials are collected at the hospital. Using the pathological database, the basic parameters for the diagnosis are obtained. Based on the statistical characteristics of the parameters, valid parameters are chosen and those are used to diagnose the pathological speech signal. Cepstrum is used to extract parameters which represents characteristics of pathological speech. 3 layered neural network is used to train and classify pathological speech into normal, benign and malignant case.

  • PDF