• 제목/요약/키워드: Spectrum Normalization

검색결과 55건 처리시간 0.027초

고차스펙트럼의 정규화 방법과 이차 위상결합 해석 (Normalization of Higher Order Spectrum and Analysis of Quadratic Phase Coupling)

  • 이준서;김봉각;이원평;차경옥
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 1999년도 춘계학술대회 논문집
    • /
    • pp.235-239
    • /
    • 1999
  • This thesis is concerned with the development of useful engineering techniques to detect and analyze nonlinearities in mechanical systems. The methods developed are based on the concepts of higher order spectra, in particular the bispectrum. The study of higher order statistics has been dominated by work on the bispectrum. The bispectrum can be viewed as a decomposition of the third moment(skewness) of a signal over frequency and as such is blind to symmetric nonlinearities. Initially auto higher order spectra are studied in detail with particular attention being paid to normalization method. Traditional method based on the bicoherence are studied. Under certain conditions, notably narrow band signals, the above normalization method is shown to fail and so a new technique based on prewhitening the signal in the time domain is developed.

  • PDF

음성인식을 위한 성도 길이 정규화 (Vocal Tract Length Normalization for Speech Recognition)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제7권7호
    • /
    • pp.1380-1386
    • /
    • 2003
  • 화자들 사이의 성도의 길이의 변이에 의하여 음성 인식기의 성능이 저하된다. 본 연구에서는 입력 음성에서 추출한 단구간 스펙트럼의 주파수축을 확대하거나 축소하여 음성인식기에 미치는 화자사이의 성도 길이의 영향을 최소화하는 방법을 사용한다 성도의 길이를 정규화하기 위한 주파수 변환 함수로서, 선형의 주파수 변환 함수와 조각적 선형적인 변환 함수를 고려하였다. 또한, 커다란 성도길이의 변이에 따른 주파수축의 척도변화를 보다 효과적으로 모의할 수 있는 가변구간 조각적 선형함수를 제안한다. TIDIGITS 연결 숫자음 음성자료에 대하여 제안한 방법을 적용한 결과, 단어의 오인식률을 2.15%에서 0.53%로 크게 감소시킴으로서, 성도 길이 정규화가 화자 독립 음성인식기의 성능 향상에 필수적임을 알 수 있었다.

실환경 CR 시스템에서 오경보 감소를 위한 신호 검출 알고리즘 (The Signal Detection Algorithms for Reducing False Alarms of CR System in Real Environment)

  • 임선민;정회윤;김상원;정병장
    • 한국통신학회논문지
    • /
    • 제36권8C호
    • /
    • pp.529-535
    • /
    • 2011
  • FCC의 TV white space 개방과 관련하여 스펙트럼 센싱에 대한 관심이 높아지면서 다양한 센싱 기법들이 제안되고는 있으나 대부분 실환경을 고려하지 않아 실제 모듈 적용시 원하는 성능을 얻기가 어렵다. 본 논문에서는 센싱 모듈의 실환경 적용시 발생할 수 있는 문제점과 이를 제어할 수 있는 방법을 제안하고 전산 모의 실험을 통해 성능을 검증하였다. 우선 시스템 내부 스퓨리어스 성분으로 인한 오경보 가능성을 줄이기 위해 시스템 인식을 통한 채널 상태 정보를 이용하여 수산 신호와 구별할 수 있는 방법을 제안하였고, 다음으로 수신 신호에 여러 개의 협대역 신호가 공존하는 경우에 각 신호의 크기 차이로 발생할 수 있는 미검출 가능성을 줄일 수 있도록 서브밴드 정규화 방식을 제안하였다. 전산 모의 실험 결과 시스템 인식 과정을 통해 스퓨리어스 성분으로 인한 오경보는 발생하지 않았으며, 서브밴드 정규화를 통해 기존 채널 단위의 정규화 방식으로 인해 신호간의 크기차로 발생했던 검출 성능의 차이가 신호간의 크기 차이에 상관없이 신호 자체 크기에 따라 검출 성능이 나타나는 것을 확인할 수 있었다.

Scaling of design earthquake ground motions for tall buildings based on drift and input energy demands

  • Takewaki, I.;Tsujimoto, H.
    • Earthquakes and Structures
    • /
    • 제2권2호
    • /
    • pp.171-187
    • /
    • 2011
  • Rational scaling of design earthquake ground motions for tall buildings is essential for safer, risk-based design of tall buildings. This paper provides the structural designers with an insight for more rational scaling based on drift and input energy demands. Since a resonant sinusoidal motion can be an approximate critical excitation to elastic and inelastic structures under the constraint of acceleration or velocity power, a resonant sinusoidal motion with variable period and duration is used as an input wave of the near-field and far-field ground motions. This enables one to understand clearly the relation of the intensity normalization index of ground motion (maximum acceleration, maximum velocity, acceleration power, velocity power) with the response performance (peak interstory drift, total input energy). It is proved that, when the maximum ground velocity is adopted as the normalization index, the maximum interstory drift exhibits a stable property irrespective of the number of stories. It is further shown that, when the velocity power is adopted as the normalization index, the total input energy exhibits a stable property irrespective of the number of stories. It is finally concluded that the former property on peak drift can hold for the practical design response spectrum-compatible ground motions.

가시광 및 근적외선 분광기법을 이용한 방울토마토의 내부품질 예측에 관한 연구 (Study on Prediction of Internal Quality of Cherry Tomato using Vis/NIR Spectroscopy)

  • 김대용;조병관;모창연;김영식
    • Journal of Biosystems Engineering
    • /
    • 제35권6호
    • /
    • pp.450-457
    • /
    • 2010
  • Although cherry tomato is one of major vegetables consumed in fresh vegetable market, the quality grading method is mostly dependant on size measurement using drum shape sorting machines. Using Visible/Near-infrared spectroscopy, apparatus to be able to acquire transmittance spectrum data was made and used to estimate firmness, sugar content, and acidity of cherry tomatoes grown at hydroponic and soil culture. Partial least square (PLS) models were performed to predict firmness, sugar content, and acidity for the acquired transmittance spectra. To enhance accuracy of the PLS models, several preprocessing methods were carried out, such as normalization, multiplicative scatter correction (MSC), standard normal variate (SNV), and derivatives, etc. The coefficient of determination ($R^2_p$) and standard error of prediction (SEP) for the prediction of firmness, sugar, and acidity of cherry tomatoes from green to red ripening stages were 0.859 and 1.899 kgf, with a preprocessing of normalization, 0.790 and $0.434^{\circ}Brix$ with a preprocessing of the 1st derivative of Savitzky Golay, and 0.518 and 0.229% with a preprocessing normalization, respectively.

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제8권5호
    • /
    • pp.13-17
    • /
    • 2017
  • 음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.

연속음성 인식기를 위한 벡터양자화기 기반의 화자정규화 (Vector Quantizer Based Speaker Normalization for Continuos Speech Recognition)

  • 신옥근
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.583-589
    • /
    • 2004
  • 포만트 등의 음향학적인 정보를 이용하지 않는 연속음성인식 (CSR)을 위한 벡터 양자화기 기반의 화자 정규화 방법을 제안한다. 이 방법은 앞서 제안한 간단한 숫자음 인식기를 위한 화자정규화 방법을 개선한 것으로, 코드북의 크기를 증가시켜 가면서 벡터양자화기를 반복적으로 학습시킴으로써 정규화된 코드북을 구한 다음, 치를 이용하여 시험용화자의 워핑계수를 추정한다. 코드북 생성과 워핑계수 추정을 위해 모음 음소의 집합과 자음과 모음을 포함한 모든 음소의 집합 등 두 가지 음소집합을 이용i,겨 실험하였으며, 추정한 워핑계수에 상응하는 구간선형 워핑함수를 이용하여 인식기의 학습과 시험에 사용될 특징벡터를 워핑하였다. TIMIT 코퍼스와 HTK toolkit을 이용한 음소인식 실험을 수행하여 제안하는 방법의 성능을 조사한 결과, 포만트를 이용한 워핑 방법과 비슷한 성능을 가짐을 확인하였다.

켑스트럼으로부터 변환된 로그 스펙트럼을 이용한 포먼트 평활화 켑스트럴 평균 차감법 (Formant-broadened CMS Using the Log-spectrum Transformed from the Cepstrum)

  • 김유진;정혜경;정재호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.361-373
    • /
    • 2002
  • 본 논문에서는 음성 인식과 화자 인식에서 채널 변이 정규화를 위해 널리 사용되는 전통적인 켑스트럴 평균차감법 (CMS: Cepstral Mean Subtraction)의 성능을 향상시키기 위한 정규화 방법을 제안한다. 기존의 켑스트럴 평균 차감법은 장구간 켑스트럼의 평균으로 채널 성분을 추정하므로 유성음의 포먼트에 의해 채널 성분이 편향되는 단점을 가진다. 제안된 포먼트 평활화 켑스트럴 평균 차감법 (FBCMS; Formant-broadened CMS)은 켑스트럼으로부터 변환된 로그 스펙트럼에서 포먼트 위치를 쉽게 찾을 수 있고, 포먼트는 전극점 모델로 표현되는 성도 전달 함수의 우세 극점에 대응된다는 사실에 근거한다. 따라서 제안된 방법은 켑스트럼으로부터 음성의 포먼트를 구하고, 이로부터 포먼트의 대역폭을 확장한 켑스트럼을 구한 후 평균함으로써 채널 켑스트럼 성분으로부터 우세 극점들의 영향을 제거한다. 전극점 모델의 우세 극점을 얻기 위해 다항식 인수분해 과정을 거치지 않으므로 연산량을 줄일 수 있으며 포먼트에 해당하는 우세 극점만으로 선택적으로 처리할 수 있다. 본 연구에서는 4가지의 모의 채널을 이용하여 전통적인 켑스트럴 평균 차감법, 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CMS) 그리고 제안된 방법의 비교실험을 수행하였다. 실제 채널 켑스트럼과 추정된 채널 켑스트럼과의 거리를 측정하는 실험에서 음성에 의한 편향을 완화시켜 실제 채널에 보다 가까운 평균 켑스트럼을 얻을 수 있음을 확인하였다. 또한 문장독립 화자 식별에서 제안된 방법은 전통적인 켑스트럴 평균 차감법보다 우세하고 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CU)과는 비슷한 결과를 보였다. 결과적으로 제안된 방법은 전통적인 켑스트럴 평균 차감법에 기반하여 효과적인 채널 정규화가 가능하다는 것을 보였다.

OBSERVATIONAL STATUS OF THE TEXTURE LARGE-SCALE STRUCTURE FORMATION MODEL

  • UMEDA HIDEYUKI;FREESE KATHERINE
    • 천문학회지
    • /
    • 제29권spc1호
    • /
    • pp.23-24
    • /
    • 1996
  • We reexamined CDM texture large-scale structure (LSS) formation model. We confirmed that texture model is consistent with 4-year COBE data both in an open and a critical matter density (${\Omega}_0$ = 1) universes, and then obtained normalization for density perturbation power spectrum. We next compare the power spectrum with LSS observation data. Contrary to the previous literature, we found that texture model matches with these data in an open universe no better than in an ${\Omega}_0$ = 1 universe. We also found that the model is more likely to fit these data in a cosmological constant dominated ($\Lambda-$) universe.

  • PDF

음성 변환을 사용한 감정 변화에 강인한 음성 인식 (Emotion Robust Speech Recognition using Speech Transformation)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제20권5호
    • /
    • pp.683-687
    • /
    • 2010
  • 본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 음성 변환 방법 중의 한가지인 주파수 와핑 방법을 사용한 연구를 수행하였다. 이러한 목표를 위하여 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정의 변화에 따라 음성의 스펙트럼이 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 논문에서는 이러한 음성의 변화를 감소시키는 방법으로 주파수 와핑을 학습 과정에 사용하는 방법을 제안하여 감정 변화에 강인한 음성 인식 시스템을 구현하였고 성도 길이 정규화 방법을 사용한 방법과 성능을 비교하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법은 사용하면 감정이 포함된 데이터에 대한 인식 오차가 기존 방법보다 감소되었다.