• 제목/요약/키워드: Normalization

검색결과 1,425건 처리시간 0.032초

켑스트럼 정규화와 켑스트럼 거리기반 묵음특징정규화 방법을 이용한 잡음음성 인식 (Cepstral Normalization Combined with CSFN for Noisy Speech Recognition)

  • 최숙남;신광호;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1221-1228
    • /
    • 2011
  • 일반적인 음성인식 시스템은 보통 실내 환경에서는 잘 동작하지만 잡음이 존재하는 실제 환경에서는 여러 가지 잡음의 영향으로 그 성능이 급격히 떨어진다. 본 논문에서는 잡음환경에 강인한 음성인식을 위하여 훈련 환경과 실제 환경의 불일치를 줄이기 위한 방법으로 켑스트럼 거리기반 묵음특징 정규화(CSFN: Cepstral distance based SFN) 방법에 켑스트럼 정규화 방법(CMVN:cepstral mean and variance normalization)을 결합한 CSFN-CMVN 방법을 제안하였다. 이 방법은 켑스트럼 특징의 분포 특성의 차이를 나타내는 켑스트럼 유클리디언 거리를 결합하여 음성/묵음 분류에 사용하여 묵음특징을 정규화하는 CSFN 방법에 켑스트럼 정규화 방법을 결합하는 방법이다. Aurora 2.0 DB를 이용한 실험결과, 제안한 CSFN-CMVN은 기존의 대표적인 묵음특징 정규화 방법인 SFN-I 과 비교했을 때 모든 테스트 세트에 대한 평균 단어인식 정확도에서 약 7%의 인식률 향상을 가져옴을 확인하였다. 또한, 기존의 SFN-II, CSFN에 비해서도 약 6%, 5% 향상되었음을 확인 할 수 있어 제안한 방법의 유효성을 확인할 수 있었다.

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.

능동 소음 제어를 위한 정규화된 다채널 FxLMS 알고리즘 (Multi-channel normalized FxLMS algorithm for active noise control)

  • 정익주
    • 한국음향학회지
    • /
    • 제35권4호
    • /
    • pp.280-287
    • /
    • 2016
  • 본 논문에서는 다채널 능동 소음 제어를 위한 적응 필터에 적용할 수 있는 정규화된 FxLMS(Filtered-x Least Mean Square) 알고리즘을 제안하였다. 단일 채널 능동 소음 제어를 위한 FxLMS 알고리즘의 경우는 기존의 NLMS(Normalized Least Mean Square) 알고리즘과 같은 방식으로 정규화할 수 있는 반면, 다채널 능동 소음 제어의 경우에는 단일 채널 방식의 정규화 알고리즘을 그대로 적용할 수 없다. 먼저, 최소 교란 원리에 근거한 일반화된 정규화 알고리즘을 이용하여, 역행렬 연산을 피하기 위하여 대각 성분만을 고려한 정규화 알고리즘을 제안하였다. 컴퓨터 모의 실험을 통하여 제안된 알고리즘을 정규화되지 않은 기존의 알고리즘들과 비교하였다. 제안된 알고리즘이 정규화되지 않은 기존의 알고리즘에 비하여 비정상 환경에서 우수한 성능을 가진다는 것을 보였다.

불변의 무게중심을 이용한 영상 정규화에 기반한 기하학적 공격에 강인한 워터마킹 (Image Watermarking Robust to Geometrical Attacks based on Normalization using Invariant Centroid)

  • 김범수;최재각
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권3호
    • /
    • pp.243-251
    • /
    • 2004
  • 본 논문에서는 기존의 영상 정규화에 기반 한 워터마킹을 개선하여 잘림을 동반한 기하학적 공격에 강인한 워터마킹 기법을 제안한다. 영상 정규화의 기준이 되는 무게 중심은 영상의 전체 화소 값을 사용하므로 잘림이 발생한 경우 무게 중심이 달라지고 이로 인해 중심 모멘트 값과 정규 영상 또한 달라지게 된다. 따라서, 본 논문에서는 영상이 잘림에 의해 훼손되더라도 항상 일정한 위치에 나타나는 불변의 무게중심을 구하여 이를 이용하여 제한된 영역을 구하고 이 영역 내부의 화소 정보만을 사용하여 중심 모멘트와 정규 영상을 구한다. 이렇게 구해진 정규 영상은 잘림을 동반한 기하학적 공격이 발생하더라도 원 영상과 동일한 형태의 정규영상을 얻을 수 있으며 정규 영상을 이산 퓨리에 변환 (Discrete Fourier Transform: DFT) 하여 워터마크를 삽입함으로써 기하학적 공격에 강인한 워터마킹 기법이 된다.

유전자알고리즘을 기반으로 하는 정규화 기법에 관한 연구 : 역전파 알고리즘을 이용한 부도예측 모형을 중심으로 (GA-based Normalization Approach in Back-propagation Neural Network for Bankruptcy Prediction Modeling)

  • 태추월;신경식
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.1-14
    • /
    • 2010
  • 역전파 알고리즘은 오랫동안 부도예측모형 관련한 연구에 많이 적용되어왔다. 역전파 알고리즘을 사용하기전에 필히 고려해야 할 중요한 요소들로는 네트워크 구조, 학습요소, 정규화 방법 등이다. 하지만 신경망 성과를 향상시키기 위한 네트워크 구조 및 학습요소 최적화 관련한 연구는 기존의 연구들에서 많이 이루어 졌지만 데이터 정규화와 관련한 연구는 아직 많이 이루어지지 않았다. 따라서 본 연구에서는 유전자 알고리즘을 기반으로 하는 정규화 기법을 제시하였다. 최적의 입력데이터 정규화를 위하여 본 연구에서는 우선 각각의 서로 다른 정규화 기법들을 동일 가중치를 두어 일반화 시켰으며 유전자 알고리즘을 이용하여 최적의 가중치를 찾음으로써 최적화된 입력변수 정규화가 이루어지도록 하였다. 제안한 방법론을 검증하기 위하여 부도예측 데이터를 이용하여 실험을 하였으며 제안하는 방법과 기존 다른 방법들간의 비교를 통하여 그 타당성을 검증하였다.

표준화 기반 유의한 유전자 선택 방법 조합을 이용한 마이크로어레이 분류 시스템 설계 (The Design Of Microarray Classification System Using Combination Of Significant Gene Selection Method Based On Normalization.)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2259-2264
    • /
    • 2008
  • 정보력 있는 유전자는 특정한 실험 조건의 특성을 나타내주는 발현수준의 유전자를 의미한다. 이 유전자들은 여러 집단 간의 발현수준에서 유의한 차이를 보여주며, 실제로 집단 간의 차이를 유발하는 유전자일 확률이 높아 특정 생물학적 현상과 관련 있는 정보적 유전자를 찾는 연구에 이용될 수 있다. 본 논문에서는 먼저 그 동안 제안된 여러 표준화 방법들 중에서 가장 널리 사용되고 있는 방법들을 이용하여 데이터를 표준화 한 후 제안한 유사성 척도 조합 방법으로 정보력 있는 유전자들을 추출할 수 있는 시스템을 고안하였다. 다층퍼셉트론 신경망 분류기를 이용하여 각 표준화 방법들의 성능을 비교분석하였다. 그 결과 Lowess 표준화 후 피어슨 적률 상관 계수와 유클리디안 거리 계수 조합을 이용하여 선택된 200 유전자들을 멀티퍼셉트론 신경망 분류기로 분류한 결과 93.84%의 향상된 분류 성능을 보였다.

항만효율성 측정 자료의 정규성과 변환 불변성 검증 소고 : DEA접근 (A Brief Verification Study on the Normalization and Translation Invariant of Measurement Data for Seaport Efficiency : DEA Approach)

  • 박노경;박길영
    • 한국항만경제학회지
    • /
    • 제23권2호
    • /
    • pp.109-120
    • /
    • 2007
  • 본 논문에서는 항만효율성 측정 시 문제가 되었던 두 가지 문제점(첫째, 각기 상이한 기본단위를 갖는 투입변수와 산출변수의 정규화문제, 둘째, DEA분석의 기본가정인 비음수조건에 벗어난 자료, 즉, 음수를 갖는 투입-산출자료의 변환불변성)를 해결하기 위해서 국내 26개항만의 자료를 이용하여 실증분석을 한 후에 검증을 함으로써 항만효율성 측정방법을 부분적으로 확장시켰다. 본 논문의 실증분석의 핵심적인 결과는 다음과 같다. 첫째, 항만효율성 측정 시 사용되는 자료의 정규성과 변환불변성은 실증분석 결과 분명하게 있는 것으로 검증되었다. 둘째, 항만효율성 측정 시 사용되는 자료가 마이너스(-)인 경우에 가장 큰 음수보다 더 큰 양수를 더해 주는 이른바 자료의 변환을 검증하는 변환불변성은 투입지향-산출지향 BCC 모형에서 확인되었다. 위와 같은 실증분석 결과는 다음과 같은 정책적인 함의를 갖고 있다. 즉, 효율성 측정시 사용되는 자료의 정규성과 변환불변성이 실증적으로 검증되었으므로, 국내 항만의 정책입안가들은 항만효율성 측정 시 이용되는 자료의 정규성과 변환불변성과 같은 사항을 고려하여 보다 세부적인 항만통계자료를 수집 정리 공표하는 것이 매우 필요하다. 예를 들면 항만사고와 같은 통계도 해역별이 아닌 항만별로 세부적으로 통계를 발행하도록 관련된 정책적인 지원이 필요하다.

  • PDF

뇌파 신호의 정량적 분석을 위한 데이터 정규화 및 표현기법 연구 (Study on Data Normalization and Representation for Quantitative Analysis of EEG Signals)

  • 황태훈;김진헌
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권6호
    • /
    • pp.729-738
    • /
    • 2019
  • 최근 화두가 되는 가상현실 분야와 감정인식 분야의 결합으로 감정을 정량적으로 분석하고, 분석된 결과를 바탕으로 가상현실 콘텐츠를 개선하는 접근이 시도되고 있다. 감정은 콘텐츠 체험자의 생체신호를 기반으로 분석되는데, 신호 분석 관점에서는 많은 연구가 이루어지고 있으나 이를 정량화하는 방법론에 관해서는 충분히 논의되지 않고 있다. 본 논문에서는 감정의 정량화를 위한 초석으로 여러 생체신호 중 뇌파 신호에 대한 정규화 함수 설계와 이를 나타내는 표현 기법을 제안하고자 한다. 정규화 함수의 최적 파라미터를 찾아내기 위해 무차별 대입법을 사용하였으며, 본 논문에서 정의한 True Score와 False Score를 사용하여 찾아낸 파라미터들의 신뢰성을 높였다. 결과적으로 경험에 의존되던 생체신호 정규화 함수의 파라미터 결정을 자동화할 수 있으며, 이를 바탕으로 감정의 정량적 분석이 가능하다.

On-Line Blind Channel Normalization for Noise-Robust Speech Recognition

  • Jung, Ho-Young
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제1권3호
    • /
    • pp.143-151
    • /
    • 2012
  • A new data-driven method for the design of a blind modulation frequency filter that suppresses the slow-varying noise components is proposed. The proposed method is based on the temporal local decorrelation of the feature vector sequence, and is done on an utterance-by-utterance basis. Although the conventional modulation frequency filtering approaches the same form regardless of the task and environment conditions, the proposed method can provide an adaptive modulation frequency filter that outperforms conventional methods for each utterance. In addition, the method ultimately performs channel normalization in a feature domain with applications to log-spectral parameters. The performance was evaluated by speaker-independent isolated-word recognition experiments under additive noise environments. The proposed method achieved outstanding improvement for speech recognition in environments with significant noise and was also effective in a range of feature representations.

  • PDF

Adaptive Channel Normalization Based on Infomax Algorithm for Robust Speech Recognition

  • Jung, Ho-Young
    • ETRI Journal
    • /
    • 제29권3호
    • /
    • pp.300-304
    • /
    • 2007
  • This paper proposes a new data-driven method for high-pass approaches, which suppresses slow-varying noise components. Conventional high-pass approaches are based on the idea of decorrelating the feature vector sequence, and are trying for adaptability to various conditions. The proposed method is based on temporal local decorrelation using the information-maximization theory for each utterance. This is performed on an utterance-by-utterance basis, which provides an adaptive channel normalization filter for each condition. The performance of the proposed method is evaluated by isolated-word recognition experiments with channel distortion. Experimental results show that the proposed method yields outstanding improvement for channel-distorted speech recognition.

  • PDF