• 제목/요약/키워드: 신호정규화방법

검색결과 131건 처리시간 0.03초

강인한 끝점 추출과 에너지 정규화 (Robust Endpoint Detection and Energy Normalization)

  • 고기원;정원용
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.126-129
    • /
    • 2003
  • 자동 음성 인식(ASR) 시스템에, 끝점 추출과 에너지 정규화는 중요한 역할을 하게 된다 그러나 낮은 SNR이나 nonstationary 환경에서, 기존 방법은 끝점 추출과 에너지 정규화에 있어서 자주 실패하게 되며, ASR을 급격히 열화시키곤 한다. ASR을 수행하기 위해, 최적의 필터에 3상태 천이도를 사용하고, 필터는 정확성과 강인함을 확실히 하기 위해 여러 이론들을 이용하여 설계하였고 여러 가지 잡음이 있는 음성 신호환경에서 거의 일정한 응답을 주었다. 검출된 끝점은 곧바로 에너지 정규화에 적용된다. 실험 결과는 제안된 알고리즘이 낮은 SNR에서 에러율을 크게 감소시키고 있다는 것을 보여준다.

  • PDF

Elastic Net를 이용한 시간 지연 추정 알고리즘 (Time delay estimation algorithm using Elastic Net)

  • 임준석; 이근화
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.364-369
    • /
    • 2023
  • 두 개 수신기에 들어오는 신호 간의 시간 지연 추정 기술은 수중 음향 뿐만 아니라 실내 음향 및 로보틱스에 이르기까지 다양한 분야에서 응용되고 있는 기술이다. 시간 지연 추정 기술에는 수신기 사이 상호 상관으로부터 시간 지연량을 추정하는 방법이 한 기술 부류이고, 수신기 사이의 시간 지연을 파라메트릭 모델링을 하여 그 파라미터를 시스템 인식의 방법으로 추정하는 기술 부류가 있다. 두 부류 중 후자의 경우 시스템의 파라미터 중에서 지연과 직접 관련 있는 파라미터는 전체 중 극히 일부라는 특성이 있다. 이 특성을 이용하여 Lasso 정규화 같은 방법으로 추정 정확도를 높이기도 한다. 그러나 Lasso 정규화의 경우 필요한 정보가 소실되는 경우가 발생한다. 본 논문에서는 이를 보완하기 위해서 Lasso 정규화에 Ridge 정규화를 덧붙인 Elastic Net을 사용한 방법을 제안한다. 제안한 방법을 기존의 일반 상호 상관(Generalized Cross Correlation, GCC) 방법 및 Lasso 정규화를 사용한 방법과 비교하여, 백색 가우시안 신호원 및 유색 신호원에서도 추정 오차가 매우 적음을 보인다.

불균일한 클러터 환경 안에서 Nonhomogeneity Detector의 다양한 정규화 방법에 따른 성능 평가 (Performance Evaluation of Nonhomogeneity Detector According to Various Normalization Methods in Nonhomogeneous Clutter Environment)

  • 류장희;정지채
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.72-79
    • /
    • 2009
  • 본 논문에서는 불균일한 클러터 환경에서 다양한 정규화 방법을 사용한 NHD(nonhomogeneity detector) 기술을 통해 비행체 레이더를 위한 STAP(space-time adaptive processing)의 성능 평가를 수행하였다. 실제로 클러터는 시스템 환경에 따라 임펄스 신호와 같은 신호의 크기가 매우 큰 간섭 신호를 종종 포함하고 있기 때문에 수신된 간섭 신호는 균일한 신호와 불균일한 신호로 구성된다. 이 환경에서 STAP의 성능을 유지하기 위해서는 NHD 기술이 필수적이고, 그 NHD 결과를 이용한 정규화는 불균일한 신호를 제거하는데 효과적인 방법이다. 최적의 정규화는 주어진 데이터의 특성을 잘 고려한 대푯값을 통해서 가능하고, 이에 우리는 K 평균 군집화 알고리즘을 제안한다. 이 알고리즘에서는 군집화에 필요한 묶음의 수를 결정할 때 불규칙한 데이터의 특성을 고려할 수 있게 되고 군집화 된 결과를 이용해 균일한 데이터만을 선택하기 위한 대푯값을 결정할 수 있게 된다. 또한 여기서 우리는 시시각각 변화하는 불규칙적인 데이터의 특성을 잘 반영하기 위해, 적절한 묶음의 수를 결정하기 위한 방법을 연구한다. 시뮬레이션 결과를 통해 K 평균 군집화 알고리즘이 기존의 정규화 방법들에 비하여 매우 우수한 정규화와 목표물 검출 성능을 갖는 것을 확인할 수 있었다.

  • PDF

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제8권5호
    • /
    • pp.13-17
    • /
    • 2017
  • 음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.

스펙트럼 평탄화 기법의 비교평가에 관한 연구 (A Study on the Comparison and Evaluation of Spectrum Flattening Techniques)

  • 강은영;한상일;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.797-800
    • /
    • 2001
  • 스펙트럼의 평탄화는 스펙트럼 신호로부터 포만트의 영향이나 천이진폭의 영향을 제거하는 것이다. 따라서 정확한 피치검출과 포만트검출에 적용할 수 있다. 본 논문에서는 새로운 스펙트럼 평탄화 기법을 제안하고 기존의 방법인 LPC법, Cepstrum법과 비교하여 어느 정도의 우수성을 보이는지 평가하였다. 평가 방법은 각각의 평탄화된 신호의 분산을 구하여 평탄화의 정도를 측정하였다. 이때 핑탄화된 신호는 최고점이 영이 되도 록 정규화 시키고 평균이 영인 분산을 계산하였다. 실험 결과는 제안한 방법이 기존의 방법보다 우수함을 보여 준다.

  • PDF

음성 에너지 최대화와 묵음 특징 정규화를 이용한 잡음 환경에 강인한 음성 검출 (Voice Activity Detection in Noisy Environment using Speech Energy Maximization and Silence Feature Normalization)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.169-174
    • /
    • 2013
  • 음성 인식 성능 저하의 문제는 모델 훈련 환경과 인식 환경의 차이이다. 이러한 환경의 불일치를 줄이기 위한 방법으로 다양한 묵음 특징 정규화 방법을 사용하고 있다. 기존의 묵음 특징 정규화 방법은 낮은 신호 대 잡음비에서 묵음 구간의 에너지 레벨이 증가하여 음성과 비음성에 대한 분류의 정확도가 떨어짐으로 인해 인식 성능이 저하되는 문제점이 있다. 본 논문에서는 음성 에너지 최대화와 묵음 특징 정규화를 이용한 잡음 환경에 강인한 음성 검출 방법을 제안하였다. 제안한 방법은 높은 신호 대 잡음비에서는 음성 에너지를 최대화시켜 특징이 잡음의 영향을 적게 받는 특성을 이용하였고 낮은 신호 대 잡음비에서는 음성/비음성의 켑스트럼 특징 분포 특성을 이용하여 인식 성능을 향상시켰다. 인식 실험 결과 기존 방법에 비해 향상된 인식 성능을 확인할 수 있었다.

후처리기를 이용한 음향 반향 제거기의 성능향상 (Performance Improvement of Acoustic Echo Canceller Using Post-Processor)

  • 박장식;김현태;손경식
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.35-43
    • /
    • 1999
  • 본 논문에서는 크게 계산량이 증가하지 않으면서 음향 반향 제거기의 성능을 향상시킬 수 있는 잡음에 강건한 적응 알고리즘과 후처리기를 제안한다. 제안하는 적응 알고리즘은 기준 입력신호와 마이크 입력신호의 전력 합으로 적응 상수를 정규화 한다. 근단화자의 음성신호나 주변 잡음이 마이크로 입력되면 그 전력만큼 적응 상수가 작아지기 때문에 이들 주변 잡음에 의한 계수 오조정을 줄일 수 있다. 잔여 반향을 제거하기 위해서 잡음에 강건한 알고리즘과 연동하는 새로운 후처리 방법을 제안한다. 제안하는 후처리 방법은 마이크 입력신호와 추정 오차신호의 상관도를 활용한다. 잔여 반향은 마이크 입력신호의 전력으로 정규화된 상관도에 의해서 감쇠되어 제거한다. 정규화 상관도는 잔여 반향에 대해서 Wiener 필터 역할을 한다. 동시 통화시에는 추정 오차신호에는 근단화자의 음성신호가 대부분을 차지함으로 정규화 상관도는 거의 1이 되어 근단화자의 음성신호는 감쇠없이 전송된다. 반향 신호만 있을 때에는 잔여 반향은 후처리기에 의해서 대부분 감쇠되어 제거된다. 제안하는 후처리기를 이용한 음향 반향 제거기의 계산량은 NLMS 알고리즘에 비해서 크게 증가하지 않는다.

  • PDF

뇌파 신호의 정량적 분석을 위한 데이터 정규화 및 표현기법 연구 (Study on Data Normalization and Representation for Quantitative Analysis of EEG Signals)

  • 황태훈;김진헌
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권6호
    • /
    • pp.729-738
    • /
    • 2019
  • 최근 화두가 되는 가상현실 분야와 감정인식 분야의 결합으로 감정을 정량적으로 분석하고, 분석된 결과를 바탕으로 가상현실 콘텐츠를 개선하는 접근이 시도되고 있다. 감정은 콘텐츠 체험자의 생체신호를 기반으로 분석되는데, 신호 분석 관점에서는 많은 연구가 이루어지고 있으나 이를 정량화하는 방법론에 관해서는 충분히 논의되지 않고 있다. 본 논문에서는 감정의 정량화를 위한 초석으로 여러 생체신호 중 뇌파 신호에 대한 정규화 함수 설계와 이를 나타내는 표현 기법을 제안하고자 한다. 정규화 함수의 최적 파라미터를 찾아내기 위해 무차별 대입법을 사용하였으며, 본 논문에서 정의한 True Score와 False Score를 사용하여 찾아낸 파라미터들의 신뢰성을 높였다. 결과적으로 경험에 의존되던 생체신호 정규화 함수의 파라미터 결정을 자동화할 수 있으며, 이를 바탕으로 감정의 정량적 분석이 가능하다.

새로운 시간축 정규화 방법을 이용한 한국어 고립단어 인식기 (Korean isolated word recognizer using new time alignment method of speech signal)

  • 남명우;박규홍;노승용
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.567-575
    • /
    • 2001
  • 본 논문에서는 음성신호의 발성길이와 상관없이 일정한 크기의 파라미터를 얻을 수 있는 새로운 방법을 제안하였다. 음성인식기의 성능은 음성신호에서 추출된 파라미터간의 유사도(패턴간의 거리)를 어떻게 비교하는지에 따라 결정된다. 그러나 화자에 따른 음성신호의 변이나 발성속도의 차이는 음성신호에서 일정한 크기의 파라미터 추출을 어렵게 한다. 제안한 방법은 음성신호에서 얻어진 파라미터를 스펙토그램의 형태로 표현한 뒤 2차원 DCT(Discrete Cosine Transform)를 이용해 일정한 크기의 파라미터로 정규화시키는 방법이다. 제안한 방법의 유효성을 입증하기 위해 청각세포를 모델링한 32개의 대역통과 필터로부터 얻어진 음성신호의 파라미터를 2차원 DCT 방법으로 가공한 후, 신경 회로망의 입력으로 사용하였다. 또한 기존 방법과의 인식률 비교를 위해 기존의 정규화된 입력을 구하는 방법 중 하나를 선택하여 비교 실험을 수행하였다. 실험결과 제안한 방법은 기존 방법에 비해 화자종속 및 화자독립 고립단어 인식에서 더 높은 인식률과 빠른 인식속도를 얻을 수 있었다.

  • PDF

2.9kbps LP-SMBE 음성부호기 개발 (Design of the 2.9kbps LP-SMBE vocoder)

  • 김승주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.175-178
    • /
    • 1994
  • 본 논문에서는 선형 예측 방법과 다중 대역 여기 방법의 장점을 조합하여 낮은 전송률에서 고품질의 합성음을 제공하는 LP-SMBE 부호기를 제안한다. LP-SMBE 부호기에서는 선형 예측 방법과 단순화된 여기 신호 추정방법을 이용하여 성도 특성 정보와 여기 신호를 분리 추정한다. 제안한 단순화된 여기 신호 추정 방법은 정규화된 스펙트럼 영역에서 원음 스펙트럼과 합성 스펙트럼을 비교하여 여기 신호를 추정한다. 이 방법은 기존 MBE 방법의 여기 신호 추정 방법보다 연산량이 적고, 여기 신호르 F보다 정확히 추정할 수 있다.

  • PDF