• 제목/요약/키워드: 잡음 은닉

검색결과 61건 처리시간 0.02초

블록 신뢰도와 경계면 매칭 기반의 잡음 은닉 알고리즘 (Boundary Match and Block Reliability Based Error Concealment Algorithm)

  • 김도현;최경호
    • 스마트미디어저널
    • /
    • 제6권2호
    • /
    • pp.9-14
    • /
    • 2017
  • 무선 환경에서의 패킷 손실은 비디오 통신과정에서 심각한 비디오 품질 저하를 초래한다. 이 논문에서는 블록의 신뢰도와 블록 경계면 매칭을 기반으로 한 비디오 에러 은닉 기술에 대해서 제안한다. 손실된 블록의 모션 정보를 참조 프레임의 동일한 위치에 존재하는 블록의 모션 정보를 복사하여 사용함으로써 임시로 손실된 블록의 잡음을 은닉하고, 블록의 신뢰도를 기준으로 블록의 신뢰도가 낮은 경우에는 추가적으로 블록의 경계면 매칭을 이용하여 모션 벡터를 재탐색하여 잡음 은닉에 대한 정확도를 높이도록 하였다. 실험을 통해서 제안된 기법이 다양한 패킷 손실 환경에서 우수한 에러 은닉 성능을 보임을 확인하였다.

잡음환경에 강인한 음성분류기반의 패킷손실 은닉 알고리즘 (Packet Loss Concealment Algorithm Based on Robust Voice Classification in Noise Environment)

  • 김형국;류상현
    • 한국음향학회지
    • /
    • 제33권1호
    • /
    • pp.75-80
    • /
    • 2014
  • 실시간 VoIP 네트워크는 지연, 지터 그리고 패킷손실과 같은 네트워크 장애요소로 인해 품질저하가 발생한다. 본 논문은 VoIP 음질 향상을 위해 잡음환경에 강인한 음성분류기반의 패킷손실 은닉 알고리즘을 제안한다. 제안된 방식에서는 음성신호로부터 추출된 다양한 특징들을 분석하고 이를 기반으로 획득된 적응적인 문턱값을 사용하여 수신단에 도착한 패킷을 분류한다. 정확한 신호분류 결과는 패킷손실 은닉에 사용된다. 그리고 선형 예측 기반의 손실패킷 은닉은 연속적으로 패킷을 은닉하거나 손실된 패킷복원 시 발생하는 메탈릭 아티펙트를 제거함으로써 고품질의 음성을 제공한다.

다중 $H_\infty$ 필터에 의한 강인한 음성향상 (Robust Speech Enhancement By Multi $H_\infty$ Filter)

  • 김준일;이기용
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.85-88
    • /
    • 2004
  • 칼만/위너 필터 같은 기존의 음성향상 알고리즘은 잡음의 선험적 지식을 요구하고, 음성신호와 추정신호의 오차분산을 최소화하는데 중점을 두었다. 따라서, 잡음에 대한 통계적 추정에 오류가 있을 경우 결과에 악영향을 미칠 수 있다. 그러나 $H_\infty$ 필터는 잡음에 대한 어떠한 가정이나 선험적 지식을 요구하지 않는다. $H_\infty$ 필터는 최소상계(Upper Bound Least)를 적용하여 추정된 모든 신호들로부터 최소 에러 신호를 갖는 최상의 추정신호를 찾아내므로 칼만/위너 필터보다 잡음의 변화에 강인하다. 본 논문에서는 학습 신호로부터 은닉 마코프 모델의 파리미터를 추정한 후, 오염된 신호를 고정된 개수의 $H_\infty$ 필터를 통과시켜 각 출력에 가중된 합으로 향상된 음성 신호를 구한다. 음성의 통계적 특성을 이용하여 모델 파라미터를 추정하는 은닉 마코프 모델과 잡음의 변화에 강인한 $H_\infty$ 알고리즘을 사용해서, 다중 $H_\infty$필터에 의한 강인한 음성향상 방법을 제안하였다.

  • PDF

혼합 은닉필터모델 (HFM)을 이용한 비정상 잡음에 오염된 음성신호의 향상 (Speech Enhancement Based on Mixture Hidden Filter Model (HFM) Under Nonstationary Noise)

  • 강상기;백성준;이기용;성굉모
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.387-393
    • /
    • 2002
  • 비정상 잡음에 오염된 음성신호의 향상을 위하여 혼합 은닉필터모델 (HFM: Hidden Filter Model)에 기초한 기법을 제안하였다. 오염된 음성신호를 선형상태방정식으로 모델링하고 파라미터는 마코프 모델에 따른다고 가정하였다. 이 파라미터들은 잡음에 오염되지 않은 학습신호로부터 추정할 수 있다. 추정과정은 혼합 상호복합모델 (IMM: Interacting Multiple Model)에 기초하여 이루어지며, 음성신호의 추정값은 상호작용하는 병렬의 칼만 필터들의 가중합으로 주어진다. 실험결과로부터 제안한 방법의 성능이 기존의 방법에 비해 개선되었음을 확인할 수 있었다.

강화학습 기반의 음성향상기법 (Speech enhancement based on reinforcement learning)

  • 박태준;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.335-337
    • /
    • 2018
  • 음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.

시변가산유색잡음하의 음성 향상을 위한 효율적인 Mixture IMM 알고리즘 (Efficient Mixture IMM Algorithm for Speech Enhancement under Nonstationary Additive Colored Noise)

  • 이기용;임재열
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.42-47
    • /
    • 1999
  • 본 논문에서는 시변가산유색잡음에 오염된 음성신호의 향상을 위한 MIMM(mixture interacting multiple model) 알고리즘을 제안 한다. 제안된 방법에서 음성신호는 혼합 은닉필터모델(hidden filter model: HFM)로 모델링되며, 잡음신호는 하나의 은닉필터로 모델링 된다. MIMM 알고리즘은 혼합 은닉필터모델에 의한 다중 Kalman 필터링에 기초한 회귀계산이기 때문에 계산량이 많아, Kalman 필터링 식의 구조적 측면에서 효율적인 계산이 가능하도록 알고리즘을 구현했다. 시뮬레이션 결과, 제안된 방법이 기존의 결과 [4,5]에 비하여 성능향상이 이루어 졌음을 보여 준다.

  • PDF

채널 코딩 기법을 이용한 디지털 워터마킹 (Digital Watermarking using the Channel Coding Technique)

  • 배창석;최재훈;서동완;최윤식
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3290-3299
    • /
    • 2000
  • 멀티미디어 데이터의 저작권 보호를 위해 데이터의 조작에 강인한 특성을 가져야 하는 디지털 워터마크는 잡음 환경에서 최대한 오류를 줄이면서 데이터를 전달하고자 하는 채널 코딩 기법과 유사한 개념을 가진다. 본 논문에서는 정지영상을 대상으로 이러한 채널 코딩 알고리즘을 이용하여 각종 데이터의 조작에 강인한 디지털 워터마킹 기법을 제안한다. 저작권 정보는 길쌈 부호(convolutional code)를 사용하여 부호화되며, 데이터의 연속적인 손실을 방지하기 위하여 블록 인터리빙(block interleaving) 기법이 적용된다. 부호화된 저작권 정보는 데이터의 조작에 강인한 특성을 갖는 대역 확산 기법에 의해 영상 데이터에 은닉된다. 저작권 정보의 복원을 위해 워터마크된 영상과 은닉 과정에서 사용된 가상 랜덤 잡음 시퀀스(pseudo random noise sequence)와의 공분산(covariance)에 의해 워터마크 신호가 검출되며, 이 신호를 디인터리빙(de-interleaving)하고 복호화(decoding)하여 은닉된 저작권 정보를 복구한다. 실험 결과 일반적인 대역 확산 기법보다 채널 코딩과 블록 인터리빙을 활용한 기법이 동일한 PSNR에서 가우시안(Gaussian) 잡음 추가, 필터링 및 JPEG 압축 등의 공격에 대해 보다 정확하게 은닉된 저작권 정보를 검출할 수 있다는 것을 확인하였다.

  • PDF

잡음하에서 이득 적응을 가지는 비정상상태 자기회귀 은닉 마코프 모델에 의한 오염된 음성을 위한 인식 (Recognition for Noisy Speech by a Nonstationary AR HMM with Gain Adaptation Under Unknown Noise)

  • 이기용;서창우;이주헌
    • 한국음향학회지
    • /
    • 제21권1호
    • /
    • pp.11-18
    • /
    • 2002
  • 본 논문에서는 부가 잡음에 오염된 음성신호에 이득 적응을 가지는 음성인식을 시간 영역에서 다루었다. 잡음은 유색잡음이라고 가정한다. 전화망에서 마찰음 (fricative), 운음 (glides), 유음 (liquds), 그리고 천이영역(transition region)과 같은 음성 신호의 뚜렷한 비정상상태를 극복하기 위해서 NAR-HMM (nonstationary autoregressive HMM)7을 제안하였다. 비정상상태 AR 처리는 M개의 알고 있는 기저 함수 (basis function)의 선형 결합으로 이루어진 다항 함수 (polynomial function)로 나타낼 수 있다. 오염된 신호만을 이용할 수 있을 때, 잡음의 추정 (estimation)문제는 필연적으로 발생한다. 다중 Kalman 필터를 사용함으로써, 잡음모델의 추정과 음성의 이득곡선 (gain contour)을 수행하였다. 제안한방법의 잡음 추정은 오염된 신호로부터 효과적으로 잡음을 제거하여 깨끗한 음성신호를 얻을 수 있었다. 또한 잡음 추정을 하는 일반적인 ARHMM보다 제안한 NAR-HMM이 약 2-3%의 인식성능을 향상시켰다.

HMM과 $H_\infty$필터를 이용한 강인한 음성 향상 (Robust Speech Enhancement Using HMM and $H_\infty$ Filter)

  • 이기용;김준일
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.540-547
    • /
    • 2004
  • 칼만/위너 필터에 근거한 음성향상 알고리즘은 잡음의 선험적 지식을 요구하고, 음성신호와 추정신호의 오차분산을 최소화하는데 중점을 두고 있어, 잡음에 대한 통계적 추정에 오류가 있을 경우 결과에 악영향을 미칠 수 있다. 그러나 H/sub ∞/필터는 잡음에 대한 어떠한 가정이나 선험적 지식을 요구하지 않으며, 최소상계 (Least Upper Bound)를 적용하여 추정된 모든 신호들로부터 최소에러 신호를 갖는 최상의 추정신호를 찾아내므로 칼만/위너 필터보다 잡음의 변화에 강인하다. 본 논문에서는 학습 신호로부터 은닉 마코프 모델의 파라미터를 추정한 후, 오염된 신호를 고정된 개수의 H/sub ∞/필터를 통과시켜 각 출력에 가중된 합으로 향상된 음성 신호를 구하는 다중 H/sub ∞/필터에 의한 강인한 음성향상 방법을 제안한다. 제안된 방법의 성능 평가를 위하여 음성 향상 시간과 신호 대 잡음비를 비교한 결과, 기존의 방법에 비해 계산량은 다소 증가하지만 신호 대 잡음비는 약 1∼2dB 향상 되었다.

ART2 기반 자가 생성 지도 학습 알고리즘을 이용한 컨테이너 인식 시스템 (Container Image Recognition using ART2-based Self-Organizing Supervised Learning Algorithm)

  • 정병희;김재용;조재현;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.393-398
    • /
    • 2005
  • 본 논문에서는 ART2 기반 자가 생성 지도 학습 알고리즘을 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 글자의 색이 검정색 또는 흰색으로 이루어져 있는 특징이 있다. 이러한 특성을 고려하여 원 컨테이너 영상에 대해 검은색과 흰색을 제외한 모든 부분을 잡음으로 처리하기 위해 퍼지를 이용한 잡은 판단 방법을 적용하여 식별자 영역과 잡음을 구별한다. 식별자 영역을 제외한 잡음 영역을 전체 영상의 평균 픽셀값으로 대체시킨다. 그리고 Sobel 마스크를 이용하여 에지를 검출하고, 추출된 에지를 이용하여 수직 블록과 수평 블록을 검출하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 8방향 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출한다. 개별 식별자 인식을 위해 ART2 기반 자가 생성 지도 학습 알고리즘은 입력층과 은닉층 사이에 ART2를 적용하여 은닉층의 노드를 생성하고, 은닉층과 출력층 사이에 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 성능을 개선한다. 실제 컨테이너 영상을 대상으로 실험한 결과, 기존의 식별자 추출 방법보다 제안된 식별자 추출 방법이 개선되었다. 그리고 기존의 식별자 인식 알고리즘보다 제안된 ART2 기반 자가 생성 지도 학습 알고리즘이 식별자의 학습 및 인식에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF