• 제목/요약/키워드: 양자화 잡음

검색결과 154건 처리시간 0.023초

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

  • Sang-Yeob, Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.87-92
    • /
    • 2023
  • 음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.

분산 동영상 부호화 시스템을 위한 효과적인 상관 잡음 모델링 및 성능평가 (Efficient Correlation Noise Modeling and Performance Analysis for Distributed Video Coding System)

  • 문학수;이창우;이성원
    • 한국통신학회논문지
    • /
    • 제36권6C호
    • /
    • pp.368-375
    • /
    • 2011
  • 분산 동영상 부호화 시스템에서는 복호기에서 Wyner-Ziv 프레임을 복원하기 위해서 부호기에서 생성된 패리티비트를 사용하게 된다. 이때 오류 정정 부호로 터보 부호나 LDPC 부호가 사용되는데 복호기에서는 원 Wyner-Ziv 프레임을 모르기 때문에 오류 정정을 위한 효과적인 상관 잡음 모델링이 필요하다. 본 논문에서는 복호기에서 Wyner-Ziv 프레임과 부가정보 간의 상관 잡음을 효과적으로 모델링하기 위한 방법을 제안하고 추정한 상관 잡음 모델이 분산 동영상 부호화 시스템에 미치는 영향을 분석한다. 또한 모의실험을 위해 H.264 intraframe 부호화 방법으로 부호화된 키 프레임을 사용하였는데 부호기에서 동적으로 키 프레임 양자화 파라미터 값을 추정하기 위한 방법을 제안하고 성능을 해석한다.

주부호화기 대역폭에 따른 오디오 부호화의 성능비교 (Performance Comparison of Audio Coders According to Core Codec Bandwidth)

  • 정용석;김인철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.177-178
    • /
    • 2010
  • 본 논문에서는 음향신호의 부호화에 있어 주부호화기로 부호화 되는 주파수 대역폭이 음질에 미치는 영향에 대하여 고찰한다. 또한 비트율을 변화시켜 양자화 잡음 발생을 줄일 수 있는 비트율의 기준에 대하여 고찰한다. 마지막으로 주관적 음질평가 및 객관적 음질평가를 통하여 그에 따른 성능을 평가한다.

  • PDF

내적과 양자화를 이용한 영상의 워터마킹 (Image watermarking using Projection and Quantization)

  • 이승욱;호요성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.511-514
    • /
    • 2000
  • 디지털 워터마킹이란 디지털 컨텐츠의 저작권을 보호하기 위해 보이지 않는 임의의 데이터를 미디어에 삽입하는 방법이다. 본 논문에서는 주파수 영역으로 변환된 원 데이터를 임의의 방향으로 정의된 데이터와 내적(Inner Product)하여 이를 워터마크 정보에 따라 변화시키는 방법을 제안한다. 이 방법은 비밀키가 워터마크 데이터와 연관된 것이 아니기 때문에 어떠한 종류의 데이터도 삽입할 수 있다는 장점이 있다. 사용되는 비밀키는 주파수 영역으로 변환된 원 데이터와 내적되는 임의의 데이터를 만드는데 사용된다. 또한 워터마크의 견고성을 높이기 위해, 주파수 영역으로 변환된 원 데이터와 내적된 임의의 데이터는 잡음처럼 되므로 이를 인간 시각 특성을 사용하여 모델링 하였다. 제안된 방법은 원 영상 없이 워터마크를 검출할 수 있으며. 워터마크의 견고성 실험을 위해 JPEG, Cropping, Resizing. Gaussian 잡음 등을 적응하였다.

  • PDF

광대역 고속 디지털 PLL의 설계에 대한 연구 (A Study on the Wide-band Fast-Locking Digital PLL Design)

  • 안태원
    • 전자공학회논문지 IE
    • /
    • 제46권1호
    • /
    • pp.1-6
    • /
    • 2009
  • 본 논문에서는 광대역 주파수 합성기의 구현을 위하여 주파수 검출 범위와 락킹 시간을 개선한 디지털 PLL의 구조 및 설계에 대하여 기술한다. 제안된 구조에서는 광대역의 고속 주파수 비교기를 위하여 광역 디지털 로직 직교상관기를 사용하였고, 2 비트 업-다운 카운터 및 시그마-델타 변조기를 적용하여 디지털 제어 발진기의 주파수가 제어되도록 하였다. 따라서 양자화에 의한 잡음으로부터 추가되는 위상 잡음을 감소시킬 수 있으며, 최근의 휴대용 멀티미디어 통신 단말기 등에서 요구되는 고속의 락킹 및 광대역 지원, 그리고 저전력 현에 적합하다.

다중 펄스와 다중 대역 이차 장구간 예측을 이용한 CELP 음성 부호화기 (A CELP Speech Coder Using Secondary Long Term Prediction with Multi-Band Pass Filtered Multi-Pulses)

  • 서정태;최용수;강홍구;윤대희
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.9-16
    • /
    • 1998
  • 본 논문에서는 낮은 비트율 CELP 음성 부호화기의 장구간 예측기의 성능 향상 방 법을 제안한다. 비트율을 낮추기 위해서는 분석 구간의 길이가 길어져야하며 이에 따라 장 구간 예측기의 성능이 저하되어 장구간 예측 후에도 준 주기성 성분이 상당량 존재하므로 백색 잡음으로 구성된 통계 코드북만으로는 이를 모델링하기 어려워진다. 제안 방법에서는 다중 대역 필터와 다중 펄스열을 이용하여 한 번 더 필터링(이차 장구간 예측)함으로써 장 구간 예측 후의 신호가 통계 코드북에 적합한 백색 잡음 형태로 되도록 모델링한다. 제안된 방법의 성능을 평가하기 위해 4.8kbps 비트율로 양자화한 후, 기존에 제안된 같은 전송률의 MBCELP와 DoD-CELP와 비교하였다. 실험 결과 제안된 방법이 기존 부호화기들에 비해 주/객관적인 음질에서 우수한 성능을 보여준다.

  • PDF

CGIC의 디지탈 구조 및 잡음특성 (Digital Configuration and Noise Characteristic of CGIC)

  • 박종연;이민호
    • 대한전자공학회논문지
    • /
    • 제27권11호
    • /
    • pp.152-156
    • /
    • 1990
  • 포트 콘덕턴스가 서로 독립적인 CGIC의 디지탈 구조를 APF를 이용하여 네 종류로 구분하여 실현하였다. 포트 콘덕턴스에 의해서 결정되는 곱셈계수의 양자화 과정에서 발생되는 출력잡음식을 유도하여 해석함으로써 각각의 성능을 비교하여 적용방법을 설명하였다.

  • PDF

퍼지 기법을 이용한 구름 분류 (A Cloud Classification Using Fuzzy Method)

  • 조현학;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.355-359
    • /
    • 2009
  • 본 논문에서는 퍼지 기법을 이용하여 구름의 종류를 분석하는 방법을 제안한다. 본 논문에서는 가시 영상과 적외 영상을 대상으로 육지 영역은 RGB 컬러 정보 중에 G 채널 값의 수치가 높고, 바다영역에서는 B 채널 값의 수치가 높다는 정보를 이용한다. 이 정보를 이용하여 육지 영역에서는 R과 B 채널 값을 적용하고, 바다 영역에서는 R과 G 채널 값을 적용한다. 가시 영상과 적외 영상에서 임계치를 적용하여 잡음(구름 이외의 영역)을 제거하고, 잡음을 제거한 영상에서 육지 영역과 바다 영역을 구분한 후, 각 R, G, B 채널 정보를 퍼지 기법에 적용하여 구름 영역을 판별한다. 그리고 가시영상과 적외 영상에 모두 포함된 구름 영역에 대해서는 두 영상을 합성하여 구름을 판별한다. 제안된 기법을 구름 분류에 적용한 결과, 제안된 방법이 기존의 양자화를 적용한 방법보다 구름의 분류 성능이 개선된 것을 확인하였다.

  • PDF

가변 템플릿의 양자화 FCNN을 이용한 영상 에지 검출 (The Edge Detection of Image using the quantization FCNN with the variable template)

  • 최선곤;변오성;이철희;문성용
    • 전자공학회논문지S
    • /
    • 제35S권11호
    • /
    • pp.144-151
    • /
    • 1998
  • 논문에서는 템플릿과 입력/출력사이에 퍼지논리를 결합한 CNN의 구조를 갖는 FCNN에 미리 정의된 가중구조적 요소의 조합으로 최소/최대 연산을 수행하기 위하여 수학적 형태학의 분해특성을 적용하였다. 본 논문에서는 잡음이 포함된 영상에 퍼지 estimator를 적용함으로써 잡음을 제거함과 동시에 에지 검출이 가능함을 컴퓨터 모의 실험을 통해 확인하였다. 형태학의 erosion 연산을 적용한 FCNN과 CNN, 메디안필터를 이용한 에지 검출 결과를 비교분석 하였으며, 양자화 퍼지 함수를 이용한 FCNN에 고정 템플릿과 가변적 템플릿을 적용한 결과 FCNN의 성능이 향상됨을 컴퓨터 모의실험을 통하여 확인하였다.

  • PDF

시각특성과 DCT를 이용한 영상부호화에 관한 연구 (A Study on Image Coding using the Human Visual System and DCT)

  • 남승진;최성남;전중남;박규태
    • 한국통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.323-335
    • /
    • 1992
  • 본 논문에서는 인간의 시각특성을 반영한 적응 DCT 영상 부호화에 관하여 연구하였다. 인간의 시각은 특정한 중간 주파수 대역에 가장 민감하며, 저주파 대역과 고주파 대역에 대하여 상대적으로 덜 민감하다. 이러한 특성은 많은 심리시각적 실험을 통하여 MTF(Modulation transfer function)라는 수식으로 모델링되었다. DCT는 공간영역의 에너지를 주파수 영역으로 변환하므로 MTF를 효율적으로 이용할 수 있다. 또한 시각의 공간 마스킹 특성에 의하여 변화가 많은 영역의 잡음은 변화가 적은 영역의 잡음에 비하여 인간의 시각에 덜 민감하다. 제안된 부호화 방법은 시각의 공간주파수 반응 특성을 양자화 행렬로 채택하였으며, 영상의 변화도에 따라 변환 블럭을 차등양자화 함으로써 주관적 화질의 향상을 꾀하였다. 각 블럭의 변화도를 측정하기 위한 방법으로 공간 영역에서 간단한 연산을 행하였으며, 이에 따라 변화가 적은 블럭을 상대적으로 정확하게 양자화하였다. 실험결과 낮은 비트율에서 시각특성을 반영한 제안된 부호화 방법이 주관적으로 우수한 성능을 보임을 확인하였다.

  • PDF