• 제목/요약/키워드: Psychoacoustic model

검색결과 55건 처리시간 0.03초

심리음향모델에 근거한 잡음 형상화 (Noise Shaping Based on Psychoacoustic Model)

  • 이진걸
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.335-336
    • /
    • 2000
  • A psychoacoustic model based noise shaping method is proposed, where noise's presence with a host signal will not be perceptually noticeable. The derivation of imperceptible noise levels from the masking thresholds of the signal involves a deconvolution associated with the spreading function in the psychoacoustic model, which results in an ill-conditioned problem. In this paper, the problem is formulated as a constrained optimization, and it is demonstrated that the solution provides noise shaping where the noise excitation level conforms to the masking thresholds of the signal.

  • PDF

심리음향모델에 근거한 음성개선 (Speech Enhancement Based on Psychoacoustic Model)

  • 이진걸
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.337-338
    • /
    • 2000
  • The perceptual filter for speech enhancement was analytically derived where the frequency content of the input noisy signal was made the same as that of the estimated clean signal in auditory domain. However, the analytical derivation should rely on the deconvolution associated with the spreading function in the psychoacoustic model, which results in an ill-conditioned problem. In order to cope with the problem associated with the deconvolution, we propose a novel psychoacoustic model based speech enhancement filter whose principle is the same as the perceptual filter, however the filter is derived by a constrained optimization which provides solutions to the ill-conditioned problem.

  • PDF

Speech Enhancement Based on Psychoacoustic Model

  • Lee, Jingeol;Kim, Soowon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제19권3E호
    • /
    • pp.12-18
    • /
    • 2000
  • Psychoacoustic model based methods have recently been introduced in order to enhance speech signals corrupted by ambient noise. In particular, the perceptual filter is analytically derived where the frequency content of the input noisy signal is made the same as that of the estimated clean signal in auditory domain. However, the analytical derivation should rely on the deconvolution associated with the spreading function in the psychoacoustic model, which results in an ill-conditioned problem. In order to cope with the problem associated with the deconvolution, we propose a novel psychoacoustic model based speech enhancement filter whose principle is the same as the perceptual filter, however the filter is derived by a constrained optimization which provides solutions to the ill-conditioned problem. It is demonstrated with artificially generated signals that the proposed filter operates according to the principle. It is shown that superior performance results from the proposed filter over the perceptual filter provided that a clean speech signal is separable from noise.

  • PDF

Noise Shaping Based on Psychoacoustic Model

  • Lee, Jingeol;Nam, Seung Hyon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권2E호
    • /
    • pp.9-16
    • /
    • 2001
  • A psychoacoustic model based noise shaping method which shapes the noise in the frequency domain is proposed, where its presence with a host signal will not be perceptually noticeable. The derivation of imperceptible noise levels from the masking thresholds of the signal involves a deconvolution associated with the spreading function in the psychoacoustic model, which results in an ill-conditioned problem. In this paper, the problem is formulated as a constrained optimization, and it is demonstrated that the solution provides noise shaping where the noise excitation level conforms to the masking thresholds of the signal, and thus the noises embedded in the signal will not be perceived by human ear.

  • PDF

MPEG 심리음향 모델-ll 알고리듬의 ASIC 구현을 위한 고정 소수점 연산 최적화 (Fixed-point Processing Optimization of MPEG Psychoacoustic Model-II Algorithm for ASIC Implementation)

  • 이근섭;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권11C호
    • /
    • pp.1491-1497
    • /
    • 2004
  • 구현하기 위하여 고정 소수점 연산기에 적합하도록 최적화를 수행하였다. 최적화 과정은 크게 부호화기의 음질을 고려하여 프로세서의 데이터 워드 길이를 결정하는 과정과 자주 사용되는 초월 함수를 고정 소수점 연산을 통해 구현하는 것으로 구성된다. 데이터 워드 길이를 결정하기 위하여 심리음향 모델 과정의 고정 소수점 연산 오차와 이 오차가 비트 할당 과정에 영향을 미칠 확률 사이의 관계를 통계적 모델로 정의하였다. 여기서 정의된 모델을 사용하여 고정 소수점 연산 오차에 의한 영향이 1% 이내가 되도록 24비트의 데이터 워드를 선택하였다. 최적화된 고정 소수점 심리음향 모델을 사용한 MP3 부호화기의 음질은 부동 소수점 부호화기에 비해 W-R의 음질평가 점수를 기준으로 평균 -0.2 이내의 구분하기 힘든 수준의 음질 저하를 보였다

결정적/확률적 요소로의 음성 분해와 심리음향 모델 기반 잡음 제거 기법 (Speech Enhancement with Decomposition into Deterministic and Stochastic components and Psychoacoustic Model)

  • 조석환;유창동
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.301-302
    • /
    • 2007
  • A speech enhancement algorithm based on both a decomposition of speech into deterministic and stochastic components and a psychoacoustic model is proposed. Noisy speech is decomposed into deterministic and stochastic components, and then each component is enhanced preserving its individual characteristics. A psychoacoustic model is taken into account when enhancing the stochastic component. Simulation results show that the proposed algorithm performs better than some of the more popular algorithms.

  • PDF

MPEG-2 AAC 심리음향 모델을 이용한 오디오 워터마킹 기법 (The Audio Watermarking method Using the MPEG-2 AAC Psychoacoustic Model)

  • 성종수;강상구;신재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.716-719
    • /
    • 1999
  • In this Paper, we Present a method for embedding digital watermarks into digital audio signals. The watermarking must be imperceptible and should be robust to attacks, such as filtering and compression etc. In our method, we adaptively embedded the watermarks changing the scale factor using the spread spectrum and MPEG-2 AAC psychoacoustic model.

  • PDF

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

대역확산과 심리음향 모델을 이용한 고음질 오디오 워터마킹 (High Quality Audio Watermarking using Spread Spectrum and Psychoacoustic Model)

  • 노진수;이강현
    • 전자공학회논문지CI
    • /
    • 제43권5호
    • /
    • pp.48-56
    • /
    • 2006
  • 본 논문에서는 심리음향 모델과 MDCT/IMDCT(Modified DCT/Inverse Modified DCT)를 이용하여 고음질 오디오 워터마킹 알고리즘을 제안하였다. 일반적으로 디지털 오디오 워터마크는 디지털 오디오 신호를 주파수 영역으로 변환 한 다음 주파수 영역에 워터마크를 삽입하지만 삽입된 워터마크에 의해 디지털 오디오 음질이 영향을 받게 된다. 제안된 알고리즘에서는 디지털 오디오 데이터를 PN(Pseudo Noise) 코드를 사용하여 확산시킨 다음 심리음향 모델을 참조하여 MDCT 과정을 통하여 오디오 워터마크를 삽입시킨다. MDCT 과정에서 고음질의 오디오를 얻기 위해 필터뱅크 출력의 첨예도에 따라 256, 1,024 또는 2,048 포인트의 윈도우가 선택되어진다. 본 논문에서 워터마크 계수 ${\alpha}$가 2.5 이하일 때, 워터마크의 검출률이 SDMI(Secure Digital Music Initiative)의 제안 조건을 50% 이상 상회 하며, SNR은 4종류의 공격(압축, 절단, FFT, 에코)에 대해 $50{\sim}68dB$ 값을 가짐을 확인하였다.

고음질 디지털 오디오 워터마킹을 위한 효율적인 PN 시퀸스 삽입 및 검출 방법 (An Efficient PN Sequence Embedding and Detection Method for High Quality Digital Audio Watermarking)

  • 김현욱;오현오;김연정;윤대희
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.21-31
    • /
    • 2001
  • PN 시퀸스를 삽입하는 오디오 워터마킹은 들리지 않으면서도 강인한 워터마크를 만들기 위해 심리음향모델을 사용하여 PN 시퀸스를 변형시킨다. 하지만 워터마크를 삽입하는 모든 프레임에 대해 심리음향모델을 계산하기 위해서는 부호화 과정이 매우 복잡해지는 문제가 있다 부호화기에서 심리음향모델의 역할을 대신 하도록 만든 고정필터로 PN 시퀸스를 변형하면 훨씬 간단하 면서도 효율적인 워터마킹 시스템이 가능해진다. 본 논문에서는 고정된 지각필터를 도입한 효율적인 워터마킹 시스템을 제안한다. 심리음향모델을 대체하는 고정필터를 사용함으로써 PN 시퀸스를 들리지 않게 만들어주고 따라서 강인한 워터마크를 삽입할 수가 있다. 이와 함께 복호화기에서는 PN 시퀸스를 매칭시켜 상관도를 높여주는 보상필터 구조를 제안하여 원신호를 사용하지 않는 복호화기의 복호화 성능을 향상시켰다.

  • PDF