• Title/Summary/Keyword: 심리음향 모델

검색결과 71건 처리시간 0.025초

An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model (MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산)

  • 송건호;이근섭;박영철;윤대희
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • 제41권6호
    • /
    • pp.261-269
    • /
    • 2004
  • In this paper, an efficient algorithm for computing in the MPEG/audio Layer Ⅲ (MP3) encoder is proposed. The proposed algerian performs a full-band 1024-point FFT by computing 32-point FFT's of 32 subband outputs. To reduce the aliasing caused by the analysis filter bank, an aliasing cancellation butterfly is developed. A major benefit of the proposed algorithm is the computational saving. By using the proposed algorithm, it is possible to save 40~50% of computations for FFT, which results in about 20% reduction of the PAM-2 complexity.

Audio Watermark Using Psychoacoustic Model (심리음향 모델을 이용한 오디오 워터마킹)

  • 이희숙;이우선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.859-861
    • /
    • 2001
  • 본 논문은 오디오의 masking특성을 적용한 심리음향 모델을 이용하여 오디오의 고음질을 보장하면서 잡음과 압축 등의 공격에 강한 오디오 워터마킹 방법을 제안한다. 제안하는 워터마킹 방법은 심리음향 모델에 의해 생산되는 masking thresholds와 원신호의 power spectral density의 각 주파수별 차이 에너지를 이용하여 시간도메인에서 워터마크를 삽입하는 방법으로 오디오의 품질을 유지할 수 있다. 워터마크로는 자기상관성이 강한 PN-시퀀스를 이용하여 강인한 워터마킹을 구현한다. 그리고 PN-시퀀스와 같은 이진 시퀀스 워터마크의 검출을 위한 유사도 측정식을 제안한다.

  • PDF

MPEG Audio Layer-III Encoder Using Approximated Psy-choacoustic Model (간략화된 심리음향모델을 이용한 MPEG Audio Layer-III 부호화기)

  • 송창준;오현오;박영철;윤대희
    • Proceedings of the IEEK Conference
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.469-472
    • /
    • 2001
  • MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.

  • PDF

MDCT/IMDCT (MPEG 오디오 신호처리를 위한 MDCT/IMDCT의 FPGA 구현)

  • 노진수;이강현
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.69-73
    • /
    • 2003
  • 음향압축에 있어서 인간의 청각신경의 특성을 이용하는 방식이 사용되고 있다. 이러한 방법은 심리음향모델(psychoacustical model)에서 도입되었다. 음향압축에서는 이러한 심리음향모델을 사용하여 인간이 지각할 수 없는 한도 내에서 부호화하지 않는 지각음향부호화(perceptual audio coding)사용한다. 지각음향부호화는 분석필터와 합성필터로 각각 부호화 복호화하는데 이것은 필터뱅크(filter bank)로 구현된 서브밴드코더(subband coder) 이다. 본 논문에서는 분석필터와 합성필터에 사용되는 MDCT(Modified Discrete Cosine Transform)와 IMDCT(Inverse Modified Discrete Cosine Transform)를 FPGA에 구현하였다.

  • PDF

The Study of the Sensorineural Hearing Loss Compensation Algorithm using Psychoacoustics Model (심리음향모델을 적용한 난청 보정 알고리즘의 연구)

  • 노형철;김헌중;한헌수;차형태
    • Proceedings of the IEEK Conference
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.189-192
    • /
    • 2000
  • 본 논문에서는 청각 장애인의 보다 향상된 보청 환경을 조성하고자 청각손실을 심리음향 모델을 적용하여 감음 신경성 난청을 보정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 난청의 유형은 내이에서부터 중추 뇌에 걸친 감음계와 신경계의 장애에서 비롯되는 감음신경성 난청(sensorineural hearing loss)으로 주파수 영역상에서 MTH(minimum hearing threshold)가 균일하지 않게 상승하게되어 가청영역이 좁아지는 문제점을 해결하기 위한 방법으로 각각의 주파수 밴드마다 멀티밴드 압축 알고리즘을 적용하였다. 그러나 이 경우 각각의 주파수 밴드에 따른 서로 다른 가청 영역의 영향에 의한 변형된 스펙트럼 모양으로 인해 spectral contrast reduction과 변형된 마스킹 특성으로 인해 음성 변별력에 제한을 가하게 된다. 이것은 주변 주파수 성분들에 의한 마스킹 효과에 의한 것으로, 신호에 대한 난청인이 느끼는 지각 영역(perceptual domain)에서의 해석과 심리음향 모델 파라미터를 통한 보청기의 개발이 이루어져야 하며, 본 논문에서 그 알고리즘을 적용하였다.

  • PDF

Objectively Quantified Consonance of Complex Sounds (객관적으로 정량화된 복합 신호음의 조화도)

  • Chon, Sang-Bae;Choi, In-Yong;Lee, Min-Gu;Sung, Koeng-Mo
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권7호
    • /
    • pp.323-327
    • /
    • 2007
  • In this paper, objectively quantified consonance of complex sound is proposed as a new psychoacoustical parameter. Proposing algorithm quantifies consonance of complex sound after applying psycho acoustical models which are parts of human perception such as masking effect, equal loudness contour, and critical band. To verify proposing algorithm, experiments with 10 car horn signals which have different complex sound were performed. The experiments show cross correlation of 0.95 between objectively quantified consonance by proposing algorithm and subjectively assessed consonance by listening tests. Considering the fact that there are few psychoacoustical parameter except Zwicker parameter, proposing algorithm will help to quantify psychoacoustical effect of complex sounds objectively.

Analysis and Synthesis of Audio Signals using a Sinusoidal Model (Sine 파를 이용한 오디오 신호 분석 및 합성)

  • 남승현
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.255-258
    • /
    • 1998
  • Sine파를 이용한 오디오 분석과 합성은 고음질 저비트율 오디오 부호화에 매우 효율적인 방법의 하나로 알려져 있다. 본 논문은 sine파를 이용한 오디오 분석과 합성에 중요한 sine파 검출에 심리음향모델을 활용하는 방안을 제안하였다. 모의실험 결과, 심리음향모델을 사용한 경우 사용하지 않은 경우에 비해 합성에 사용되는 sine파의 개수를 약 50% 정도 줄일 수 있었음을 알 수 있었다. 한편 오디로 신호의 attack이나 nonstationarity를 처리할 수 있는 방법이 sine파를 이용한 오디오 부호화에 필수적이라는 사실을 확인하였고 그에 대한 대처 방안을 제시하였다.

  • PDF

MPEG 오디오 부호화 과정을 고려한 오디오 워터마킹

  • 김연정;오현오;윤대희;석종원;홍진우
    • Review of KIISC
    • /
    • 제12권1호
    • /
    • pp.19-24
    • /
    • 2002
  • 시간 영역에서 수행하는 대역확산 워터마킹의 경우 들리지 않으면서도 강인한 워터마크를 생성하기 위해 심리음향 모델을 이용한다. 주파수 영역에서 심리음향모델에 의해 변형된 PN 시퀸스는 시간 영역으로 역변환되어 원신호에 삽입된다. 워터마크가 삽입된 오디오 신호가 WEG 오디오 부호화 과정을 통과할 경우, 다시 심리음향모델과 주파수 변환을 수행하는 중복 연산이 요구된다. 본 논문에서는 WEG오디오 부호화 과정과 오디오 워터마킹 과정을 결합시킴으로써 중복 연산을 피한 효율적인 오디오 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 MPEG 오디오 부호화 중에서, 특히, MP3 부호화 과정에 대해 수행하였으며, MDCT 영역에서 워터마크를 삽입한다. 삽입된 워터마크 신호는 일반적인 대역확산 워터마킹 복호화기를 이용하여 시간 영역에서 검출이 가능하며, 기존의 방법과 유사한 수준의 복호화 성능을 나타낸다.

Improved MPEG-Audio Coding Method (MPEG 오디오 부호화 바업의 성능 향상)

  • 신종인
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.183-187
    • /
    • 1994
  • ISO/MPEG 에서는 스테레오 신호만을 부호화할 수 있는 MPEG-1 오디오 부호화 방법을 5.1 채널의 다채널 신호로 확장한 MPEG-2 오디오 방법을 제안하였다. 압축해야 될 신호가 증가하면서 MPEG에서는 채널 내의 부호화 방법으로는 MPEG-1에서 제안된 방법을 사용하고, 부가적으로 채널 간의 부호화 방법을 이용하여 MPEG-1과 호환이 가능하도록 하는 부호화 방법을 다방면에 걸쳐서 연구하여 표준화 작업을 진행하고 있다. 본 논문에서는 MPEG 오디오 부호화 방법을 두가지 측면에서 효율적으로 향상시키는 방법을 제안하고자 한다. 첫 번째는 MPEG에서 제안한 오디오 부호화 알고리듬을 개선하여 음질과 비트율에 있어 향상시키는 것으로 각 서브밴드의 비트 할당 방법과 시간 영역에서의 마스킹 효과 등을 사용한 심리음향 모델 등의 개선 방법이 제안되었다. 두 번째 방법은 부호화기의 계산량을 감소시키는 방법으로 심리음향 모델이나 비트 할당시의 계산과정에 있어 반복적인 과정은 시간 여역에서의 중복성을 이용하여 계산량에 대한 향상을 얻을 수 있었다.

  • PDF

An Efficient PN Sequence Embedding and Detection Method for High Quality Digital Audio Watermarking (고음질 디지털 오디오 워터마킹을 위한 효율적인 PN 시퀸스 삽입 및 검출 방법)

  • 김현욱;오현오;김연정;윤대희
    • Journal of Broadcast Engineering
    • /
    • 제6권1호
    • /
    • pp.21-31
    • /
    • 2001
  • In the PN-sequence based audio watermarking system, the PN sequence is shaped by a filter derived from the psychoacoustic model to increase robustness and inaudibility The psychoacoustic model calculated in each audio segment, however, requires heavy computational loads. In this paper, we propose an efficient watermarking system adopting a fixed-shape perceptual filter that substitutes psychoacoustic model derived filter. The proposed filter can shape the PN-sequence to be inaudible and enable to embed the robust watermark in a simple manner. Moreover, we propose an anchitecture for the PN-sequence compensation fitter In the watermark detecter to increase correlation between the watermark and the PN-sequence. With the proposed architecture, the blind watermark detection performance has been enhanced.

  • PDF