• 제목/요약/키워드: 심리음향모델

검색결과 71건 처리시간 0.013초

MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산 (An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model)

  • 송건호;이근섭;박영철;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.261-269
    • /
    • 2004
  • 본 논문은 MPEG 오디오 부호화 과정 중 심리음향모델(PAM: Psychoacoustic Model)에 사용되는 FFT를 효율적으로 계산할 수 있는 방법을 제안한다. MPEG 오디오 부호화 과정 중 심리음향 모델 연산은 많은 연산량을 차지하며, 부호화의 실시간 및 저 전력 구현을 위해서는 이의 최적화가 요구된다. 최적화를 위하여 제안하는 알고리듬은 심리음향모델에서 사용하는 입력신호에 대한 1024-샘플 FFT 대신에 서브밴드과정에서 나온 각각의 32개의 밴드에 대하여 32-샘플 FFT를 함으로써 1024-샘플 FFT의 효과를 얻는데 있다. 이때 서브밴드과정을 거친 신호에 대한 FFT에는 에일리어징이 발생하며 이를 줄이기 위하여 버터플라이 구조의 에일리어징 제거블록을 제안한다. 제안한 알고리듬으로 심리음향모델을 구현할 경우 SMR이 약 1dB이내의 오차를 가지며, 기존 알고리듬에 비해 절반의 연산량으로 심리음향 모델을 위한 FFT 스펙트럼을 얻을 수 있다.

간략화된 심리음향모델을 이용한 MPEG Audio Layer-III 부호화기 (MPEG Audio Layer-III Encoder Using Approximated Psy-choacoustic Model)

  • 송창준;오현오;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.469-472
    • /
    • 2001
  • MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.

  • PDF

MPEG 오디오 신호처리를 위한 MDCT/IMDCT의 FPGA 구현 (MDCT/IMDCT)

  • 노진수;이강현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.69-73
    • /
    • 2003
  • 음향압축에 있어서 인간의 청각신경의 특성을 이용하는 방식이 사용되고 있다. 이러한 방법은 심리음향모델(psychoacustical model)에서 도입되었다. 음향압축에서는 이러한 심리음향모델을 사용하여 인간이 지각할 수 없는 한도 내에서 부호화하지 않는 지각음향부호화(perceptual audio coding)사용한다. 지각음향부호화는 분석필터와 합성필터로 각각 부호화 복호화하는데 이것은 필터뱅크(filter bank)로 구현된 서브밴드코더(subband coder) 이다. 본 논문에서는 분석필터와 합성필터에 사용되는 MDCT(Modified Discrete Cosine Transform)와 IMDCT(Inverse Modified Discrete Cosine Transform)를 FPGA에 구현하였다.

  • PDF

Sine 파를 이용한 오디오 신호 분석 및 합성 (Analysis and Synthesis of Audio Signals using a Sinusoidal Model)

  • 남승현
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.255-258
    • /
    • 1998
  • Sine파를 이용한 오디오 분석과 합성은 고음질 저비트율 오디오 부호화에 매우 효율적인 방법의 하나로 알려져 있다. 본 논문은 sine파를 이용한 오디오 분석과 합성에 중요한 sine파 검출에 심리음향모델을 활용하는 방안을 제안하였다. 모의실험 결과, 심리음향모델을 사용한 경우 사용하지 않은 경우에 비해 합성에 사용되는 sine파의 개수를 약 50% 정도 줄일 수 있었음을 알 수 있었다. 한편 오디로 신호의 attack이나 nonstationarity를 처리할 수 있는 방법이 sine파를 이용한 오디오 부호화에 필수적이라는 사실을 확인하였고 그에 대한 대처 방안을 제시하였다.

  • PDF

고음질 디지털 오디오 워터마킹을 위한 효율적인 PN 시퀸스 삽입 및 검출 방법 (An Efficient PN Sequence Embedding and Detection Method for High Quality Digital Audio Watermarking)

  • 김현욱;오현오;김연정;윤대희
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.21-31
    • /
    • 2001
  • PN 시퀸스를 삽입하는 오디오 워터마킹은 들리지 않으면서도 강인한 워터마크를 만들기 위해 심리음향모델을 사용하여 PN 시퀸스를 변형시킨다. 하지만 워터마크를 삽입하는 모든 프레임에 대해 심리음향모델을 계산하기 위해서는 부호화 과정이 매우 복잡해지는 문제가 있다 부호화기에서 심리음향모델의 역할을 대신 하도록 만든 고정필터로 PN 시퀸스를 변형하면 훨씬 간단하 면서도 효율적인 워터마킹 시스템이 가능해진다. 본 논문에서는 고정된 지각필터를 도입한 효율적인 워터마킹 시스템을 제안한다. 심리음향모델을 대체하는 고정필터를 사용함으로써 PN 시퀸스를 들리지 않게 만들어주고 따라서 강인한 워터마크를 삽입할 수가 있다. 이와 함께 복호화기에서는 PN 시퀸스를 매칭시켜 상관도를 높여주는 보상필터 구조를 제안하여 원신호를 사용하지 않는 복호화기의 복호화 성능을 향상시켰다.

  • PDF

심리음향모델 기반의 디지털 오디오 워터마킹 (Digital Audio Watermarking Based on Psychoacoustic Model)

  • 송유수;김종환;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.772-775
    • /
    • 2005
  • 본 논문에서는 대역확산 기반 오디오 워터마킹 삽입에 대한 연구를 하였다. 최근 디지털 저작권을 확인하는데 디지털 워터마크가 사용되고, 영상, 문서뿐만 아니라 디지털 오디오 분야에서도 연구가 이루어지고 있다. MP3(MPEG Audio Layer-III)에 사용하는 심리음향모델을 이용함으로써 음질에 영향을 주지 않고 지각 할 수 없는 디지털 저작권을 삽입 할 수 있다. 본 논문에서는 대역확산 기반 오디오 워터마킹을 위한 심리음향모델을 분석하고 Matlab으로 모델링하여 시뮬레이션 하였으며, 이를 대역확산 기반 오디오 워터마크 삽입에 적용하였다.

  • PDF

심리음향 모델을 이용한 오디오 워터마킹 (Audio Watermark Using Psychoacoustic Model)

  • 이희숙;이우선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.859-861
    • /
    • 2001
  • 본 논문은 오디오의 masking특성을 적용한 심리음향 모델을 이용하여 오디오의 고음질을 보장하면서 잡음과 압축 등의 공격에 강한 오디오 워터마킹 방법을 제안한다. 제안하는 워터마킹 방법은 심리음향 모델에 의해 생산되는 masking thresholds와 원신호의 power spectral density의 각 주파수별 차이 에너지를 이용하여 시간도메인에서 워터마크를 삽입하는 방법으로 오디오의 품질을 유지할 수 있다. 워터마크로는 자기상관성이 강한 PN-시퀀스를 이용하여 강인한 워터마킹을 구현한다. 그리고 PN-시퀀스와 같은 이진 시퀀스 워터마크의 검출을 위한 유사도 측정식을 제안한다.

  • PDF

MPEG 오디오 부호화 과정을 고려한 오디오 워터마킹

  • 김연정;오현오;윤대희;석종원;홍진우
    • 정보보호학회지
    • /
    • 제12권1호
    • /
    • pp.19-24
    • /
    • 2002
  • 시간 영역에서 수행하는 대역확산 워터마킹의 경우 들리지 않으면서도 강인한 워터마크를 생성하기 위해 심리음향 모델을 이용한다. 주파수 영역에서 심리음향모델에 의해 변형된 PN 시퀸스는 시간 영역으로 역변환되어 원신호에 삽입된다. 워터마크가 삽입된 오디오 신호가 WEG 오디오 부호화 과정을 통과할 경우, 다시 심리음향모델과 주파수 변환을 수행하는 중복 연산이 요구된다. 본 논문에서는 WEG오디오 부호화 과정과 오디오 워터마킹 과정을 결합시킴으로써 중복 연산을 피한 효율적인 오디오 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 MPEG 오디오 부호화 중에서, 특히, MP3 부호화 과정에 대해 수행하였으며, MDCT 영역에서 워터마크를 삽입한다. 삽입된 워터마크 신호는 일반적인 대역확산 워터마킹 복호화기를 이용하여 시간 영역에서 검출이 가능하며, 기존의 방법과 유사한 수준의 복호화 성능을 나타낸다.

객관적으로 정량화된 복합 신호음의 조화도 (Objectively Quantified Consonance of Complex Sounds)

  • 전상배;최인용;이민구;성굉모
    • 한국음향학회지
    • /
    • 제26권7호
    • /
    • pp.323-327
    • /
    • 2007
  • 본 논문에서는 객관적으로 정량화된 복합 신호음의 조화도를 새로운 심리 음향 파라미터로 제안하였다. 사람이 복합신호음을 인지하는 과정에서 발생하는 masking 효과, 등청감 곡선, criticalband 등의 심리음향학적인 모델들을 적용시킨 후, 그 소리가 어느정도의 조화도를 갖는지를 정량화시키는 모델을 제안하였고, 이를 검증하기 위하여 복합음으로 구성된 자동차 Horn 신호로 실험을 수행하였다. 실험 결과, 제안한 알고리즘에 의하여 정량화된 객관적인 조화도와 청취 평가를 통한 주관적인 조화도가 0.95의 cross correlation을 보였다. 현재 객관적인 심리음향학적인 파라미터로는 Zwicker 파라미터 외에는 거의 전무한 상태여서 제안하는 알고리즘을 통하여 소리의 심리음향학적인 효과를 보다 객관적으로 파악하는 데에 도움이 될 것으로 보인다.

심리음향모델을 적용한 난청 보정 알고리즘의 연구 (The Study of the Sensorineural Hearing Loss Compensation Algorithm using Psychoacoustics Model)

  • 노형철;김헌중;한헌수;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.189-192
    • /
    • 2000
  • 본 논문에서는 청각 장애인의 보다 향상된 보청 환경을 조성하고자 청각손실을 심리음향 모델을 적용하여 감음 신경성 난청을 보정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 난청의 유형은 내이에서부터 중추 뇌에 걸친 감음계와 신경계의 장애에서 비롯되는 감음신경성 난청(sensorineural hearing loss)으로 주파수 영역상에서 MTH(minimum hearing threshold)가 균일하지 않게 상승하게되어 가청영역이 좁아지는 문제점을 해결하기 위한 방법으로 각각의 주파수 밴드마다 멀티밴드 압축 알고리즘을 적용하였다. 그러나 이 경우 각각의 주파수 밴드에 따른 서로 다른 가청 영역의 영향에 의한 변형된 스펙트럼 모양으로 인해 spectral contrast reduction과 변형된 마스킹 특성으로 인해 음성 변별력에 제한을 가하게 된다. 이것은 주변 주파수 성분들에 의한 마스킹 효과에 의한 것으로, 신호에 대한 난청인이 느끼는 지각 영역(perceptual domain)에서의 해석과 심리음향 모델 파라미터를 통한 보청기의 개발이 이루어져야 하며, 본 논문에서 그 알고리즘을 적용하였다.

  • PDF