• 제목/요약/키워드: Psychoacoustic model II

검색결과 8건 처리시간 0.025초

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

MPEG 심리음향 모델-ll 알고리듬의 ASIC 구현을 위한 고정 소수점 연산 최적화 (Fixed-point Processing Optimization of MPEG Psychoacoustic Model-II Algorithm for ASIC Implementation)

  • 이근섭;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권11C호
    • /
    • pp.1491-1497
    • /
    • 2004
  • 구현하기 위하여 고정 소수점 연산기에 적합하도록 최적화를 수행하였다. 최적화 과정은 크게 부호화기의 음질을 고려하여 프로세서의 데이터 워드 길이를 결정하는 과정과 자주 사용되는 초월 함수를 고정 소수점 연산을 통해 구현하는 것으로 구성된다. 데이터 워드 길이를 결정하기 위하여 심리음향 모델 과정의 고정 소수점 연산 오차와 이 오차가 비트 할당 과정에 영향을 미칠 확률 사이의 관계를 통계적 모델로 정의하였다. 여기서 정의된 모델을 사용하여 고정 소수점 연산 오차에 의한 영향이 1% 이내가 되도록 24비트의 데이터 워드를 선택하였다. 최적화된 고정 소수점 심리음향 모델을 사용한 MP3 부호화기의 음질은 부동 소수점 부호화기에 비해 W-R의 음질평가 점수를 기준으로 평균 -0.2 이내의 구분하기 힘든 수준의 음질 저하를 보였다

스포츠웨어용 투습발수직물 소리가 심리음향학적 특성에 미치는 영향 (Effect of Fabric Sound of Vapor Permeable Water Repellent Fabrics for Sportswear on Psychoacoustic Properties)

  • 이지현;이규린;진은정;양윤정;조길수
    • 감성과학
    • /
    • 제15권2호
    • /
    • pp.201-208
    • /
    • 2012
  • 본 연구에서는 심한 소음으로 불쾌감을 주는 스포츠웨어용 PTFE 라미네이팅 투습발수 직물 8종을 대상으로 직물 마찰음의 심리음향학적 특성을 고찰하고, 심리음향학적 특성에 영향을 미치는 직물의 기본 특성과 역학적 특성 간의 관계를 파악함으로써, 직물의 심리음향학적 마찰음을 낮출 수 있는 변인을 찾아내고자 하였다. 직물 마찰음 시뮬레이터를 이용하여 녹음한 직물의 소리에서 Zwicker의 파라미터인 심리음향학적 크기(loudness(Z)), 날카로움(sharpness(Z)), 거칠기(roughness(Z)), 그리고 변동강도(fluctuation strength(Z))를 계산한 뒤, 소리특성에 대한 사후검정 결과에 따라 시료를 덜 시끄러운 PTFE 필름 그룹과 더 시끄러운 PTFE 필름 그룹으로 나누어 마찰음의 심리음향학적 특성과 직물의 역학적 특성, 기본특성간의 관계를 고찰하였다. 심리음향학적 특성 중 loudness(Z)만이 시료의 마찰음과 유의한 관계에 있는 것으로 나타났으며, 분석 결과 직물의 기본 특성에서는 layer가 얇고 필라멘트사를 사용한 직물의 마찰음이 덜 시끄럽게 인지되는 것으로 나타났으며, 직물 마찰음의 심리음향학적 크기에 영향을 미치는 주요변수로는 layer로 것으로 나타났다. 마찰음이 작은 PTFE 필름 그룹의 경우 전단 방향으로의 변형이 어려울수록 마찰음이 시끄나타났다. 시끄러운 마찰음을 갖는 PTFE 필름 그룹의 경우 심리음향학적 크기에 영향을 미치는 주요 변수로 전단이력이 설명 변인으로 포함되었다.

  • PDF

MPEG-2 AAC Encoder의 심리음향 모델 최적화 (An Optimization on the Psychoacoustic Model for MPEG-2 AAC Encoder)

  • 박종태;문규성;이강현
    • 전자공학회논문지CI
    • /
    • 제38권2호
    • /
    • pp.33-41
    • /
    • 2001
  • 최근 멀티미디어 분야 중에서 가장 중요한 기술 중의 하나가 압축이다. 오디오 파일들은 인터넷을 중심으로 급속히 전파되어가고 있으며, 그 중에서 가장 유명한 것이 MP-3(MPEC-1 Layer3)인데, MP-3는 128Kbps에서 CD음질을 얻을 수 있지만 64Kbps 이하에서는 음질이 급속히 떨어진다. 반면에 MPEG-2 AAC(Advanced Audio Coding)는 MPEG-1과 호환성을 무시하지만 MP 3보다 1.4배의 높은 압축 율을 갖으며, 최대 7.1채널과 96KHz의 샘플 율을 갖는다. 본 논문에서는 MPEG-2 AAC 인코더 부분에서 막대한 연산 량을 갖는 심리음향 모델을 최적화하여 AAC 인코딩 연산 량을 감소시키며 처리속도를 증가하는 알고리즘을 제안한다. 심리음향 모델 최적화 응용 프로그램은 C++언어를 이용하여 구현하였으며, 실험결과 심리음향 모델은 SMR(Signal to Masking Ratio)을 위하여 44.1KHz의 샘플 율을 갖고 2048포인트의 FFT(Fast Fourier Transform)연산을 수행하며, 인코더 블록의 제어를 위하여 서브밴드 필터에 각각의 엔트로피 값들이 입력된다. 제안된 심리음향 모델은 비 예측성 값의 최적화로 인하여 빠른 속도로 수행되었다. 또한 비 예측성 값을 순음지수로 변화 시, 고 주파수 영역의 순음지수 값의 최적화로 연산처리 속도가 증가하였다.

  • PDF

ADSP-21020을 이용한 MPEG-II 오디오 인코더의 구현 (IMPLEMENTATION OF MPEG-II AUDIO ENCODER USING ADSP-21020)

  • 김재영;이병철;이기서;정진현
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1995년도 하계학술대회 논문집 B
    • /
    • pp.977-979
    • /
    • 1995
  • MPEG-II is the international standard of compression for digital image and digital audio that is the most important in the multimedia environment. Now many researchers are developing relevant systems. MPEG-II consists of video, audio, system and the other part. In this paper, we have designed and demonstrated two channel audio encoder system that processes the audio compression part, and excutes layer II for complexity and psychoacoustic model II, with ADSP-21020 of Analog Device.

  • PDF

지각 오디오 부호화기에서의 스펙트럼 에너지 기반 톤 성분 검출 알고리듬 (Tonality Detection based on Spectrum Energy in Perceptual Audio Coder)

  • 이근섭;연규철;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.770-776
    • /
    • 2004
  • 지각 오디오 부호화기는 신호의 지각적 중복성과 함께 지각에 무관한 성분들을 줄이기 위해 인간의 청각 특성인 마스킹 효과를 이용하여 부호화 과정에서 발생하는 양자화 잡음을 귀에 들리지 않는 수준 이하로 낮춘다. 이때 마스킹 하는 주체인 입력 신호의 특성이 들, 잡음 중 어떤 성분에 가까운지에 따라 주위의 작은 신호들을 마스킹하는 양이 달라지기 때문에 입력 신호의 특성을 알아내는 것은 지각 부호화기의 성능을 좌우하는 중요한 요소이다. 본 논문에서는 낮은 복잡도로 구현 가능한 새로운 톤 성분 검출 알고리듬을 제안하였다. 제안한 알고리듬은 MPEG 심리음향 모델-II 비해 초월함수가 적게 사용되며 사용되는 연산도 단순하기 때문에 낮은 복잡도의 부호화기 구현에 적합하다. 제안한 알고리듬은 다양한 신호들에 대해 성능평가가 수행되었으며, DSP를 사용한 구현 결과 약 3 MIPS 정도로 구현 가능하였다.

MPEG 오디오 부호화기를 위한 향상된 프리 에코 컨트롤 알고리듬 (Enhanced Pre echo Control Algorithm for MPEG Audio Coders)

  • 이창준;이재성;박영철
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.191-199
    • /
    • 2006
  • 본 논문은 심리음향 모델 II(PAM II)를 기반으로 한 MPEG 오디오 코더에 대해서 효율적으로 프리 에코(pre echo)를 제어하는 알고리듬을 제안한다. 프리 에코 제어는 PAM II에서 마스킹 임계값 계산의 마지막 단계로써, 현재 프레임에 대해서 발생하는 양자화 오차를 최소화시키는 역할을 한다. 기존에 부호화기에서 프리 에코는 추정되는 마스킹 임계치가 이전 프레임에서 얻어진 값을 넘지 않도록 제한함으로써 결정된다. 기존의 방법에서 사용되는 프리 에코 제어는 단구간 블록(short block)은 물론 장구간 블록(long block)에 대해서도 사용되는데, 이는 마스킹 임계값을 불필요하게 떨어뜨려 전체적인 양자화 잡음 레벨을 높이는 문제를 발생시킨다. 본 논문에서는 이러한 문제를 해결할 수 있는 효율적인 프리 에코 제어 과정을 제안하였다. 음질 테스트 결과에서 변화가 심한 오디오 신호에 대해서 ITU R 테스트를 시행한 결과 제안된 방법이 평균적으로 0.4점 이상 개선된 결과를 보였다.

실시간 처리를 위한 멀티채널 오디오 코덱의 구현 (The Implementation of Multi-Channel Audio Codec for Real-Time operation)

  • 홍진우
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.91-97
    • /
    • 1995
  • 본 논문은 저비트율을 갖는 고품질의 HDTV용 멀티채녈 오디오 코덱을 구현에 대해 기술한다. 이 코덱은 저주파수 효과 채널을 포함한 최대 3/2 스테레오 채널 구성, 최대 채널 구성보다 낮은 채널 구성과의 호환성, 기존 2채널 스테레오 시스템과의 호환성(MPEG-1 오디오), 그리고 다중 대화 채널 등을 제공하는 특징을 갖는다. 구현한 멀티채널 오디오 코덱의 인코더는 3개의 DSP(TI의 TMS320C40)로 구성되었고, 최대 48KHz 샘플링율과 16비트의 부호화를 갖는 5.1 채널의 아날로그 및 AES/EBU, IEC 958등의 포맷을 갖는 스테레오 2채널의 디지털 오디오를 이력으로 받아 지각 심리음향 모델을 사용하여 압축한후 384Kbps의 빛 스트림으로 전송하는 특징을 가지며, 디코더는 2개의 DSP로 구성되어 있고, 384Kbps로 입력되는 비트 스트림을 받아 최대 5.1 채널의 아날로그 및 2개의 2채널 스테레오의 디지털 오디오 신호로 출력시키는 특징을 갖는다. DSP를 이용한 다중처리는 DMA를 통한 통신포트를 이용한 DSP들간의 고속 데이터 전송에 의해 이루어진다. 끝으로, 멀티 채널 오디오 코덱의 구현을 통하여 나타난 실시간 처리는 위해 고려해야할 기술적 사항을 제안한다.

  • PDF