• Title/Summary/Keyword: Psychoacoustic model

검색결과 55건 처리시간 0.023초

정현파 모델을 이용한 오디오 신호의 심리음향적 분석 및 합성 (Analysis and Synthesis of Audio Signals using a Sinusoidal Model with Psychoacoustic Criteria)

  • 남승현;강경옥;홍진우
    • 한국음향학회지
    • /
    • 제18권2호
    • /
    • pp.77-82
    • /
    • 1999
  • 정현파 모델은 음성과 오디오 신호의 분석과 합성에 많이 활용되어 왔으며 최근 고음질 저비트율 오디오 부호화에 효율적인 방법의 하나로 대두되고 있다. 정현파 모델을 이용한 오디오 신호의 분석과 합성에서 중요한 단계 중의 하나는 순음의 검출이다. 본 논문은 정현파를 이용한 오디오 신호의 분석과 합성에 매스킹 효과와 매스킹 인덱스 그리고 JNDf(Just Noticeable Difference in Frequency) 등의 심리음향적 기준들을 활용하는 효율적인 방안을 제안하였다. 모의실험 결과, 심리음향적 기준을 사용하면 합성된 음질에 거의 영향을 주지 않으면서 합성에 사용되는 정현파의 개수를 현저하게 줄일 수 있었음을 알 수 있었다.

  • PDF

음성부호화기에서의 잡음제거 방식 비교 (Comparison of Noise Suppression Methods in Voice CODEC)

  • 이진걸;기훈재
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1203-1206
    • /
    • 1998
  • Considerable research in the last three decades has examined the problem of enhancement of speech degraded by additive background noise. We compare traditional methods such as spectral subtraction and Wiener filter, recently proposed psychoacoustic model based methods such as perceptual filter and noise suppression in EVRC in terms of performance and complexity.

  • PDF

지각적으로 가중된 매칭 퍼슈잇을 이용한 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Audio Signals Using Perceptually Weighted Matching Pursuit)

  • 김연지;이인성
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.96-103
    • /
    • 2003
  • 본 논문은 매칭 퍼슈잇 (Matching Pursuit)에 인지적인 가중치를 사용하여 오디오 신호를 정현파 모델링하는 것에 대해 기술한다. 매칭 퍼슈잇은 입력 신호에서 에너지가 가장 큰 성분들을 반복적으로 추출해 원 신호와 재생 신호의 차이가 영에 도달될 때까지 계속된다. 본 논문에서는 매칭 퍼슈잇에 심리음향모델을 사용한 인지적인 매칭 퍼슈잇으로 입력 신호로부터 인지적으로 중요한 성분을 차례대로 추출하였다 인지적인 매칭 퍼슈잇의 성능을 평가하기 위해 인지적인 가중치를 주지 않은 정현파 매칭 퍼슈잇과 비교 평가하였다. 여러 가지 입력 신호에 대한 실험 결과 정현파 매칭 퍼슈잇보다 인지적인 매칭 퍼슈잇의 성능이 좋았고, 특히 시간축 변화율이 큰 신호일 경우에 인지적인 매칭 퍼슈잇을 통해 원래 신호의 음질을 더 잘 복원할 수 있었음을 확인하였다.

고음질을 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Digital Audio Watermarking for a High Quality Audio)

  • 조병록;정일용;박창균;이강현
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.53-61
    • /
    • 2002
  • 본 논문에서는 고음질을 위한 디지털 오디오 워터마킹(watermarking) 알고리즘을 제안한다. 오늘날 디지털 저작물을 확인하는데 디지털 워터마크(digital watermark)가 쓰이고 있으며, 영상뿐만 아니라 디지털 오디오 분야도 연구가 활발하다. 특히, 디지털 오디오 분야에서의 워터마크 삽입은 워터마크의 강인성뿐만 아니라 워터마킹된 오디오 데이터 자체의 음질에 상당한 영향을 주게 된다. 오디오 워터마크는 일반적으로 FFT 변환 후 주파수 영역에 워터마크를 삽입하는데, 이때 워터마크 삽입 영향으로 오디오 데이터 음질에 영향을 미치게 된다. 따라서 오디오의 고음질을 유지하면서 강인한 워터마크를 삽입하는 연구가 큰 문제로 대두되었다. 논문에서는 심리음향 모델(Psychoacoustic model) 및 MDCT/IMDCT(Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform)를 사용한 고음질 오디오 워터마킹 알고리즘을 제안한다. 제안된 논문에서, 오디오 워터마킹 알고리즘을 위하여 44.1㎑, 128Kbps, 스테레오 오디오 파일을 이용하였다. 오디오 데이터가 MDCT를 통해 주파수 변환하는 과정에서 256, 1024, 2048 포인트 간격으로 워터마크를 삽입할 수 있다. 50㎳의 RMS 윈도우를 사용했을 때 원 오디오 데이터와 워터마킹 된 오디오 데이터의 전체 RMS 파워의 차이는 0.8㏈이다.

스프레드 스펙트럼 기반 디지털 오디오 워터마킹 기법 연구 (Digital Audio Watermarking Based on Spread Spectrum Techniques)

  • 진창윤;최창렬;정제창
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.257-260
    • /
    • 2001
  • In this paper, we propose a robust audio watermarking method. The proposed watermarking algorithm is composed of a psychoacoustic model to achieve perceptual transparency and spread spectrum technique to embed watermark. The watermark is embedded in each audio frame by adding a perceptually-shaped pseudo-random sequence. We demonstrate the robustness of the watermarking algorithm.

  • PDF

음성코덱에서의 잡음제거 방식 비교 (Comparion of Noise Suppression Methods in Voice CODEC)

  • 이진걸
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.43-46
    • /
    • 1998
  • 지난 30년간 부가 잡음에 의해 열화된 음성신호의 개선에 관해 많은 연구가 진행되어 왔다. 잡음제거를 위한 고전적인 방법인 spectral subtraction, Wiener filter와 최근에 제안된 심리음향모델에 근거한 perceptual filter, EVRC의 잡음제거단을 성능과 구현의 복잡도 측면에서 비교하였다.

  • PDF

심리음향 모델을 이용한 오디오 워터마킹 (Audio Watermark Using Psychoacoustic Model)

  • 이희숙;이우선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.859-861
    • /
    • 2001
  • 본 논문은 오디오의 masking특성을 적용한 심리음향 모델을 이용하여 오디오의 고음질을 보장하면서 잡음과 압축 등의 공격에 강한 오디오 워터마킹 방법을 제안한다. 제안하는 워터마킹 방법은 심리음향 모델에 의해 생산되는 masking thresholds와 원신호의 power spectral density의 각 주파수별 차이 에너지를 이용하여 시간도메인에서 워터마크를 삽입하는 방법으로 오디오의 품질을 유지할 수 있다. 워터마크로는 자기상관성이 강한 PN-시퀀스를 이용하여 강인한 워터마킹을 구현한다. 그리고 PN-시퀀스와 같은 이진 시퀀스 워터마크의 검출을 위한 유사도 측정식을 제안한다.

  • PDF

지각 오디오 부호화기에서의 스펙트럼 에너지 기반 톤 성분 검출 알고리듬 (Tonality Detection based on Spectrum Energy in Perceptual Audio Coder)

  • 이근섭;연규철;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.770-776
    • /
    • 2004
  • 지각 오디오 부호화기는 신호의 지각적 중복성과 함께 지각에 무관한 성분들을 줄이기 위해 인간의 청각 특성인 마스킹 효과를 이용하여 부호화 과정에서 발생하는 양자화 잡음을 귀에 들리지 않는 수준 이하로 낮춘다. 이때 마스킹 하는 주체인 입력 신호의 특성이 들, 잡음 중 어떤 성분에 가까운지에 따라 주위의 작은 신호들을 마스킹하는 양이 달라지기 때문에 입력 신호의 특성을 알아내는 것은 지각 부호화기의 성능을 좌우하는 중요한 요소이다. 본 논문에서는 낮은 복잡도로 구현 가능한 새로운 톤 성분 검출 알고리듬을 제안하였다. 제안한 알고리듬은 MPEG 심리음향 모델-II 비해 초월함수가 적게 사용되며 사용되는 연산도 단순하기 때문에 낮은 복잡도의 부호화기 구현에 적합하다. 제안한 알고리듬은 다양한 신호들에 대해 성능평가가 수행되었으며, DSP를 사용한 구현 결과 약 3 MIPS 정도로 구현 가능하였다.

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

Audio Watermarking through Modification of Tonal Maskers

  • Lee, Hee-Suk;Lee, Woo-Sun
    • ETRI Journal
    • /
    • 제27권5호
    • /
    • pp.608-616
    • /
    • 2005
  • Watermarking has become a technology of choice for a broad range of multimedia copyright protection applications. This paper proposes an audio watermarking scheme that uses the modified tonal masker as an embedding carrier for imperceptible and robust audio watermarking. The method of embedding is to select one of the tonal maskers using a secret key, and to then modify the frequency signals that consist of the tonal masker without changing the sound pressure level. The modified tonal masker can be found using the same secret key without the original sound, and the embedded information can be extracted. The results show that the frequency signals are stable enough to keep embedded watermarks against various common signal processing types, while at the same time the proposed scheme has a robust performance.

  • PDF