• 제목/요약/키워드: 심리음향모델

검색결과 71건 처리시간 0.031초

러프니스 계산 알고리즘의 구현 및 이를 이용한 러프니스 기여성분 탐색방법의 제안 (Calculation Model of Roughness for Searching Roughness-contributed Components)

  • 정혁;김현빈;이정권
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.3-12
    • /
    • 2001
  • 본 연구에서는 소리에 대한 주관적 평가 인자 중 하나인 러프니스 계산 모델을 구현하였다. 구현된 러프니스 모델은 기존 모델의 고찰을 통해 계산 모델을 구체화하였으며, 주파수 영역으로부터 상호 상관 인자를 구하는 방법 등을 이용하여 계산 효율 및 정확도를 향상시켰다. 또한 기존의 주관적인 러프니스 평가치와의 비교를 통해 구현된 모델의 유용성을 확인하였다. 한편 기존 모델 및 구현된 러프니스 계산 모델을 통해 얻을 수 있는 러프니스 스펙트럼이 주파수 영역에서의 슬롭 가진(slope excitation)의 영향으로 인해 실제 변조되는 주파수 대역을 탐색하기 어려운 점을 발견하고, 구현된 모델의 상관 인자 계산 부분을 실제 변조가 발생하는 임계 대역에서만 러프니스 스펙트럼 값이 존재하도록 수정하여, 러프니스 기여성분의 탐색이 보다 용이해진 방법을 제안하였다.

  • PDF

음성코덱에서의 잡음제거 방식 비교 (Comparion of Noise Suppression Methods in Voice CODEC)

  • 이진걸
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.43-46
    • /
    • 1998
  • 지난 30년간 부가 잡음에 의해 열화된 음성신호의 개선에 관해 많은 연구가 진행되어 왔다. 잡음제거를 위한 고전적인 방법인 spectral subtraction, Wiener filter와 최근에 제안된 심리음향모델에 근거한 perceptual filter, EVRC의 잡음제거단을 성능과 구현의 복잡도 측면에서 비교하였다.

  • PDF

Sinusoidal Function Pattern을 이용한 오디오 워터마킹의 시퀀스 생성 및 Threshold 설정 방안 (Sequence generation and measuring threshold of audio watermarking using sinusoidal function pattern)

  • 김태훈;김형중
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.87-90
    • /
    • 2003
  • 본 논문에서는 정현파를 이용한 spread-spectrum watermarking 에서 비가청성을 높이기 위한 방법과 효율적인 threshold 설정 방법을 제안한다. 제안하는 방법에서는 spread-spectrum 기법을 사용할 때 계산량이 많이 요구되는 심리음향모델 계산을 피하면서도 가청잡음을 줄이기 위한 방법을 제시한다. 또한 outlier 를 이용하여 워터마크 검출에서 적절한 threshold 설정방법을 제안한다.

  • PDF

Frequency masking과 Wavelet 변환을 이용한 적응형 오디오 워터마킹 (An Adaptive Audio Watermarking using Frequency Masking and Wavelet Transform)

  • 이동인;김순곤
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.358-363
    • /
    • 2000
  • 본 논문에서는 디지털오디오 원시 데이터의 양에 따라 적당한 양의 오디오워터마크를 생성, 삽입하여 일정한 수준의 오디오데이터의 품질을 유지하도록 하는 적응적 워터마킹을 제안한다. 제안하는 알고리즘은 심리음향모델인 frequency masking과 Wavelet 변환의 개념을 적용한다. 저작권자 혹은 소유자의 데이터는 PN-sequence를 이용하여 생성된다. 워터마크 생성량의 조절은 특정한 모듈이 담당하게 되는데 이 모듈은 원시 데이터의 크기에 따라 워터마크의 적당한 양을 산출하여 오디오데이터의 품질을 유지하도록 한다.

  • PDF

MP3 와 AAC 압축에 강인한 오디오 워터마킹 기술에 관한 연구 (A Study of Robust Watermarking Technique against MP3 and AAC Audio Compression)

  • 이한호;김종원;최종욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.213-216
    • /
    • 2001
  • 본 논문은 심리음향모델과 주파수변환을 이용하여 MP3 와 AAC 의 압축에서 강인하게 살아남을 수 있는 디지털 오디오 워터마킹 알고리즘에 관한 것이다. 워터마크를 의사난수열이나 이미지 등 외부 정보를 이용하지 않고 원본음악으로부터 생성시킨다는 것이 본 논문의 가장 큰 특징으로 원본 오디오로부터 생성된 워터마크는 음악과 융합되어 워터마크의 삽입여부를 일반인의 청각으로는 인식할 수 없다.

  • PDF

ISO/MPEG-1 오디오 부호화 기술 분석 (Analysis of ISO/MPEG-1 Audio Coding Method)

  • 홍진우
    • 전자통신동향분석
    • /
    • 제10권2호통권36호
    • /
    • pp.191-201
    • /
    • 1995
  • ISO/MPEG 오디오 그룹은 2채널 스테레오 오디오에 대한 압축 부호화 알고리즘을 ISO/MPEG-1 오디오 표준으로 정하고, 국제 표준 (ISO 11172-3)으로 제정하였다. ISO/MPEG-1 오디오의 주요 목적중 하나는 한정된 용량의 저장매체나 제한된 전송채널의 조건하에서 고품질의 오디오를 저장하거나 전송할 수 있는 저비트율의 오디오 압축 부호화 알고리즘의 표준을 개발하는 것이다. 이를 위해 ISO/MPEG 오디오에서는 심리음향 특성을 모델링한 지각 부호화 방식을 사용하여 원신호와 재생신호 사이에 정보의 객관 측정량의 차이는 있으나 주관 측정량의 차이가 없도록 한다. 이 글에서는 ISO/MPEG-1 오디오 부호화의 계층 I과 계층 II를 중심으로 하여 표준의 개요, 청각 특성을 이용한 심리 음향 모델, 부호화 알고리즘, 데이타 구조, 그리고 응용분야 등에 대해 기술하였다.

교차 예측 기반의 보컬 추정 방법을 이용한 SAOC Karaoke 모드에서의 음질 향상 기법에 대한 연구 (Quality Improvement of Karaoke Mode in SAOC using Cross Prediction based Vocal Estimation Method)

  • 이동금;박영철;윤대희
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.227-236
    • /
    • 2013
  • 본 논문에서는 SAOC의 Karaoke 모드의 출력 신호 내에 존재하는 잔여 보컬 성분을 추정하여 억제시킴으로써 음질을 향상시킬 수 있는 알고리듬을 제안하였다. 잔여 보컬 성분은 Karaoke 모드 환경으로 합성된 신호와 Solo 모드로 새로 합성된 신호를 서로 교차 예측하여 추정될 수 있다. 그러나, 두 신호는 모두 같은 다운 믹스 신호로부터 합성되는 신호이므로, 두 신호간의 높은 상관성으로 인하여 가라오케 신호내의 잔여 보컬 성분뿐만 아니라 음악 성분도 함께 제거된다. 이러한 열화를 해결하기 위해, 본 논문에서는 교차 예측 과정에서 심리 음향적 특성을 고려한 예측 방해 신호를 적용하였으며, 이 신호의 크기는 심리음향모델의 마스킹 특성에 따라 음악적 음질의 열화가 최소화되도록 적응적으로 설정되었다. 실험은 보컬 객체가 포함된 음악 신호에 대해서 객관적 및 주관적 음질평가를 수행하였으며, 전체적으로 성능 향상이 있음을 확인하였다.

2채널 트랜스오럴 필터를 이용한 최적 청취영역 확대에 관한 연구 (A Study on the Sweet-Spot Widening using 2-Channel Sound Transaural Filter)

  • 안찬식;황신;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.53-56
    • /
    • 2002
  • 본 논문은 2채널 스피커를 사용하여 청취자에게 보다 입체적인 음향 효과를 제시하기 위하여 크로스토크현상을 제거하고 청취자의 보다 자유로운 청취를 위해 최적 청취영역 확대를 위한 실험과 시스템 구현에 관한 것이다. 정면에 위치한 두 스피커로부터 교차경로인 크로스토크를 제거하기 위해 음질의 왜곡을 최소화하는 자유음장 모델을 이용하여 구현한 트랜스오럴 필터 사용하였고 최적 청취영역의 확대를 위해 스피커는 BPF(Band Pass Filter)를 이용하여 저주파와 고주파를 분리하여 각각 재생할 수 있는 스피커를 구성하였으며 저주파 영역은 제외하고 중고주파 영역을 이용하였으며 기존 크로스토크제거 시스템을 사용하여 고정된 한 점의 청취영역에서 좌${\cdot}$우로 5Cm씩 이동하au 100Cm까지 측정한 결과 30Cm, 55Cm, 75Cm, 90Cm, 100Cm에서 크로스토크제거됨을 알 수 있는 음의 분리도가 5dB이상 나타났다. 실험 결과 얻어진 각 지점들로부터 자유음장 모델을 이용하여 트랜스오럴 필터링 하였으며 각각의 간섭현상을 막기 위해 주파수 영역에서 심리음향에 기초한 1/3-Octave Band Pass Filter를 사용하여 음질 보상을 실시하였다. 음원을 제작하여 기존의 2채널 시스템에서 제시하는 음원을 각각의 위치의 음원과 비교하여 음질 평가를 실시하였으며 기존의 트랜스오럴 필터와 비교평가를 실시하였다.

  • PDF

사용자의 스트레스 완화를 위한 맞춤형 콘텐츠 서비스 시스템의 설계 및 구현 (Design and Implementation of a Customized Contents Service System for Relieving Users' Stress)

  • 김진성;김승훈
    • 한국콘텐츠학회논문지
    • /
    • 제11권2호
    • /
    • pp.101-112
    • /
    • 2011
  • 사회가 점점 고도화 되면서 스트레스는 중요한 사회적 이슈로 부각되고 있다. 본 논문에서는 스트레스의 완화를 위한 맞춤형 콘텐츠 서비스 시스템을 설계하고 구현한다. 본 제안 시스템에서는 생체신호 및 심리정보를 기반으로 스트레스 증상 및 지수를 계산하고 선호도 등의 사용자 정보를 기반으로 영상, 음향, 향기 및 조명 콘텐츠 조합을 추천하고 추천된 콘텐츠 서비스를 제공한다. 이를 위하여 본 논문에서는 스트레스 증상을 분류하고, 심리정보 측정을 위한 자가평가도구 문항을 정의하였다. 정의된 스트레스 증상에 맞게 영상, 음향, 향기 및 조명 콘텐츠를 분류하였으며, 3단계 사용자 맞춤형 콘텐츠 추천 모델을 제안하였다. 또한 사용자 맞춤형 콘텐츠 서비스 모델을 제안하였으며, 이에 따라 서비스 시스템을 설계 및 구현하였다. 본 시스템은 기존의 시스템들과는 달리 사용자 맞춤형이며 다양한 콘텐츠 조합을 서비스할 수 있는 특징이 있다.

MPEG-2 AAC 심리음향 모델을 이용한 오디오 워터마킹 기법 (The Audio Watermarking method Using the MPEG-2 AAC Psychoacoustic Model)

  • 성종수;강상구;신재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.716-719
    • /
    • 1999
  • In this Paper, we Present a method for embedding digital watermarks into digital audio signals. The watermarking must be imperceptible and should be robust to attacks, such as filtering and compression etc. In our method, we adaptively embedded the watermarks changing the scale factor using the spread spectrum and MPEG-2 AAC psychoacoustic model.

  • PDF