• Title/Summary/Keyword: 심리음향모델

Search Result 71, Processing Time 0.033 seconds

Calculation Model of Roughness for Searching Roughness-contributed Components (러프니스 계산 알고리즘의 구현 및 이를 이용한 러프니스 기여성분 탐색방법의 제안)

  • Jeong, Hyuk;Kim, Hyun-Bin;Ih, Jeong-Guon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.7
    • /
    • pp.3-12
    • /
    • 2001
  • It is known that the roughness is one of the most important metrics in assessing the sound quality. In this study, a new roughness model is suggested by combing the previous auditory filter model and several signal processing methods for the enhancement of calculation efficiency and accuracy. For testing the usefulness of the present model, the predicted responses are compared with the experimental data and it is observed that they are in good agreements. Also, it is found that the previous models have limitations to search frequency components mainly contributed to overall roughness. By modifying the correlation criteria of the present model, the revised model for the proper estimation of roughness-contributed components is embedded.

  • PDF

Comparion of Noise Suppression Methods in Voice CODEC (음성코덱에서의 잡음제거 방식 비교)

  • Lee, Jin-Geol
    • The Journal of Engineering Research
    • /
    • v.3 no.1
    • /
    • pp.43-46
    • /
    • 1998
  • Considerable research in the last three decades has examined the problem of enhancement of speech degraded by additive background noise. We compare traditional methods such as spectral subtraction and Wiener filter, recently proposed psychoacoustic model based methods such as perceptual filter and noise suppression in EVRC in terms of performance and complexity.

  • PDF

Sequence generation and measuring threshold of audio watermarking using sinusoidal function pattern (Sinusoidal Function Pattern을 이용한 오디오 워터마킹의 시퀀스 생성 및 Threshold 설정 방안)

  • 김태훈;김형중
    • Proceedings of the IEEK Conference
    • /
    • 2003.11b
    • /
    • pp.87-90
    • /
    • 2003
  • 본 논문에서는 정현파를 이용한 spread-spectrum watermarking 에서 비가청성을 높이기 위한 방법과 효율적인 threshold 설정 방법을 제안한다. 제안하는 방법에서는 spread-spectrum 기법을 사용할 때 계산량이 많이 요구되는 심리음향모델 계산을 피하면서도 가청잡음을 줄이기 위한 방법을 제시한다. 또한 outlier 를 이용하여 워터마크 검출에서 적절한 threshold 설정방법을 제안한다.

  • PDF

An Adaptive Audio Watermarking using Frequency Masking and Wavelet Transform (Frequency masking과 Wavelet 변환을 이용한 적응형 오디오 워터마킹)

  • 이동인;김순곤
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.358-363
    • /
    • 2000
  • 본 논문에서는 디지털오디오 원시 데이터의 양에 따라 적당한 양의 오디오워터마크를 생성, 삽입하여 일정한 수준의 오디오데이터의 품질을 유지하도록 하는 적응적 워터마킹을 제안한다. 제안하는 알고리즘은 심리음향모델인 frequency masking과 Wavelet 변환의 개념을 적용한다. 저작권자 혹은 소유자의 데이터는 PN-sequence를 이용하여 생성된다. 워터마크 생성량의 조절은 특정한 모듈이 담당하게 되는데 이 모듈은 원시 데이터의 크기에 따라 워터마크의 적당한 양을 산출하여 오디오데이터의 품질을 유지하도록 한다.

  • PDF

A Study of Robust Watermarking Technique against MP3 and AAC Audio Compression (MP3 와 AAC 압축에 강인한 오디오 워터마킹 기술에 관한 연구)

  • Lee, Han-Ho;Kim, Jong-Weon;Choi, Jong-Uk
    • Annual Conference of KIPS
    • /
    • 2001.04a
    • /
    • pp.213-216
    • /
    • 2001
  • 본 논문은 심리음향모델과 주파수변환을 이용하여 MP3 와 AAC 의 압축에서 강인하게 살아남을 수 있는 디지털 오디오 워터마킹 알고리즘에 관한 것이다. 워터마크를 의사난수열이나 이미지 등 외부 정보를 이용하지 않고 원본음악으로부터 생성시킨다는 것이 본 논문의 가장 큰 특징으로 원본 오디오로부터 생성된 워터마크는 음악과 융합되어 워터마크의 삽입여부를 일반인의 청각으로는 인식할 수 없다.

  • PDF

Analysis of ISO/MPEG-1 Audio Coding Method (ISO/MPEG-1 오디오 부호화 기술 분석)

  • Hong, J.W.
    • Electronics and Telecommunications Trends
    • /
    • v.10 no.2 s.36
    • /
    • pp.191-201
    • /
    • 1995
  • ISO/MPEG 오디오 그룹은 2채널 스테레오 오디오에 대한 압축 부호화 알고리즘을 ISO/MPEG-1 오디오 표준으로 정하고, 국제 표준 (ISO 11172-3)으로 제정하였다. ISO/MPEG-1 오디오의 주요 목적중 하나는 한정된 용량의 저장매체나 제한된 전송채널의 조건하에서 고품질의 오디오를 저장하거나 전송할 수 있는 저비트율의 오디오 압축 부호화 알고리즘의 표준을 개발하는 것이다. 이를 위해 ISO/MPEG 오디오에서는 심리음향 특성을 모델링한 지각 부호화 방식을 사용하여 원신호와 재생신호 사이에 정보의 객관 측정량의 차이는 있으나 주관 측정량의 차이가 없도록 한다. 이 글에서는 ISO/MPEG-1 오디오 부호화의 계층 I과 계층 II를 중심으로 하여 표준의 개요, 청각 특성을 이용한 심리 음향 모델, 부호화 알고리즘, 데이타 구조, 그리고 응용분야 등에 대해 기술하였다.

Quality Improvement of Karaoke Mode in SAOC using Cross Prediction based Vocal Estimation Method (교차 예측 기반의 보컬 추정 방법을 이용한 SAOC Karaoke 모드에서의 음질 향상 기법에 대한 연구)

  • Lee, Tung Chin;Park, Young-Cheol;Youn, Dae Hee
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.227-236
    • /
    • 2013
  • In this paper, we present a vocal suppression algorithm that can enhance the quality of music signal coded using Spatial Audio Object Coding (SAOC) in Karaoke mode. The residual vocal component in the coded music signal is estimated by using a cross prediction method in which the music signal coded in Karaoke mode is used as the primary input and the vocal signal coded in Solo mode is used as a reference. However, the signals are extracted from the same downmix signal and highly correlated, so that the music signal can be severely damaged by the cross prediction. To prevent this, a psycho-acoustic disturbance rule is proposed, in which the level of disturbance to the reference input of the cross prediction filter is adapted according to the auditory masking property. Objective and subjective test were performed and the results confirm that the proposed algorithm offers improved quality.

A Study on the Sweet-Spot Widening using 2-Channel Sound Transaural Filter (2채널 트랜스오럴 필터를 이용한 최적 청취영역 확대에 관한 연구)

  • Ahn Chan-Shik;Hwang Shin;Kim Soon-Hyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.53-56
    • /
    • 2002
  • 본 논문은 2채널 스피커를 사용하여 청취자에게 보다 입체적인 음향 효과를 제시하기 위하여 크로스토크현상을 제거하고 청취자의 보다 자유로운 청취를 위해 최적 청취영역 확대를 위한 실험과 시스템 구현에 관한 것이다. 정면에 위치한 두 스피커로부터 교차경로인 크로스토크를 제거하기 위해 음질의 왜곡을 최소화하는 자유음장 모델을 이용하여 구현한 트랜스오럴 필터 사용하였고 최적 청취영역의 확대를 위해 스피커는 BPF(Band Pass Filter)를 이용하여 저주파와 고주파를 분리하여 각각 재생할 수 있는 스피커를 구성하였으며 저주파 영역은 제외하고 중고주파 영역을 이용하였으며 기존 크로스토크제거 시스템을 사용하여 고정된 한 점의 청취영역에서 좌${\cdot}$우로 5Cm씩 이동하au 100Cm까지 측정한 결과 30Cm, 55Cm, 75Cm, 90Cm, 100Cm에서 크로스토크제거됨을 알 수 있는 음의 분리도가 5dB이상 나타났다. 실험 결과 얻어진 각 지점들로부터 자유음장 모델을 이용하여 트랜스오럴 필터링 하였으며 각각의 간섭현상을 막기 위해 주파수 영역에서 심리음향에 기초한 1/3-Octave Band Pass Filter를 사용하여 음질 보상을 실시하였다. 음원을 제작하여 기존의 2채널 시스템에서 제시하는 음원을 각각의 위치의 음원과 비교하여 음질 평가를 실시하였으며 기존의 트랜스오럴 필터와 비교평가를 실시하였다.

  • PDF

Design and Implementation of a Customized Contents Service System for Relieving Users' Stress (사용자의 스트레스 완화를 위한 맞춤형 콘텐츠 서비스 시스템의 설계 및 구현)

  • Kim, Jin-Sung;Kim, Seung-Hoon
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.2
    • /
    • pp.101-112
    • /
    • 2011
  • As the society has become maturer, stress has emerged as a hot social issue. In this paper, we proposed the design and implementation of a customized contents service system for relieving users' stress. In the proposed system, we compute the stress index from a user's biometics and psychology, and recommend a combination of video, sound, aroma, and lighting based on the index and user's data such as preferences, and provide the recommended contents service. We first classify symptoms of stress and then define a tool for self assessment. We classify video, sound, aroma, and lighting contents as well according to the defined symptoms. We propose 3-phase customized recommender and service model for customized contents service. We design and implement a customized contents service system for relieving users' stress. Different from existing systems, this proposed system has an individually-customized system and provides a diverse combination of different content's types.

The Audio Watermarking method Using the MPEG-2 AAC Psychoacoustic Model (MPEG-2 AAC 심리음향 모델을 이용한 오디오 워터마킹 기법)

  • 성종수;강상구;신재호
    • Proceedings of the IEEK Conference
    • /
    • 1999.06a
    • /
    • pp.716-719
    • /
    • 1999
  • In this Paper, we Present a method for embedding digital watermarks into digital audio signals. The watermarking must be imperceptible and should be robust to attacks, such as filtering and compression etc. In our method, we adaptively embedded the watermarks changing the scale factor using the spread spectrum and MPEG-2 AAC psychoacoustic model.

  • PDF