• 제목/요약/키워드: 청각음향

검색결과 229건 처리시간 0.029초

현실감있는 입체음향 생성을 위한 머리전달함수의 개선 (Improvement of Head Related Transfer Function to Create Realistic 3D Sound)

  • 구교식;차형태
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.381-386
    • /
    • 2008
  • 최근 게임, 멀티미디어 콘텐츠, 가상현실 등을 제공하는 멀티미디어 장치에서 2개의 스피커나 헤드폰을 이용하여 3차원 입체 음향효과를 내고자 하는 가상 입체음향 기법에 관한 연구가 많이 이루어지고 있다. 가상 입체음향 기법 중 가장 대표적인 것으로는 소리가 음원으로부터 청자의 두 귀에 이르는 정보를 포함하고 있는 머리전달함수를 사용하는 방법이 있다. 그러나 이 방법은 혼돈원추 상에서 음상정위의 혼돈을 주게 됨으로서 입체감이 저하된다는 단점이 있다. 본 논문에서는 인간의 청각특성에 따른 여기에너지를 이용하여 현실감있는 입체음향을 생성하는 알고리즘을 제안하고자 한다. 서로 대칭되는 각 머리전달함수의 여기에너지를 계산하고 각 bark 대역에 따른 비율을 추출한 후 앞방향에 해당하는 머리전달함수의 저주파 영역을 보상해줌으로서 스펙트럼 특성을 부각시키는 새로운 방법을 제안하였으며 청감테스트를 통하여 제안한 방식이 기존의 방법보다 방향감을 개선시킴을 확인할 수 있었다.

MP3 와 AAC 압축에 강인한 오디오 워터마킹 기술에 관한 연구 (A Study of Robust Watermarking Technique against MP3 and AAC Audio Compression)

  • 이한호;김종원;최종욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.213-216
    • /
    • 2001
  • 본 논문은 심리음향모델과 주파수변환을 이용하여 MP3 와 AAC 의 압축에서 강인하게 살아남을 수 있는 디지털 오디오 워터마킹 알고리즘에 관한 것이다. 워터마크를 의사난수열이나 이미지 등 외부 정보를 이용하지 않고 원본음악으로부터 생성시킨다는 것이 본 논문의 가장 큰 특징으로 원본 오디오로부터 생성된 워터마크는 음악과 융합되어 워터마크의 삽입여부를 일반인의 청각으로는 인식할 수 없다.

  • PDF

ISO/MPEG-1 오디오 부호화 기술 분석 (Analysis of ISO/MPEG-1 Audio Coding Method)

  • 홍진우
    • 전자통신동향분석
    • /
    • 제10권2호통권36호
    • /
    • pp.191-201
    • /
    • 1995
  • ISO/MPEG 오디오 그룹은 2채널 스테레오 오디오에 대한 압축 부호화 알고리즘을 ISO/MPEG-1 오디오 표준으로 정하고, 국제 표준 (ISO 11172-3)으로 제정하였다. ISO/MPEG-1 오디오의 주요 목적중 하나는 한정된 용량의 저장매체나 제한된 전송채널의 조건하에서 고품질의 오디오를 저장하거나 전송할 수 있는 저비트율의 오디오 압축 부호화 알고리즘의 표준을 개발하는 것이다. 이를 위해 ISO/MPEG 오디오에서는 심리음향 특성을 모델링한 지각 부호화 방식을 사용하여 원신호와 재생신호 사이에 정보의 객관 측정량의 차이는 있으나 주관 측정량의 차이가 없도록 한다. 이 글에서는 ISO/MPEG-1 오디오 부호화의 계층 I과 계층 II를 중심으로 하여 표준의 개요, 청각 특성을 이용한 심리 음향 모델, 부호화 알고리즘, 데이타 구조, 그리고 응용분야 등에 대해 기술하였다.

머리전달함수의 인지량적 평가 방법과 이를 이용한 음상 정위 기법의 연구 (Evaluation method of Perception-based HRTFs and Its Usage for Spatial Sound-Image Localisation)

  • 정완섭;황신;방승범;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.231-236
    • /
    • 1999
  • 금번 연구는 공간 음상 정위에 직면하는 주된 문제점인 음색왜곡과 음질저하의 영향 인자들과 개선방안을 고찰한다. 측정 머리전달함수로부터 청각기관의 공간 음상에 대만 인지양적 특성치 (양귀 음압레벨 차이 ILD와 음압 도달시간 차비 ITD)를 추정하는 새로운 방법의 제안, 총간 음상정위 특성치의 새로운 DB구축, 그러고 이를 이용한 공간 음상 정위 구현방법의 새로운 방안을 소개한다. 그리고, 제안된 공간 음상 구현 기법은 음색 왜곡 및 음질저하를 최소화할 뿐 아니라 구현 방법의 간결성 때문에 제품화로 직접 적용할 수 있는 장점을 제공할 수 있음을 본 논문에서 보인다.

  • PDF

한국어 음성 파형의 편집에 의한 한국어 음운 변화에 관한 연구 (A study on the phonemic feature changes according to Korean speech waveform edition)

  • 김선일;홍기원;이행세
    • 한국음향학회지
    • /
    • 제13권6호
    • /
    • pp.60-65
    • /
    • 1994
  • 한국어의 음성 파형의 일부분을 제거하거나, 일부분을 교체하므로서 얻어진 파형을 인간의 청각에 의한 음운 변별하는 실험을 수행하였다. 이 실험을 통해서 위치에 따라 급격한 음운 변화가 발생하는 천이구간, 가감해도 음운 변화가 극히 미세하여 음운 변화가 없는 구간, 그리고 상호 치환해도 변화를 가져오지 않는 등가 음운 구간 및 음가에 결정적 영향을 미치는 구간등을 확인하였다.

  • PDF

청각자극에 의해 유발된 정서 및 주의반응의 생리적 지표 (PHYSIOLOGICAL INDICATORS OF EMOTION AND ATTENTION PROCESSES DURING AFFECTIVE AND ORIENTING AUDITORY STIULATION)

  • Estate M. Sokhadze
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.291-296
    • /
    • 1998
  • In the experiment carried out on 20 college students, recorded were frontal, temporal and occipital EEG, skin conductance response, skin conductance level, heart rate and respiration rate during listening to two music fragments with different affective valences and white noise administered immediately after negative visual stimulation. Analysis of physiological patterns observed during the experiment suggests that affective auditory stimulation with music is able to selectively modulate autonomic and cortical activity evoked by preceding aversive visual stimulation and to restore initial baseline levels. On other hand, physiological responses to white noise, which does not possess emotion-eliciting capabilities, evokes response typical for orienting reaction after the onset of a stimulus and is rapidly followed by habituation. Observed responses to white noise were similar to those specific to attention only and had no evidence for any emotion-related processes. Interpretation of the obtained data is considered in terms of the role of emotional and orienting significance of stimuli, dependence of effects on the background physiological activation level and time courses of attention and emotion processes. Physiological parameters are summarized with regard to their potential utility in differentiation of psychological processes induced by auditory stimuli.

  • PDF

지각 필터 응답 보상을 통한 음질 개선 (Improvement of Sound Quality using Compensation of Perceptual Filter Response)

  • 채병국;차혁근;차형태
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.295-298
    • /
    • 2004
  • 본 논문에서는 잡음에 오염된 신호의 지각관계를 해석하여 지각 필터 응답 제어를 통한 음성 신호 개선 알고리즘을 제안한다. 음성 신호 개선 기법은 단일 채널환경에서 사람의 청각시스템에서의 주파수 변별력을 나타내는 각각의 임계대역에 대한 전체 에너지를 나타내는 임계대역 에너지의 지각적인 확산의 영향 즉, 마스킹 확산의 영향을 나타내는 자극에너지를 이용하여 신호와 잡음 에너지에 의해 변화하는 잡음에 의한 신호의 마스킹 구간을 검출하여 묵음 구간 추출 잡음 필터응답과 추정 잡음 오차를 보상시킨 필터응답을 통한 지각 필터 응답을 보상하여 신호를 개선하는 방법이다. 실험 결과 제안한 방법을 통해 SNR에 개선과 음질 개선 효과를 얻을 수 있음을 테스트를 통해 확인하였다.

  • PDF

지각적 특성을 이용한 저 비트오율 압축 오디오 음질개선 (Audio Quality Enhancement using Perceptual Property at a Low-bitrate Compression)

  • 차혁근;채병국;차형태
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.275-278
    • /
    • 2004
  • 본 논문에서는 저 비트오율 압축 시 발생되는 신호 왜곡을 인간의 지각적 특성을 이용하여 음질을 개선하는 알고리즘을 제안한다. 저 비트오율 압축 과정에서 손실된 고주파 영역의 신호를 부가 정보를 사용하지 않고 손실되지 않은 영역의 정보를 사용하여 고주파 영역의 신호를 첨가함으로써 음질을 개선하였다. 비 손실 영역의 순음 및 비 순음 성분을 검출하여 손실영역에 해당 하모닉 성분을 청각 자극 에너지로 스케일 하여 새로운 신호를 첨가한다. 원 신호와 저 비트오율 압축으로 인해 왜곡된 신호, 그리고 본 논문의 알고리즘을 이용하여 개선된 신호를 신호 대 잡음 비를 측정하고 청감 테스트를 통해 음질 개선 효과를 확인하였다.

  • PDF

인터렉티브 하이브리드 미디어 응용기술 -MPEG-4 SNHC를 중심으로-

  • 김형곤
    • 방송과미디어
    • /
    • 제3권2호
    • /
    • pp.44-58
    • /
    • 1998
  • 최근의 멀티미디어 기술은 정보의 디지털화와 온라인화에 따라 가전, 컴퓨터, 통신 및 방송 기술이 융화되어 가는 추세에 있으며, 대화형의 하이브리드 멀티미디어 기술을 그 특징으로 하고있다. 하이브리드 멀티미디어는 컴퓨터 그래픽 및 미디(MIDI) 기술로 인위적으로 생성한 2D/3D그래픽 및 음향을 실제의 자연적인 영상과 소리에 추가하여 합성하므로 생성된다. MPEG-4는 이렇게 인위적으로 합성되거나 자연적인 영상 혹은 음향 정보의 디지털 하이브리드 멀티미디어 부호화를 목적으로 하며, 활성화된 혼합 미디어의 내용기반 처리, 상호, 동작 및 사용자의 쉬운 접근 등을 가능하게 한다. SNHC(Synthetic-Natural Hybrid Coding)는 기존의 수동적인 미디어의 전달뿐 아니라 실시간 처리가 가능한 인터랙티브 응용 분야까지 다루고 있으며, 통합된 시공간 부호화 기법을 사용하여 시각, 청각, 2차원, 3차원 컴퓨터 그래픽스 등 다양한 형태의 표준 AV(Aural/Visual) 객체를 처리한다. 표준화는 주로mesh-segmented 비디오 부호화, 구조물 부호화, 객체간의 동기화, AV 객체 스트림의 멀티플렉싱, 혼합 미디어 형태의 시-공간 통합화 등에서 이루어지게 되는데, 이는 궁극적으로 네트워크로 연결되는 가상 환경(Virtual Environment)에서 다수의 사용자가 서로 상호작용 할 수 있는 틀을 제공하는데 있다. 이러한 틀이 제공되면, 대화형 하이브리드 멀티미디어라는 새로운 형태의 정보를 사용함으로써 기존의 미디어로는 경험하지 못하는 다양한 응용과 서비스를 경험할 수 있을 것이다.

  • PDF

멜켑스트럼의 성능 향상을 위한 critical band 필터의 최적화 (Optimization of Critical Band Filter for Improving Performance of Mel-cepstrum)

  • 현동훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.403.1-406
    • /
    • 1998
  • 현재 음성 인식에서 널리 사용되고 있는 피춰 중의 하나로 멜켑스트럼을 들 수 있다. 멜켑스트럼은 인간의 청각 특성을 적용한 critical band 필터를 사용하여 구하는데, 필터의 형태를 다양하게 적용하여 같은 음성에 대해서 여러 가지의 멜켑스트럼을 구할 수 있다. 본 논문에서는 critical band 필터의 형태, 즉 필터의 모양, 인접한 필터간의 중심 주파수 간격, 그리고 필터의 대역폭을 각각 변화시키면서 멜켑스트럼을 구하여 음성 인식 성능에 미치는 영향을 분석하였다. 또한 최적의 인식 성능을 나타내는 멜켑스트럼을 구하기 위하여 simplex 기법을 사용하여 필터를 최적화하는 방법을 제안한다. DTW(dynamic time warping)를 인식 알고리즘으로 사용하였고 한국어 숫자음을 사용하여 인식 실험을 수행한 결과, 제안된 방법으로 최적화된 필터를 사용하여 구한 멜켑스트럼은 기존의 critical band 필터를 사용하는 것보다 향상된 인식 성능을 나타내었다.

  • PDF