• 제목/요약/키워드: Front-Back Confusion

검색결과 17건 처리시간 0.03초

헤드폰 기반의 입체음향 생성에서 앞/뒤 음상정위 특성 개선 (Improvement of front-back sound localization characteristics in headphone-based 3D sound generation)

  • 김경훈;김시호;배건성;최송인;박만호
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1142-1148
    • /
    • 2004
  • 일반적으로 2채널의 헤드폰에서 입체음향을 생성하기 위해서는 HRTF(Head Related Transfer Function) DB를 이용한 바이노럴(binaural) 합성기법을 사용하게 된다(1). 그러나 비 개인화 된 HRTF DB를 이용하여 생성된 2채널 입체음향은 사용자에 따라 앞/ 뒤 또는 상/하 방향에 대해서 혼돈을 가져와 입체감을 저하시킬 수 있다. 본 논문에서는 앞/뒤 음상정위의 혼돈을 개선하기 위해 스펙트럼 단서를 부각시키는 기존의 알고리즘을 분석하고 이를 토대로 혼돈 방향의 HRTF의 차이 성분을 이용하여 스펙트럼 특성을 강조하는 방법을 제안하였다. 또한, 제안한 방식이 기존의 방법에 비해 앞/뒤 방향감이 개선됨을 청감평가 실험을 통해 확인하였다.

머리전달함수의 심리음향적 특성을 이용한 전/후 음상정위 특성 개선 (Improvement of front/back Sound Localization Characteristics using Psychoacoustics of Head Related Transfer Function)

  • 구교식;차형태
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.448-457
    • /
    • 2006
  • 일반적으로 3D 입체음향을 생성하기 위해서는 소리가 음원으로부터 청자의 두 귀에 이르는 정보를 포함하고 있는 머리전달함수를 사용한다. 그러나 HRTF의 비개인화적인 특성 때문에 양쪽 귀까지의 거리가 같아지는 혼돈원추상에서는 앞/뒤 방향지각에 대한 혼돈을 주게 됨으로써 입체감을 저하시키게 된다. 이에 본 논문에서는 인간의 청각특성에 따른 여기에너지를 이용하여 앞/뒤 음상정위의 특성을 개선하는 방법을 제안하고자 한다. 서로 대칭되는 각 HRTF의 여기 에너지를 계산하고 각 bark 대역에 따른 에너지의 비율을 추출하는 방식으로써 각 HRTF의 스펙트럼 특성을 부각시키는 방법을 제안하였으며 청감테스트를 통해서 제안한 방식이 기존 방법보다 방향감을 개선시킴을 확인할 수 있었다.

머리전달함수의 그룹화를 이용한 가상 스피커의 정위감 개선 (Improvement of virtual speaker localization characteristics using grouped HRTF)

  • 서보국;차형태
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.671-676
    • /
    • 2006
  • 일반적으로 가상 스피커 구현을 위한 음상정위 방법으로 HRTF(Head Related Transfer Function) DB를 원음에 convolution하는 기법을 사용하게 된다. 그러나 비개인화된 HRTF는 가상 스피커 구현에 있어 사용자에 따라 상/하 또는 앞/뒤 방향에 대해서 혼돈을 가져올 수 있어 정위감을 저하시킬 수 있다. 본 논문에서는 상/하, 앞/뒤 정위감을 개선하기 위해 가상 스피커 주변의 HRTF를 그룹화하여 만들어진 새로운 HRTF를 사용한 가상 스피커에 대하여 연구한다. 효과적인 HRTF 그룹화를 위해 필요한 HRTF 개수, 위치 등을 실험을 통해 결정하며, 청감 평가를 수행한다. 생성된 HRTF를 사용한 가상 스피커의 성능 평가 결과, 상/하, 앞/뒤 정위감이 개선됨을 실험을 통해 확인하였다.

Fast 360° Sound Source Localization using Signal Energies and Partial Cross Correlation for TDOA Computation

  • Yiwere, Mariam;Rhee, Eun Joo
    • Journal of Information Technology Applications and Management
    • /
    • 제24권1호
    • /
    • pp.157-167
    • /
    • 2017
  • This paper proposes a simple sound source localization (SSL) method based on signal energies comparison and partial cross correlation for TDOA computation. Many sound source localization methods include multiple TDOA computations in order to eliminate front-back confusion. Multiple TDOA computations however increase the methods' computation times which need to be as minimal as possible for real-time applications. Our aim in this paper is to achieve the same results of localization using fewer computations. Using three microphones, we first compare signal energies to predict which quadrant the sound source is in, and then we use partial cross correlation to estimate the TDOA value before computing the azimuth value. Also, we apply a threshold value to reinforce our prediction method. Our experimental results show that the proposed method has less computation time; spending approximately 30% less time than previous three microphone methods.

현실적인 3D 입체음향 구현을 위한 HRTF의 앞/뒤 음상정위 특성 개선 (Improvement of sound localization for real 3D Sound)

  • 구교식;한상일;서보국;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.415-416
    • /
    • 2007
  • HRTF DB, including the information of the sounds which is arrived to our ears, is generally used to make a 3D sound. But it can decline some three-dimensional effects by the confusion between front and back directions due to the non-individual HRTF depending on each listener. In this paper, we propose a new method to use psychoacoustic theory that reduces the confusion of sound image localization. And we make use of an excitation energy by the sense of hearing. This method is brought HRTF spectrum characteristics into relief to draw out the energy ratio about the bark band and control low frequency band. Informal listening tests show that the proposed method improves the front-back sound localization characteristics much better than the conventional methods.

  • PDF

고설 모음 환경에서 한국어 자음의 지각적 구조 (Perceptual Structure of Korean Consonants in High Vowel Contexts)

  • 배문정
    • 말소리와 음성과학
    • /
    • 제1권2호
    • /
    • pp.95-103
    • /
    • 2009
  • We investigated the perceptual structure of Korean consonants by analyzing the confusion among consonants in various vowel contexts. The 36 CV syllable types combined by 18 consonants and 2 vowels (/i/ and /u/) were presented with masking noises or in degraded intensity. The confusion data were analyzed by the INDSCAL (Individual Difference Scaling), ADCLUS (Additive Clustering) and the probability of the transmitted information. The results were compared with those of a previous study with /a/ vowel context (Bae and Kim, 2002). The overall results showed that the laryngeal features-aspiration, lax and tense-are the most salient features in the perception of Korean consonant regardless of vowel contexts, but the perceptual saliency of place features varies across vowel conditions. In high vowel (front and back vowel) contexts, sibilant consonants were perceptually salient compared to in low vowel contexts. In back vowel contexts, grave (labial and velar) consonants were perceptually salient. These findings imply that place features and vowel features strongly interact in speech perception as well as in speech production. All statistical measures from our confusion data ensured that the perceptual structure of Korean consonants correspond to the hierarchical structure suggested in the feature geometry (Clements, 1991). We discuss the link between speech perception and production as the basis of phonology.

  • PDF

A TDOA Sign-Based Algorithm for Fast Sound Source Localization using an L-Shaped Microphone Array

  • Yiwere, Mariam;Rhee, Eun Joo
    • Journal of Information Technology Applications and Management
    • /
    • 제23권3호
    • /
    • pp.87-97
    • /
    • 2016
  • This paper proposes a fast sound source localization method using a TDOA sign-based algorithm. We present an L-shaped microphone set-up which creates four major regions in the range of $0^{\circ}{\sim}360^{\circ}$ by the intersection of the positive and negative regions of the individual microphone pairs. Then, we make an initial source region prediction based on the signs of two TDOA estimates before computing the azimuth value. Also, we apply a threshold and angle comparison to tackle the existing front-back confusion problem. Our experimental results show that the proposed method is comparable in accuracy to previous three microphone array methods; however, it takes a shorter computation time because we compute only two TDOA values.

헤드폰을 이용한 가상음향 재현의 주관적, 객관적 평가 (Objective and Subjective Test of a Virtual Sound Reproduction Using a Headphone)

  • 최원재;김상명
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2003년도 춘계학술대회논문집
    • /
    • pp.611-616
    • /
    • 2003
  • The headphone is regarded as the most effective means for reproducing 3-dimentional virtual sound due to its channel separation property. However, there still exist several serious problems in headphone reproduction, such as, 'front-back confusion' and in-head localization'. These well-known problems are in general assessed by the subjective test that is based on human judgment. In this paper, an objective test is conducted in parallel with the subject test in order to validate the objective reproduction performance. Such a combined approach may be a more scientific and systematic approach to the reproduction performance.

  • PDF

바이노럴 합성을 위한 3채널 HRTF 측정 (3-channel HRTF measurement for binaural synthesis.)

  • 이신렬;김래훈;방희석;성굉모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.337-340
    • /
    • 2000
  • 입체음향 생성을 위한 기존의 방법은 크게 바이노럴 녹음기법과 머리전달함수(HRTF)를 이용한 바이노럴 합성 기법으로 나눌 수 있다. 기존 2채널 더미헤드를 이용한 바이노럴 녹음기법과 바이노럴 합성기법은 표준 더미헤드를 사용함으로써 청취자 머리와의 오차로 정면 음상 정위의 어려움, "Front-back confusion", 이동 음 음상 정위 어려움 등의 문제로 실제 녹음 현장에서는 거의 사용되지 않고 있다. 본 논문에서 제안한 3채널 더미헤드 기법은 이러한 문제점을 극복할 수 있고, 특히, HRTF 합성 시 기존의 HRTF의 문제점을 극복할 수 있는 새로운 HRTF를 구축할 수 있다. 따라서 바이노럴 합성 기법이 필요한 오락, 시뮬레이터, 음장 가청화 기술(Auralization) 프로그램 등 다양한 분야에서의 적용이 가능하다.

  • PDF

HRTF를 이용한 헤드폰 기반의 다채널 입체음향 생성 (Headphone-based multi-channel 3D sound generation using HRTF)

  • 김시호;김경훈;배건성;최송인;박만호
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.71-77
    • /
    • 2005
  • 본 논문에서는 5.1채널 입체음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위한 HRTF (Head Related Transfer Function) 기반의 입체음향 생성 시스템에 대하여 다룬다. 각 채널의 모노 입력신호는 HRTF를 이용한 바이노럴(binaural) 필터링을 통해 가상적으로 음상정위되며, 입체감과 공간감을 증가시키기 위해 잔향효과가 추가된다. 연산량 감소를 위해 음상정위 성능을 저하시키지 않는 범위에서 HRTF의 임펄스 응답 탭 수를 줄였으며, 잔향효과를 위한 음장제어부에서는 초기반사열중 주요한 성분만을 지연기로 모델링하였다. 또한 비개인화된 HRTF DB에 의란 앞/뒤 혼돈 문제를 줄이기 위하여 앞/뒤 스펙트럼의 차를 가중치로 하여 HRTF 스펙트럼을 강조하는 방법을 적용하였다. 구현한 시스템의 성능 평가 결과, 단순한 스테레오 방법이나 2채널 Down Mixing 방식에 비해 현실감 있고 방향성 있는 입체음향을 느낄 수가 있었다.