A Space Skew and Crosstalk Cancellation Scheme Based on Indoor Spacial Information Using Self-Generating Sounds

자체발성음을 이용한 실내공간정보 획득 및 공간뒤틀림/상호간섭 제거기법

  • 김영문 (건국대학교 전자정보통신공학부) ;
  • 유승수 (건국대학교 전자정보통신공학부) ;
  • 이기승 (건국대학교 전자정보통신공학부) ;
  • 김선용 (건국대학교 전자정보통신공학부)
  • Published : 2010.02.28

Abstract

In this paper, a method of removing the space skew and cross-talk cancellation is proposed where the self-generated signals from the subject are used to obtain the subject's location. In the proposed method, the good spatial sound image is maintained even when the listener moves from the sweet spot. Two major parts of the proposed method are as follows: listener position tracking using the stimuli from the subject and removal of the space skew and cross-talk signals. Listener position tracking is achieved by estimation of the time difference of arrival (TDoA). The position of the listener is then computed using the Talyer-series estimation method. The head-related transfer functions (HRTF) are used to remove the space skew and cross-talk signals, where the direction of the HRTF is given by the one estimated from the listener position tracking. The performance evaluation is carried out on the signals from the 100 subjects that are composed of the 50 female and 50 male subjects. The positioning accuracy is achieved by 70%~90%, under the condition that the mean squared positioning error is less than $0.07m^2$. The subjective listening test is also conducted where the 27 out of the 30 subjects are participated. According to the results, 70% of the subjects indicates that the overall quality of the reproduced sound from the proposed method are improved, regardless of the subject's position.

본 논문에서는 자체발성음을 이용한 실내공간정보 획득과 이를 이용한 공간뒤틀림 및 상호간섭 제거기법을 제안하였다. 제안한 기법은 자체발성음 기반 청취자 위치추적 부분과 공간뒤틀림 및 상호간섭 제거 부분으로 구성된다. 각기 다른 아는 위치에 있는 마이크로 수신한 청취자 자체발성음의 도달지연시간차를 추정-상관기를 사용해 추정하고, 추정된 도달지연시간차를 사용해 테일러 급수 추정법으로 청취자 위치해를 구한다. 이렇게 얻은 공간정보를 바탕으로 청취자위치의 머리전달함수를 얻고, 이를 활용해 공간뒤틀림 및 상호간섭을 제거한다. 제안한 기법의 성능평가를 위해 남성 및 여성 각 50명씩, 모두 100명의 자체발성음 데이터베이스를 구축하였으며, 100명이 각각 10회씩 생성한 자체발성음을 위치추적 성능평가에 사용하였다. 평가결과 음향효과의 차이를 느끼지 못하는 평균제곱측위오차가 $0.07m^2$이내일 확률이 약 70%~90%로 나타났다. 그리고 공간뒤틀림 및 상호간섭 제거기법의 성능평가를 위해 실시한 주관평가에서 약 70%의 평가자가 음향효과가 개선된 것으로 평가하였다.

Keywords

References

  1. 최범석, 홍진우, "입체음향 (3D 오디오) 기술과 원리", 한국방송공학회논문지, 제6권 제1호, pp.36-45, 2001년 3월.
  2. W. Gardner, "Transaural 3-D audio," MIT Media Lab. Perceptual Computing-Technical Report, No.342. 1995
  3. 김원겸, "입체음향 기술동향", 정보통신연구진흥원 주간기술동향, http://kidbs.itfrnd.or.kr/WZIN/jugidong/1130/113001.htm, 2004년 4월.
  4. C. Kyriakakis, T. Holman, J. Lim, H. Hong, and H. Neven, "Signal processing, acoustic, and psychoasoustics for high quality desktop audio," Trans. Vision Communication and Image Representation, Vol.9, No.1, pp.51-61, Mar. 1998. https://doi.org/10.1006/jvci.1998.0379
  5. P. Georgiou, A. Mouchtaris, S. Roumeliotis, and C. Kyriakakis, "Immersive sound rendering using laser-based tracking," Proc. Audio Engineering Society Convention, CD-ROM, Los Angeles, CA, Sep. 2000.
  6. S. Kim, S. Jang, D. Kong, and S. Bang, "Adaptive virtual surround sound rendering method for an arbitrary listening position," Proc. Audio Engineering Society, pp.1-9, Saariseka, Finland, Mar. 2007.
  7. 유승수, 김영문, 이정혁, 이석필, 김선용, "청취자측위 음원으로서의 박수소리 분석", 대한전자공학회 하계학술대회 논문집, CD-ROM, 대한민국 제주, 2009년 7월.
  8. W. Foy, "Position-location solutions by Taylor series estimation," Trans. IEEE Aerospace and Electronics System, vol. AES-12, No.2, pp. 187-194, Mar. 1976.
  9. S. Kay, Fundamentals of Statistical Signal Processing Volume II: Detection Theory, Prentice Hall, Inc., Upper Saddle River, NJ, 1998.
  10. V. Algazi, R. Duda, D. Thompson, and C. Avendano, "The CIPIC HRTF Database," Proc. IEEE Workshop on Applications of Signal Processing to Audio and Electroacoustics, pp. 99-102, New Paltz, NY, Oct. 2001.
  11. J. Bauck and D. Cooper, "Generalized transaural stereo and applications," Trans. Audio Engineering Society, Vol.44, No.9, pp.683-705, Sep. 1996.
  12. J. Rose, P. Nelson, B. Rafaely, and T. Takeuchi, "Sweet spot size of virtual acoustic imaging systems at asymmetric listener locations," Trans. Acoustical Society of America, Vol.112, No.5, pp.1992-2002, Nov. 2002. https://doi.org/10.1121/1.1510532
  13. B. Repp, "The sound of two hands clapping: An exploratory study," Trans. Acoustical Society of America, Vol.81, No.4, pp.1100-1109, Apr. 1987. https://doi.org/10.1121/1.394630