Abstract
In this paper, a new interpolation model for the head related transfer function (HRTF) was proposed. In the method herein, we assume that the impulse response of the HRTF for each azimuth angle is given by linear interpolation of the time-delayed neighboring impulse responses of HRTFs. The time delay of the HRTF for each azimuth angle is given by sum of the sound wave propagation time from the ears to the sound source, which can be estimated by using azimuth angle, the physical shape of the underlying head and the distance between the head and sound source, and the refinement time yielding the minimum mean square error. Moreover, in the proposed model, the interpolation intervals were not fixed but varied, which were determined by minimizing the total number of HRTFs while the synthesized signals have no perceptual difference from the original signals in terms of sound location. To validate the usefulness of the proposed interpolation model, the proposed model was applied to the several HRTFs that were obtained from one dummy-head and three human heads. We used the HRTFs that have 5 degree azimuth angle resolution at 0 degree elevation (horizontal plane). The experimental results showed that using only $30\sim40%$ of the original HRTFs were sufficient for producing the signals that have no audible differences from the original ones in terms of sound location.
본 논문에서는 머리 전달 함수에 대한 새로운 보간 기법을 제안하였다. 제안된 기법은 각 방위각에 대한 머리 전달 함수의 충격파 응답이 인접 방위각에 대한 시간 지연된 충격파 응답의 선형 보간으로 주어진다고 가정하였다. 각 방위각에 대한 충격파 응답의 시간 지연은 방위각, 머리의 물리적 형태, 음원과 머리의 거리 정보를 이용하여 추정될 수 있는 귀와 음원간의 전파시간과 최소 자승 오차를 갖도록 하는 교정값의 합으로 주어진다. 또한 제안된 모델에서는 보간 시 방위각의 간격을 고정 간격이 아닌 가변 간격으로 하였으며 본래 충격파 응답과 보간된 충격파 응답이 본래의 충격파 응답과 비교하여 청취 상으로 큰 차이가 느껴지지 않고, 보간에 필요한 충격파 응답의 재수가 최소화되는 조건을 만족하도록 결정하였다. 제안된 보간 모델의 유용성을 검증하기 위하여 더미 헤드 및 3명의 사람으로부터 측정된 머리 전달 함수에 대해 제안된 보간 모델을 적용하였다 머리 전달 함수는 0도의 고도각을 갖는 수평면을 5도 간격의 방위각으로 분할한 총 72개가 사용되었으며, 실험 결과 전체 머리 전달 함수 중 단지 $30\sim40%$ 만을 사용하고 나머지는 보간에 의해 얻어진 머리전달 함수를 사용하더라도 청취상의 음원의 위치가 변동되지 않음을 알 수 있었다.