• 제목/요약/키워드: 3-D sound localization

검색결과 52건 처리시간 0.028초

멀티미디어 환경에서 언더발코니 스피커의 역할 (The role of Under-balcony Speaker in the Multimedia Environmental)

  • 송덕근;박은진;이선희
    • 한국위성정보통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.86-89
    • /
    • 2015
  • 복층이 있는 공간의 음향 특성을 계산식, 시뮬레이션 및 실측을 통해 비교해 보았다. 언더발코니 스피커의 바로 뒤 지역은 메인스피커와 딜레이 차이가 생기며, 중/저음 부분에서 충분한 음압저하가 이뤄지지 않아 컴필터링(Comb-Filtering) 현상이 크게 발생하게 된다. 또한 언더발코니 스피커의 바로 하부 지역은 스피커와 거리가 2~3m 내외로 언더발코니 스피커의 음압이 메인 스피커보다 커져 강대상과 음상일치가 깨지게 된다. 언더발코니 스피커에서 5~6m 이상 벗어나는 지역은 음의 역자승법칙에 따라 언더발코니 스피커 하부 지역보다 10dB이상 차이가 발생하며, 메인스피커에서도 중/고역 주파수(Mid/High Frequency) 음이 유입되지 않아 주파수별 음압 편차가 크게 발생하여 집중도가 떨어지게 된다. 이러한 음향 문제를 최소화하기 위해서 메인스피커의 위치 및 출력에 따른 언더발코니 스피커의 적절한 배치와 출력이 요청된다. 발코니 하부 지역을 더 쾌적한 음향 환경으로 개선하기 위해서는 언더발코니 스피커에 대한 적절한 음향설계 방향이 제시되어야 한다.

A DNN-Based Personalized HRTF Estimation Method for 3D Immersive Audio

  • Son, Ji Su;Choi, Seung Ho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권1호
    • /
    • pp.161-167
    • /
    • 2021
  • This paper proposes a new personalized HRTF estimation method which is based on a deep neural network (DNN) model and improved elevation reproduction using a notch filter. In the previous study, a DNN model was proposed that estimates the magnitude of HRTF by using anthropometric measurements [1]. However, since this method uses zero-phase without estimating the phase, it causes the internalization (i.e., the inside-the-head localization) of sound when listening the spatial sound. We devise a method to estimate both the magnitude and phase of HRTF based on the DNN model. Personalized HRIR was estimated using the anthropometric measurements including detailed data of the head, torso, shoulders and ears as inputs for the DNN model. After that, the estimated HRIR was filtered with an appropriate notch filter to improve elevation reproduction. In order to evaluate the performance, both of the objective and subjective evaluations are conducted. For the objective evaluation, the root mean square error (RMSE) and the log spectral distance (LSD) between the reference HRTF and the estimated HRTF are measured. For subjective evaluation, the MUSHRA test and preference test are conducted. As a result, the proposed method can make listeners experience more immersive audio than the previous methods.

헤드폰 청취환경에서의 실감 오디오 재현을 위한 음상 외재화 기법 (A Sound Externalization Method for Realistic Audio Rendering in a Headphone Listening Environment)

  • 김용국;전찬준;김홍국;이용주;장대영;강경옥
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.1-8
    • /
    • 2010
  • 본 논문에서는 헤드폰 재생 환경에서의 머리 밖 음상정위를 위한 음상 외재화(externalization) 기법을 제안한다. 제안된 기법에서는 기존의 머리전달함수(HRTF) 또는 초기 반사음 등을 이용한 외재화 기법들에서 발생하는 정위된 음성의 음색 왜곡을 줄이는 것에 그 초점을 맞춘다. 즉, 제안된 음상 외재화 기법은 모델 기반의 HRTF와 잔향 기법을 결합하고, 전방 음상 외재화의 성능 향상을 위하여 decorrelation 및 spectral notch 필터링 기법 등을 포함한다. 제안된 음상 외재화 기법의 성능을 평가하기 위하여 백색잡음, 효과음, 음성 및 오디오 등 다양한 장르의 음원을 이용하여, 평가자의 주관에 의한 청취평가를 수행하였다. 제안된 음상 외재화 알고리즘은 성능평가 결과에서 기존의 방법에 비해 더 좋은 외재화 거리 성능을 보였다.

Sensor Nodes Localization for Temperature Distribution Measurement System

  • Ohyama, Shinji;Alasiry, Ali Husein;Takayama, Junya;Kobayashi, Akira
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1781-1786
    • /
    • 2005
  • In sensor network systems, all the nodes are interconnected and the positional information of each sensor is essential. To measure the temperature, position detection and communication functions are required. Many sensor nodes are distributed to a measurement field, and these sensors have three main functions: they measure the distance to the other nodes, the data of which are used to determine the position of each node; they communicate with other nodes; and they measure the temperature of each node. A novel range measurement method using the difference between light and sound propagation speed is proposed. The experimental results show the temperature distribution as measured with the aid of the determined positions. The positions of every node were calculated with a PC program. Eight nodes were manufactured and their fundamental functions were tested. The results of the range measurement method, which takes relatively accurate measurements, contribute significantly to the accuracy of the position determination. Future studies will focus on 3-D position determination and on the architecture of appropriate sensors and actuators.

  • PDF

UHDTV를 위한 10.2 채널 기반 다채널 오디오 재현 기술 (Multichannel Audio Reproduction Technology based on 10.2ch for UHDTV)

  • 이태진;유재현;서정일;강경옥;김환우
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.827-837
    • /
    • 2012
  • 방송 환경이 점차 디지털로 발전해 나가면서, HDTV를 넘어서는 차세대 방송서비스에 관한 관심이 증대되고 있다. 차세대 방송 서비스는 2차원 영상 서비스에서 3차원 영상 서비스로, HD급 영상 서비스에서 UHD(Ultra High Definition)급 영상 시비스로, 5.1 채널 오디오 서비스에서 10 채널 이상의 다채널 오디오 서비스로 진화하여 고품질의 실감 방송 서비스를 제공하는 것을 목표로 하고 있다. 본 논문에서는 UHDTV 방송 서비스 환경에서 고품질의 오디오 서비스를 제공하기 위한 10.2 채널 기반의 다채널 오디오 재현 기술에 대해 설명한다. 10.2 채널 재현 시스템은 기존 5.1 채널 시스템을 기반으로 측면에 2개의 스피커를 추가하여 측면의 음상정위 성능을 향상시켰으며, 전면에 2개의 수직면 스피커와 후면에 1개의 천정 스피커를 추가하여 수평면 뿐 아니라 수직면에서의 음상정위가 가능하다. 10.2 채널 시스템에 대한 성능을 평가하기 위해 APM 모델을 활용한 객관적 음상정위 평가와 22.2 채널과 10.2 채널 재현시스템을 구축하여 청취자를 통한 실제 주관적 음상정위 평가를 수행하였다. 객관적, 주관적 음상정위 평가 결과 10.2 채널 시스템은 22.2 채널 시스템과 통계학적으로 동일한 음성정위 평가 결과를 보였고, 기존 5.1 채널 시스템 대비 우수한 음상정위 평가결과를 보여주었다.

비균일 음속 다중경로 환경에서 ML 추정기법을 이용한 표적의 3차원 위치추정 (3-D Source Localization using Maximum Likelihood Estimate in Multi-path Environment with Inhomogeneous Sound Speed)

  • 최병웅;박도현;김정수;신창홍;이정훈;이균경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.155-160
    • /
    • 2004
  • 배열센서를 사용한 표적의 위치 추정은 레이다 및 소나에서 잘 알려진 문제이다. 최근에 Lee 등은 1 차원 수평 선배열 센서만을 사용하여 다중경로를 통해 들어오는 신호로부터 표적의 3 차원 위치를 추정하였다. 그러나 이 알고리즘에서 수중에서의 음속은 수심에 관계없이 일정하다고 가정하였기 때문에 음속이 수심에 따라 다양하게 변화하는 실제 수중환경에서는 그 추정성능이 현저히 저하된다. 따라서 본 논문에서는 표적의 거리, 깊이, 방위각으로 구성되는 3 차원 위치 추정을 위해 비균일 음속환경에서의 음파전달모델(ray propagation model)을 이용한 ML 기법(maximum likelihood estimation)을 적용하였으며 일정한 음속을 가정한 Lee 기법의 추정치를 초기값으로 한 탐색을 통해 ML 기법의 연산량을 감소시켰다.

  • PDF

Virtual displays and virtual environments

  • Gilkey, R.H.;Isabelle, S.K.;Simpson, B.B.
    • 대한인간공학회지
    • /
    • 제16권2호
    • /
    • pp.101-122
    • /
    • 1997
  • Our recent work on virtual environments and virtual displays is reviewed, including our efforts to establish the Virtual Environment Research, Interactive Technology, And Simulation (VERITAS) facility and our research on spatial hearing. VERITAS is a state-of -the-art multisensory facility, built around the ${CAVE}^{TM}$ technology. High-quality 3D audio is included and haptic interfaces are planned. The facility will support technical and non-technical users working in a wide variety of application areas. Our own research emphasizes the importance of auditory stimulation in virtual environments and complex display systems. Experiments on auditory-aided visual target acquistion, sensory conflict, sound localization in noise, and loxalization of speech stimuli are discussed.

  • PDF

음향 인텐시티 기반 다채널 센서 모듈을 이용한 배관 누설 소음 탐지 (Leakage noise detection using a multi-channel sensor module based on acoustic intensity)

  • 유현빈;우정한;서윤호;김상렬
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.414-421
    • /
    • 2024
  • 본 논문에서는 누설에 의한 플랜트 대형사고 방지를 위한 기술로써, 다채널 음향 센서 모듈을 활용해 잔향 및 반향 영향이 큰 환경에서 배관 누설 소음을 탐지할 수 있는 시스템을 설계하고 검증한다. 정사면체 형태로 배열한 4채널 마이크로폰을 하나의 센서 모듈로 설계해, 3차원 음향 인텐시티 벡터를 측정한다. 잔향 및 반향 영향이 큰 환경에서는 센서 모듈 각각의 인텐시티 벡터 측정 오차가 평균적으로 증가하기 때문에, 다수의 센서 모듈을 현장에 배치하여 실제 음원 위치를 추정해야 한다. 따라서, 여러 쌍의 센서 모듈로부터 얻은 3차원 벡터 간 교점을 이용해 음원이 위치한 지점들을 추정해내고, 해당 지점들 중 이상치(예, 반사의 영향으로 현장 외부로 추정된 지점, 주변 구조물에 의한 회절 영향으로 평균 지점에서 먼 지점으로 추정된 지점 등)를 검출해 제외하는 알고리즘을 제안하였다. 현장의 도면상에 누설음 추정 위치 좌표를 1 s 이내에 가시화해 실시간으로 누설음이 발생한 위치를 발견해 즉각적인 대응이 가능한 시스템을 구성하고 검증한다. 본 연구는 대형 플랜트의 사고 대응 능력 향상 및 안전성 확보에도 기여할 수 있을 것으로 기대된다.

A Spatial Audio System Using Multiple Microphones on a Rigid Sphere

  • Lee, Tae-Jin;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Jeong, Dae-Gwon;Hamada, Hareo
    • ETRI Journal
    • /
    • 제27권2호
    • /
    • pp.153-165
    • /
    • 2005
  • The main purpose of a spatial audio system is to give a listener the same impression as if he/she were present in a recorded environment. A dummy head microphone is generally used for such purposes. Because of its human-like shape, we can obtain good spatial sound images. However, its shape is a restriction on its public use and it is difficult to convert a 2-channel recording into multi-channel signals for an efficient rendering over a multi-speaker arrangement. In order to solve the problems mentioned above, a spatial audio system is proposed that uses multiple microphones on a rigid sphere. The system has five microphones placed on special points of the rigid sphere, and it generates audio signals for headphone, stereo, stereo dipole, 4-channel, and 5-channel reproduction environments. Subjective localization experiments show that front/back confusion, which is a common limitation of spatial audio systems using the dummy head microphone, can be reduced dramatically in 4-channel and 5-channel reproduction environments and can be reduced slightly in a headphone reproduction.

  • PDF

비선형 특징추출 기법에 의한 머리전달함수(HRTF)의 저차원 모델링 및 합성 (Low Dimensional Modeling and Synthesis of Head-Related Transfer Function (HRTF) Using Nonlinear Feature Extraction Methods)

  • 서상원;김기홍;김현석;김현빈;이의택
    • 한국정보처리학회논문지
    • /
    • 제7권5호
    • /
    • pp.1361-1369
    • /
    • 2000
  • For the implementation of 3D Sound Localization system, the binaural filtering by HRTFs is generally employed. But the HRTF filter is of high order and its coefficients for all directions have to be stored, which imposes a rather large memory requirement. To cope with this, research works have centered on obtaining low dimensional HRTF representations without significant loss of information and synthesizing the original HRTF efficiently, by means of feature extraction methods for multivariate dat including PCA. In these researches, conventional linear PCA was applied to the frequency domain HRTF data and using relatively small number of principal components the original HRTFs could be synthesized in approximation. In this paper we applied neural network based nonlinear PCA model (NLPCA) and the nonlinear PLS repression model (NLPLS) for this low dimensional HRTF modeling and analyze the results in comparison with the PCA. The NLPCA that performs projection of data onto the nonlinear surfaces showed the capability of more efficient HRTF feature extraction than linear PCA and the NLPLS regression model that incorporates the direction information in feature extraction yielded more stable results in synthesizing general HRTFs not included in the model training.

  • PDF