• 제목/요약/키워드: sound localization

검색결과 254건 처리시간 0.028초

오디오 기반 인간로봇 상호작용 기술 (Audio-Based Human-Robot Interaction Technology)

  • 곽근창;김혜진;배경숙;윤호섭
    • 전자통신동향분석
    • /
    • 제22권2호통권104호
    • /
    • pp.31-37
    • /
    • 2007
  • 인간로봇 상호작용 기술(human-robot interaction)은 다양한 의사소통 채널인 로봇카메라, 마이크로폰, 기타 센서를 통해 인지 및 정서적으로 상호작용할 수 있도록 로봇시스템 및 상호작용 환경을 디자인하고 구현 및 평가하는 지능형 서비스 로봇의 핵심기술이다. 본 고에서는 오디오 기반 인간로봇 상호작용 기술 중에서 음원 추적(sound localization)과 화자인식(speaker recognition) 기술의 국내외 기술동향을 살펴보고 최근 ETRI 지능형로봇연구단에서 상용화를 추진중인 시청각 기반 음원 추적(audio visual sound localization)과 문장독립 화자인식(text-independent speaker recognition)기술들을 다룬다. 또한 이들 기술들을 가정환경에서 효과적으로 사용하기 위해 음성인식, 얼굴검출, 얼굴인식 등을 결합한 시나리오에 대해서 살펴본다.

칼만 필터를 이용한 시청각 음원 정위 및 추적 (Audio-Visual Localization and Tracking of Sound Sources Using Kalman Filter)

  • 송민규;김진영;나승유
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.519-525
    • /
    • 2007
  • 최근 로봇 기술 및 응용에 대한 관심이 고조됨에 따라, 로봇의 청각기술에 대한 연구가 활발하다. 본 기술에서는 로봇 탑재용으로 인간 청각기능중 하나인 음원정위 및 추적기술에 대하여 논한다. 음원 정위 및 추적을 위하여 시청각 정보를 이용하였는데, 시각정보로는 얼굴색 기반 얼굴 탐지 정보를 이용하였으며, 양이(binaural) 기반의 음원 추정 정보가 청각 정보로서 활용되었다. 시각과 청각 정보는 Kalman 필터를 이용하여 통합하였다. 실험결과 시청각 음원 추적 기술은 일부 정보의 유실이 있을 때, 효과적으로 활용될 수 있음을 보였다.

웨이블릿을 이용한 입체음향의 확산감 제어 (3D Sound Diffusion Control Using Wavelets)

  • 김익형;정의필
    • 융합신호처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.23-29
    • /
    • 2003
  • 본 논문에서는 무향실에서 녹음된 모노 음으로부터 효과적인 음의 확산감을 얻기 위해서 스테레오 헤드폰을 이용한 개선된 입체음향 시스템의 구현을 위한 알고리듬을 제안하고자 한다. 머리전달함수(HRTF)를 이용해서 음상을 정위하고 음의 확산 효과를 위해서 시간 지연을 삽입한 웨이블릿 필터 뱅크를 이용한다. 좌$.$우 머리전달함수의 샘플링률을 변화시키면서 음상 정위의 왜곡 정도를 파악한다. 계산의 복잡도를 고려하여 공간상의 정보를 잃지 않는 가장 낮은 샘플링률을 갖는 머리전달함수와 실험 음원과의 컨벌루션 처리를 통해서 2 채널의 스테레오 음을 획득한다. 헤드폰의 좌$.$우측 신호에 대한 상관계수 값의 제어를 통해서 음의 확산 정도를 비교한다. 잔향처리를 통하여 최종적인 확산 음원을 획득한다.

  • PDF

애니메이션의 하위 텍스트로서의 음향의 연상 작용과 역할에 관한 연구 (A Study on Rolls for the Association of Sound as Subtext for Animation)

  • 김지홍
    • 디자인학연구
    • /
    • 제16권2호
    • /
    • pp.15-22
    • /
    • 2003
  • 애니메이션은 시각적 요소(visual element)와 청각적 요소(audio element)로 구성된다. 청각적 요소인 음향(sound)에는 대사(dialogue)와 음향효과(sound effects)와 음악이 있다. 애니메이션에서 청각적 요소는 시각적 요소의 부가적인 위치를 점한다고 하나 결코 그 역할과 의미는 적지 않다. 본 연구는 애니메이션의 이론적 기틀을 마련하여 단순히 오락물로써만이 아니라 예술작품으로써 애니메이션을 영상 미학적으로 승화시킬 수 있을 것이다. 음향은 애니메이션의 하위텍스트로서의 연상 작용을 위해 사용될 수 있다. 연기의 부속물로서, 라이트모티브(leitmotif)를 위해, 반어적 표현을 위하여, 성격화를 위해, 지역과 민족의 표현을 위하여 그리고 시간의 변화를 위해 음향이 연상 작용을 한다. 따라서 이러한 내용들을 애니메이션인 드림웍스사의 슈렉(Shrek)과 디즈니사의 몬스터 주식회사(Monsters Inc.)를 통해 비교 분석하여 실제 애니메이션의 제작시에 음향을 적절히 사용할 수 있도록 한다 또한 음향의 연상의 활용방안을 찾아보고, 이를 통해 영상 표현의 방법을 다양화하여 미학의 질적 수준을 향상시키는 이론적인 바탕이 되도록 한다.

  • PDF

Development of New Methods for Position Estimation of Underground Acoustic Source Using a Passive SONAR System

  • Jarng, Soon-Suck;Lee, Je-Hyeong;Ahn, Heung-Gu
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제2권1호
    • /
    • pp.69-75
    • /
    • 2000
  • The aim of the work described in this paper is to develop a complex underground acoustic system which detects and localizes the origin of an underground hammering sound using an array of hydrophones located about 100m underground. Three different methods for the sound localization will be presented, a time-delay method, a power-attenuation method and a hybrid method. In the time-delay method, the cross correlation of the signals received from the array of sensors is used to calculate the time delays between those signals. In the power-attenuation method, the powers of the received signals provide a measure of the distances of the source from the sensors. In the hybrid method, both informations of time-delays and power-ratios are coupled together to produce better performance of position estimation. A new acoustic imaging technique has been developed for improving the hybrid method. This new acoustic imaging method shows the multi-dimensional distribution of the normalized cost function, so as to indicate the trend of the minimizing direction toward the source location. For each method the sound localization is carried out in three dimensions underground. The distance between the true and estimated origins of the source is 28m for a search area of radius 250m.

  • PDF

음원 위치 검출기의 구현 (Implementation of Sound Source Location Detector)

  • 이종혁;김진천
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1017-1025
    • /
    • 2000
  • 인간의 청각시스템은 두 가지 요소 즉, ITD(Interaural Time Difference)와 IID(Interaural Intensity Difference)를 처리하여 음원의 위치와 추적을 하고 있다. 본 연구에서는 음원의 위치 검출을 위하여 ITD와 IID 뿐만 아니라 이전의 위치 정보를 이용하여 정확한 음원의 방향을 결정할 수 있는 TEPILD(Time Energy Previous Integration Location Detector) 모델을 제안하였다. TEPILD 모델에서 time function generator는 ITD, energy function generator는 IID를 처리할 수 있도록 하였다. 음원은 정현파(500Hz,1kHz, 2kHz, 3kHz), White noise, Pink noise, News, Music으로 하고 음원의 방향은 right, front right, front, front left, left로 하였다. 실험 결과 전체 평균 정확도가99.2로 좋은 결과를 얻을 수 있었으며, TEPILD가 음원 위치 검출기에 이용될 수 있음을 확인하였다.

  • PDF

수동형 SONAR 시스템을 사용한 지하 진원지의 추정 (Position estimation of underground acoustic source origin using a passive SONAR system)

  • 장순석;이제형;안흥구;최현호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.103-108
    • /
    • 1999
  • The aim of the work described in this paper is to develop a complex underground acoustic system which detects and localizes the origin of an underground hammering sound using an array of hydrophones located about loom underground. Three different methods for the sound localization will be presented, a time-delay method, a power-attenuation method and a hybrid method. In the time-delay method, the cross correlation of the signals received from the array of sensors is used to calculate the time delays between those signals. In the power-attenuation method, the powers of the received signals provide a measure of the distances of the source from the sensors. In the hybrid method, both informations of time-delays and power-ratios are coupled together to produce better performance of position estimation. A new acoustic imaging technique has been developed for improving the hybrid method. This new acoustic imaging method shows the multi-dimensional distribution of the normalized cost function, so as to indicate the trend of the minimizing direction toward the source location. For each method the sound localization is carried out in three dimensions underground. The distance between the true and estimated origins of the source is 28m for a search area of radius 250m.

  • PDF

HRTF Measurement and Its Application for 3-D Soung Localization

  • Kang, Kyeong Ok;Kang, Dong-Gyu;Hahn, Minsoo;Jho, Moon Jae;Jeong, Dae-Gwon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제16권3E호
    • /
    • pp.50-55
    • /
    • 1997
  • Based on the anthropometric data of Korea male adults, a head and torso simulator(HATS) is constructed to measure its head related transfer functions (HRTFs) which can be used for three dimensional (3-D) sound localization. The HRTFs binaural impulse responses, are measured in an anechoic chamber using a burst maximum length sequence (MLS) signal of 65,535 samples and 32,768 samples acquisition at the sampling rate of 75.47kHz. Also measured are the impulse responses of a driving loudspeaker and some headphones for sound reproduction to get the exact HRTF of the HATS-alone. Through a post-processing procedure, the impulse-version HRTFs at the sampling frequency of 44.1 kHz, which have filter lengths of 512 points, are finally obtained. As an application of the measured HRTFs, a 3-D sound processor for headphone reproduction has been developed. The signal intervals to be processed can be selected and each interval is manipulated to have its diretionality and distance information by using corresponding HRTF and energy control.

  • PDF

New method development for position estimation of underground acoustic source using a passive SONAR system

  • Jarng, Soon-Suck;Lee, Je-Hyeong;Ahn, Heung-Gu;Park, Heun-Ho
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1999년도 제14차 학술회의논문집
    • /
    • pp.149-152
    • /
    • 1999
  • The aim of the work described in this paper is to develop a complex underground acoustic system which detects and localizes the origin of an underground hammering sound using an array of hydrophones located about loom underground. Three different methods for the sound localization will be presented, a time-delay method, a power-attenuation method and a hybrid method. In the time-delay method, the cross correlation of the signals received from the way of sensors is used to calculate the time delays between those signals. In the power-attenuation method, the powers of the received signals provide a measure of the distances of the source from the sensors. In the hybrid method, both informations of time-delays and power-ratios are coupled together to produce better performance of position estimation. A new acoustic imaging technique has been developed for improving the hybrid method. For each method the sound localization is carried out in three dimensions underground. The minimum distance between the true and estimated origins of the source is 28 m for a search area of radius 250m.

  • PDF

입체음향 구현을 위한 머리전달함수의 IIR필터 설계 (IIR Filter Design of HRTF for Implementation of 3D Sound)

  • 김판곤;박장식;김현태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.341-345
    • /
    • 2005
  • 본 논문에서는 FIR 필터를 IIR 필터로 근사시키는 알고리즘을 제안한다. 제안하는 알고리즘은 균형화모델감소법의 개념을 바탕으로 한다. 더미 헤더의 머리전달함수를 32차 IIR 필터로 모델링한다. 근사화된 머리전달함수를 해드폰을 통해 바이노럴 사운드로 재생하면 입체음향이 구현된다. 컴퓨터 시뮬레이션과 DSP 보드를 병행하여 실험하였다. 10명의 피실험자를 대상으로 한 실험을 통해 기존의 FIR 필터를 사용한 경우와 같이 IIR 필터로 구현한 근사화된 머리전달함수를 사용한 경우도 동일하게 인지된 것을 확인할 수 있었다.

  • PDF