• Title/Summary/Keyword: 음상정위

검색결과 78건 처리시간 0.022초

반사음이 존재하는 양귀 모델의 음원분리에 관한 연구 (A study on sound source segregation of frequency domain binaural model with reflection)

  • 이채봉
    • 융합신호처리학회논문지
    • /
    • 제15권3호
    • /
    • pp.91-96
    • /
    • 2014
  • 두 개의 입력소자에 의한 음원방향 및 분리방법으로서는 연산량이 적고, 음원분리 성능이 높은 주파수 양귀 모델(Frequency Domain Binaural Model : FDBM)이 있다. FDBM은 주파수 영역에서 양귀간 위상차(Interaural Phase Difference : IPD) 및 양귀간 레벨차(Interaural Level Difference : ILD)를 구하여 음향신호가 오는 방향과 음원의 분리처리를 한다. 그러나 실제 환경에서는 반사음의 문제가 되고 있다. 이러한 반사음에 의한 영향을 줄이기 위하여 선행음 효과에 의한 직접음의 음상정위를 모의하여 초기 도착음을 검출하고 직접음이 오는 방향과 음원분리 방법을 제시하였다. 제시한 방법을 이용하여 음원방향 추정 및 분리에 대한 성능을 시뮬레이션으로 검토하였다. 그 결과, 방향추정은 음원이 오는 방향에서 ${\pm}10%$의 범위로 집중되어 음원의 방향과 가까운 값으로 추정되었다, 반사음이 존재하는 경우의 음원분리는 기존의 FDBM에 비하여 코히런스(Coherence), 음성품질 지각평가 PESQ(Perceptual Evaluation of Speech Quality : PESQ)가 높고, 정면에서의 지향특성 감쇠량이 작아 분리의 정도가 개선됨을 나타내었다. 그러나 반사음이 존재하지 않는 경우는 분리 정도가 낮았다.

현실감있는 입체음향 생성을 위한 머리전달함수의 개선 (Improvement of Head Related Transfer Function to Create Realistic 3D Sound)

  • 구교식;차형태
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.381-386
    • /
    • 2008
  • 최근 게임, 멀티미디어 콘텐츠, 가상현실 등을 제공하는 멀티미디어 장치에서 2개의 스피커나 헤드폰을 이용하여 3차원 입체 음향효과를 내고자 하는 가상 입체음향 기법에 관한 연구가 많이 이루어지고 있다. 가상 입체음향 기법 중 가장 대표적인 것으로는 소리가 음원으로부터 청자의 두 귀에 이르는 정보를 포함하고 있는 머리전달함수를 사용하는 방법이 있다. 그러나 이 방법은 혼돈원추 상에서 음상정위의 혼돈을 주게 됨으로서 입체감이 저하된다는 단점이 있다. 본 논문에서는 인간의 청각특성에 따른 여기에너지를 이용하여 현실감있는 입체음향을 생성하는 알고리즘을 제안하고자 한다. 서로 대칭되는 각 머리전달함수의 여기에너지를 계산하고 각 bark 대역에 따른 비율을 추출한 후 앞방향에 해당하는 머리전달함수의 저주파 영역을 보상해줌으로서 스펙트럼 특성을 부각시키는 새로운 방법을 제안하였으며 청감테스트를 통하여 제안한 방식이 기존의 방법보다 방향감을 개선시킴을 확인할 수 있었다.

확장폭주각 모델을 이용한 음상거리정위의 모델화 (Modeling of distance localization using by an extended auditory parallax model)

  • 김혜영;영목장일;고근소일;증근민부
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.141-146
    • /
    • 1999
  • This study aims at establishing an digital signal processing technique to control 3-D sound localization, especially focusing our eyes on the role of information provided by Head-Related Transfer Function(HRTF). In order to clarify the cues to control the auditory distance perception, two conventional models named Hirsch-Tahara model and auditory parallax model were examined. As a result, it was shown that both models have limitations to universally explain the auditory distance perception. Hence, the auditory parallax model was extended so as to apply in broader cases of auditory distance perception. The results of the experiment by simulating HRTFs based on the extented parallax model showed that the cues provided by the new model were almost sufficient to control the perception of auditory distance from an actual sound source located within about 2 m.

  • PDF

객체기반 3차원 오디오 방송 시스템 설계 (The Design of Object-based 3D Audio Broadcasting System)

  • 강경옥;장대영;서정일;정대권
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.592-602
    • /
    • 2003
  • 본 논문은 오디오를 동반한 방송 서비스에 있어서 기존의 단순 청취형의 오디오 서비스에서 탈피한 대화형의 객체 기반 3차원 오디오 방송 시스템의 구조를 설명한다. 객체기반 3차원 오디오 방송 시스템은 3차원 오디오 입력부, 3차원 오디오 편집/제작부, 3차원 오디오 부호화부, 3차원 오디오 복호화부, 3차원 오디오 장면합성부 및 3차원 오디오 재생부로 구성된다. 오디오 입력부에서는 3차원 배경음 객체와 독립적인 오디오 객체들을 획득한다. 편집/제작부에서는 오디오 객체들에 대한 3차원 음상정위 및 오디오 이미지 생성을 위한 파라미터를 설정하고, 이들을 조합하여 3차원 오디오 장면을 편집/제작한다. 부호화부에서는 장면정보와 오디오 객체들을 부호화하고, 복호화부에서는 오디오 객체들을 복원하고 장면정보를 획득한다. 장면 합성부에서는 장면정보와 오디오 객체들을 이용하여 오디오 장면을 구성한다. 3차원 오디오 재생부에서는 3차원 오디오 객체들 재생하고, 사용자의 제어신호를 이용한 대화형 기능을 구현한다.

스테레오 입체음향을 위한 머리 움직임 추정 (A Tracking of Head Movement for Stereophonic 3-D Sound)

  • 김현태;이광의;박장식
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1421-1431
    • /
    • 2005
  • 입체음향을 구현하는 방법은 두 가지가 있으며, 5.1 채널과 같은 서라운드 시스템(surround system)을 이용하는 방법과 2 채널의 바이노럴 시스템(binaural system)을 이용하는 방법이 있다. 바이노럴 시스템은 사람이 두 귀를 이용하여 음상을 정위하는 원리를 이용하는 방법이다. 일반적으로 라우더 스피커 시스템에서 각 채널사이에 발생하는 크로스토크(crosstalk)는 본래의 입체음향을 재생하기 위해서는 제거되어야만 한다. 이 문제를 해결하기 위해서는 머리의 움직임을 추정할 필요가 있다. 본 논문에서는 청취자의 머리 움직임을 제대로 추정하는 새로운 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴과 눈의 영역 검출을 기본으로 한다. 얼굴 검출은 이미지의 밝기 값을 이용하고 눈 검출은 수학적 형태학(mathematical morphology)을 이용한다. 청취자의 머리가 움직일 때 얼굴 영역과 눈 사이의 경계선의 길이가 변한다. 이 정보를 이용하여 머리 움직임을 추정한다. 컴퓨터 시뮬레이션을 통해 제안하는 알고리즘이 +10오차 범위 내에서 머리의 움직임을 효율적으로 추정하는 것을 확인하였다.

  • PDF

합성 스테레오 방식 3차원 입체음향의 실시간 구현을 위한 머리전달 함수의 IIR 필터 설계 (IIR Filter Design of HRTF for Real-Time Implementation of 3D Sound by Synthetic Stereo Method)

  • 박장식;김현태
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.74-86
    • /
    • 2005
  • 본 논문에서는 2 채널 입체음향 시스템을 효율적으로 구현하기 위하여 고차의 FIR 필터로 구현된 머리 전달함수를 저차의 IIR 필터로 근사시키는 알고리즘을 제안한다. 제안하는 알고리즘은 균형화모델감소법의 개념을 바탕으로 한다. 근사화된 머리전달함수를 헤드폰을 통해 바이노럴 사운드로 재생하면 입체음향이 구현된다. 더미 헤더의 머리전달함수를 512차 FIR 필터에서 32차 IIR 필터로 근사화하여 기존의 머리전달함수와 성능을 비교한다. 이를 위해 10명을 대상으로 음상 정위에 대한 실험을 한다. 실험은 컴퓨터 시뮬레이션과 TMS320C32를 이용한 하드웨어 실험을 병행한다. 실험을 통해 기존의 FIR 필터를 사용한 경우와 같이 IIR 필터로 근사화된 머리전달함수를 사용한 경우도 동일하게 인지되는 것을 확인할 수 있다.

  • PDF

컴퓨터 시뮬레이션을 이용한 음의 사각지역 및 음상의 경제적 개선방안 연구 (A Study for economic improvement of sound image localization and dead zone using computer simulations)

  • 고은지;이현수;이경량;김성권
    • 한국전자통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.703-708
    • /
    • 2011
  • 본 논문에서는 대형 교회를 제외한 대부분의 교회가 협소한 공간에 많은 청중을 수용하고자 발코니 층을 설치하여 음의 사각지역 및 음상 정위가 어긋난 지역이 발생하는 문제를 경제적 관점에서 컴퓨터 시뮬레이션을 이용하여 음의 사각지역 및 음상의 개선하는 해결방안을 제시한다. 본 연구에서는 특정교회에 대하여 컴퓨터 시뮬레이션 툴로 경제적으로 쉽게 구할 수 있는 Mapp online으로 사용하였으며, 서브 스피커의 추가 설치 및 메인 스피커 대비 서브 스피커의 -10 dB 이득조절로 명료도를 실측값과 비교한 결과 약 52% 상승하여 명료도가 "보통"에서 "아주 좋음" 단계로 개선됨을 확인할 수 있었다.

공간감 인자로서의 고주파 대역 포락선 양이 시간차의 유효성 (Salience of Envelope Interaural Time Difference of High Frequency as Spatial Feature)

  • 서정훈;전상배;성굉모
    • 한국음향학회지
    • /
    • 제29권6호
    • /
    • pp.381-387
    • /
    • 2010
  • 다채널 오디오 코딩 시스템을 평가함에 있어서 음색 요소뿐만 아니라 공간감 요소 역시 큰 중요성을 갖는다. 이러한 이유로 양이 시간차 왜곡 (Interaural Time Difference Distortion, ITDDist), 양이 크기차 왜곡 (Interaural Level Difference Distortion, ILDDist), 양이 상관관계 왜곡 (Interaural Cross Correlation Distortion, IACCDist)과 같은 공간감 요소를 추가하여 기존의 음질 객관 평가 권고안인 ITU-R Rec. BS. 1387-1을 다채널 오디오 시스템에 적용하기 위한 시도가 있었다. 이 다채널 오디오 시스템을 위한 확장 모델에서는 Duplex 이론에 따라, 양이 시간차 왜곡은 1.5kHz 이하의 저주파 영역에 대해서만 계산되었으며, 양이 크기차 왜곡은 2.5kHz 이상의 고주파 영역에 대해서만 계산되었다. 하지만 고주파 영역에 있어서 포락선의 양이 시간차는 공간감 인지에 있어서, 특히 음상 정위에 있어서 중요한 역할을 한다. 이러한 고주파 영역 포락선의 양이 시간차 공간감 인지에 미치는 영향을 정량적으로 분석하기 위해 해당 인자를 계산하는 방법이 본 논문에서 소개된다. 또한, 이렇게 계산된 고주파 영역 포락선의 양이 시간차는 다채널 오디오의 주관평가 결과와 높은 상관관계를 가짐을 확인한다.