• 제목/요약/키워드: 음원영역

검색결과 110건 처리시간 0.025초

사각영역이 없는 전방향 음원인식을 위한 QRAS 기반의 알고리즘 (QRAS-based Algorithm for Omnidirectional Sound Source Determination Without Blind Spots)

  • 김영언;박구만
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.91-103
    • /
    • 2022
  • 음원의 음량, 방향 및 음원까지의 거리와 같은 음원의 특성을 인식하는 것은 자율주행차, 로봇 시스템, AI 스피커 등 무인 시스템에서 중요한 기술 중의 하나이다. 음원의 방향이나 거리를 인식하는 방법은 레이다, 라이더, 초음파 및 고주파와 소리를 이용하는 방법이 있다. 그러나 이러한 방법은 신호를 발신하여야 하며, 장애물에 의한 비가시 영역에서 발생하는 음원은 정확하게 인식할 수 없다. 본 논문에서는 비가시 영역을 포함한 주변에서 발생하는 음원의 음량, 방향 및 음원까지의 거리를 인식하는 방법으로 가청 주파수 대역의 소리를 검출하여 인식하는 방법을 구현하고 평가하였다. 음원을 인식하기 위하여 주로 사용하는 교차형 기반의 음원인식 알고리즘은 음원의 음량과 방향을 인식할 수 있으나 사각영역이 발생하는 문제가 있다. 뿐만아니라 이 알고리즘은 음원까지의 거리를 인식할 수 없다는 제약이 있다. 이러한 기존 방법의 한계를 탈피하기 위하여, 본 논문에서는 교차형 기반의 알고리즘보다 더 발전된 직사각형 기법을 사용한 QRAS 기반의 알고리즘으로 음원의 음량, 방향 및 음원까지의 거리를 인식하여 음원의 특성을 파악할 수 있는 음원인식 알고리즘을 제안한다. 전방향 음원인식을 위한 QRAS 기반의 알고리즘은 직사각형으로 배치된 4개의 음향센서에 의하여 도출되는 6쌍의 음향 도착 시간차를 사용한다. QRAS 기반의 알고리즘은 기존 교차형 기반의 알고리즘으로 음원을 인식할 때 발생하는 사각영역과 같은 문제점을 해결할 수 있으며, 음원까지의 거리도 인식할 수 있다. 실험을 통하여 제안된 전방향 음원 인식을 위한 QRAS 기반의 알고리즘은 사각영역없이 음원의 음량, 방향 및 음원까지의 거리를 인식할 수 있음을 확인하였다.

음원신호 추출을 위한 주파수영역 응용모델에 기초한 독립성분분석 (Independent Component Analysis Based on Frequency Domain Approach Model for Speech Source Signal Extraction)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.807-812
    • /
    • 2020
  • 본 논문은 여러 음원신호가 혼합된 환경에서 목적으로 하는 음원신호만을 분리하기 위하여 마이크로폰을 사용한 블라인드 음원분리 알고리즘을 제안한다. 제안하는 알고리즘은 독립성분분석 방법을 기반으로 한 주파수영역 표현모델이다. 따라서 2 음원에 대한 주파수영역 독립성분분석의 실제 환경에서의 유효성 검증을 목적으로, 음원의 종류를 변경하여 주파수영역 독립성분분석을 실행하여 음원분리를 실시하여 그 향상효과를 검증한다. 파형에 의한 실험결과로부터 원래의 파형과 비교하여 2채널의 음원신호를 깨끗하게 분리할 수 있음을 명확히 하였다. 또한 목표 신호 대 간섭 에너지비율을 사용하여 비교한 실험 결과로부터 본 논문에서 제안한 알고리즘의 음원분리 성능이 기존의 알고리즘에 비하여 성능이 향상되었다는 것을 알 수 있었다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

피부영상을 이용한 호흡 반영 음원 조율방법에 관한 연구 (A Study on Respiratory-Reflected Music Play Using Skin Image)

  • 김성혁;홍광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.863-865
    • /
    • 2018
  • 본 논문에서는 피부영상을 이용한 호흡 반영 음원 조율 방법을 제안한다. 얼굴 영상으로부터 호흡 신호를 추정하기 위해 ROI(Region of Interest)를 지정하고 지정된 영역의 색상 체계를 RGB에서 YCgCo로 변환한다. 피부 관심 영역으로부터 계산된 Cg색상 데이터 평균값에 필터링을 적용하여 호흡 신호를 검출한다. 검출된 호흡 신호를 통하여 사용자의 호흡 상태를 반영한 음원 조율방법을 제안하고, 이를 구현한 응용 프로그램을 소개한다. 구현한 응용프로그램의 성능평가를 위해 피험자 15명을 대상으로 블라인드 테스트와 MOS 평가방법을 사용하였으며, 실험 결과 9명의 피실험자가 호흡을 반영한 음원과 반영하지 않은 음원에 대한 차이를 느꼈다. 또한, MOS 평가방법으로 두 음원의 선호도를 조사한 결과 총 5점 만점 중 호흡을 반영한 음원이 4점, 원음이 3.6점을 얻었으며 이를 통해 피실험자들이 호흡이 반영된 음원을 선호한다는 결과를 확인하였다.

입력신호 상호상관을 이용한 주파수 영역 블라인드 음원 분리 (Frequency Domain Blind Source Seperation Using Cross-Correlation of Input Signals)

  • 성창숙;박장식;손경식;박근수
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.328-335
    • /
    • 2005
  • 본 논문에서는 혼합된 입력음성신호들을 분리하기 위해 마이크로폰 어레이를 이용한 주파수영역 ICA 블라인드 음원분리 방법을 제안한다. 음성신호가 지연 혼합되어 입력되더라도 신호와 잡음을 분리하기 위한 분리행렬이 최적해로 수렴할 수 있도록 입력신호의 상호상관도를 이용하여 지연 혼합의 초기 지연값을 결정하는 방법을 제안한다. 그리고 계산량을 줄이기 위하여 주파수영역 블라인드 음원분리 알고리즘을 채용한다. 본 논문에서 제안하는 블라인드 음원분리 방법의 성능을 컴퓨터시뮬레이션을 통하여 확인한다.

  • PDF

제주분지 제 5광구 탄성파자료의 중합전 역시간 구조보정 (Prestack Reverse Time Migration for Seismic Reflection data in Block 5, Jeju Basin)

  • 고진석;장성형
    • 자원환경지질
    • /
    • 제43권4호
    • /
    • pp.349-358
    • /
    • 2010
  • 탄성파 심도영역 중합전 역시간 구조보정은 음원영역 파동외삽과 수진기영역 파동외삽의 상호상관으로 지층구조를 영상화하는 방법으로 암염돔 하부, 단층, 습곡, 심한 경사층 등 복잡한 층서구조를 영상화하는데 주로 이용된다. 여기에서는 한국지질자원연구원에서 개발된 중합전 심도영역 역시간 구조보정 기술을 국내 대륙붕 제주분지 제 5광구 탄성파 현장자료에 적용하여 음원번호 1280번 하부에 존재하는 향사 층서구조 영상을 향상시키고자 하였다. 음원모음 신호음을 향상시키기 위해 기본 자료처리를 실시하였고, 반복적으로 속도스펙트럼을 계산하는 방법으로 중합속도를 결정하여 속도모델을 구축하였다. 중합단면도상에 나타나는 향사구조는 산란파 영향으로 지층경계면의 연속성이 떨어져 보이지만 구조보정 적용 결과 탄성파 반사 에너지가 집중된 곳에서 향사구조 영상이 향상된 심도영역 지층단면도를 구할 수 있었다.

음원의 주파수와 심박변화율의 상관관계 분석 (Correlation Analyst of Music Frequence and Heart Rate Variability)

  • 김재경;박민호;장계선;고일주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제38차 하계학술발표논문집 16권1호
    • /
    • pp.337-341
    • /
    • 2008
  • 음원은 개인의 감정변화에 많은 영향을 주는 것으로 알려져 있다. 하지만 객관적인 근거가 없어 어떤 자극원이 영향을 주는지 알 수가 없다. 사람은 감정은 실시간적으로 변한다. 그렇기 때문에 이것을 측정 할 수 있는 심전도 센서를 가지고 심박변화율을 측정하여 변화되는 자극을 측정 할 수 있다. 음악은 주파수로 이루어져 있으며 음악을 들을 때 동시에 여러 대역에서 음악이 나온다. 이러한 주파수의 변화와 심박의 변화를 분석하면 감정변화의 기반하는 특징을 알 수 있을 것이다. 이것의 기초 단계로 안정감을 주는 음악은 주파수 영역이 저음 영역으로 규칙적이고 반복적이며 파형의 변화가 없다. 저음영역에서 고음영역으로 변화 되는 음원을 사용하여 심박변화율을 살펴봄으로써 자극음원이 사람에게 영향을 끼치는지를 분석하였다.

  • PDF

2차원 상의 음원위치 추정을 위한 효율적인 영역분할방법 (An efficient space dividing method for the two-dimensional sound source localization)

  • 김환용;최홍섭
    • 한국음향학회지
    • /
    • 제35권5호
    • /
    • pp.358-367
    • /
    • 2016
  • 음원의 위치를 찾는 SSL(Sound Source Localization)은 로봇과의 인터페이스, 화상회의, 스마트 자동차 등 여러 분야에서 꼭 필요한 기술이다. 일반적으로 음원의 위치 정보를 활용하는 기술들은 주로 측정 장치에 대한 음원의 각도 정보를 찾아서 이용하고 있다. 그러나 음원의 위치에 대한 각도를 추정할 때 이용하는 사인 역함수의 비선형적인 특성으로 추정된 각도에 오차가 발생하며, 이에 대한 방안으로 마이크가 담당하는 영역을 분할하는 방법이 제안되었다. 본 논문에서는 마이크 어레이 패턴에 따른 영역분할 방법을 제안하고 음원의 위치를 2차원상의 평면 좌표로 특정하는 방법으로 위치 추정 성능을 평가하였다. 실험에서 잡음에 강인한 GCC-PHAT(Generalized Cross Correlation Phase Transform) 방법을 사용했으며, 마이크 어레이의 패턴은 마이크 3개와 4개로 삼각형과 사각형 두 종류로 구성하였으며, 100개의 음성 데이터로 실험한 결과 실제 환경에서는 3개의 마이크 어레이를 사용해서는 영역 분할 해상도가 낮아서 음원의 위치를 정해진 특정 범위내로 추정하는데 실패했으나, 4개 마이크를 이용하여 해상도를 높였더니 위치추정 성공률이 67 %로 크게 향상됨을 확인할 수 있었다.

영역 분할을 이용한 효율적인 음원 위치 추정 시스템 (Efficient Sound Source Localization System Using Angle Division)

  • 김용은;조수현;정진균
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.114-119
    • /
    • 2009
  • 서비스 로봇에서 사용되는 음원인식 시스템은 사람이 로봇을 향해 말할 때 화자의 위치를 추정한다. 로봇용 음원인식 알고리즘들 중에서 복수개의 마이크로폰에 소리가 도착하는 시간지연 정보를 이용하여 음원을 추정하는 방법이 널리 이용된다. 마이크로폰에 도달하는 지연시간 정보를 구하기 위해서 상관관계 함수가 사용된다. 상관관계 함수에서 최대 값의 위치를 각도로 변환할 때 코사인 역함수가 사용되며 코사인 역함수의 비선형적인 특성 때문에 음원의 위치에 따라 마이크로폰 쌍에서 추정하는 각도의 정확성이 다르게 된다. 본 논문에서는 음원의 위치에 따라 각도를 가장 잘 추정할 수 있는 각도 영역을 구분하여 정확하게 음원의 위치를 인식하는 방법을 제안한다. 또한 제안한 방법을 이용하면 각 마이크 쌍에서 60도 범위에 대해서만 각도를 계산하므로 기존의 180도에 대한 방법에 비하여 연산이 1/2로 줄어든다. 테스트 환경을 구축하여 제안한 영역 분할 위치 추정 알고리즘과 기존 알고리즘의 성능을 비교한 결과 제안한 알고리즘의 기존 알고리즘에 의한 평균오차의 31%에 불과함을 보인다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part I: 빔공간-영역 다채널 비음수 행렬 분해 시스템 (Audio Source Separation Method Based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part I: Beamspace-domain Multichannel Non-negative Matrix Factorization system)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.317-331
    • /
    • 2012
  • 본 논문에서는 다채널 음향 신호의 음원 분리를 수행하기 위하여, 빔공간-영역에서 다채널 비음수 행렬 분해 기법을 이용하는 음원 분리 시스템을 제안한다. 비음수 행렬 분해(NMF) 기법은 음원 분리에서 최근 널리 쓰이는 알고리즘이며, 특히 최근에는 다채널 비음수 행렬 분해(MC-NMF) 기법으로 발전하여 다채널 음향 신호에 대해서 적용되고 있다. 본 논문에서 제안하는 다채널 비음수 행렬 분해 기법은 빔공간-영역에서 수행되어, 기존의 다채널 비음수 행렬 분해 기법에 비해 좋은 성능을 가진다. 제안되는 비음수 행렬 분해 기법은 SiSEC 2010의 데이터셋을 이용하여 검증되었다.