• 제목/요약/키워드: Microphone array

검색결과 184건 처리시간 0.026초

마이크로폰 어레이 시스템을 사용한 브라인드 처리에 의한 음원분리 (Source signal separation by blind processing for a microphone array system)

  • 박진남
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.609-612
    • /
    • 2000
  • 본 논문에서는 음원에 관한 정보가 미지의 상황에서 마이크로폰 어레이를 사용하여 두 음원신호를 분리하는 ,시스템을 제안한다 이 시스템은 두 단계로 구성되어 있으며, 첫 번째 단계에서는 파워가 큰 제 1음원의 DOA(Direction Of Arrival)를 추정하고, AMUSE(Algorithm for Multiple Unknown Signals Extraction)법을 사용한 Blind Deconvolution에 의해 음원신호의 분리를 행한다 두 번째 단계에서는 파워가 낮은 제 2음원의 강조신호를 사용하여 DSA(Delay and Sum Array)법에 의해 제 2음원의 DOA를 추정하고,AMUSE법의 출력신호와 두 음원의 DOA를 이용하여 ANF(Adaptive Notch Filter)를 구성하고, 두 음원신호의 재 분리를 행한다. 그리고, 시뮬레이션을 통해 제안한 방법의 유효성을 검토한 결과 두 음원 신호가 분리 가능한 것이 확인되었다.

  • PDF

입력신호 상호상관을 이용한 주파수 영역 블라인드 음원 분리 (Frequency Domain Blind Source Seperation Using Cross-Correlation of Input Signals)

  • 성창숙;박장식;손경식;박근수
    • 한국멀티미디어학회논문지
    • /
    • 제8권3호
    • /
    • pp.328-335
    • /
    • 2005
  • 본 논문에서는 혼합된 입력음성신호들을 분리하기 위해 마이크로폰 어레이를 이용한 주파수영역 ICA 블라인드 음원분리 방법을 제안한다. 음성신호가 지연 혼합되어 입력되더라도 신호와 잡음을 분리하기 위한 분리행렬이 최적해로 수렴할 수 있도록 입력신호의 상호상관도를 이용하여 지연 혼합의 초기 지연값을 결정하는 방법을 제안한다. 그리고 계산량을 줄이기 위하여 주파수영역 블라인드 음원분리 알고리즘을 채용한다. 본 논문에서 제안하는 블라인드 음원분리 방법의 성능을 컴퓨터시뮬레이션을 통하여 확인한다.

  • PDF

지면에 고정된 선형 마이크로폰 어레이를 이용한 pass-by 소음의 가시화 (Visualization of pass-by noise by means of a line array of microphones affixed to the ground)

  • 박순홍;김양한
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2000년도 춘계학술대회논문집
    • /
    • pp.1479-1486
    • /
    • 2000
  • This paper introduces the improved moving frame acoustic holography (MFAH) method and its application. MFAH allows us to visualize the noise generated by moving noise sources by employing a vertical line array of microphones affixed to the ground. The sound field generated by moving sources is different from that of stationary ones due to the movement of the sources. Therefore the measured sound pressure by the microphone on the ground has to be processed so that it cooperates the effect of the movement. This paper discusses the effect of moving noise sources on the obtained hologram by MFAH. This assures the applicability of MFAH to the visualization of moving sources. This paper also reviews the improved MFAH that can visualize a coherent narrow band noise and a pass-by noise. The practical applicability of the improved MFAH was demonstrated by visualizing tire noise during a pass-by test.

  • PDF

조정 응답 파워 방법과 결합된 generalized cross correlation with phase transform 음원 위치 추정 (Generalized cross correlation with phase transform sound source localization combined with steered response power method)

  • 김영준;오민재;이인성
    • 한국음향학회지
    • /
    • 제36권5호
    • /
    • pp.345-352
    • /
    • 2017
  • 본 논문에서는 잔향과 잡음이 존재하는 실제 환경을 모델링하여 두 개의 마이크로폰을 이용한 음원 위치추정의 정확성을 향상시키는 방법을 제안하였다. 입력신호에 VAD(Voice Activity Detection)를 적용하여 묵음 구간을 제외한 음성 구간만을 사용하였고, 샘플링 주파수의 제한으로 인한 측정 범위를 벗어나는 프레임은 업샘플링(up-sampling)을 통해 지연시간을 다시 추정하였다. 여기서 계산된 도착 지연 시간은 Time-table을 참조해 주변 후보위치의 지연 값들과의 비교로 최대 파워 값을 갖는 지연 시간을 선택하여 음원 위치의 정확도를 높였다. 또한 프레임간의 상관성을 이용하여 연속된 음성 프레임의 경우 큰 추정 차가 발생하는 곳을 찾아 주변 프레임의 평균값으로 대체함으로써 음원의 위치 추정 성능을 향상시켰다.

저주파 위상 복원 알고리듬을 이용한 화자 위치 추적 시스템의 성능 개선과 구현 (An Enhancement of Speaker Location System Using the Low-frequency Phase Restoration Algorithm and Its Implementation)

  • 이학주;차일환;윤대희;이충용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.22-28
    • /
    • 2001
  • 본 논문에서는 마이크로폰 어레이를 통해 수신한 화자의 음성신호를 이용하여 추출된 공간정보를 통해 화자의 위치를 실시간으로 추적하는 알고리듬을 개선하고 이를 실시간으로 구현하였다. 기존의 대표적인 화자 위치 추정 알고리듬인 CPSP (Cross Power, Spectrum Phase) 함수는 상호 상관관계 (Cross Correlation)가 정규화 되어있는 형태를 갖는데, CPSP 함수의 최대값 인덱스로부터 화자의 공간정보인 TDOA(Time Difference Of Arrival)를 추출하게 된다. 그러나 CPSP함수를 이용한 공간정보 추정 알고리듬은 실내환경에서 심각하게 일어나는 반향신호에 대해서 취약한 단점을 갖고 있다. 본 논문에서 제안하는 저주파 위상 복원 알고리듬은 주파수 측면에서 반향신호가CPSP함수에 미치는 영향을 분석하여 반향으로 인하여 왜곡된 위상 성분을 복원함으로써 보다 신뢰도 있는 TDOA 추정을 가능하게 한다. 반향신호로 인한 CPSP의 위상은 저주파보다 고주파에서 심하게 왜곡되는데, 각각의 반향신호의 도달 시간을 기하학적 분포를 갖는 확률변수로 모델링하여 이를 수학적으로 증명하였다. 제안한 시스템의 성능분석을 위해 DSP를 이용한 실시간 시스템을 구현하여 기존 CPSP 알고리듬과 제안된 알고리듬을 적용한 시스템을 실제 환경에서 비교 실험을 수행한 결과 제안된 알고리듬을 적용한 시스템에서 약 15샘플 이상 TDOA 추정 오차가 줄어들고 있음을 확인하였다.

  • PDF

Recognition Performance Improvement of Unsupervised Limabeam Algorithm using Post Filtering Technique

  • Nguyen, Dinh Cuong;Choi, Suk-Nam;Chung, Hyun-Yeol
    • 대한임베디드공학회논문지
    • /
    • 제8권4호
    • /
    • pp.185-194
    • /
    • 2013
  • Abstract- In distant-talking environments, speech recognition performance degrades significantly due to noise and reverberation. Recent work of Michael L. Selzer shows that in microphone array speech recognition, the word error rate can be significantly reduced by adapting the beamformer weights to generate a sequence of features which maximizes the likelihood of the correct hypothesis. In this approach, called Likelihood Maximizing Beamforming algorithm (Limabeam), one of the method to implement this Limabeam is an UnSupervised Limabeam(USL) that can improve recognition performance in any situation of environment. From our investigation for this USL, we could see that because the performance of optimization depends strongly on the transcription output of the first recognition step, the output become unstable and this may lead lower performance. In order to improve recognition performance of USL, some post-filter techniques can be employed to obtain more correct transcription output of the first step. In this work, as a post-filtering technique for first recognition step of USL, we propose to add a Wiener-Filter combined with Feature Weighted Malahanobis Distance to improve recognition performance. We also suggest an alternative way to implement Limabeam algorithm for Hidden Markov Network (HM-Net) speech recognizer for efficient implementation. Speech recognition experiments performed in real distant-talking environment confirm the efficacy of Limabeam algorithm in HM-Net speech recognition system and also confirm the improved performance by the proposed method.

GSC 기반 빔포밍을 위한 주파수 밴드별 전력비 분포의 혼합 가우시안 모델을 이용한 목표 음성신호의 검출 (Target Speech Detection Using Gaussian Mixture Model of Frequency Bandwise Power Ratio for GSC-Based Beamforming)

  • 장형욱;김영일;정상배
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.61-68
    • /
    • 2015
  • 다양한 종류의 잡음에 의해서 발생하는 음성인식 성능 저하를 보상하기 위해서는 잡음제거가 필수적이다. 마이크로폰 배열을 이용하는 많은 잡음제거 기술 중에서, GSC는 비정상성 잡음을 제거하기 위해서 널리 적용되어 왔다. GSC의 성능은 AMC에 의해서 직접적인 영향을 받는다. 즉, 정확한 목표 음성 신호의 검출은 순수 잡음구간에서의 충분한 잡음제거 및 목표 음성구간에서의 적은 왜곡을 보장하기 위해서 필수적이다. 따라서, 본 논문에서는 고정 빔포밍의 출력과 차단 매트릭스의 출력간의 전력비가 주파수 밴드 단위로 계산되는 향상된 AMC 설계법을 제안한다. 그 후, 밴드별 전력비는 가우시안 혼합에 의해서 각 클래스가 확률적으로 모델링 된다. 실험결과, 제안한 알고리즘이 ROC 및 출력 SNR 관점에서 더 높은 성능을 보였다.

개선된 이동 프레임 음향 홀로그래피 방법과 이동 음원의 방사 소음의 가시화에 대한 응용 (Review of the Improved Moving Frame Acoustic Holography and Its Application to the Visualization of Moving Noise Sources)

  • 박순홍;김양한
    • 소음진동
    • /
    • 제10권4호
    • /
    • pp.669-678
    • /
    • 2000
  • This paper reviews the improved moving frame acoustic holography (MFAH) method and its application. Moving frame acoustic holography was originally proposed to increase the aperture size and the spatial resolution of hologram by using a moving line array of microphones. The hologram of scanned plane can be obtained by assuming the sound field to be product of spatial and temporal information. Although conventional MFAH was only applied to sinusoidal signals, it allows us to visualize the noise generated by moving noise sources by employing a vertical line array of microphones affixed to the ground. However, the sound field generated by moving sources becomes different from that of stationary ones due to the movement of the sources. Firstly, this paper introduces the effect of moving noise sources on the obtained hologram by MFAH and the applicability of MFAH to the visualization of moving sources. Secondly, this paper also reviews improved MFAH that can visualize a coherent narrow band noise and a pass-by noise. The practical applicability of the improved MFAH was demonstrated by visualizing tire noise during a pass-by test.

  • PDF

마이크로폰 31개로 이루어진 선형배열 음향렌즈의 구성과 실험 (Development and Experiment of a Linear Array Acoustic Lens with 31 Microphones)

  • 현석봉;민동현;김수용
    • 한국음향학회지
    • /
    • 제13권5호
    • /
    • pp.15-23
    • /
    • 1994
  • 31개의 마이크로폰이 34mm 간격으로 선형배열된 음향영상장치용 전자 렌즈를 제작하였다. 마이크로폰을 이용한 음향센서의 공진주파수는 20kHz이고, 16개의 마이크로폰은 수평으로 나머지 15개의 마이크로폰은 수직으로 배치되어 있어서, 음원의 2차원적인 각도를 알아낼 수 있고 음원의 운동을 실시간으로 추적할 수 있다. 이산 푸리어변환할때 ㅈ나타나는 aliasing 문제 때문에 제작된 렌즈의 최대 관찰가능각도는 15도로 제한된다. 또한 촛점을 맞추기 위해 직각위상 검파방법을 이용하였다. 무향실에서 PC를 이용하여 음향렌즈를 실험하였으며 음향영상이론과 일치하는 결과를 얻었다.

  • PDF

A DSP Implementation of Subband Sound Localization System

  • Park, Kyusik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권4E호
    • /
    • pp.52-60
    • /
    • 2001
  • This paper describes real time implementation of subband sound localization system on a floating-point DSP TI TMS320C31. The system determines two dimensional location of an active speaker in a closed room environment with real noise presents. The system consists of an two microphone array connected to TI DSP hosted by PC. The implemented sound localization algorithm is Subband CPSP which is an improved version of traditional CPSP (Cross-Power Spectrum Phase) method. The algorithm first split the input speech signal into arbitrary number of subband using subband filter banks and calculate the CPSP in each subband. It then averages out the CPSP results on each subband and compute a source location estimate. The proposed algorithm has an advantage over CPSP such that it minimize the overall estimation error in source location by limiting the specific band dominant noise to that subband. As a result, it makes possible to set up a robust real time sound localization system. For real time simulation, the input speech is captured using two microphone and digitized by the DSP at sampling rate 8192 hz, 16 bit/sample. The source location is then estimated at once per second to satisfy real-time computational constraints. The performance of the proposed system is confirmed by several real time simulation of the speech at a distance of 1m, 2m, 3m with various speech source locations and it shows over 5% accuracy improvement for the source location estimation.

  • PDF