• Title/Summary/Keyword: 음원 분리

Search Result 88, Processing Time 0.022 seconds

Audio signal separation Algorithm Implementation based PCA (PCA 기반 오디오 신호 분리 알고리즘 구현)

  • Jeon, Jae-Hyeon;Jo, Du-ri;Jeong, Je-chang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.151-154
    • /
    • 2013
  • 다수의 음원이 특정한 공간에 산재하고 있을 때, 그 중 특정 음원에 주목하면 다른 음원과 분리되어 특정 음원만 들리는 현상을 칵테일파티 현상이라고 한다. 심리적인 이 현상에 영감을 받아 음원을 분리하는 알고리즘이 만들어졌다. 이런 음원 분리방법을 Blind Source Separation(BSS) 이라고 하는데, 여러 신호가 섞이는 과정을 모르는 상태에서 음원을 분리한다는 뜻에서 Blind Source Separation 이라고 한다. BSS에 사용되는 알고리즘으로 주로 PCA, ICA이 있다. PCA는 2차원의 경우를, ICA는 그 이상의 고차원의 통계적 특성을 이용한다. 이에 본 논문은 PCA를 이용하여 두 음원을 분리하는 알고리즘을 구현하는데 역점을 두었다. PCA는 주로 음원보다는 이미지 신호 처리에 초점이 맞추어져 있지만, 음원 분리에 있어서도 충분한 성능을 보여주므로, ICA를 이용한 음원 분리 알고리즘과의 비교를 통하여 장, 단점을 알아보고 추후 PCA의 응용 가능성을 알아보았다.

  • PDF

Performance Analysis of Sound Source Separation Combining EADRess and NMF (EADRess 와 NMF 를 결합한 음원분리 성능 분석)

  • Jeong, Youngho;Jang, Daeyoung;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.224-227
    • /
    • 2016
  • 본 논문에서는 스테레오 채널 신호 간 강도비를 이용하여 음원을 분리하는 EADRess 알고리즘과 부분기반 표현을 특징으로 한 비음수 행렬 인수분해를 통해 음원을 분리하는 NMF 가 결합된 새로운 음원분리 알고리즘을 제안한다. 입력 오디오 신호로부터 frequency-azimuth 평면 구성을 통해 식별된 방위각에 상응하는 신호 강도비로 표현되는 확률밀도함수를 이용하여 1 단계 음원분리를 수행하고, 얻어진 개별 분리음원을 대상으로 supervised NMF 및 Wiener 필터 기반 마스킹 함수를 적용함으로써 잔류 혼합성분을 제거하는 2 단계 음원분리를 수행한다. 제안된 EADRess/NMF 결합 음원분리 알고리즘의 성능을 검증하기 위하여 SASSEC 에서 제공하는 테스트 음원을 이용하여 측정한 결과, 개별 음원분리 알고리즘에 비해 SIR 이 각각 1.41dB, 10.43dB 향상된 결과를 얻었다.

  • PDF

Integrated Algorithm of Sound Source Separation and Localization (음원 분리와 음원 위치 추정 통합 알고리즘)

  • Han, Taek-Jin;Park, Hochong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.111-114
    • /
    • 2014
  • 본 논문에서는 다양한 스테레오 환경에서도 정확한 음원 위치 추정이 가능한 방법을 제안한다. 기존의 음원 위치 추정 방법은 방향성을 가지고 있는 주성분 신호와 방향성이 없는 주변 성분으로 구성된 스테레오 환경에서만 음원의 위치 추정이 가능했다. 그러나 현재 제공되고 있는 스테레오 신호는 방향성을 가지는 다수의 음원으로 구성되어있고, 기존의 음원 위치 추정 방법으로는 정확한 음원 위치 추정이 어렵다. 이와 같은 문제 때문에 다수의 음원을 분리한 뒤, 음원의 위치를 추정하는 방법이 제안되었다. 그러나 음원의 분리 과정에서 생기는 분리 오차가 커서 음원 위치 추정이 정확하지 않다. 이에 본 논문에서는 정확한 음원 위치 추정을 위하여 음원 분리와 음원 위치 추정이 통합된 새로운 알고리즘을 제안한다. 제안한 알고리즘은 음원 위치를 기존의 방법보다 정확하게 추정하는 것을 확인할 수 있었다.

  • PDF

A Source Separation Algorithm for Stereo Panning Sources (스테레오 패닝 음원을 위한 음원 분리 알고리즘)

  • Baek, Yong-Hyun;Park, Young-Cheol
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.4 no.2
    • /
    • pp.77-82
    • /
    • 2011
  • In this paper, we investigate source separation algorithms for stereo audio mixed using amplitude panning method. This source separation algorithms can be used in various applications such as up-mixing, speech enhancement, and high quality sound source separation. The methods in this paper estimate the panning angles of individual signals using the principal component analysis being applied in time-frequency tiles of the input signal and independently extract each signal through directional filtering. Performances of the methods were evaluated through computer simulations.

A Unified Method for Vocal Source Separation From Stereophonic Music Signals (스테레오 음악 신호에서의 보컬 음원 분리를 위한 통합 알고리즘)

  • Kim, Min-Je;Jang, In-Seon;Kang, Kyeong-Ok
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.5
    • /
    • pp.89-99
    • /
    • 2010
  • A unified method for separating musical sources, singing voice for example, from stereophonic mixtures is provided. We usually have two observed signals in stereophonic music contents, where more than two instruments are played together. If we regard each instrument as source, this problem becomes an underdetermined source separation problem and cannot be solved by conventional methods, which infers the spatial environment of the downmixing process happens. Instead, source-specific information has been exploited to recover a particular instrumental source. This paper provides a unifying structure consists of heterogenious ad-hoc separate algorithms, which are designed for separating vocal sources using stereophonic channel information and dominant pitch information of the sources, respectively. Experiments on real world music contents show that the proposed unification can neutralize the drawbacks of the two ad-hoc separation algorithms and finally enhance the separation results.

Source signal separation by blind processing for a microphone array system (마이크로폰 어레이 시스템을 사용한 브라인드 처리에 의한 음원분리)

  • ;Usagawa Tsuyoshi;Masanao Ebata
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.609-612
    • /
    • 2000
  • 본 논문에서는 음원에 관한 정보가 미지의 상황에서 마이크로폰 어레이를 사용하여 두 음원신호를 분리하는 ,시스템을 제안한다 이 시스템은 두 단계로 구성되어 있으며, 첫 번째 단계에서는 파워가 큰 제 1음원의 DOA(Direction Of Arrival)를 추정하고, AMUSE(Algorithm for Multiple Unknown Signals Extraction)법을 사용한 Blind Deconvolution에 의해 음원신호의 분리를 행한다 두 번째 단계에서는 파워가 낮은 제 2음원의 강조신호를 사용하여 DSA(Delay and Sum Array)법에 의해 제 2음원의 DOA를 추정하고,AMUSE법의 출력신호와 두 음원의 DOA를 이용하여 ANF(Adaptive Notch Filter)를 구성하고, 두 음원신호의 재 분리를 행한다. 그리고, 시뮬레이션을 통해 제안한 방법의 유효성을 검토한 결과 두 음원 신호가 분리 가능한 것이 확인되었다.

  • PDF

New Separated Sound Source Synthesis based on ADRess Algorithm (ADRess 알고리즘 기반 새로운 분리음원 합성 기법)

  • Jeong, Youngho;Jang, Daeyoung;Lee, Taejin
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.11a
    • /
    • pp.56-59
    • /
    • 2015
  • 본 논문에서는 스테레오 오디오 신호를 이용하여 음원을 분리하는 ADRess 알고리즘을 기반으로, 추정된 음원 방위각에 대한 신호 강도비를 이용하여 분리음원을 생성하는 새로운 분리음원 합성 기법을 제안한다. 입력된 스테레오 채널 신호 간 강도 차(IID) 특성을 이용하여 신호 분석 프레임별로 개선된 신호 강도비 함수에 따른 frequency-azimuth 평면을 구성하고, 이를 통해 추정된 방위각에 상응하는 신호 강도비로 표현되는 확률밀도함수를 좌/우 신호 중 하나의 주 입력 신호에 취함으로써 분리음원을 합성한다. 제안된 기법의 성능을 검증하기 위하여 SASSEC 에서 제공하는 테스트 음원 및 객관적 평가 지표를 이용하여 측정한 결과, 기존 ADRess 알고리즘에서 제시된 방법에 비해 개선된 품질의 분리음원을 합성하는 것으로 평가되었다.

  • PDF

Gaussian Processes for Source Separation: Pseudo-likelihood Maximization (유사-가능도 최대화를 통한 가우시안 프로세스 기반 음원분리)

  • Park, Sun-Ho;Choi, Seung-Jin
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.7
    • /
    • pp.417-423
    • /
    • 2008
  • In this paper we present a probabilistic method for source separation in the case here each source has a certain temporal structure. We tackle the problem of source separation by maximum pseudo-likelihood estimation, representing the latent function which characterizes the temporal structure of each source by a random process with a Gaussian prior. The resulting pseudo-likelihood of the data is Gaussian, determined by a mixing matrix as well as by the predictive mean and covariance matrix that can easily be computed by Gaussian process (GP) regression. Gradient-based optimization is applied to estimate the demixing matrix through maximizing the log-pseudo-likelihood of the data. umerical experiments confirm the useful behavior of our method, compared to existing source separation methods.

Independent Component Analysis Based on Frequency Domain Approach Model for Speech Source Signal Extraction (음원신호 추출을 위한 주파수영역 응용모델에 기초한 독립성분분석)

  • Choi, Jae-Seung
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.15 no.5
    • /
    • pp.807-812
    • /
    • 2020
  • This paper proposes a blind speech source separation algorithm using a microphone to separate only the target speech source signal in an environment in which various speech source signals are mixed. The proposed algorithm is a model of frequency domain representation based on independent component analysis method. Accordingly, for the purpose of verifying the validity of independent component analysis in the frequency domain for two speech sources, the proposed algorithm is executed by changing the type of speech sources to perform speech sources separation to verify the improvement effect. It was clarified from the experimental results by the waveform of this experiment that the two-channel speech source signals can be clearly separated compared to the original waveform. In addition, in this experiments, the proposed algorithm improves the speech source separation performance compared to the existing algorithms, from the experimental results using the target signal to interference energy ratio.

Frequency Domain Blind Source Seperation Using Cross-Correlation of Input Signals (입력신호 상호상관을 이용한 주파수 영역 블라인드 음원 분리)

  • Sung Chang Sook;Park Jang Sik;Son Kyung Sik;Park Keun-Soo
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.3
    • /
    • pp.328-335
    • /
    • 2005
  • This paper proposes a frequency domain independent component analysis (ICA) algorithm to separate the mixed speech signals using a multiple microphone array By estimating the delay timings using a input cross-correlation, even in the delayed mixture case, we propose a good initial value setting method which leads to optimal convergence. To reduce the calculation, separation process is performed at frequency domain. The results of simulations confirms the better performances of the proposed algorithm.

  • PDF