• 제목/요약/키워드: non-negative decomposition techniques

검색결과 2건 처리시간 0.022초

주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원 (Target Speaker Speech Restoration via Spectral bases Learning)

  • 박선호;유지호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.179-186
    • /
    • 2009
  • 본 논문에서는 학습이 가능한 특정화자의 발화음성이 있는 경우, 잡음과 반향이 있는 실 환경에서의 스테레오 마이크로폰을 이용한 특정화자 음성복원 알고리즘을 제안한다. 이를 위해 반향이 있는 환경에서 음원들을 분리하는 다중경로 암묵음원분리(convolutive blind source separation, CBSS)와 이의 후처리 방법을 결합함으로써, 잡음이 섞인 다중경로 신호로부터 잡음과 반향을 제거하고 특정화자의 음성만을 복원하는 시스템을 제시한다. 즉, 비음수 행렬분해(non-negative matrix factorization, NMF) 방법을 이용하여 특정화자의 학습음성으로부터 주파수 특성을 보존하는 기저벡터들을 학습하고, 이 기저벡터들에 기반 한 두 단계의 후처리 기법들을 제안한다. 먼저 본 시스템의 중간단계인 CBSS가 다중경로 신호를 입력받아 독립음원들을(두 채널) 출력하고, 이 두 채널 중 특정화자의 음성에 보다 가까운 채널을 자동적으로 선택한다(채널선택 단계). 이후 앞서 선택된 채널의 신호에 남아있는 잡음과 다른 방해음원(interference source)을 제거하여 특정화자의 음성만을 복원, 최종적으로 잡음과 반향이 제거된 특정화자의 음성을 복원한다(복원 단계). 이 두 후처리 단계 모두 특정화자 음성으로부터 학습한 기저벡터들을 이용하여 동작하므로 특정화자의 음성이 가지는 고유의 주파수 특성 정보를 효율적으로 음성복원에 이용 할 수 있다. 이로써 본 논문은 CBSS에 음원의 사전정보를 결합하는 방법을 제시하고 기존의 CBSS의 분리 결과를 향상시키는 동시에 특정화자만의 음성을 복원하는 시스템을 제안한다. 실험을 통하여 본 제안 방법이 잡음과 반향 환경에서 특정화자의 음성을 성공적으로 복원함을 확인할 수 있다.

TV-G 분해를 이용한 초해상도 알고리즘 (Super Resolution Algorithm using TV-G Decomposition)

  • 엄경배;범동규
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권8호
    • /
    • pp.1517-1522
    • /
    • 2017
  • 단일 영상 기반 초해상도(SR) 기법 중 TV 기반 초해상도 기법은 에지 보존과 artifact가 없다는 점에서 성공적인 방법으로 평가되어 왔으나, 텍스쳐 성분에서는 개선을 보이지 못했다. 본 논문에서는 이와 같은 문제점을 개선하기 위해서 새로운 TV-G 분해 기반 초해상도 기법을 제안하였다. 제안된 초해상도 방법에서는 에지와 같은 구조적 성분의 해상도를 보다 더 개선하기 위해 SVR 기반 up-sampling 방법을 제안하였다. 또한, Neighbor Embedding(NE)을 개선하기 위해 완화된 제약조건을 이용한 Non-negative Embedding(NNE) 방법에 기반한 학습 방법을 이용하여 텍스쳐 성분의 해상도를 개선하였다. 실험을 통하여 본 논문에서 제안된 방법이 기존의 보간법, ScSR, 기존의 TV 및 NNE 기법들에 비해 정량적인 척도 및 시각적으로도 향상된 좋은 결과들을 보였다.