• 제목/요약/키워드: Non Negative Factorization

검색결과 104건 처리시간 0.031초

비음수 제약을 통한 일반 소리 분류 (Classification of General Sound with Non-negativity Constraints)

  • 조용춘;최승진;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1412-1417
    • /
    • 2004
  • 전체관적인 표현방법인 희소 코딩 또는 독릴 성분 분해(ICA)는 이전의 청각의 처리와 소리 분류의 작업을 해명하는데 성공적으로 적용되었다. 반대로 부분 기반 표현법은 뇌에서 물체를 인식하는 방법을 이해하는 또 다른 방법이다. 이 논문에서, 우리는 소리 분류의 작업에 부분기반 표현법을 학습시키는 비음수화 행렬 분해(NMF)(1) 방법을 적용하였다. 잡음이 존재할 때와 존재하지 않을 때 두 가지 상황에서, NMF를 이용하여 주파수-시간영역의 소리로부터 특징을 추출하는 방법을 설명한다. 실험결과에서는 NMF에 기반을 둔 특징이 ICA에 기반을 두어 추출한 특징보다 소리 분류의 성능을 향상시킴을 보여준다.

K-SVD 기반 사전 훈련과 비음수 행렬 분해 기법을 이용한 중첩음향이벤트 검출 (Overlapping Sound Event Detection Using NMF with K-SVD Based Dictionary Learning)

  • 최현식;금민석;고한석
    • 한국음향학회지
    • /
    • 제34권3호
    • /
    • pp.234-239
    • /
    • 2015
  • 비음수 행렬 분해(Nonnegative Matrix Factorization, NMF) 기법은 사전행렬과 크기성분을 번갈아 가며 업데이트 하면서 구하는 방법이며 직관적 해석 및 구현의 용이성으로 인해 중첩음향이벤트 분리 및 검출방법으로 널리 활용되었다. 하지만 비음수 행렬 분해의 고유한 특성인 부분기반표현(part-based representation)으로 인해 하나의 음향 이벤트를 구성 하는 사전(dictionary)의 파편화 현상이 발생하고, 다른 음향이벤트와 중복되는 사전이 생성되어 결과적으로 분리, 검출 성능의 저하 문제가 발생한다. 본 논문에서는 사전 획득 단계의 부분기반표현에 의한 문제를 해소하기 위해 K-Singular Value Decomposition(K-SVD)을 사용하여 사전을 획득하고, 음향이벤트 검출 단계 에서는 기존 비음수 행렬 분해 기법을 이용하여 크기를 획득 한다. 제안하는 방식을 통해 비음수 행렬 분해 기반의 사전을 사용하는 경우보다 중첩음향이벤트 검출 성능이 개선되는 것을 확인하였다.

보행 과정에서 발생하는 복합 근육 활성의 양성 및 음성 공변 메커니즘 (Positive and Negative Covariation Mechanism of Multiple Muscle Activities During Human Walking)

  • 김유신;홍영기
    • 한국콘텐츠학회논문지
    • /
    • 제18권1호
    • /
    • pp.173-184
    • /
    • 2018
  • 보행 과정에서 여러 근육이 동시에 수축하는 운동 모듈 또는 근육 시너지는 매우 중요한 중추신경계 운동조절 메커니즘이다. 본 연구는 걷는 동안 근육 간 양성 및 음성 공변 패턴을 이해하는 것을 목표로 한다. 본 연구에서는 트레드밀 보행 시 발생하는 다리 근육 활성을 근전도 검사를 통해 측정하였다. 동시 수축근육 그룹, 즉 운동 모듈을 확인하기 위해 우리는 양쪽 4 개의 다리 근육(전경골근, 내측 비복근, 대퇴직근, 내측 슬괵근)에서 근전도 데이터를 수집하였고, 이를 바탕으로 비음수행렬분해 및 주성분 분석을 수행하였다. 이후 근육 또는 운동 모듈 간의 다양한 조합으로부터 공변이 값을 계산하였고, 이원배치분산분석을 이용하여 각 조합들에서 발생하는 공변이 패턴을 비교하였다. 그 결과, 다양한 조합 사이에 유의미한 공변이 값의 차이가 발견되었다(p < 0.05). 같은 운동 모듈로 정의된 특정 근육 사이에서 발생하는 근 활성은 양성공변이를 보여주었으나 운동 모듈 사이에서는 음성 공변이를 보여주었다. 모든 근육 조합들 사이에서는 음성 공변이가 발생하였다. 운동 모듈 사이에서 안정적으로 발생하는 음성 공변이는 운동 모듈이 복잡한 운동 조정의 제어 단위(control unit) 일 수 있음을 암시하고 있다.

선형적 특징추출 방법의 특성 비교 (Comparisons of Linear Feature Extraction Methods)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제9권4호
    • /
    • pp.121-130
    • /
    • 2009
  • 이 논문은 고차원의 데이터를 저 차원으로 줄이는 방법 중 하나인 특징추출에 대한 방법들의 특성을 비교한다. 비교대상 방법은 전통적인 PCA(Principal Component Analysis)방법과 시각피질의 특성을 보인다고 알려진 ICA(Independent Component Analysis), 국소기반인식을 구현한 NMF(Non-negative Matrix Factorization), 그리고 이의 성능을 개선한 sNMF(Sparse NMF)로 정하였다. 추출된 특징들의 특성을 시각적으로 확인하기 위하여 필기체 숫자 영상을 대상으로 특징추출을 수행하였으며, 인식기에 적용한 효과의 확인을 위하여 추출된 특징을 다층퍼셉트론에 학습시켜보았다. 각 방법의 특성을 비교한 결과는 응용하고자 하는 문제에서 어떤 특징을 추출하기 원하느냐에 따라 특징추출 방법을 선정할 때 유용할 것이다.

복잡한 영상 내의 문자영역 추출을 위한 텍스춰와 연결성분 방법의 결합 (Hybrid Approach of Texture and Connected Component Methods for Text Extraction in Complex Images)

  • 정기철
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.175-186
    • /
    • 2004
  • 본 논문은 복잡한 컬러 영상에서의 문자 추출을 위한 텍스춰와 연결성분 방법의 결합된 방법을 제안한다. 자동 학습 방법으로 구축된 다층 신경망(multilayer perceptron)은 부트스트랩 학습 방법을 사용함으로써 별도의 특징값 추출 단계 없이 다양한 환경의 입력 영상에 대한 검출률(recall rate)을 향상시키며, 검출률을 향상함으로써 발생되는 정확도(precision rate) 저하 문제는, NMF(Non-negative matrix factorization)를 이용한 연결 성분 방법을 사용함으로써 극복한다. 문자의 존재 비율이 낮은 입력영상에 대하여 CAMShift 알고리즘을 이용한 영역 마킹 방법을 사용함으로써, 두 방법을 결합함으로써 야기되는 속도 저하 문제의 해결을 시도하였다. 이와 같이 텍스춰와 연결성분 방법을 결합함으로써 강건하고 효율적인 시스템을 구성할 수 있었다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

비음수 의미 가변 행렬을 기반으로 한 자동 포괄적 문서 요약 (Automatic Generic Summarization Based on Non-negative Semantic Variable Matrix)

  • 박선;이주홍;안찬민;박태수;김덕환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.391-393
    • /
    • 2006
  • 인터넷의 급속한 확산과 대량 정보의 이동은 문서의 요약을 더욱 필요로 하고 있다. 본 논문은 비음수 행렬 인수분해로(NMF, non-negative matrix factorization) 얻어진 비음수 의미 가변 행렬(NSVM, non-negative semantic variable matrix)을 이용하여 자동으로 포괄적 문서요약 하는 새로운 방범을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 잠재의미색인에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 또한, 비지도 학습에 의한 문서요약으로 사전 전문가에 의한 학습문장이 필요 없으며, 적은 계산비용을 통하여 쉽게 문장을 추출할 수 있는 장점을 갖는다.

  • PDF

실시간 얼굴인식 시스템을 위한 새로운 LINF 알고리즘의 제안 (The Suggestion of LINF Algorithm for a Real-time Face Recognition System)

  • 장혜경;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.79-86
    • /
    • 2005
  • 본 논문에서는 실시간 얼굴인식 시스템을 위한 새로운 LINF(Linear Independent Non-negative Factorization) 알고리즘을 제안한다. 시스템은 크게 얼굴추출 부분과 얼굴인식 부분으로 구성 되어 있으며, 얼굴추출 부분에는 차영상, 눈과 입의 영역 검출 그리고 정규화 방법을 사용하였고, 얼굴인식 부분에는 추출된 얼굴 후보 영역 영상에 LINF 를 적용하였다. 기존의 PCA(Principal Component Analysis)만을 사용한 인식시스템은 낮은 인식률을 보였으며, LDA(Linear Discriminants Analysis)만을 사용한 인식시스템에서는 학습데이터의 수에 비하여 영상의 화소 개수가 많은 경우 LDA를 그대로 적용하기 곤란하였다. 이러한 단점을 극복하기 위하여, 본 논문에서 제안하는 시스템은 기존의 고유얼굴과 달리 비음수 값을 갖는 행렬로 차원을 축소하여 LDA를 적용하였다. 제안한 시스템의 성능을 평가하기 위하여 자체 제작한 DAUface 데이터베이스와 영국 Cambridge 에 있는 AT&T 연구소에서 제공하는 ORL 데이터베이스를 가지고 실험을 하였다. 실험 결과, 제안된 방법이 PCA 방법과 LDA 방법, ICA(Independent Component Analysis) 방법, 그리고 PLMA(PCA-based LDA mixture algorithm)에 비해 인식률이 상당히 우수함을 알 수 있었다.

비음수행렬분해와 위키피디아를 이용한 사용자기반의 문서요약 (User-based Document Summarization using Non-negative Matrix Factorization and Wikipedia)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 본 논문은 위키피디아의 외부지식을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 문서집합의 내부구조를 표현하는 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 사용자의 초기 질의에 위키피디아 기반의 연관 피드백을 적용하여 사용자가 요구하는 요약문장을 추출할 수 있도록 질의를 확장하며, 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 확장된 질의와 의미특징을 이용하여 의미 있는 문장을 추출함으로써 사용자의 요구사항과 제안방법의 요약결과 사이의 의미적 차이를 감소시킨다. 실험결과 제안방법이 기존방법에 비해서 문서요약에 대해 더 좋은 성능을 보인다.