• 제목/요약/키워드: Non-negative matrix

검색결과 138건 처리시간 0.024초

비음수 행렬 분해와 동적 분류체계를 사용한 이메일 분류 (Email Classification using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-39
    • /
    • 2009
  • 이메일의 사용증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factrazation)를 기반으로 한 자동 분류 주제 생성 방법과 동적 분류 체계(DCH, Dynamic Category Hierachy) 방법을 결합한 새로운 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 분류 결과 사용자의 요구사항을 만족하지 못하면 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

비음수 행렬 인수분해와 NMF 군집방법을 이용한 다중문서요약 (Multi-document Summarization using Non-negative Matrix Factorization and NMF Clustering Method)

  • 박선;이주홍;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2008
  • 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)와 NMF 군집방법을 이용하여 다중문서를 요약하는 새로운 방법을 제안하였다. 본 논문에서 NMF에 의해 계산된 의미 특징(semantic feature)은 문서의 고유 구조(inherent structure)를 반영하여 문장을 추출함으로써 요약의 질을 높일 수 있고, 의미 변수(semantic variable)를 이용한 문장의 군집은 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

NMF를 이용한 영문자 활자체 폰트 분류 (Font Classification of English Printed Character using Non-negative Matrix Factorization)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.65-76
    • /
    • 2004
  • 최근 대부분의 문서들이 전자적으로 생성되고 많은 고문서들이 이미지 형태로 전자화되고 있다. 이미지 형태의 전자 문서들은 정보 추출과 데이터베이스화에 많은 어려움이 있기 때문에, 이러한 문서를 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문자 인식을 위한 많은 연구가 필요하다. 본 논문은 폰트의 구분 특성(font discrimination features)들이 폰트이미지의 공간적으로 지역적인 특징들에 기반함을 가정한 방법으로써, 객체의 부분기반 표현들을 학습할 수 있는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법이다. 제안된 방법은 부분기반의 비지도 학습 방법(part-based unsupervised learning technique)을 이용하여 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들이 폰트의 식별을 위한 적절성을 보인다. 제안된 방법이 기존의 문자인식, 문서 검색 시스템들의 전처리기로 사용되면, 그 시스템들의 성능을 향상시킬 것으로 기대된다.

시각 자극 복원을 위한 비음수 행렬 분해 기반의 영상 기저 자동 추출 (Automatic Extraction of Image Bases Based on Non-Negative Matrix Factorization for Visual Stimuli Reconstruction)

  • 조성식;박영묘;이성환
    • 인지과학
    • /
    • 제22권4호
    • /
    • pp.347-364
    • /
    • 2011
  • 본 논문에서는 fMRI를 사용하여 뇌신경 반응을 측정한 후, 자극으로 주어진 $10{\times}10$ 크기의 이진 영상을 사전 정보 없이 복원하기 위해 비음수 행렬 분해를 이용한 자동화된 영상 기저 추출 방법을 제안한다. 영상 기저란 영상을 표현하는 기본 단위로, 기존 연구에서는 사전에 정의된 $1{\times}1$, $2{\times}1$, $1{\times}2$, $2{\times}2$의 크기를 갖는 총 361개의 영상 기저에 반응하는 뇌 신호를 분석하여 기저 영상으로 복원하고, 모든 기저에 대한 복원 결과를 선형 결합하여 최종복원 영상을 획득하였다. 사람이 사전에 정의한 영상 기저를 필요로 하는 기존 연구와는 달리, 본 연구에서는 비음수 행렬 분해를 기반으로 학습 데이터로 주어진 이진 영상을 가장 잘 표현하는 영상 기저를 자동 추출하였다. 자동으로 추출된 영상 기저를 사용하여 이진 영상을 복원한 결과, 기존 연구 방법보다 개선된 복원 정확도를 보였다.

  • PDF

비음수행렬분해와 위키피디아를 이용한 사용자기반의 문서요약 (User-based Document Summarization using Non-negative Matrix Factorization and Wikipedia)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 본 논문은 위키피디아의 외부지식을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 문서집합의 내부구조를 표현하는 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 사용자의 초기 질의에 위키피디아 기반의 연관 피드백을 적용하여 사용자가 요구하는 요약문장을 추출할 수 있도록 질의를 확장하며, 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 확장된 질의와 의미특징을 이용하여 의미 있는 문장을 추출함으로써 사용자의 요구사항과 제안방법의 요약결과 사이의 의미적 차이를 감소시킨다. 실험결과 제안방법이 기존방법에 비해서 문서요약에 대해 더 좋은 성능을 보인다.

가려진 얼굴의 인식 (Recognition of Occluded Face)

  • 강현철
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.682-689
    • /
    • 2019
  • 부분 기반 영상 표현(part-based image representation)에서는 영상의 부분적인 모습을 기저 벡터로 표현하고 기저 벡터의 선형 조합으로 영상을 분해하며, 이 때 기저 벡터의 계수가 곧 물체의 부분적인 특징을 의미하게 된다. 본 논문에는 부분 기반 영상 표현 기법인 비음수 행렬 분해(non-negative matrix factorization, NMF)를 이용하여 얼굴 영상을 표현하고 신경망 기법을 적용하여 가려진 얼굴을 인식하는 얼굴 인식을 제안한다. 표준 비음수 행렬 분해, 투영 경사 비음수 행렬 분해, 직교 비음수 행렬 분해를 이용하여 얼굴 영상을 표현하였고, 각 기법의 성능을 비교하였다. 인식기로는 학습벡터양자화 신경망을 사용하였으며, 인식기에서의 거리 척도로는 유클리디언 거리를 사용하였다. 실험 결과, 전통적인 얼굴 인식 방법에 비하여 제안한 기법이 가려진 얼굴 인식에 보다 강인함을 보인다.

비음수행렬분해 기반 연속파 잔향 제거 기법의 초매개변숫값에 따른 실험적 성능 분석 (Experimental performance analysis on the non-negative matrix factorization-based continuous wave reverberation suppression according to hyperparameters)

  • 이용곤;이석진;김기만;김근환
    • 한국음향학회지
    • /
    • 제42권1호
    • /
    • pp.32-41
    • /
    • 2023
  • 최근 비음수행렬분해 기법을 이용한 잔향 제거 연구가 활발히 이루어지고 있다. 비음수행렬분해 기법은 최적화를 위해 쿨백라이블러 발산 기반의 비용함수를 사용하며, 시간 연속성, 펄스 길이, 잔향과 표적 간 에너지 비율 등 제약사항들이 추가된다. 그리고 초매개변수를 이용하여 제약사항이 적용되는 경향을 조절한다. 따라서 효율적인 잔향 제거를 위해서는 초매개변수를 최적화해야 하지만 현재까지는 관련된 연구가 미흡한 실정이다. 본 논문에서는 실제 해상실험 데이터를 이용하여 비음수행렬분해 기반 잔향 제거 기법의 세 가지 초매개변수에 따른 잔향 제거 성능을 분석하였다. 분석결과, 시간 연속성과 펄스 길이에 대한 초매개변수는 값이 높을 경우 잔향과 표적 간의 에너지 비율은 0.4 이하에서 우수한 성능을 보였으나, 변화하는 송수신 환경에 따라서 성능의 변동성이 있음을 확인하였다. 본 논문의 분석 결과가 향후 비음수행렬분해 기반 연속파 잔향 제거 기법의 초매개변수를 최적화하기 위한 정밀한 실험을 계획하는 것에 유용한 지침표가 될 수 있을 것으로 기대한다.

보행 과정에서 발생하는 복합 근육 활성의 양성 및 음성 공변 메커니즘 (Positive and Negative Covariation Mechanism of Multiple Muscle Activities During Human Walking)

  • 김유신;홍영기
    • 한국콘텐츠학회논문지
    • /
    • 제18권1호
    • /
    • pp.173-184
    • /
    • 2018
  • 보행 과정에서 여러 근육이 동시에 수축하는 운동 모듈 또는 근육 시너지는 매우 중요한 중추신경계 운동조절 메커니즘이다. 본 연구는 걷는 동안 근육 간 양성 및 음성 공변 패턴을 이해하는 것을 목표로 한다. 본 연구에서는 트레드밀 보행 시 발생하는 다리 근육 활성을 근전도 검사를 통해 측정하였다. 동시 수축근육 그룹, 즉 운동 모듈을 확인하기 위해 우리는 양쪽 4 개의 다리 근육(전경골근, 내측 비복근, 대퇴직근, 내측 슬괵근)에서 근전도 데이터를 수집하였고, 이를 바탕으로 비음수행렬분해 및 주성분 분석을 수행하였다. 이후 근육 또는 운동 모듈 간의 다양한 조합으로부터 공변이 값을 계산하였고, 이원배치분산분석을 이용하여 각 조합들에서 발생하는 공변이 패턴을 비교하였다. 그 결과, 다양한 조합 사이에 유의미한 공변이 값의 차이가 발견되었다(p < 0.05). 같은 운동 모듈로 정의된 특정 근육 사이에서 발생하는 근 활성은 양성공변이를 보여주었으나 운동 모듈 사이에서는 음성 공변이를 보여주었다. 모든 근육 조합들 사이에서는 음성 공변이가 발생하였다. 운동 모듈 사이에서 안정적으로 발생하는 음성 공변이는 운동 모듈이 복잡한 운동 조정의 제어 단위(control unit) 일 수 있음을 암시하고 있다.

Speech Denoising via Low-Rank and Sparse Matrix Decomposition

  • Huang, Jianjun;Zhang, Xiongwei;Zhang, Yafei;Zou, Xia;Zeng, Li
    • ETRI Journal
    • /
    • 제36권1호
    • /
    • pp.167-170
    • /
    • 2014
  • In this letter, we propose an unsupervised framework for speech noise reduction based on the recent development of low-rank and sparse matrix decomposition. The proposed framework directly separates the speech signal from noisy speech by decomposing the noisy speech spectrogram into three submatrices: the noise structure matrix, the clean speech structure matrix, and the residual noise matrix. Evaluations on the Noisex-92 dataset show that the proposed method achieves a signal-to-distortion ratio approximately 2.48 dB and 3.23 dB higher than that of the robust principal component analysis method and the non-negative matrix factorization method, respectively, when the input SNR is -5 dB.

비음수 제약을 통한 일반 소리 분류 (Classification of General Sound with Non-negativity Constraints)

  • 조용춘;최승진;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1412-1417
    • /
    • 2004
  • 전체관적인 표현방법인 희소 코딩 또는 독릴 성분 분해(ICA)는 이전의 청각의 처리와 소리 분류의 작업을 해명하는데 성공적으로 적용되었다. 반대로 부분 기반 표현법은 뇌에서 물체를 인식하는 방법을 이해하는 또 다른 방법이다. 이 논문에서, 우리는 소리 분류의 작업에 부분기반 표현법을 학습시키는 비음수화 행렬 분해(NMF)(1) 방법을 적용하였다. 잡음이 존재할 때와 존재하지 않을 때 두 가지 상황에서, NMF를 이용하여 주파수-시간영역의 소리로부터 특징을 추출하는 방법을 설명한다. 실험결과에서는 NMF에 기반을 둔 특징이 ICA에 기반을 두어 추출한 특징보다 소리 분류의 성능을 향상시킴을 보여준다.