• 제목/요약/키워드: Non Negative Factorization

검색결과 104건 처리시간 0.023초

Refinement of Document Clustering by Using NMF

  • Shinnou, Hiroyuki;Sasaki, Minoru
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.430-439
    • /
    • 2007
  • In this paper, we use non-negative matrix factorization (NMF) to refine the document clustering results. NMF is a dimensional reduction method and effective for document clustering, because a term-document matrix is high-dimensional and sparse. The initial matrix of the NMF algorithm is regarded as a clustering result, therefore we can use NMF as a refinement method. First we perform min-max cut (Mcut), which is a powerful spectral clustering method, and then refine the result via NMF. Finally we should obtain an accurate clustering result. However, NMF often fails to improve the given clustering result. To overcome this problem, we use the Mcut object function to stop the iteration of NMF.

  • PDF

비음수 행렬 인수분해와 NMF 군집방법을 이용한 다중문서요약 (Multi-document Summarization using Non-negative Matrix Factorization and NMF Clustering Method)

  • 박선;이주홍;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2008
  • 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)와 NMF 군집방법을 이용하여 다중문서를 요약하는 새로운 방법을 제안하였다. 본 논문에서 NMF에 의해 계산된 의미 특징(semantic feature)은 문서의 고유 구조(inherent structure)를 반영하여 문장을 추출함으로써 요약의 질을 높일 수 있고, 의미 변수(semantic variable)를 이용한 문장의 군집은 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

Deducing Isoform Abundance from Exon Junction Microarray

  • Kim Po-Ra;Oh S.-June;Lee Sang-Hyuk
    • Genomics & Informatics
    • /
    • 제4권1호
    • /
    • pp.33-39
    • /
    • 2006
  • Alternative splicing (AS) is an important mechanism of producing transcriptome diversity and microarray techniques are being used increasingly to monitor the splice variants. There exist three types of microarrays interrogating AS events-junction, exon, and tiling arrays. Junction probes have the advantage of monitoring the splice site directly. Johnson et al., performed a genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays (Science 302:2141-2144, 2003), which monitored splicing at every known exon-exon junctions for more than 10,000 multi-exon human genes in 52 tissues and cell lines. Here, we describe an algorithm to deduce the relative concentration of isoforms from the junction array data. Non-negative Matrix Factorization (NMF) is applied to obtain the transcript structure inferred from the expression data. Then we choose the transcript models consistent with the ECgene model of alternative splicing which is based on mRNA and EST alignment. The probe-transcript matrix is constructed using the NMF-consistent ECgene transcripts, and the isoform abundance is deduced from the non-negative least squares (NNLS) fitting of experimental data. Our method can be easily extended to other types of microarrays with exon or junction probes.

NMF를 이용한 영문자 활자체 폰트 분류 (Font Classification of English Printed Character using Non-negative Matrix Factorization)

  • 이창우;강현;정기철;김항준
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.65-76
    • /
    • 2004
  • 최근 대부분의 문서들이 전자적으로 생성되고 많은 고문서들이 이미지 형태로 전자화되고 있다. 이미지 형태의 전자 문서들은 정보 추출과 데이터베이스화에 많은 어려움이 있기 때문에, 이러한 문서를 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문자 인식을 위한 많은 연구가 필요하다. 본 논문은 폰트의 구분 특성(font discrimination features)들이 폰트이미지의 공간적으로 지역적인 특징들에 기반함을 가정한 방법으로써, 객체의 부분기반 표현들을 학습할 수 있는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법이다. 제안된 방법은 부분기반의 비지도 학습 방법(part-based unsupervised learning technique)을 이용하여 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들이 폰트의 식별을 위한 적절성을 보인다. 제안된 방법이 기존의 문자인식, 문서 검색 시스템들의 전처리기로 사용되면, 그 시스템들의 성능을 향상시킬 것으로 기대된다.

시각 자극 복원을 위한 비음수 행렬 분해 기반의 영상 기저 자동 추출 (Automatic Extraction of Image Bases Based on Non-Negative Matrix Factorization for Visual Stimuli Reconstruction)

  • 조성식;박영묘;이성환
    • 인지과학
    • /
    • 제22권4호
    • /
    • pp.347-364
    • /
    • 2011
  • 본 논문에서는 fMRI를 사용하여 뇌신경 반응을 측정한 후, 자극으로 주어진 $10{\times}10$ 크기의 이진 영상을 사전 정보 없이 복원하기 위해 비음수 행렬 분해를 이용한 자동화된 영상 기저 추출 방법을 제안한다. 영상 기저란 영상을 표현하는 기본 단위로, 기존 연구에서는 사전에 정의된 $1{\times}1$, $2{\times}1$, $1{\times}2$, $2{\times}2$의 크기를 갖는 총 361개의 영상 기저에 반응하는 뇌 신호를 분석하여 기저 영상으로 복원하고, 모든 기저에 대한 복원 결과를 선형 결합하여 최종복원 영상을 획득하였다. 사람이 사전에 정의한 영상 기저를 필요로 하는 기존 연구와는 달리, 본 연구에서는 비음수 행렬 분해를 기반으로 학습 데이터로 주어진 이진 영상을 가장 잘 표현하는 영상 기저를 자동 추출하였다. 자동으로 추출된 영상 기저를 사용하여 이진 영상을 복원한 결과, 기존 연구 방법보다 개선된 복원 정확도를 보였다.

  • PDF

피부 조직의 라만 스펙트럼에서 NMF 알고리즘을 통한 기저 세포암 진단 방법 (A Diagnosis Method of Basal Cell Carcinoma by Raman Spectra of Skin Tissue using NMF Algorithm)

  • 박아론;백성준
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.196-202
    • /
    • 2013
  • 기저 세포암은 가장 일반적인 피부암이고 그 발병이 급속도로 증가하고 있다. 본 연구에서는 피부 조직에서 측정한 라만 스펙트럼에서 기저 세포암 진단을 위해 NMF(non-negative matrix factorization) 알고리즘을 사용하는 방법을 제안하였다. 측정된 라만 스펙트럼은 영역 선택과 정규화 등의 몇 가지 전처리 과정을 거쳐 분류 실험에 사용한다. 전처리 과정을 수행한 라만 스펙트럼은 NMF 알고리즘을 이용하여 분해된 행렬의 열벡터를 기저로 사용한다. 이 기저들을 선형 결합하여 각 클래스의 평균 스펙트럼에 근사하기 위한 가중치는 행렬 연산으로 결정한다. 분류 실험은 스펙트럼과 NMF에 의한 기저와 가중치의 선형 결합 스펙트럼의 차에 대한 제곱평균제곱근을 최소로 하는 클래스를 선택하는 것으로 수행한다. 기저 세포암의 진단을 위한 분류 실험에서 제안한 방법을 사용하는 경우가 약 99.1%의 평균 분류율로 이전의 BCC 진단에 사용한 방법보다 약 2-3% 정도의 향상된 성능을 보였다.

NMF 기반의 용어 가중치 재산정을 이용한 문서군집 (Document Clustering using Term reweighting based on NMF)

  • 이주홍;박선
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.11-18
    • /
    • 2008
  • 문서군집은 정보검색의 많은 응용분야에 사용되는 중요한 문서 분석 방법이다. 본 논문은 비음수 행렬 분해(NMF, non-negative matrix factorization)를 기반한 용어 가중치 재산정 방법을 이용하여서 사용자의 요구에 적합한 군집결과를 얻도록 하는 새로운 군집모델을 제안한다. 제안된 모델은 군집형태에 대한 사용자 요구와 기계에 의한 군집 형태의 차이를 최소화하기 위하여 사용자 피드백에 의한 가중치가 재계산된 용어를 이용한다. 또한 제안방법은 용어의 가중치 재계산과 문서군집에 문서집합의 내부구조를 나타내는 의미특징행렬과 의미변수행렬 이용하여 문서군집의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 적용하지 않은 문서군 방법에 비하여 좋은 성능을 보인다.

  • PDF

가려진 얼굴의 인식 (Recognition of Occluded Face)

  • 강현철
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.682-689
    • /
    • 2019
  • 부분 기반 영상 표현(part-based image representation)에서는 영상의 부분적인 모습을 기저 벡터로 표현하고 기저 벡터의 선형 조합으로 영상을 분해하며, 이 때 기저 벡터의 계수가 곧 물체의 부분적인 특징을 의미하게 된다. 본 논문에는 부분 기반 영상 표현 기법인 비음수 행렬 분해(non-negative matrix factorization, NMF)를 이용하여 얼굴 영상을 표현하고 신경망 기법을 적용하여 가려진 얼굴을 인식하는 얼굴 인식을 제안한다. 표준 비음수 행렬 분해, 투영 경사 비음수 행렬 분해, 직교 비음수 행렬 분해를 이용하여 얼굴 영상을 표현하였고, 각 기법의 성능을 비교하였다. 인식기로는 학습벡터양자화 신경망을 사용하였으며, 인식기에서의 거리 척도로는 유클리디언 거리를 사용하였다. 실험 결과, 전통적인 얼굴 인식 방법에 비하여 제안한 기법이 가려진 얼굴 인식에 보다 강인함을 보인다.

비음수행렬분해 기반 연속파 잔향 제거 기법의 초매개변숫값에 따른 실험적 성능 분석 (Experimental performance analysis on the non-negative matrix factorization-based continuous wave reverberation suppression according to hyperparameters)

  • 이용곤;이석진;김기만;김근환
    • 한국음향학회지
    • /
    • 제42권1호
    • /
    • pp.32-41
    • /
    • 2023
  • 최근 비음수행렬분해 기법을 이용한 잔향 제거 연구가 활발히 이루어지고 있다. 비음수행렬분해 기법은 최적화를 위해 쿨백라이블러 발산 기반의 비용함수를 사용하며, 시간 연속성, 펄스 길이, 잔향과 표적 간 에너지 비율 등 제약사항들이 추가된다. 그리고 초매개변수를 이용하여 제약사항이 적용되는 경향을 조절한다. 따라서 효율적인 잔향 제거를 위해서는 초매개변수를 최적화해야 하지만 현재까지는 관련된 연구가 미흡한 실정이다. 본 논문에서는 실제 해상실험 데이터를 이용하여 비음수행렬분해 기반 잔향 제거 기법의 세 가지 초매개변수에 따른 잔향 제거 성능을 분석하였다. 분석결과, 시간 연속성과 펄스 길이에 대한 초매개변수는 값이 높을 경우 잔향과 표적 간의 에너지 비율은 0.4 이하에서 우수한 성능을 보였으나, 변화하는 송수신 환경에 따라서 성능의 변동성이 있음을 확인하였다. 본 논문의 분석 결과가 향후 비음수행렬분해 기반 연속파 잔향 제거 기법의 초매개변수를 최적화하기 위한 정밀한 실험을 계획하는 것에 유용한 지침표가 될 수 있을 것으로 기대한다.

강인 음성 인식을 위한 가중화된 음원 분산 및 잡음 의존성을 활용한 보조함수 독립 벡터 분석 기반 음성 추출 (Speech extraction based on AuxIVA with weighted source variance and noise dependence for robust speech recognition)

  • 신의협;박형민
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.326-334
    • /
    • 2022
  • 이 논문에서는 배경 잡음이 포함되는 환경에서 강인한 음성 인식을 하기 위한 전처리 단계로서 쓰이는 목표 음성 향상 방법을 제안한다. 보조 함수 기반의 독립 벡터 분석(Auxiliary-function-based Independent Vector Analysis, AuxIVA) 기법을 기반으로 가중 공분산 행렬에서 시간에 따라 변하는 분산에 의해서 가중치가 결정된다. 목표 음성에 대한 시간-주파수별 기여도를 나타내는 마스크를 통해 분산의 크기를 조절한다. 이러한 마스크는 음성 향상을 위해서 학습된 신경망 혹은 목표 화자로부터의 직선 성분의 기여도를 찾기 위한 확산성으로부터 추정할 수 있다. 이에 더하여 둘러싼 잡음에 대한 출력들은 서로 다차원 독립 성분 분석을 도입하여 의존성을 주어 안정적으로 노이즈 성분을 추출할 수 있다. 이 AuxIVA 기반의 목표 음성 추출 알고리즘은 또한 노이즈에 대해서 비음수 행렬 분해(Non-negative Matrix Factorization, NMF)를 비음수 텐서 분해(Non-negative Tensor Factorization, NTF)로 확장하여 독립 단순 행렬 분석(Independent Low-Rank Matrix Analysis, ILRMA)의 틀에서도 수행될 수 있다. 이러한 확장을 통해서 여전히 잡음 출력 채널에서의 채널간 의존성을 유지할 수 있다. CHiME-4데이터셋에 대한 실험 결과는 소개된 알고리즘에 대한 효과를 보여준다.