• 제목/요약/키워드: Non Negative Factorization

검색결과 104건 처리시간 0.021초

도심 영상에서의 비음수행렬분해를 이용한 차량 인식 (Vehicle Recognition using NMF in Urban Scene)

  • 반재민;이병래;강현철
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.554-564
    • /
    • 2012
  • 차량인식은 차량 후보영역 검출단계와 검출된 후보 영역에서 특징을 기반으로 차량을 검증하는 차량 검증단계로 나누어진다. 선형 변환 방식의 특징은 차원 감소 효과와 통계적인 특징을 지니게 되어, 이동이나 회전에 강인한 특성을 갖는다. 선형 변환 방식 중 비음수행렬분해(Non-negative Matrix Factorization, NMF)는 부분 기반 표현 방식으로 차량의 국소적인 특징을 기저벡터로 사용하여 희소성을 갖는 특징을 추출할 수 있기 때문에 도심영상에서 발생하는 차폐 영역에 따른 인식률 저하를 방지할 수 있다. 본 논문에서는 차량 인식에 적합한 NMF 특징 추출 방법을 제안하고, 인식률을 검증하였다. 또한 희소성 제약 조건을 이용하여 기저 벡터에 희소성을 가지는 SNMF(Sparse NMF)와 LVQ2(Learning Vector Quantization) 신경 회로망을 결합하여 차폐 영역에 대한 차량 인식 효율을 기존의 NMF를 이용한 방법과 비교하였다. NMF를 이용하는 특징은 차량이 혼재되어 차폐 영역이 빈번히 발생하는 도심에서도 강건한 특징임을 보였다.

수동 선배열 소나의 저주파 간섭 신호에 대한 독립성분분석 알고리즘 비교 (Comparison of independent component analysis algorithms for low-frequency interference of passive line array sonars)

  • 김주호;;이종현;정명준
    • 한국음향학회지
    • /
    • 제38권2호
    • /
    • pp.177-183
    • /
    • 2019
  • 본 논문에서는 수동 선배열 소나의 저주파 영역에서 수신된 표적 신호로부터 간섭신호를 분리해 내기 위해 독립성분분석 알고리즘을 적용하는 방안을 제안하고 기존 알고리즘들의 성능을 비교해 보았다. 저주파 대역 신호의 경우 비교적 넓은 방위로부터 수신되기 때문에 인접 빔 신호를 관측신호로 활용하여 독립성분분석을 수행할 수 있다. 신호분리에 사용한 독립성분분석 알고리즘은 FastICA(Fast Independent Component Analysis), NNMF (Non-negative Matrix Factorization), JADE (Joint Approximation Diagonalization of Eigen-matrices)이다. 실측 선배열 수동소나신호를 이용하여 독립성분분석을 수행한 결과 제안한 방법으로 간섭신호분리가 가능함을 확인하였으며, JADE 알고리즘의 신호 분리 성능이 가장 우수한 것으로 나타났다.

비음수 행렬 분해와 디코릴레이터를 이용한 모노-스테레오 블라인드 업믹스 기법 (Mono-To-Stereo Blind Upmix Using Non-Negative Matrix Factorization and Decorrelator)

  • 최근우;전상배;이석진;성굉모
    • 한국음향학회지
    • /
    • 제29권8호
    • /
    • pp.509-515
    • /
    • 2010
  • 본 논문은 충분한 음원 너비 (Apparent Source Width)와 스테레오 이미지 품질 (Stereophonic Image Quality)을 확보하는 모노-스테레오 업믹스 기법을 제안한다. 모노 신호의 분석을 위해 높은 계수의 비음수 행렬 분해가 사용된다. 그 결과로\ 나온 분해된 음원들은 음조성 (Tonality)에 의하여 타악기 (Percussive)와 음조 (Tonal) 그룹으로 분류된다. 두 그룹 중 하나는 바로 스테레오 채널로 들어가는 반면 나머지 하나는 디코릴레이터를 통과하여 들어가게 된다. 청취 평가 결과 제안한 방법은 충분한 음원 너비와 스테레오 음상을 제공할 뿐만 아니라 기존의 방법에 비해 음색 변화도 감소하는 종합적으로 향상된 성능을 보여주었다.

PCA와 NMF를 이용한 대화식 드라마의 스토리 경로 추천 시스템 구현 (An Implementation of Story Path Recommendation System of Interactive Drama Using PCA and NMF)

  • 이연창;장재희;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.95-102
    • /
    • 2012
  • 대화식 드라마는 사용자의 자유로운 선택과 참여가 요구되는 상호작용성을 가진 이야기를 말한다. 본 논문에서는 이러한 대화식 드라마의 특성을 이용하여 훈련 데이터를 만들어 사용자의 선호도를 파악한다. 그 후 파악된 선호도 특성에 맞게 새로운 사용자들에게 스토리의 경로를 추천하는 시스템 구현 과정을 기술한다. 선호도 특성을 추출하기 위하여 Principal Component Analysis(이하 PCA)와 Non-negative Matrix Factorization(이하 NMF)를 사용하였다. PCA를 이용하여 추천한 결과 성공률은 75%, NMF을 이용하여 추천한 결과 성공률은 62.5%를 나타냈다.

확률적 비음수 행렬 인수분해를 사용한 통계적 음성검출기법 (Statistical Voice Activity Detection Using Probabilistic Non-Negative Matrix Factorization)

  • 김동국;신종원;권기수;김남수
    • 한국통신학회논문지
    • /
    • 제41권8호
    • /
    • pp.851-858
    • /
    • 2016
  • 본 논문은 비음수 행렬 인수분해(NMF)의 확률적 해석에 근거한 새로운 통계적 음성검출기법을 제안한다. NMF의 기저와 부호화 행렬들이 주어졌을 때, 데이터 행렬의 분포를 Poisson 분포로 가정한 로그 우도는 Kullback-Leibler 발산을 이용한 NMF의 목적 함수와 일치한다. 이러한 NMF의 확률모델에 근거하여 음성검출을 위해 DFT영역에서 잡음과 음성의 크기 스펙트럼을 Poisson 분포로 모델링하여 새로운 우도비 검출 규칙을 유도한다. 실험 결과를 통해 제안된 기법이 0-15dB 신호 대 잡음비의 시뮬레이션 환경에서 기존 Gaussian과 NMF을 사용한 기법보다 향상된 음성검출 결과를 보여준다.

A New Anchor Shot Detection System for News Video Indexing

  • Lee, Han-Sung;Im, Young-Hee;Park, Joo-Young;Park, Dai-Hee
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.217-220
    • /
    • 2007
  • In this paper, we present a new anchor shot detection system which is a core step of the preprocessing process for the news video analysis. The proposed system is composed of four modules and operates sequentially: 1) skin color detection module for reducing the candidate face regions; 2) face detection module for finding the key-frames with a facial data; 3) vector representation module for the key-frame images using a non-negative matrix factorization; 4) anchor shot detection module using a support vector data description. According to our computer experiments, the proposed system shows not only the comparable accuracy to the recent other results, but also more faster detection rate than others.

  • PDF

Speech Denoising via Low-Rank and Sparse Matrix Decomposition

  • Huang, Jianjun;Zhang, Xiongwei;Zhang, Yafei;Zou, Xia;Zeng, Li
    • ETRI Journal
    • /
    • 제36권1호
    • /
    • pp.167-170
    • /
    • 2014
  • In this letter, we propose an unsupervised framework for speech noise reduction based on the recent development of low-rank and sparse matrix decomposition. The proposed framework directly separates the speech signal from noisy speech by decomposing the noisy speech spectrogram into three submatrices: the noise structure matrix, the clean speech structure matrix, and the residual noise matrix. Evaluations on the Noisex-92 dataset show that the proposed method achieves a signal-to-distortion ratio approximately 2.48 dB and 3.23 dB higher than that of the robust principal component analysis method and the non-negative matrix factorization method, respectively, when the input SNR is -5 dB.

Dimension-Reduced Audio Spectrum Projection Features for Classifying Video Sound Clips

  • Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권3E호
    • /
    • pp.89-94
    • /
    • 2006
  • For audio indexing and targeted search of specific audio or corresponding visual contents, the MPEG-7 standard has adopted a sound classification framework, in which dimension-reduced Audio Spectrum Projection (ASP) features are used to train continuous hidden Markov models (HMMs) for classification of various sounds. The MPEG-7 employs Principal Component Analysis (PCA) or Independent Component Analysis (ICA) for the dimensional reduction. Other well-established techniques include Non-negative Matrix Factorization (NMF), Linear Discriminant Analysis (LDA) and Discrete Cosine Transformation (DCT). In this paper we compare the performance of different dimensional reduction methods with Gaussian mixture models (GMMs) and HMMs in the classifying video sound clips.

Language Model Adaptation Based on Topic Probability of Latent Dirichlet Allocation

  • Jeon, Hyung-Bae;Lee, Soo-Young
    • ETRI Journal
    • /
    • 제38권3호
    • /
    • pp.487-493
    • /
    • 2016
  • Two new methods are proposed for an unsupervised adaptation of a language model (LM) with a single sentence for automatic transcription tasks. At the training phase, training documents are clustered by a method known as Latent Dirichlet allocation (LDA), and then a domain-specific LM is trained for each cluster. At the test phase, an adapted LM is presented as a linear mixture of the now trained domain-specific LMs. Unlike previous adaptation methods, the proposed methods fully utilize a trained LDA model for the estimation of weight values, which are then to be assigned to the now trained domain-specific LMs; therefore, the clustering and weight-estimation algorithms of the trained LDA model are reliable. For the continuous speech recognition benchmark tests, the proposed methods outperform other unsupervised LM adaptation methods based on latent semantic analysis, non-negative matrix factorization, and LDA with n-gram counting.

시각 영상 복원을 위한 비음수 행렬 분해 기반의 영상 기저 추출 (Extraction of Image Bases based on Non-Negative Matrix Factorization for Visual Stimuli Reconstruction)

  • 박영묘;조성식;신봉기;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.383-385
    • /
    • 2011
  • 본 논문에서는 동영상을 대상으로 하는 기존의 시각주의 시스템의 성능을 향상시킨 새로운 시스템에 대하여 설명한다. 제안하는 시스템은 기존의 시스템이 가지고 있던 한계점인 서로 반대되는 특징을 가지는 색상에서 하나의 특징만을 고정적으로 선택하던 것을 극복하여, 서로 반대되는 특징 중 현저함이 더 높은 색상 특징을 선택하여 입력 들어오는 영상에 적응적인 현저함 추출을 하였다. 도한 시간 현저함 정보를 추가적으로 고려할 수 있도록 하여 동영상에 대한 처리도 가능하도록 하였고, 성능 평가 시 인간을 대상으로 한 설문 조사 실험을 추가하여 보다 인간의 시각 인식과 유사한 시스템임을 증명하였다.