• 제목/요약/키워드: Sparseness

검색결과 77건 처리시간 0.026초

Gini 계수를 이용한 Blind Source Recovery 방법의 구현 (Implementation of Blind Source Recovery Using the Gini Coefficient)

  • 정재웅;송은정;박영철;윤대희
    • 한국음향학회지
    • /
    • 제27권1호
    • /
    • pp.26-32
    • /
    • 2008
  • UBSS (under-determined blind source separation)는 BMMR (blind mixing matrix recovery) 과정과 BSR (blind source recovery) 과정으로 구분된다. 일반적으로 이 두 과정은 취득된 데이터의 sparseness를 이용하여 수행되는데, 얼마나 sparseness를 정확히 측정하느냐에 따라 그 성능이 좌우된다. 본 논문에서는 Gini 계수를 이용한 sparseness의 측정 방법을 BSR 과정에 도입하여, $l_1$-노름, $l_q$-노름과 쌍곡탄젠트 (hyperbolic tangent)를 이용하는 측정 방법들과 비교하였으며, 보다 정확한 sparseness 측정과 향상된 BSR 성능을 획득하였다. 이는 컴퓨터 모의 실험을 통하여 검증되었다.

성긴임펄스 응답 시스템을 위한 부밴드 IPNLMS 적응필터 (Subband IPNLMS Adaptive Filter for Sparse Impulse Response Systems)

  • 손상욱;최훈;배현덕
    • 전기학회논문지
    • /
    • 제60권2호
    • /
    • pp.423-430
    • /
    • 2011
  • In adaptive filtering, the sparseness of impulse response and input signal characteristics are very important factors of it's performance. This paper presents a subband improved proportionate normalized least square (SIPNLMS) algorithm which combines IPNLMS for impulse response sparseness and subband filtering for prewhitening the input signal. As drawing and combining the advantage of conventional approaches, the proposed algorithm, for impulse responses exhibiting high sparseness, achieve improved convergence speed and tracking ability. Simulation results, using colored signal(AR(4)) and speech input signals, show improved performance compared to fullband structure of existing methods.

협동적 여과에서의 희소성 문제 해결을 위한 데이타 블러링 기법 (Data BILuring Method for Solving Sparseness Problem in Collaborative Filtering)

  • 김형일;김준태
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.542-553
    • /
    • 2005
  • 추천 시스템은 사용자의 선호도를 분석하고, 아이템에 대한 사용자의 선호도를 예측하여 아이템을 추천하는 시스템이다. 다양한 추천 기법 중에 협동적 여과(collaborative filtering)는 상용화된 시스템에성공적인 적용이 이루어진 기법이다. 그러나 협동적 여과는 데이타의 희소성 문제(sparseness problem)와초기 추천 문제(cold-start problem)에 대해 취약점을 가 고 있다. 만약 매우 적은 양외 선호도 데이타가존재하면 많은 유사 사용자를 찾기 어려우며, 이것은 추천 성능을 저하시키는 요인으로 작용한다. 또한 선호도 정보가 없는 새로운 사용자에게는 아이템을 전혀 추천할 수 없는 문제가 발생한다. 본 논문에서는 사용자와 아이템에 대한 추가 속성 정보를 통합하여 협동적 여과의 희소성 문제와 초기 추천 문제를 해결하 고 추천 성능을 향상시키는 기법을 제안한다. 본 논문에서 제안하는 기법은 추가 속성 정보의 확률분포를 이용하여 알려지지 않은 선호도 값을 예측함으로써 선호도 데이타를 변경 고, 변경된 선호도 데이타에 협동적 여과를 적용하여 top-N 추천을 생성하는 것이다. 이와 같은 선호도 데이타 변경 기법을 데이타 블러링(data blurring)이라 한다. 몇 가지 실험 결과를 통해 제안된 기법의 효과를 확인하였다.

주색도 분석을 적용한 비음수 행렬 분해 기반의 광원 추정 (Illumination Estimation Based on Nonnegative Matrix Factorization with Dominant Chromaticity Analysis)

  • 이지헌;김대철;하영호
    • 전자공학회논문지
    • /
    • 제52권8호
    • /
    • pp.89-96
    • /
    • 2015
  • 인간의 시각은 색순응을 통해서 사물의 색을 광원의 색에 영향 없이 인지 할 수 있다. 반면에, 카메라는 입력 값을 그대로 기록하기 때문에, 광원에 따라 물체의 색이 다르게 나타난다. 최근에 희박성 제약조건의 비음수 행렬 분해(nonnegative matrix factorization with sparseness constraint; NMFsc)를 이용한 광원추정 방법이 제안되었다. 이 방법은 낮은 희박성 제약조건을 사용해서 광원을 추정하고, 높은 희박성 제약조건을 사용해서 반사율을 추정한다. 하지만, 희박성 제약조건의 비음수 행렬분해를 이용한 광원 추정 방법은, 영상의 전역적인 정보를 사용하므로, 영상에서 동일한 색이 넓은 영역에 존재하는 경우, 추정된 광원이 큰 오차를 가진다. 이러한 단점을 보완하기 위해, 영상에서 주색도 분석과 희박성 제약조건의 비음수 행렬 분해를 이용한 광원 추정 방법을 제안하였다. 먼저 주색도를 분석하기 위해 영상을 색도 좌표계로 옮기고 색도 히스토그램을 이용하여 유사한 색도를 가지는 영역들로 영상을 분할한다. 다음으로 영상의 주색도는 분할된 영상들 중 색도의 표준편차가 가장 적은 영상의 색도로 선택한다. 마지막으로 주색도 분석 결과와 희박성 제약조건의 비음수 행렬 분해를 이용해 입력 영상에서 주색도 성분을 제거하고 최종적인 광원을 추정한다. 실제 촬영 영상에 대한 평균 각오차를 사용하여 기존의 방법과의 성능을 비교하였고, 그 결과 제안하는 방법의 평균 각 오차는 5.5를 나타내어 영상의 주 색도를 포함하여 광원을 추정한 기존 방법의 평균 각 오차 5.7 보다 우수한 성능을 나타내었다.

Sparse Data Cleaning using Multiple Imputations

  • Jun, Sung-Hae;Lee, Seung-Joo;Oh, Kyung-Whan
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권1호
    • /
    • pp.119-124
    • /
    • 2004
  • Real data as web log file tend to be incomplete. But we have to find useful knowledge from these for optimal decision. In web log data, many useful things which are hyperlink information and web usages of connected users may be found. The size of web data is too huge to use for effective knowledge discovery. To make matters worse, they are very sparse. We overcome this sparse problem using Markov Chain Monte Carlo method as multiple imputations. This missing value imputation changes spare web data to complete. Our study may be a useful tool for discovering knowledge from data set with sparseness. The more sparseness of data in increased, the better performance of MCMC imputation is good. We verified our work by experiments using UCI machine learning repository data.

Use of Word Clustering to Improve Emotion Recognition from Short Text

  • Yuan, Shuai;Huang, Huan;Wu, Linjing
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.103-110
    • /
    • 2016
  • Emotion recognition is an important component of affective computing, and is significant in the implementation of natural and friendly human-computer interaction. An effective approach to recognizing emotion from text is based on a machine learning technique, which deals with emotion recognition as a classification problem. However, in emotion recognition, the texts involved are usually very short, leaving a very large, sparse feature space, which decreases the performance of emotion classification. This paper proposes to resolve the problem of feature sparseness, and largely improve the emotion recognition performance from short texts by doing the following: representing short texts with word cluster features, offering a novel word clustering algorithm, and using a new feature weighting scheme. Emotion classification experiments were performed with different features and weighting schemes on a publicly available dataset. The experimental results suggest that the word cluster features and the proposed weighting scheme can partly resolve problems with feature sparseness and emotion recognition performance.

자료 빈약성을 해소하기 위한 말뭉치 크기의 예측 (Estimation of the Corpus Size for Solving Data Sparseness)

  • 양단희;임수종;송만석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권4호
    • /
    • pp.568-583
    • /
    • 1999
  • 대량의 말뭉치(corpus)로부터 구문 정보나 의미 정보를 컴퓨터를 사용하여 자동으로 발췌하려는 연구가 활발하다. 그러나 실용적인 자연언어처리 시스템이 되기 위해 필요한 망라성(coverage)과 견고성(robustness)을 갖기 위해 어느 정도 규모의 말뭉치가 필요한지에 대한 연구는 극히 미비하다. 본 연구는 '우리말큰사전'상의 주요 4가지 품사에 속하는 단어들을 중심으로 상이 단어(different words) 수와 말뭉치 크기간의 상관관계를 통계적으로 고찰하여 수학적 예측함수(estimating functions)를 구한다. 그리고 이를 통해 자료 빈약성(data sparseness)현상을 타당한 수준으로 감소시켜 말뭉치를 기반 자연어처리의 신뢰도를 높이기 위해 요구되는 말뭉치 크기를 예측한다. 또한 예측된 말뭉치 크기를 근거로 합리적인 말뭉치 구축 방법을 제안한다.

Overlapping NMF와 Sparseness를 이용한 단일 채널 다성 음악의 음원 분리 (Single Channel Polyphonic Music Separation Using Sparseness and Overlapping NMF)

  • 김민제;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.769-771
    • /
    • 2005
  • In this paper we present a method of separating musical instrument sound sources from their monaural mixture, where we take the harmonic structure of music into account and use the sparseness and the overlapping NMF [1] to select representative spectral basis vectors which are used to reconstruct unmixed sound. A method of spectral basis selection is illustrated and experimental results with monaural mixture of voice/cello and trumpet/viola are shown to confirm the validity of our proposed method.

  • PDF

SI기법에 의한 구조물 상태평가 (Structural Condition Assessment by SI Schemes)

  • 신수봉;오성호
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 추계학술대회논문집
    • /
    • pp.419-422
    • /
    • 2004
  • The paper classified SI schemes for structural engineering applications based on the type of measured data. Only parametric SI algorithms with optimization processes were reviewed where optimal structural parameters are estimated by minimizing an output error between measured and computed responses. Some important issues in applying SI schemes were analyzed with the definition of an analytical model, noise and sparseness in measured data. As a sample study, the application of a nonlinear time-domain SI algorithm for a shear building was examined.

  • PDF

개체 중의성 해소를 위한 사용자 유사도 기반의 트윗 개체 링킹 기법 (Tweet Entity Linking Method based on User Similarity for Entity Disambiguation)

  • 김서현;서영덕;백두권
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1043-1051
    • /
    • 2016
  • 트위터 문서는 웹 문서에 비해 길이가 짧기 때문에 웹 기반의 개체 링킹 기법을 그대로 적용시킬 수 없어 사용자 정보나 집단의 정보를 활용하는 방법들이 시도되고 있다. 하지만, 트윗의 개수가 충분하지 않은 사용자의 경우 데이터 희소성 문제가 여전히 발생하고 관련이 없는 집단의 정보를 사용할 경우 링킹의 결과에 악영향을 미칠 수 있다. 본 논문에서는 기존 연구의 문제를 해결하기 위해 단일 트윗 내의 의미 관련도 뿐만 아니라 사용자의 트윗 집합과 다른 사용자들의 트윗 집합까지 고려하여 데이터 희소성을 해결하고, 관련성이 높은 사용자들의 트윗 정보에 가중치를 주어 트윗 개체 링킹의 성능을 높이고자 한다. 실제 트위터 데이터를 활용한 실험을 통해 제안하는 트윗 개체 링킹 기법이 기존의 기법에 비해 높은 성능을 가지며, 유사도가 높은 사용자의 정보를 사용하는 것이 트윗 개체 링킹에서 데이터 희소성 해결과 링킹 정확도 향상에 연관성이 있음을 보였다.