• 제목/요약/키워드: additive clustering

검색결과 12건 처리시간 0.021초

Nonnegative Matrix Factorization with Orthogonality Constraints

  • Yoo, Ji-Ho;Choi, Seung-Jin
    • Journal of Computing Science and Engineering
    • /
    • 제4권2호
    • /
    • pp.97-109
    • /
    • 2010
  • Nonnegative matrix factorization (NMF) is a popular method for multivariate analysis of nonnegative data, which is to decompose a data matrix into a product of two factor matrices with all entries restricted to be nonnegative. NMF was shown to be useful in a task of clustering (especially document clustering), but in some cases NMF produces the results inappropriate to the clustering problems. In this paper, we present an algorithm for orthogonal nonnegative matrix factorization, where an orthogonality constraint is imposed on the nonnegative decomposition of a term-document matrix. The result of orthogonal NMF can be clearly interpreted for the clustering problems, and also the performance of clustering is usually better than that of the NMF. We develop multiplicative updates directly from true gradient on Stiefel manifold, whereas existing algorithms consider additive orthogonality constraints. Experiments on several different document data sets show our orthogonal NMF algorithms perform better in a task of clustering, compared to the standard NMF and an existing orthogonal NMF.

클러스터링 및 영상 분할을 위한 커널 기반의 Possibilistic 접근 방법 (A Kernel based Possibilistic Approach for Clustering and Image Segmentation)

  • 최길수;최병인;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제14권7호
    • /
    • pp.889-894
    • /
    • 2004
  • Fuzzy Kernel C-Means(FKCM) 알고리즘은 커널 함수를 통하여 구형의 데이터뿐만 아니라 Fuzzy C-Means(FCM)에서는 분류하기 힘든 복잡한 형태의 분포를 갖는 데이터를 분류할 수 있다. 하지만 FCM과 같이 노이즈에 대해서는 민감한 성질을 가진다. 이처럼 노이즈(noise)에 민감한 성질을 보완하기 위해서 본 논문에서는 Possibilistic C-Means 알고리즘에 커널 함수를 적용하였다. 제안한 Kernel Possibilistic C-Means(KPCM) 알고리즘은 일반적인 데이터에 대해 FKCM과 같은 성능의 클러스터링 수행이 가능하며 노이즈가 있는 데이터에 대해서는 FKCM보다 정확한 클러스터링을 수행할 수 있다.

적응 군집화 기반 희소 부호화에 의한 영상 잡음 제거 (Adaptive Clustering based Sparse Representation for Image Denoising)

  • 김시현
    • 전기전자학회논문지
    • /
    • 제23권3호
    • /
    • pp.910-916
    • /
    • 2019
  • 자연 영상의 비지역적 유사성은 다양한 영상 응용 분야에서 활용되는 중요한 특성 중에 하나이다. 영상 내 객체의 에지나 텍스쳐, 무늬 등은 비지역적으로 반복되어 나타난다. 유사도가 높은 영상 블록들로 군집을 형성하면 자연스럽게 그로부터 특징을 추출할 수 있다. 또한 군집의 크기가 클수록 원치 않는 백색 잡음에 대한 대항력을 키울 수 있다. 영상 신호 처리 중 잡음 제거 관련 연구는 백색 가산 잡음이 포함된 영상의 복원을 다룬다. 본 논문에서는 백색 잡음이 포함된 영상을 유사도에 따라 적응적으로 군집화하여 잡음 신호에 대한 이득을 향상시키고, 이를 통해 잡음을 효과적으로 제거하는 알고리듬을 제안한다. 다양한 영상과 잡음 강도에 대한 모의실험 결과로부터 제안된 알고리듬이 에지, 텍스쳐, 무늬 영역을 잘 보존하면서 잡음을 제거할 수 있음을 시각적으로 확인할 수 있고, 또한 최근 보고된 여러 방법들과의 잡음 제거 성능 수치 비교에서도 우수한 결과를 보인다.

일본인이 지각하는 한국어 자음의 구조 (The Structure of Korean Consonants as Perceived by the Japanese)

  • 배문정;김정오
    • 인지과학
    • /
    • 제19권2호
    • /
    • pp.163-175
    • /
    • 2008
  • 한국에 거주하는 일본인 12명을 대상으로 한국어 초성 자음에 대한 지각적 혼동을 조사하여 그들이 한국어 자음을 지각할 때 사용하는 심리적 차원과 특질들을 추출하였다. 개음절들은 비소음(no noise) 조건과 소음 조건에서 제시되고 참여자들은 그 정체를 파악하였다. 실험 결과로 자음들 간의 혼동 행렬(confusion matrix)을 구성하였고 이 행렬 자료로 가산 군집 분석, 개별차이 척도법 및 정보 전달율을 계산했다. 가산 군집 분석 결과, 비소음 조건에서 일본인들은 '다 타'를 가장 유사한 소리로 지각했으며, '가 카', '자 차 짜', '타 따', '파 빠', '사 싸' 순으로 지각적 군집을 형성하였다. 소음 조건에서는 '가 다 바', '마 바', '차 카 타 파' 등 10개의 군집이 추출되었는데, 이 군집들은 같은 청취 조건에서 '싸 짜', '다 자', '파 하' 등 발성 유형(공명, 이완, 기식, 긴장)이 같고 조음 방법이 다른 음소들을 유사한 소리로 지각한 한국인의 군집들과 큰 차이를 보였다. 개별차이 척도법을 적용한 결과, 소음 조건에서 공명음을 포함한 이완음과 나머지 음소를 구분하는 차원(이완성 차원), 기식성의 정도와 관련된 차원(기식성 차원) 및 조음 위치(설정음과 주변음)와 관련된 차원(설정성 차원)을 찾았다. 한국인이 보인 기식성과 긴장성 차원은 이원적인 값을 갖고 있었으나 일본인이 보인 차원은 연속적인 값을 가지는 것으로 드러났다. 정보 전달율을 분석한 결과, 일본인은 한국인에 비해 기식성과 긴장성의 후두 자질은 잘 지각하지 못하지만 순음성과 설정성의 조음 위치 자질은 더 잘 지각하였다. 본 연구의 결과들은 각 언어의 음소 범주를 구성하는 기저 표상의 구조적 차이로 다루는 접근의 중요성을 시사한다.

  • PDF

λ-퍼지측도를 사용한 질적, 양적혼합품질특성을 가진 부품의 군집화 (The Clustering of Parts with Qualitative and Quantitative Quality Properties using λ-Fuzzy Measure)

  • 김정만;이상도
    • 품질경영학회지
    • /
    • 제24권1호
    • /
    • pp.126-136
    • /
    • 1996
  • In multi-item production system, GT(Group Technology) is used effectively in order to cluster various parts into groups. GT is based on clustering parts which have similar features, and these features are classified into two properties, namely crisp(quantitative) feature and fuzzy(qualitative) feature. Especially, many difficult problems are often faced that have to evaluate the properties of parts with the crisp and fuzzy feature together. As the basis of determining the similarity of inter-parts, in this method, one aggregate value is calculated on each part. However, because the above aggregate value is only gained from simple additive weighted sum, there is one problem in this method that has been handled the combination effect of inter-parts. For these reasons, in this paper, a proposed method is suggested for representing combination effect in order to cluster parts that have crisp and fuzzy properties into groups using ${\lambda}$-fuzzy measure and fuzzy integral.

  • PDF

Compositional data analysis by the square-root transformation: Application to NBA USG% data

  • Jeseok Lee;Byungwon Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제31권3호
    • /
    • pp.349-363
    • /
    • 2024
  • Compositional data refers to data where the sum of the values of the components is a constant, hence the sample space is defined as a simplex making it impossible to apply statistical methods developed in the usual Euclidean vector space. A natural approach to overcome this restriction is to consider an appropriate transformation which moves the sample space onto the Euclidean space, and log-ratio typed transformations, such as the additive log-ratio (ALR), the centered log-ratio (CLR) and the isometric log-ratio (ILR) transformations, have been mostly conducted. However, in scenarios with sparsity, where certain components take on exact zero values, these log-ratio type transformations may not be effective. In this work, we mainly suggest an alternative transformation, that is the square-root transformation which moves the original sample space onto the directional space. We compare the square-root transformation with the log-ratio typed transformation by the simulation study and the real data example. In the real data example, we applied both types of transformations to the USG% data obtained from NBA, and used a density based clustering method, DBSCAN (density-based spatial clustering of applications with noise), to show the result.

Stiefel 다양체에서 곱셈의 업데이트를 이용한 비음수 행렬의 직교 분해 (Orthogonal Nonnegative Matrix Factorization: Multiplicative Updates on Stiefel Manifolds)

  • 유지호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권5호
    • /
    • pp.347-352
    • /
    • 2009
  • 주어진 비음수 데이터를 두 개의 비음수 행렬의 곱의 형태로 표현하는 비음수 행렬 분해(Nonnegative Matrix Factorization)는 비음수 데이터의 다변량 분석에서 폭넓게 사용되고 있는 방법이다. 비음수 행렬 분해는 집단화(Clustering), 특히 문서의 집단화에서 유용하게 쓰일 수 있다. 본 논문에서는 주어진 문서들로부터 구성된 단어-문서 행렬을 두 개의 비음수 행렬의 곱으로 분해할 때, 그 중 하나의 행렬에 직교 제한을 주는 비음수 행렬의 직교 분해(Orthogonal Nonnegative Matrix Factorization) 방법을 다룬다. 현존하는 비음수 행렬의 직교 분해 방법은 직교 제한과 관련된 항을 더해주는 방식을 사용하지만, 여기서는 Stiefel 다양체 위에서의 실제 기울기를 직접 구하여 곱셈의 업데이트 알고리즘을 유도하였다. 다양한 문서 데이터에 대한 실험을 통해 새롭게 유도된 비음수 행렬의 직교 분해 방법이 기존의 비음수 행렬 분해나 기존의 비음수 행렬의 직교 분해보다 문서 집단화에서 우수한 성능을 나타냄을 보였다.

IoT 기기 재설계를 위한 적층제조를 활용한 부품병합 설계 방법에 대한 연구 (A Study of Design for Additive Manufacturing Method for Part Consolidation to Redesign IoT Device)

  • 김삼연
    • 사물인터넷융복합논문지
    • /
    • 제8권2호
    • /
    • pp.55-59
    • /
    • 2022
  • 최근 4차 산업혁명으로 인하여, 고객 제품형 제품 설계 및 새로운 서비스 개발을 위하여 IoT 기술이 주목받고 있다. 최근 적층제조 기술은 IoT 센서를 직접 제작하거나, 센서를 포함한 기기를 만드는 분야에 다양하게 활용되고 있다. IoT 기기를 적층제조를 활용하여 제작시, 적층제조 고유의 설계 장점을 활용하기 위해 다양한 부품들을 병합하는 설계 방법론이 큰 관심을 받고 있다. 부품병합을 통해 조립 공정을 단축하고, 부품 경량화 등의 장점을 이룰 수 있기 때문이다. 따라서, 본 연구에서는 적층제조를 활용한 부품병합을 지원하기 위한 설계 방법론을 개발하였다. 이를 통해 제품의 기능 및 제품 내 부품의 기능과 물리적 연결성을 분석한 제품 아키텍쳐를 생성하고, 인접한 기능들 및 부품을 Girvan Newman 알고리즘을 활용하여, 최종 부품병합 후보군을 선정하도록 지원한다. 제안한 설계 방법론을 검증하고자 사례연구를 통해 적층제조로 출력된 전기 자전거의 부품병합과정을 분석하였다.

Non-negative matrix factorization 을 이용한 마이크로어레이 데이터의 클러스터링 (Clustering gene expression data using Non -Negative matrix factorization)

  • Lee, Min-Young;Cho, Ji-Hoon;Lee, In-Beum
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.117-123
    • /
    • 2004
  • 마이크로어레이 (microarray) 기술이 개발된 후로 연관된 유전자 클러스터 (cluster)를 찾는 문제는 깊이 연구되어왔다. 이 문제는 핵심적인 과제 중 하나는 생물학적으로 타당한 클러스터의 수를 결정하는 데 있다. 본 논문은 최적의 클러스터 수를 결정하는 기준을 제시하고, non-negative factorization (NMF)를 이용해 클러스터 centroid의 패턴을 찾는 방법을 제안한다. NMF에 의해 발견된 각각의 패턴은 생물학적 프로세스의 특정 부분으로 해석될 수 있다. NMF는 factor matrix의 entity를 non-negative로 제약 (constraint)하고, 이 제약은 오직 additive combination만 허용하기 때문에 이러한 부분적인 패턴을 찾아낼 수 있다. NMF의 유용성은 이미지 분석과 텍스트 분석에서 이미 입증되어 있다. 본 논문에서 제안한 방법에 의해 위의패턴과 유사한 발현 패턴을 갖는 유전자를 모을 수 있었다. 제안된 방법은 human fibroblast데이터와 yeast cell cycle 데이터에 적용해 성능을 입증하였다.

  • PDF

III-V 삼상 화합물 반도체의 분자선 결정성장법에서의 열역학적 고찰

  • 오원웅;오재응;백수현
    • ETRI Journal
    • /
    • 제13권4호
    • /
    • pp.42-51
    • /
    • 1991
  • MBE 성장시 기판 표면에서의 성장과정을 운동론적 지배과정과 열역학적 지배과정으로 나누어 성장모델을 제시하였으며, 화학적 평형상태에서의 열역학이 III-V compound의 성장속도와 composition 에 미치는 영향을 기존의 보고된 결과 데이터와 비교 분석하였다. 특히 miscibility gap 내에 존재하는 III-V ternary compound의 경우 박막의 성질 및 소자의 특성에 영향을 미치는 alloy clustering은 저온 성장시 surface kinetics에 의해, 고온성장시에는 열역학적 spinodal decomposition에 의해 결정됨을 알수 있었다. 열역학적 모델에서는 기판과 layer사이의 lattice mismatch와 재료의 elastic coefficient의 함수인 additive strain Gibbs free energy, 그리고 ternary solid solution의 regular behavior를 가정하여 ternary alloy의 mixing에 기인한 excess Gibbs free energy를 고려하였다.

  • PDF