• 제목/요약/키워드: 스펙트럼 군집화 기법

검색결과 3건 처리시간 0.016초

스펙트럼 군집화에서 블록 대각 형태의 유사도 행렬 구성 (Magnifying Block Diagonal Structure for Spectral Clustering)

  • 허경용;김광백;우영운
    • 한국멀티미디어학회논문지
    • /
    • 제11권9호
    • /
    • pp.1302-1309
    • /
    • 2008
  • K-means나 퍼지 군집화와 같은 전통적인 군집화 기법들이 원형(prototype)을 기반으로 하고 볼록한 형태의 집단들에 적합한 반면, 스펙트럼 군집화(spectral clustering)는 국부적인 유사성을 기반으로 전역적인 집단을 찾아내는 기법으로 오목한 형태의 집단들에도 적용할 수 있어 커널을 기반으로 하는 SVM과 더불어 각광을 받고 있다. 하지만 SVM이 그러하듯이 스펙트럼 군집화에서도 커널의 폭은 성능에 지대한 영향을 끼치는 요인으로, 이를 결정하기 위한 다양한 방법이 시도되었지만 여전히 휴리스틱에 의존하는 실정이다. 이 논문에서는 유사도 행렬이 보다 명백한 블록 대각 형태를 가지도록 하기 위해 국부적인 커널의 폭을 거리 히스토그램을 바탕으로 적응적으로 결정하는 방법을 제시한다. 제안한 방법은 스펙트럼 군집화에 사용되는 유사도 행렬(affinity matrix)이 블록 형태의 대각 행렬을 이룰 때 이상적인 결과를 낸다는 사실에 기반하고 있으며, 이를 위해서 전통적인 유클리디안 거리와 무작위 행보 거리(random walk distance)를 함께 사용한다. 제안한 방법은 기존의 방법들에서 사용하는 유사도 행렬에 비해 명확한 블록 대각 행렬을 나타내고 있음을 실험 결과를 통해 확인할 수 있다.

  • PDF

다양한 차원 축소 기법을 적용한 문서 군집화 성능 비교 (Comparison of Document Clustering Performance Using Various Dimension Reduction Methods)

  • 조희련
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.437-438
    • /
    • 2018
  • 문서 군집화 성능을 높이기 위한 한 방법으로 차원 축소를 적용한 문서 벡터로 군집화를 실시하는 방법이 있다. 본 발표에서는 특이값 분해(SVD), 커널 주성분 분석(Kernel PCA), Doc2Vec 등의 차원 축소 기법을, K-평균 군집화(K-means clustering), 계층적 병합 군집화(hierarchical agglomerative clustering), 스펙트럼 군집화(spectral clustering)에 적용하고, 그 성능을 비교해 본다.

단세포 RNA 시퀀싱 데이터를 위한 가중변수 스펙트럼 군집화 기법 (One-step spectral clustering of weighted variables on single-cell RNA-sequencing data)

  • 박민영;박세영
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.511-526
    • /
    • 2020
  • 단세포 RNA 시퀀싱 데이터(single-cell RNA-sequencing data, 이하 단세포 RNA 데이터)는 세포 조직으로부터 추출한 각 단세포 별 유전자의 신호를 기록한 데이터로, 세포 간의 이질성을 파악하는 것을 주요 목적으로 한다. 그러나 단세포 RNA 데이터는 샘플링 및 기술적인 한계로 인해 결측비율이 높고, 노이즈가 크다. 이러한 이유 때문에 기존의 군집화 방법을 적용하는 데에 한계가 존재한다. 본 논문에서는 단세포 RNA 데이터 분석에서 모티브를 얻어 스펙트럼 군집화(spectral clustering) 기반의 방법을 제안한다. 특히 유사도 행렬(similarity matrix) 계산에서 유전자 별로 가중치를 부여하여 기존의 단세포 데이터 분석 방법과 차별화하였다. 제안하는 군집화 방법은 유전자별 가중치를 부여함과 동시에 세포를 군집화한다. 군집화는 반복 알고리즘을 통해 제안하는 비볼록식(non-convex optimization)을 풀어 진행한다. 또한 실데이터 적용과 시뮬레이션을 통해 제안하는 군집화 방법이 기존의 방법보다 군집을 잘 구분하는 것을 보인다.