• 제목/요약/키워드: k-mean 군집화

검색결과 78건 처리시간 0.031초

제약된 K-means를 위한 초기 씨드 생성방법 (Initial Seed Generation for Constrained K-means)

  • 서향숙;강재호;류광렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.283-286
    • /
    • 2003
  • 군집화 시 일반적으로 개별 클래스(class) 혹은 카테고리(category) 당 하나의 군집이 형성되는 결과가 선호된다. 하지만 데이터가 비정형적인 분포를 따르는 경우에는 하나의 군집으로 개별 클래스를 온전히 표현하는 것이 불가능하거나 오히려 부자연스러운 경우가 발생할 수 있다. 본 논문에서는 예제의 클래스를 알고 있는 즉, 레이블(label)된 예제들을 그렇지 않은(unlabeled) 예제들과 함께 활용하여 군집화하는 제약된 K-means (constrained K-means) 알고리즘을 위하여 보다 자연스러운 형태의 군집이 형성될 수 있도록 초기 씨드(seed, 씨앗)를 생성하는 방안을 제안한다. 레이블된 예제들을 계층적으로 군집화하면 다양한 단계에서 제약된 K-means를 위한 씨드집합을 생성할 수 있다. 본 연구에서는 각 단계의 씨드집합을 기반으로 형성된 군집결과간의 변화정도를 측정하여 가장 적절한 것으로 추정되는 씨드집합을 선정하였다. 제안한 방안을 문서 군집화 문제에 적용하여 실험한 결과 개별 클래스마다 하나의 군집을 가정하는 경우보다 더 나은 군집을 형성할 수 있음을 확인하였다.

  • PDF

3단계 과정의 장면 전환검출 (Scene Change Detection with 3-Step Process)

  • 신성윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.147-154
    • /
    • 2008
  • 본 논문에서는 우선 $X^2$ 히스토그램과 컬러 히스토그램을 합성한 방법과 정규화를 통하여 프레임 간 차이값을 계산한다. 다음으로 거리에 대한 클러스터링과 k-mean 군집화를 이용하여 클러스터의 대표 프레임을 결정한다. 마지막으로 우도비를 이용하여 그룹의 대표 프레임을 결정한다. 제안한 방법은 차이값 계산, 클리스터링과 군집화, 대표 프레임 추출의 3단계 과정을 수행하므로 다른 방법보다 검출이 뛰어나다는 것을 실험을 통해 알 수 있다.

  • PDF

컬러영상에서 Mean-Shift 군집화와 단계별 병합 방법을 이용한 자동 원료 선별 알고리즘 (Automatic Source Classification Algorithm using Mean-Shift Clustering and stepwise merging in Color Image)

  • 김상준;장지현;고병철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1597-1599
    • /
    • 2015
  • 본 논문에서는 곡물이나 광석 등의 원료들 중에서 양품 및 불량품을 검출하기 위해, Color CCD 카메라로 촬영한 원료영상에서 Mean-Shift 클러스터링 알고리즘과 단계별 병합 방법을 제안하고 있다. 먼저 원료 학습 영상에서 배경을 제거하고 영상 색 분포정도를 기준으로 모폴로지를 이용하여 영상의 전경맵을 얻는다. 전경맵 영상에 대해서 Mean-Shift 군집화 알고리즘을 적용하여 영상을 N개의 군집으로 나누고, 단계별로 위치 근접성, 색상대푯값 유사성을 비교하여 비슷한 군집끼리 통합한다. 이렇게 통합된 원료 객체는 영상채널마다의 연관관계를 반영할 수 있도록 RG/GB/BR의 2차원 컬러분포도로 표현한다. 원료 객체별로 변환된 2차원 컬러 분포도에서 분포의 주성분의 기울기와 타원들을 생성한다. 객체별 분포 타원은 테스트 원료 영상데이터에서 양품과 불량품을 검출하는 임계값이 된다. 본 논문에서 제안한 방법으로 다양한 원료영상에 실험한 결과, 기존 선별방식에 비해 사용자의 인위적 조작이 적고 정확한 원료 선별 결과를 얻을 수 있었다.

K-Mean 군집을 기반으로 하는 소프트 아일랜드 모델 (Soft Island Model based on K-means Clustering)

  • 고톱수렌 이칭허를러;신성윤;이현창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.561-562
    • /
    • 2020
  • 연구에서, k-Mean 군집화에 기반 한 다중 집단이 다수의 전략의 앙상블을 실현하기 위해 제안되어, 모집단의 유사한 개체가 동일한 돌연변이 전략을 구현하는 새로운 DE 변이체, 즉 KSDE를 생성하고 유사하지 않은 하위 집단 소프트 아일랜드 모델(SIM)을 통해 정보를 마이그레이션 한다.

  • PDF

외부 군집 연관 기준 정보를 이용한 군집수 최적화 (A Study on Optimizing the Number of Clusters using External Cluster Relationship Criterion)

  • 이현진;지태창
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권3호
    • /
    • pp.339-345
    • /
    • 2011
  • 군집화는 주어진 데이터를 분할하여 데이터 속에 숨겨져 있는 의미를 자동으로 발견하는 방법이다. k-means는 간단하고 빠른 군집화 알고리즘 중의 하나이다. 군집의 수 k는 군집화를 수행하는데 매우 중요한 요소이며, k의 값에 의해 군집화 결과가 달라진다. 본 논문에서는 반복적인 k-means 수행과 군집의 품질을 평가하는 외부 군집 연관 기준 정보를 결합하여 최적의 군집수를 결정하는 방법을 제안한다. 실험 결과 기존의 방법들에 비하여 제안하는 방법이 군집수의 정확성 측면에서 우수한 성능을 보였다.

레이더 자료의 군집화를 통한 Mean Field Rainfall Bias의 보정 (Adjustment of the Mean Field Rainfall Bias by Clustering Technique)

  • 김영일;김태순;허준행
    • 한국수자원학회논문집
    • /
    • 제42권8호
    • /
    • pp.659-671
    • /
    • 2009
  • 본 연구에서는 레이더 강우량 자료의 편차보정에 사용되는 G/R비의 정확도를 향상시키기 위하여 fuzzy c-means 방법을 사용한 자료의 군집화를 적용하였다. 대상 레이더자료는 광덕산 레이더기지의 자료로서 유효범위 100km이내의 자료를 대상으로 지상관측망인 기상청의 AWS(Automatic Weather System) 지점에서 관측한 자료와의 비교를 통하여 G/R비를 구하였다. G/R비를 구하는데 있어서 전체 유효범위를 대상으로 동일한 방법을 사용한 경우와 레이더 자료의 군집화를 통해서 지형적인 효과를 고려한 경우를 비교하였으며, AWS 실측강우량과 G/R비를 통한 레이더 강우량 자료의 비교를 위하여 절대상대오차와 평균제곱근오차 등을 비교분석하였다. 그 결과 전체유효범위를 대상으로 동일하게 G/R비를 적용하여 구한 레이더 강우량에 비하여 군집분석을 이용하여 지형효과를 고려한 G/R비를 적용한 레이더 강우량의 오차가 더 적게 나타났다.

기상자료 군집화를 통한 지형적 특성 연구 (Clustering Weather Data for Study of Local Distinction)

  • 김민진;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.412-415
    • /
    • 2008
  • 매일 쏟아져 나오는 방대한 양의 기상자료는 현재의 대기상태를 대표하기도 하지만 그 지역의 지형적 특성을 나타내고 있다. 이번 연구는 수원지역의 일일 기상자료를 토대로 지형적 특성과 그에 따른 기상현상(바람, 안개)알고자 한다. K-means를 이용 특정 기상현상끼리 군집화하여 지형적 특성과 비교하였다.

  • PDF

스펙트럼 군집화에서 블록 대각 형태의 유사도 행렬 구성 (Magnifying Block Diagonal Structure for Spectral Clustering)

  • 허경용;김광백;우영운
    • 한국멀티미디어학회논문지
    • /
    • 제11권9호
    • /
    • pp.1302-1309
    • /
    • 2008
  • K-means나 퍼지 군집화와 같은 전통적인 군집화 기법들이 원형(prototype)을 기반으로 하고 볼록한 형태의 집단들에 적합한 반면, 스펙트럼 군집화(spectral clustering)는 국부적인 유사성을 기반으로 전역적인 집단을 찾아내는 기법으로 오목한 형태의 집단들에도 적용할 수 있어 커널을 기반으로 하는 SVM과 더불어 각광을 받고 있다. 하지만 SVM이 그러하듯이 스펙트럼 군집화에서도 커널의 폭은 성능에 지대한 영향을 끼치는 요인으로, 이를 결정하기 위한 다양한 방법이 시도되었지만 여전히 휴리스틱에 의존하는 실정이다. 이 논문에서는 유사도 행렬이 보다 명백한 블록 대각 형태를 가지도록 하기 위해 국부적인 커널의 폭을 거리 히스토그램을 바탕으로 적응적으로 결정하는 방법을 제시한다. 제안한 방법은 스펙트럼 군집화에 사용되는 유사도 행렬(affinity matrix)이 블록 형태의 대각 행렬을 이룰 때 이상적인 결과를 낸다는 사실에 기반하고 있으며, 이를 위해서 전통적인 유클리디안 거리와 무작위 행보 거리(random walk distance)를 함께 사용한다. 제안한 방법은 기존의 방법들에서 사용하는 유사도 행렬에 비해 명확한 블록 대각 행렬을 나타내고 있음을 실험 결과를 통해 확인할 수 있다.

  • PDF

반려동물 사료 추천시스템을 위한 유사성 측정 알고리즘에 대한 연구 (A Study of Similarity Measure Algorithms for Recomendation System about the PET Food)

  • 김삼택
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.159-164
    • /
    • 2019
  • ICT 기술 발전으로 강아지와 고양이등 반려동물 돌보기와 건강에 대한 관심도가 높아지고 있다. 본 논문에서는 반려동물 산업의 다양한 분야에 활용될 수 있도록 반려동물 사료의 성분 데이터를 기반으로 군집분석을 수행하고 적합한 서비스에 대해 고찰한다. 군집분석을 위해 시중에서 유통되고 있는 300여 개의 강아지 및 고양이 펫푸드를 대상으로 성분별 상관관계를 분석하여 유사성을 측정하며, Hierarchical, K-Means, Partitioning around medoids(PAM), Density-based, Mean-Shift 등의 다양한 클러스터링 기법을 활용하여 군집화 하여 분석한다. 또한 반려동물의 개인화 추천시스템도 제안한다. 본 논문의 연구 결과는 반려동물을 대상으로 한 사료 추천시스템 등의 맞춤형 개인화 서비스에 활용할 수 있다.

Fuzzy c-means 알고리즘에서의 가변학습 가중치의 효과 (The Effect of Variable Learning Weights in Fuzzy c-means algorithm)

  • 박소희;조제황
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.109-112
    • /
    • 2001
  • 기존의 K-means 알고리즘은 학습벡터가 단일군집에 할당되는 방법이 crisp 이므로 다른 군집에 할당될 확률을 무시하게 된다. 따라서 군집화 작업과 관련하여 반복적인 코드북 설계 과정에서 각 학습벡터를 다중 군집으로 할당하는 Fuzzy c-means를 사용한다. 또한 Fuzzy c-means 알고리즘의 학습과정에서 구해지는 각 클래스 의 프로토타입에 가중치를 곱하여 다음 학습의 프로토타입으로 사용함으로써 Fuzzy c-means 알고리즘 적용 결과 얻어지는 코트북의 성능을 기존 알고리즘과 비교하여 개선된 Fuzzy c-means 알고리즘을 찾기 위한 근거를 마련한다.

  • PDF