• 제목/요약/키워드: 군집분

검색결과 224건 처리시간 0.023초

그리드 기반 표본의 무게중심을 이용한 케이-평균군집화 (K-means clustering using a center of gravity for grid-based sample)

  • 이선명;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.121-128
    • /
    • 2010
  • 케이-평균 군집분석은 데이터들을 k개의 군집으로 임의로 분할을 하여 군집의 평균을 대푯값으로 분할해 나가는 방법으로 데이터들을 유사성을 바탕으로 재배치를 하는 방법이다. 이러한 케이-평균 군집분석은 시장조사, 패턴분석 및 인식, 그리고 이미지 처리 분야 등에서 폭넓게 응용되고 있다. 그러나 대용량의 데이터베이스를 분석대상으로 하므로 그 만큼 데이터 처리 시간이 많이 소요되는 것이 문제 중의 하나이다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 데이터 마이닝 방법이 사용되어지고 있는데 처리 속도 문제는 더욱 중요하게 생각하고 있다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 분할 군집법에서 가장 일반적으로 사용되고 있는 케이-평균 알고리즘에 대해 그리드를 기반으로 한 무게중심 알고리즘을 제안하고자 한다.

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법 (Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity)

  • 박선;김경준;이진석;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.30-38
    • /
    • 2011
  • 본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수 행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(BOW, bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.

개미 군집 최적화 알고리즘을 이용한 뇌 자기공명 영상의 영역분할 (Region Segmentation from MR Brain Image Using an Ant Colony Optimization Algorithm)

  • 이명은;김수형;임준식
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.195-202
    • /
    • 2009
  • 논문에서는 개미 군집 최적화 알고리즘을 이용하여 뇌 자기공명 영상의 백질 및 회백질 영역을 분할하는 방법을 제안한다. 확률적 조합 최적화에 적합한 알고리즘으로 알려진 개미 군집 최적화 알고리즘은 실제 개미들이 집에서 먹이를 찾아가는 동안의 방법을 기억하는 습성을 적용한 것이다. 논문에서 제안하는 방법은 개미가 먹이를 찾아가는 동안의 방법을 기억하는 습성처럼 영상에서 원하는 픽셀을 찾아갈 수 있다는 것이다. 원하는 픽셀을 찾은 개미들은 페로몬을 픽셀에 축적하게 되는데 이 페로몬은 이후에 지나가는 개미들이 다음 경로를 선택할 때 영향을 준다. 그리고 각각의 반복단계에서 상태전이 법칙에 따라 영상의 위치를 바꿔가면서 최종 목적지에 도달하게 되며, 마지막으로 페로몬 분포의 분석을 통해 영상에서 분할 된 결과를 얻는다. 제안한 알고리즘을 기존의 임계치 기반의 분할 알고리즘인 Otsu 방법, 메타휴리스틱 계열의 대표적인 방법인 유전자알고리즘, 퍼지방법, 원래의 개미 군집 최적화 알고리즘등과 비교하였다. 비교 실험을 통해 제안한 방법이 뇌의 특정 영역을 더 정확하게 분할함을 알 수 있었다.

퍼지 클러스터링 알고리즘을 이용한 타이어 접지면 패턴의 분류 (Tire Tread Pattern Classification Using Fuzzy Clustering Algorithm)

  • 강윤관;정순원;배상욱;김진헌;박귀태
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.44-57
    • /
    • 1995
  • 본논문에서는 GFI(Generalized Fuzzy Isodata)와 FI(Fuzzy Isodata) 알고리즘에 관한 이론을 고찰하고 이를 타이어 접지면 패턴 분류에 적용해 보았다. GFI 알고리즘은 FI 알고리즘의 일반화된 형태로서 분할된 군집에 대해서도 퍼지 분할 행렬(fuzzy partition matrix)을 고려해 다시 군집화(clustering)를 가능하게 하는 알고리즘이다. GFI 알고리즘을 사용하여 이진 트리를 구성함에 있어서 각 노드에서의 분할 여부, 즉 군잡화의 타당성(clustering validity) 점검 및 최종적인 이진 트리의 완성은 FDH(Fuzzy Divisve Hierarchical) 군집화알고리즘을 통해 이루어진다. 타이어 접지면에 대한 표준 특징량을 선정하거나 패턴 분류를 수행함에 있어서 이들 알고리즘은모두 우수한 성능을 가짐을 알 수 있었다. 패턴의 특징량으로는 전처리된 타이어 접지면 영상에 나타나는 윤곽선(edge)의 각도 성분을 선정하였으며 이렇게 선정된 특징량은 패턴의 특징을 잘 표현해 주는 유용한 정보를 가진 것으로 생각된다.

  • PDF

반복최적화 무감독 분광각 분류 기법을 이용한 하이퍼스펙트럴 영상 분류에 관한 연구 (A Study on the Hyperspectral Image Classification with the Iterative Self-Organizing Unsupervised Spectral Angle Classification)

  • 조현기;김대성;김용일
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.41-45
    • /
    • 2005
  • 분광각(Spectral Angle)을 이용한 분류는 같은 종류의 지표 대상물의 분광 특성이 대기 및 지형적인 영향으로 인해 원점을 기준으로 선형적인 분포 모양을 가진다는 가정에 기초한 새로운 접근의 분류 방식이다. 최근 분광각을 이용한 무감독 분류에 대한 연구가 활발히 이루어지고 있으나, 원격탐사 데이터의 특성을 반영한 효과적인 무감독 분류에 대한 연구는 미진한 상태이다. 본 연구는 하이퍼스펙트럴 영상 분류에 있어서 기존 무감독 분광각 분류(USAC, Unsupervised Spectral Angle Classification) 연구에서 해결하지 못한 문제점들을 보완한 반복최적화 무감독 분광각 분류(ISOUSAC, Iterative Self-Organizing USAC) 기법을 제안하고 있다. 이를 위해, 무감독 분광각 분류에 적합한 각 분할(Angle Range Division) 기법을 적용하여 군집 초기 중심을 설정하였으며, 병합(Merge)과 분할(Split)를 통한 유동적인 군집 분석을 수행하였다. 결과를 통해, 제안된 알고리즘이 기존의 기법보다 수행 시간뿐 아니라 시각적인 면에서도 우수한 결과를 도출함을 확인할 수 있었다.

  • PDF

3차원 영상의 자동 소실점 검출을 위한 분할 영상 좌표계 (Split Image Coordinate for Automatic Vanishing Point Detection in 3D images)

  • 이정화;김종화;서경석;최흥문
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1891-1894
    • /
    • 2003
  • 본 논문에서는 분할 영상 좌보계 (split image coordinate: SIC)를 제안하여 3차원 영상의 주요 특징 중의 하나인 유, 무한 소실점을 그 위치의 무한성이나 카메라의 보정과 관계없이 정확하게 자동 추출하였다. 제안한 방법에서는 가우시안 구 (Gaussian sphere) 기반의 기존 방법들과는 달리 영상 공간을 누적 공간으로 활용함으로써 카메라 보정이나 영상의 사전정보가 없어도 원 영상의 정보 손실 없이 소실점을 추출할 수 있고, 영상을 무한대까지 확장한 후 분할하여 재정의 함으로써 유, 무한 소실점을 모두 추출할 수 있도록 하였다. 정확한 소실점의 검출을 위하여 직선 검출 과정에서는 방향성 마스크 (mask)를 사용하였으며, 직선들의 군집화 (clustering) 과정에서는 기울기 히스토그램 방법과 수평/수직 군집화 방법을 적응적으로 적용하였다. 제안한 방법을 합성 영상 및 건축물 (man-made environment) 영상에 적용시켜 유, 무한 소실점들을 효과적이고 정확하게 찾을 수 있음을 확인하였다.

  • PDF

텍스쳐 방향특징에 의한 비교사 텍스쳐 영상 분할 (Unsupervised Texture Image Segmentation with Textural Orientation Feature)

  • 이우범;김욱현
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.325-328
    • /
    • 2000
  • 텍스쳐 분석은 장면 분할, 물체 인식, 모양과 깊이 인식 등의 많은 영상 처리 분야에서 중요한 기술 중의 하나이다. 그러나 실영상에 포함된 다양한 텍스쳐 성분에 대해서 보편적으로 적용 가능한 효율적인 방법들에 대한 연구는 미흡한 실정이다. 본 논문에서는 텍스쳐 인식을 위해서 비교사 학습 방법에 기반 한 효율적인 텍스쳐 분석 기법을 제안한다. 제안된 방법은 텍스쳐 영상이 지닌 방향특징 정보로서 각(angle)과 강도(power)를 추출하여 자기 조직화 신경회로망에 의해서 블록기반으로 군집화(clustering)된다. 비교사적 군집 결과는 통합(merging)과 불림(dilation) 과정을 통해서 영상에 내재된 텍스쳐 성분의 분할을 수행한다. 제안된 시스템의 성능 평가를 위해서는 다양한 형태의 다중 텍스쳐 영상을 생성하여 적용한 후 그 유효성을 보인다.

  • PDF

서해(西海) 경기만(京幾灣) 식물(植物) 플랑크톤에 대(對)한 생태학적(生態學的) 연구(硏究) -IV. 식물(植物)플랑크톤의 군집구조(群集構造)와 계절적 천이 기작 (The Ecological Study of Phytoplankton in Kyeonggi Bay, Yellow Sea -IV. The Successional Mechanism and the Structure of the Phytoplankton Community)

  • 최중기;심재형
    • 한국해양학회지
    • /
    • 제23권1호
    • /
    • pp.1-12
    • /
    • 1988
  • 경기만 식물 플랑크톤의 군집구조와 천이현상을 규명하기 위하여 군집의 다양성과 우정도, 군집사이의 유사도 및 종성분에 의한 주성분 분석등이 연구되었고 군집변화에 영향을 미치는 환경요인을 알기 위하여 주성분 분석이 이루어졌다. 다양성지수와 우정도 분석에 의하면 경기만내 식물 플랑크톤 군집은 큰 물리적 환경변화와 오염수의 유입으로 인하여 불안정한 환경하에 놓여있는 것으로 나타났다. 조사수역은 군집간의 유사도 분석에 의하면 강수유입에 영향을 받는 지역, 오염수의 영향을 받는 지역, 비교적 오염수의 영향을 덜 받으나 조석주기에 의해 변화가 큰 지역등으로 구분되었다. 전체 식물 플랑크톤 군집은 춘계형, 하계형, 추계형, 추 동계형의 4계절 양상으로 뚜렷하게 변화하며 천이하였다. 춘 하 추를 대표하는 하계군집들은 주로 일반적인 식물 플랑크톤들로 구성되었으며 온도와 광조건에 크게 영향을 받는 것으로 나타났고 늦가을 부터 초봄까지 많이 나타나는 동계군집들은 일시 부유성 저서 규조류로 주로 구성되어 있으며 부유퇴적물과 영양염의 높은 농도와 밀접한 관계를 보였다.

  • PDF

비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약 (Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means)

  • 박선;이주홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.255-264
    • /
    • 2008
  • 본 논문은 K-means과 비음수 행렬 분해(NMF)를 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안하였다. 제안방법은 비음수 행렬 분해를 이용하여 가중치가 부여된 용어-문장 행렬을 희소(Sparse)한 비음수 의미특징 행렬과 비음수 변수 행렬로 분해함으로써 직관적으로 이해할 수 있는 형태의 의미적 특징을 추출할 수 있고, 주제와 의미특징간의 유사도에 가중치를 부여하여 유사도는 높으나 실제 의미 없는 문장이 추출되는 것을 막는다. 또한 K-means 군집을 이용하여 문장에 포함된 노이즈를 제거함으로써 문서의 의미가 요약에 편향되게 반영하는 것을 피할 수 있고, 추출된 문장에 부여된 순위순서대로 정렬하여 보여 줌으로써 응집성을 높인다. 실험 결과 제안방법이 다른 방법에 비하여 좋은 성능을 보인다.