• 제목/요약/키워드: 거리 기반 군집 알고리즘

검색결과 47건 처리시간 0.033초

범주형 데이터의 분류를 위한 퍼지 군집화 기법 (A Fuzzy Clustering Algorithm for Clustering Categorical Data)

  • 김대원;이광형
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.661-666
    • /
    • 2003
  • 본 논문에서는 범주형 데이터의 분류를 위한 새로운 기법을 제시한다. 기존의 대표적인 퍼지 군집화 방법인 k-modes 알고리즘과 fuzzy k-modes 알고리즘은 군집의 중심을 단일 값으로 표현하고, 군집에 속하는 데이터의 빈도 수에 기반한 중신 갱신 기법을 사용하였다. 이와 같은 기존의 방법들은 분류의 경계가 모호한 데이트를 군집화할 경우, 알고리즘의 각 단계에서 발생하는 분류의 에러를 보정하지 못해 최종적으로 지역해에 빠지는 단점이 있다. 이를 극복하기 위해 본 논문에서는 군집 중심을 퍼지 집합을 이용하여 정의한다. 퍼지 군집 중심은 주어진 데이터와 군집간의 거리 관계를 퍼지 값을 이용해 표현하며, 각 군집의 중심은 데이터의 소속 정도 값을 이용해 갱신된다. 이와 같은 퍼지 중심 표현기법을 도입하여 범주형 데이터의 분류 시에 보다 세밀한 결정을 내림으로써, 인접한 군집들의 경계에서 발생하는 불확실성을 최소화한다. 기존의 대표적인 방법들과의 비교실험을 수행함으로써 제안한 방법의 성능을 검증하였다.

영역 기반의 Multi-level Thresholding에 의한 컬러 영상 분할 (Region-based Multi-level Thresholding for Color Image Segmentation)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.20-27
    • /
    • 2006
  • Multi-level thresholding은 영상 분할 방법 중 하나로 널리 이용되고 있지만 대부분의 기존 논문들은 응용 분야에 직접적으로 이용되기에는 적합하지 않거나 영상 분할 단계까지 확장되지 않고 있다. 본 논문에서는 영상 분할을 위한 multi-level thresholding 방안으로써 영역 단위의 multi-level thresholding을 제안한다. 먼저, 영상의 색상별 성분에 대해서 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘을 적용하여 2개의 군집으로 분류한 후 코드 영상을 생성한다. EWFCM 알고리즘은 화소들에 대한 공간 정보를 추가한 개선된 FCM 알고리즘으로 영상 내 존재하는 잡음을 제거한다. 그리고 코드 영상에 존재하는 군집의 수를 감소함으로써 좀 더 나은 영상 분할 결과를 얻을 수 있으며 군집의 감소는 하나의 군집내에 존재하는 영역들과 나머지 군집들간의 유사도를 기반으로 영역을 재분류함으로써 처리된다. 그러나 영상에는 여전히 많은 영역들이 존재하기 때문에 이를 해결하기 위한 하나의 후처리 방안으로써 영역간의 Kullback-Leibler 거리값을 기반으로 Bayesian 알고리즘에 의한 영역 합병을 수행한다. 실험 결과 제안한 영역 기반의 multi-level thresholding은 기존 방법이나 화소나 군집 기반의 multi-level thresholding보다 좋은 분할 결과를 보였으며 Bayesian 알고리즘을 이용한 후처리 방안에 의해 좀 더 나은 결과를 보였다.

호모그래피 정확도 향상을 위한 Constraint Satisfaction Problem(CSP) 기반의 RANSAC 알고리즘 (CSP driven RANSAC Algorithm for improving the accuracy of Homography)

  • 장철희;이기성;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.318-320
    • /
    • 2012
  • 증강현실 콘텐츠를 2D 이미지기반으로 저작할 때, 작성된 증강현실 콘텐츠를 카메라 시점과 일치시켜 합성하기 위해 호모그래피를 이용한다. 이때 증강현실 콘텐츠를 이질감 없이 합성하기위해 정확한 호모그래피 행렬을 추정해야 한다. 그러나 호모그래피 행렬 추정 시 사용되는 특징점들이 선형을 이루거나, 특정 영역에 군집을 이루는 경우 정확한 호모그래피 행렬을 추정하지 못하는 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 선형제약, 거리제약을 적용한 CSP 기반의 RANSAC 알고리즘을 제안한다. 실험결과 호모그래피 행렬 추정 시 CSP를 적용한 RANSAC 알고리즘이 기존의 랜덤샘플링 또는 삼각형의 넓이를 이용한 샘플링을 적용한 RANSAC 알고리즘보다 정확도가 향상됨을 보였다.

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.

Entropy 기반의 Weighted FCM 알고리즘을 이용한 컬러 영상 Multi-level thresholding (Multi-level thresholding using Entropy-based Weighted FCM Algorithm in Color Image)

  • 오준택;곽현욱;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.73-82
    • /
    • 2005
  • 본 논문은 weighted FCM(Fuzzy C-Means) 알고리즘을 적용한 컬러 영상 multi-level thresholding을 제안한다. FCM 알고리즘은 기존의 thresholding 방법들과 달리 최적의 임계치를 결정할 수 있으며 multi-level thresholding으로의 확장이 가능하다. 그러나 공간정보를 포함하고 있지 않기 때문에 잡음 등에 민감하다는 단점을 가진다. 본 논문은 이러한 단점을 해결하기 위해서 이웃 화소들로부터 얻은 entropy 기반의 가중치(weight)를 FCM 알고리즘에 적용함으로써 잡음의 제거가 가능하다. 그리고 각 색상별 성분의 군집 화소들을 기반으로 생성한 코드 영상에 대해서 군집 내부의 거리값을 이용하여 최적의 군집수를 결정한다. 실험에서 제안한 방법이 기존의 방법들보다 잡음에 대해서 강건하며 우수한 분할 성능을 보였다.

네트워크 분할 기법을 이용한 도로 네트워크 데이터 정합 (Road network data matching using the network division technique)

  • 허용;손화민;이재빈
    • 한국측량학회지
    • /
    • 제31권4호
    • /
    • pp.285-292
    • /
    • 2013
  • 본 연구는 도로 네트워크를 분할한 뒤 네트워크 정합을 수행하는 방법론을 제안한다. 네트워크의 링크에 의해 둘러싸인 공간으로부터 폴리곤 객체를 생성하고 중첩기반 그래프 군집화 기법을 적용하여 이들 폴리곤 객체들의 대응 집합 쌍을 탐색하고, 이로부터 독립적인 정합을 수행하는 하위 네트워크 쌍을 얻었다. 이후 분할된 네트워크 데이터 쌍의 노드 집합에 Iterative Closest Point 알고리즘을 적용하여 기하보정을 수행한 후 하우스도르프 거리를 이용하여 1:N 링크 정합을 수행하였다. 제안된 방법의 효용성을 평가하기 위해 국가교통 DB센터에서 관리하는 KTDB의 네트워크 데이터와 국내 상용 차량 내비게이션 업체의 네트워크 데이터를 대상으로 알고리즘을 적용하고 결과를 평가하였다. 3m에서 18m까지 3m 간격으로 하우스도르프 거리에 임계값을 적용하여 네트워크를 정합한 결과 15m의 임계값에서 F-measure 기준 0.99의 정확도를 얻을 수 있었다.

GIS 분석을 활용한 부산권 버티포트 위치 및 회랑 선정에 관한 연구 (A Study on Vertiport Location and Corridor Selections using GIS Analysis in Busan Area)

  • 문찬희;시하영;구태완;강범수
    • 항공우주시스템공학회지
    • /
    • 제17권6호
    • /
    • pp.46-53
    • /
    • 2023
  • 도심 교통 체증과 환경오염이 중요한 대도시 문제로 부각되는 가운데, 최근에는 Urban Air Mobility(UAM)가 효율적인 대책으로 주목받고 있다. 본 연구에서는 부산 지역의 지형 및 인프라 등의 실제 데이터를 고려한 GIS 기반 공간 분석과 군집 알고리즘을 수행하였으며 이를 통해 UAM 운영을 위한 버티포트 위치와 경로를 선정할 수 있었다. 부산권 UAM 인프라 시스템의 중심으로 예상되는 김해국제공항을 기반으로, 목표 지역에서 세 개의 버티포트 위치가 적합하다 판단하였으며, 이후 지상 위험 평가(Ground Risk)를 고려한 A*(A-star) 알고리즘을 이용해 위험도와 거리를 최소화하는 비행경로를 선정하였고, 이를 통해 최소 거리 경로 대비 80.168%의 위험 감소 효과를 확인하였다.

분산 기반의 Gradient Based Fuzzy c-means 에 의한 MPEG VBR 비디오 데이터의 모델링과 분류 (Modeling and Classification of MPEG VBR Video Data using Gradient-based Fuzzy c_means with Divergence Measure)

  • 박동철;김봉주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.931-936
    • /
    • 2004
  • GPDF(Gaussian Probability Density Function)을 효율적으로 군집화할 수 있는 GBFCM(DM)(Gradient Based Fuzzy c_means with Divergence Measure) 알고리즘이 본 논문에서 제안되었다. 제안된 GBFCM(DM)은 데이터 사이의 거리 척도로 발산거리(Divergence measure)를 적용한 새로운 형태의 FCM으로, 기존의 GBFCM에 기반을 두는 알고리즘이다. 본 논문에서는 MPEG VBR 비디오 데이터를 GPDF형태의 다차원 데이터로 변형시켜 모델링 하고, 모델링 한 MPEG VBR 비디오 데이터를 영화 또는 스포츠 형태로 분류하는데 응용되었다. 본 논문의 실험에서 기존의 FCM, GBFCM과 새롭게 제안된 GBFCM(DM)을 사용하여 모델링 및 분류결과를 상호 비교하였다. 비교결과 GBFCM(DM)이 오분류율의 기준에서 기존의 다른 알고리즘들에 비해 약 5∼l5%의 향상된 성능을 보였다.

클러스터링 기반의 목표물체 분할 (Target Object Extraction Based on Clustering)

  • 장석우;박영재;김계영;이숙윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.227-228
    • /
    • 2013
  • 본 논문에서는 연속적으로 입력되는 스테레오 입체 영상으로부터 2차원과 3차원의 특징을 결합하여 군집화함으로써 대상 물체를 보다 강건하게 분할하는 기법을 제안한다. 제안된 방법에서는 촬영된 장면의 좌우 영상으로부터 스테레오 정합 알고리즘을 이용해 영상의 각 화소별로 카메라와 물체 사이의 거리를 나타내는 깊이 특징을 추출한다. 그런 다음, 깊이와 색상 특징을 효과적으로 군집화하여 배경에 해당하는 영역을 제외하고, 전경에 해당하는 대상 물체를 감지한다. 실험에서는 제안된 방법을 여러가지 영상에 적용하여 테스트를 해 보았으며, 제안된 방법이 기존의 2차원 기반의 물체 분리 방법에 비해 보다 강건하게 대상물체를 분할함을 확인하였다.

  • PDF

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.