• 제목/요약/키워드: 클러스터링 알고리즘

검색결과 985건 처리시간 0.024초

무선단말기 RF-fingerprinting 특징의 비지도 클러스터링을 위한 차원축소 알고리즘 연구 (Study on Dimension Reduction algorithm for unsupervised clustering of the DMR's RF-fingerprinting features)

  • 정영규;신학철;나선필
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.83-89
    • /
    • 2023
  • RF-fingerprint를 이용한 클러스터링 기술은 전송 파형에 포함된 송수신기의 특성(signature)을 추출하고 이들에게 임의의 레이블을 자동으로 할당함으로써, 추후 지도 학습기반에 무선단말기 분류기의 개발을 용이하게 해준다. 동종 무선 단말기 분류를 위한 RF-fingerprint 특징 추출 알고리즘의 출력은 512개 또는 1024개 이상의 고차원 특징이다. 이러한 고차원의 특징을 분류기에는 효과적일 수 있으나 클러스터링 알고리즘의 입력으로는 부적절하다. 이에 본 논문은 다차원의 RF-fingerprinting 특징을 무선단말기의 fingerprinting 특징을 유지하면서 차원을 효과적으로 줄일 수 있는 차원 축소 알고리즘을 제안하고, 축소된 차원을 효과적으로 클러스터링할 수 있는 클러스터링 알고리즘을 제안한다. 제안된 RF-fingerprinting 클러스터링 알고리즘은 다차원 RF-fingerprinting 특징을 KL Divergence 기반에 t-SNE를 이용하여 차원을 축소하고 DPC(Density Peaks Clustering)를 이용하여 클러스터링 수행한다. 무선단말기 클러스터링 알고리즘의 성능 분석은 모토롤라XiR 10대와 윈어텍 N-Series 10대에서 수집한 3000개의 데이터셋을 이용한다. RF-fingerprintining기반 클러스터링 알고리즘의 성능 분석 결과 20개의 클러스터가 형성되었고, Homogeneity, Completeness, V-measure 모두 99.4%의 성능을 보였다.

장애물을 고려한 밀도 기반의 공간 클러스터링 기법 (Density Based Spatial Clustering Method Considering Obstruction)

  • 임현숙;김호숙;용환승;이상호;박승수
    • 한국멀티미디어학회논문지
    • /
    • 제6권3호
    • /
    • pp.375-383
    • /
    • 2003
  • 공간 마이닝에서 클러스터링은 오브젝트간의 거리나 연결 상태, 또는 공간상에서의 상대적인 밀도를 기반으로 서로 비슷한 오브젝트들을 하나의 그룹으로 묶는 과정이다. 실세계에서 공간 상에 분포하는 강이나 호수, 고속도로와 같은 장애물들은 클러스터링의 결과에 영향을 줄 수 있다. 본 논문은 장애물을 고려한 오브젝트 사이의 거리를 정의하고, 이를 이용하여 공간 오브젝트들을 밀도를 기반으로 클러스터링 하면서 동시에 공간상에 존재하는 장애물을 고려하는 새로운 공간 클러스터링 알고리즘(DBSCAN-O)을 제안한다. 또한 실험을 통해 DBSCAN-O가 기존의 밀도 기반 알고리즘인 DBSCAN에서 찾아내지 못한 새로운 형태의 클러스터링 결과를 도출하는 것을 보인다.

  • PDF

공간국부성을 최적화하는 클러스터링 방법 (A Clustering Method for Optimizing Spatial Locality)

  • 김홍기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.83-90
    • /
    • 2004
  • 본 논문에서는 순환적인 검색공간과 장애물이 존재하는 검색공간에서 객체들을 클러스터링할 때 고려해야하는 CCD(Clustering with Circular Distance) 문제와 COD(Clustering with Obstructed Distance) 문제를 연구하였다. 그리고 다차원 검색공간에서 삽입이나 삭제가 빈번히 발생하는 객체들을 효율적으로 클러스터링하기 위한 새로운 클러스터링 알고리즘을 제안하였다. 제안한 클러스터링 알고리즘에는 CCD 및 COD 문제를 해결하기 위한 거리 함수가 정의된다. 그리고 최소의 연산 시간으로 높은 공간 국부성을 갖는 클러스터들을 생성하기 위한 클러스터링 방법이 포함된다.

웹 에이전트를 위한 통합방식 문서 클러스터링 (A Hybrid Document Clustering for a Web Agent)

  • 양찬범;이성열;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.422-430
    • /
    • 2001
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심 정보를 학습하고 사용자가 필요로 하는 웹 상의 정보를 자동 제공하는 지능형 시스템이다. 웹 에이전트가 사용자의 선호도를 학습하기 위해서는 귀납적 기계학습을 수행하는데, 이때 학습의 효율을 높이기 위해서는 사용자가 관심있어하는 문서들을 유사한 문서들로 클러스터링하여 학습 시스템에 제공하여야 한다. 본 논문에서는 웹 에이전트의 학습 시스템에 입력되는 학습대상 문서들을 보다 정확하고 효율적으로 클러스터링하여 제공하기 위해서 Top-down 방식과 Bottom-up 방식을 통합 적용한 통합방식 문서 클러스터링과 초기 클러스터 생성을 위한 평가함수를 제시한다. Top-down 방식으로는 개념적 클러스터링 알고리즘인 COBWEB을 적용하고, Bottom-up 방식으로는 교차기반(Intersection-based) 클러스터링 방식인 Etzioni의 클러스터링 알고리즘을 적용하였다.

  • PDF

고차원 대규모 데이터를 위한 효율적인 K-means 클러스터링 (Efficient K-means Clustering for High-dimensional Large Data)

  • 윤태식;심규석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.33-36
    • /
    • 2011
  • 클러스터링은 데이터 포인트들을 그룹으로 묶어 데이터를 분석하는데 유용하다. 특히 K-means는 가장 널리 쓰이는 클러스터링 알고리즘으로 k개의 군집(Cluster)을 찾는다. 본 논문에서는 기존의 K-means 알고리즘과 비교해 고차원 대규모데이터에 대해서 효율적으로 동작하는 K-means 알고리즘을 제안한다. 제안된 알고리즘은 기존의 알고리즘에서와 같이 거리 정보를 이용해 불필요한 계산을 줄여나가며 또한 움직임 없는 군집들을 계산에서 제외하여 수행시간을 단축한다. 제안된 알고리즘은 기존의 관련연구에서 제안된 알고리즘에 비해 공간을 적게 쓰면서 동시에 빠르다. 실제 고차원 데이터 실험을 통해서 제안된 알고리즘의 효율성을 보였다.

데이터와 적용되는 알고리즘의 연관성을 이용한 클러스터링 기법 (Clustering Technique Using Relevance of Data and Applied Algorithms)

  • 한우연;남미영;이필규
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.577-586
    • /
    • 2005
  • 영상 처리와 패턴 인식 그리고 컴퓨터 비젼 분야의 가장 성공적인 응용들 중 하나인 얼굴 인식을 위해 많은 알고리즘이 제안되었고, 최근에는 얼굴의 어떤 속성이 대상을 인식하는 것을 더 쉽거나 어렵게 만드는지에 대한 연구가 진행되고 있다. 본 논문에서는 얼굴의 속성(조명, 표정)에 따라 각각의 알고리즘의 인식 성능이 달라지는 점에 착안해서, 얼굴 데이터와 적용된 알고리즘과의 연관성을 이용하여 인식 성능을 높이는 클러스터링 방법을 제안하였다. 실험에서는 인식 알고리즘으로 n-tuple, PCA 그리고 가보 웨이블릿이 사용되었고, 세 가지 벡터화 방법이 제안되었다. 우선 학습 데이터를 k-means 알고리즘을 이용하여 클러스터링하고 각각의 클러스터에 대한 세 가지 인식 알고리즘의 적합도를 평가한 후, 같은 알고리즘을 선택한 클러스터들을 통합하여 새로운 클러스터를 구성한다. 그리고 테스트 데이터에서 새로운 클러스터에 대한 유사도를 평가하여 가장 가까운 클러스터가 선택한 알고리즘으로 인식을 수행한다. 그 결과 클러스터링 과정을 거치지 않고 단일 알고리즘을 사용하여 인식했을 때보다 인식 성능이 향상된 것을 관찰할 수 있다.

그룹특징기반 슬라이딩 윈도우 클러스터링에서의 k-means와 k-medoids 비교 평가 (Comparison between k-means and k-medoids Algorithms for a Group-Feature based Sliding Window Clustering)

  • 양주연;심준호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.225-237
    • /
    • 2018
  • 대용량 데이터의 발생과 처리가 대중화되면서 대용량 데이터 스트림 처리에 대한 수요가 급격하게 증가하고 있다. 이 수요에 따라 다양한 대용량 데이터 처리 기술이 개발되고 있다. 한 분야로 주목받고 있는 방식은 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링이다. 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링은 윈도우가 이동할 때마다 새로운 클러스터를 생성한다. 기존의 슬라이딩 윈도우 상의 클러스터링 기법은 코어셋(Coreset)을 기반으로 데이터 스트림 클러스터링을 구현하고 있다. 이 연구에서는 코어셋을 활용한 그룹특징을 이용한 알고리즘 내에서 이용하는 클러스터링 알고리즘을 변경하였다. 그리고 이를 통해 제안 알고리즘과 기존 알고리즘의 파라미터 값 변화에 따른 성능 비교 실험을 진행하였다. 개선된 사항에 대해 논하여 두 알고리즘을 비교하고 실험자에게 파라미터에 따른 이용 방향을 제시한다.

노드의 속성을 고려한 효율적인 TICC(Time Interval Clustering Control) 알고리즘에 관한 연구 (A Study on the Efficient TICC(Time Interval Clustering Control) Algorithm That Considering Attribute)

  • 김영삼;두경민;지삼현;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.499-502
    • /
    • 2008
  • 한정된 용량의 배터리에 의존하는 무선 Ad-hoc 네트워크(MANET)에서는 에너지 효율을 높이기 위한 다양한 클러스터링 기법과 라우팅 알고리즘이 연구되고 있다. 이러한 무선 Ad-hoc 네트워크에서는 에너지 효율이 높은 클러스터 기반의 라우팅 알고리즘이 많이 사용된다. 그러나 일반적인 클러스터 방식에 따른 라우팅 알고리즘에서는 클러스터 헤드 노드에 부하가 집중되어 에너지 소모가 많은 문제점을 가진다. 이 문제를 보완하기 위해서 클러스터 헤드 노드의 재 선출을 통해 에너지 소모를 분산하는 동적 클러스터링 방식이 사용되고 있다. 그러나 동적 클러스터링 방식 또한 높은 빈도의 클러스터 재형성 과정에서 많은 에너지를 소모하는 문제점이 있다. 즉, 지금까지 연구되어온 알고리즘은 클러스터 구성에 대한 효율적인 알고리즘을 제시하고 있지만 불필요한 에너지 소모를 최소화하는 최적의 헤드 노드 선정 방법과 클러스터 관리를 통하여 에너지 효율을 높일 수 있는 해결책을 제시하지 않았다. 따라서 본 논문에서는 위의 클러스터 문제를 해결하기 위해 TICC(Time Interval Clustering Control) 알고리즘 기법을 제안한다. 제안된 TICC은 각 노드의 에너지 속성 값에 따라 에너지 Level을 분류하고 분류된 에너지 Level에 따라 타이밍을 고려한 클러스터링 및 노드 관리방법이다. 이러한 TICC기법을 적용하여 실험을 하였고 결과적으로 클러스터 전체의 에너지 효율을 향상되고 Lifetime이 증가함을 보였다.

  • PDF

최대 전송횟수 제한 및 사용자 밀집도 변화에 따른 사용자 클러스터링 알고리즘 별 D2D 광고 확산 성능 분석 (Performance Analysis of User Clustering Algorithms against User Density and Maximum Number of Relays for D2D Advertisement Dissemination)

  • 한세호;김준선;이호원
    • 한국정보통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.721-727
    • /
    • 2016
  • 본 논문에서는 기존 알고리즘에서의 특정 D2D 사용자 분포에 대한 광고확산 효율 저하 문제를 해결하기 위해, D2D 통신 네트워크에서 광고확산 효율을 개선하는 광고확산 알고리즘 기반의 Modified Single Linkage, K-means, 그리고 Gaussian mixture model을 적용한 Expectation Maximization 클러스터링 알고리즘의 적용이 제안되었다. 제안된 클러스터링 알고리즘들을 통해 광고 확산을 위한 목표지역들이 목표그룹으로 클러스터링되고 이를 통해 D2D 전송 단말과 수신 단말 사이의 거리를 기반으로 광고 확산 경로 설정 알고리즘과 릴레이 단말 설정 알고리즘이 적용되어 광고가 연속적으로 전파된다. 본 논문에서는 MATLAB 시뮬레이션을 통해 각 알고리즘의 최대 D2D 릴레이 제한 수와 목표지역과 비목표지역의 사용자 밀집도의 비에 따른 성능을 비교 분석한다.

다양한 클러스터 결과에 의해 진화적 접근법을 사용하는 이종 클러스터링 앙상블 기법 (Heterogeneous Clustering Ensemble Method using Evolutionary Approach with Different Cluster Results)

  • 윤혜성;안선영;이상호;조성범;김주한
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.16-18
    • /
    • 2006
  • 데이터마이닝 기법의 클러스터링 알고리즘은 생물정보학에서 데이터 셋의 사전 정보를 고려하지 않고 중요한 유전적, 생물학적 상호작용을 찾기 위하여 적용되고 있다. 그러나 다양한 형식의 수많은 알고리즘들은 바이오데이터의 다양한 특성들과 실험의 가정 때문에 다른 클러스터링 결과들을 만들 수 있다. 본 논문에서는 바이오 데이터 셋의 특성에도 적합하면서 양질의 클러스터링 결과를 만들기 위한 새로운 방법을 제안한다. 이 방법은 여러 가지 클러스터링 알고리즘의 결과들을 유전자 알고리즘의 기본 개념인 진화적 환경에서 가장 적합한 형질을 선택하는 문제와 결합하였다. 그리고 실제 데이터 셋을 이용하여 우리의 제안하는 방법을 증명하고 실험 결과로 최적의 클러스터 결과를 보인다.

  • PDF