• 제목/요약/키워드: K-Means 클러스터링

검색결과 366건 처리시간 0.024초

암호화된 데이터에 대한 프라이버시를 보존하는 k-means 클러스터링 기법 (Privacy-Preserving k-means Clustering of Encrypted Data)

  • 정윤송;김준식;이동훈
    • 정보보호학회논문지
    • /
    • 제28권6호
    • /
    • pp.1401-1414
    • /
    • 2018
  • k-means 클러스터링 알고리즘은 주어진 데이터를 비슷한 k개의 그룹으로 묶어서 시장 세분화나 의료연구 등의 다양한 분야에서 활용되고 있다. 본 논문에서는 다수의 사용자 데이터를 노출하지 않고 암호화하여 외부 서버에 저장하는 환경에서 프라이버시를 보존하는 클러스터링 알고리즘을 제안한다. 분산된 서버에 평문으로 저장된 데이터를 다자간 계산프로토콜을 기반으로 수행된 기존 클러스터링 알고리즘 연구와 비교했을 때 제안하는 기법은 모든 데이터를 안전하게 암호문으로 저장할 수 있다는 뚜렷한 장점이 있다. 데이터 간의 거리를 측정하고 비교하기 위해서 덧셈과 곱셈 연산이 가능한 완전동형암호로 데이터를 암호화한다. 프로토콜 수행과정에서 사용자 데이터의 안전성을 분석하고 통신량과 연산량을 다른 연구들과 비교한다.

비구조화 P2P 시스템에서 이동에이전트를 이용한 Peer의 속성기반 계층적 클러스터링 (Property-based Hierarchical Clustering of Peers using Mobile Agent for Unstructured P2P Systems)

  • 마이클 안젤로 살보;마테오 로미오;이재완
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.189-198
    • /
    • 2009
  • 비구조화 P2P 시스템은 오늘날 인터넷에서 가장 널리 사용되지만, 파일의 배치는 임의로 이루어지며, Peer와 컨텐츠간에는 어떤 상관관계도 존재하지 않는다. 또한 보낸 모든 질의가 원하는 데이터를 찾았는지에 대한 보장도 없다. 본 논문에서는 비구조화된 P2P시스템에서 군집형 계층 클러스터링을 사용하여 노드들을 클러스터화함으로써 검색을 향상시키는 방법을 제시한다. 제안한 기법과 k-means를 사용한 기법간에 노드 클러스터링을 위한 지연시간을 비교하였다. 또한 제안한 알고리즘, k-means 클러스터링, 클러스터링을 사용하지 않은 방법간에 한 네트워크 토폴로지에서 데이터를 찾기 위한 지연시간에 대해 시뮬레이션을 수행하였다. 시뮬레이션 결과 제안한 기법의 지연시간이 다른 방법들보다 짧았음을 알 수 있었다.

  • PDF

K-Means 클러스터링을 활용한 선박입항패턴 단계화 연구 (A Study on Phase of Arrival Pattern using K-means Clustering Analysis)

  • 이정석;이형탁;조익순
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2020년도 추계학술대회
    • /
    • pp.54-55
    • /
    • 2020
  • 4차 산업혁명으로 인공지능, 사물인터넷, 빅데이터 등의 기술이 조선 해운 산업에 매우 밀접하게 연관 되고 있고 이는 자율운항선박의 탄생을 가져왔다. 현재 선박의 기술적 특성상 속력을 갑자기 낮출 수 없으므로 항만에 접안하기 위해 예인선의 도움, 도선사의 승선, 육상관제센터의 선박 컨트롤 등 복잡한 커뮤니케이션을 필요로 한다. 본 연구에서는 자율운항선박이 도입될 경우 선박이 입항하기 위한 컨트롤 기준을 어떻게 설정할지 해결하고자 클러스터링 분석을 사용하였다. 입항 선박의 축적된 AIS 데이터를 기반으로 입항 패턴을 정량적으로 단계화하고자 K-Means 클러스터링을 사용했고 SOG(Speed over Ground), COG(Course over Ground), ROT(Rate of Turn)를 사용하여 입항 단계를 6개로 구분하였다.

  • PDF

Hybrid Kohonen 네트워크에 의한 항공영상 클러스터링 (Areal Image Clustering using Hybrid Kohonen Network)

  • 이경희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.250-251
    • /
    • 2015
  • 본 논문에서는 자기 조직화 기능을 갖는 Kohonen의 SOM(Self organization map) 신경회로망과 주어지는 데이터에 따라 초기의 클러스터 개수를 설정하여 처리하는 수정된 K-Means 알고리즘을 결합한 Hybrid Kohonen Network 를 제안한다. 또한, 실제의 항공영상에 적용하여 고전적인 K-Means 알고리즘 및 고전적인 SOM 알고리즘보다 우수함을 보인다.

  • PDF

요약 문서 기반 문서 클러스터링 (Document clustering based on summarized document using K-means algorithm)

  • 오형진;고지현;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2002
  • 정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

  • PDF

적응적 Multiple Kernels을 이용한 Interval Type-2 Possibilistic Fuzzy C-Means 방법 (A Novel Approach towards use of Adaptive Multiple Kernels in Interval Type-2 Possibilistic Fuzzy C-Means)

  • 주원희;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.529-535
    • /
    • 2014
  • 본 논문에서는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 클러스터링 방법에 multiple Gaussian kernels을 기반으로 한 possibilistic fuzzy C-means multiple kernels(PFCM-MK) 알고리즘을 결합하여 적응적인 하이브리드 클러스터링 방법인 multiple kernels interval type-2 possibilistic fuzzy C-means(IT2PFCM-MK) 방법을 제안 하였다. 일반적으로 possibilistic fuzzy C-means(PFCM) 알고리즘은 fuzzy C-means(FCM) 알고리즘의 단점인 노이즈 민감성 및 특이점 문제와 알고리즘 초기 클러스터의 Prototype에 따라 위치가 겹치는 문제를 해결하기 위해 제안 되었다. 하지만 이 방법 역시 퍼지화 파라미터 값에 따라 위와 같은 문제를 여전히 가지고 있기 때문에 이와 같은 문제를 보완하기 위해 interval type-2 퍼지 접근 방법을 이용 하는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘을 제안 하였다. 또한 multiple kernels 함수를 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘에 적용하여 분류하기 복잡한 형태의 데이터와 노이즈가 있는 데이터에 대하여 보다 정확하고, 향상된 클러스터링을 수행할 수 있다.

색상과 위치정보를 이용한 클러스터링 기반의 움직이는 객체의 검출 (Motion Object Segmentation based on Clustering using Color and Position features)

  • 정윤주;김성동;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.306-308
    • /
    • 2003
  • 본 논문은 컬러영상내 움직이는 객체의 효과적인 검출을 위해 색상과 위치정보를 적용시킨 K-means 클러스터링 알고리즘을 이용하여 움직이는 객체들을 추출한 방법을 제안하고 있다. 최종 클러스터링된 중심픽셀(prototype)이 갖고있는 RGB 값을 사용해 프레임을 비교해 객체와 배경의 분리를 가능하게 했고 마지막으로 후처리를 이용해 남아있는 배경잡음을 제거하였다. 본 연구의 실험은 여러 교통장면을 포함한 다양한 영상에서 이루어졌으며 실험결과 제안된 알고리즘은 기존의 픽셀이나 블록기반의 방법에 비해 보다 정확한 객체 검출이 가능했으며 한 가지 특징 정보를 사용한 클러스터링에 비해 보다 높은 정확도를 보였다.

  • PDF

밀도에 무관한 클러스터링 기법의 개선 (Improvement on Density-Independent Clustering Method)

  • 김성훈;허경용
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.967-973
    • /
    • 2017
  • 클러스터링은 균일한 특성을 가지는 데이터를 클러스터로 묶기 위해 사용되는 비교사 학습 방법 중 하나로 다양한 응용에 사용되고 있으며 FCM(Fuzzy C-Means)이 대표적인 방법 중 하나이다. 하지만 FCM에서 주로 사용되는 유클리드 거리 척도는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미쳐 밀도가 높은 쪽으로 클러스터의 중심을 위치시키는 문제가 있으며, 이를 해결하기 위한 방법 중 하나가 클러스터 중심 사이의 거리가 가능한 멀어지도록 하는 밀도 무관 클러스터링이다. 하지만 밀도 무관 클러스터링 역시 클러스터 중심 사이의 거리를 정확히 제어하기가 어렵다. 이 논문에서는 클러스터 중심 사이의 거리가 멀어지도록 할뿐만이 아니라 클러스터 중심이 밀도가 높은 곳에 위치하도록 하는 항을 추가한 개선된 밀도 무관 클러스터링 방법을 제안한다. 제안하는 방법은 FCM이나 밀도 무관 클러스터링에 비해 실제 클러스터 중심으로 수렴하는 경우가 더 많다는 것을 실험 결과를 통해 확인할 수 있다.

X-means 클러스터링을 이용한 악성 트래픽 탐지 방법 (A Malicious Traffic Detection Method Using X-means Clustering)

  • 한명지;임지혁;최준용;김현준;서정주;유철;김성렬;박근수
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.617-624
    • /
    • 2014
  • 악성 트래픽은 디도스 공격, 봇넷 통신 등의 인터넷 망을 교란시키거나 특정 네트워크, 서버, 혹은 호스트에 피해를 끼칠 의도를 가지고 발생시키는 트래픽을 지칭한다. 이와 같은 악성 트래픽은 인터넷이 발생한 이래 꾸준히 양과 질에서 진화하고 있고 이에 대한 대응 연구도 계속되고 있다. 이 논문에서는 악성 트래픽을 기존 X-means 클러스터링 알고리즘을 적용하여 효과적으로 탐지하는 방법을 제시하였다. 특히 악성 트래픽의 통계적 특징을 분석하고 클러스터링을 위한 메트릭을 정의하는 방법을 체계적으로 제시하였다. 또한 두 개의 공개된 트래픽 데이터에 대한 실험을 통해 실효성을 검증하였다.

평균연결법과 K-means 혼합클러스터링 기법을 이용한 공시지가 유사가격권역의 설정 (A Similar Price Zone Determination of Public Land Price Using a Hybrid Clustering Technique)

  • 이성규;박수홍;홍성언
    • 대한지리학회지
    • /
    • 제41권1호
    • /
    • pp.121-135
    • /
    • 2006
  • 공시지가 유사가격권의 경우는 비교표준지 선정시 지침상에서 상당히 중요한 요소로 취급되고 있으면서도 실제적으로는 범위와 적용에 관해서 모호한 개념상의 규정을 두고 있다. 이러한 원인에 기인하여 비교표준지의 자동 선정이나 공시지가의 자동 산정에 있어 많은 문제점으로 작용하고 있다. 따라서 신속하고 정확한 비교표준지의 선정과 향후 지가산정 일련의 과정을 전산화하기 위해서는 자동화된 방식으로 유사가격권을 구획할 수 있는 객관적이고 합리적인 방법론이 필요하다. 본 연구에서는 개별공시지가 산정시 유사가격권 설정의 문제를 해결하고자 평균연결법과 K-means 혼합클러스터링 기법을 활용하여 유사가격권을 설정하여보고 이에 대한 타당성을 제시하고자 하였다. 이를 위해 실제 사례지역을 선정하고 실험한 결과 유사가격 권역 별로 군집화가 가능하였고, 현행 유사가격 권역과 많은 차이를 보이지 않아 방법론의 타당성을 제시할 수 있었다.