• 제목/요약/키워드: K-means 클러스터링

검색결과 368건 처리시간 0.033초

잎사귀 영상처리기반 질병 감지 알고리즘 (Disease Detection Algorithm Based on Image Processing of Crops Leaf)

  • 박정현;이성근;고진광
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.19-22
    • /
    • 2016
  • 최근 IT 기술을 활용하여 농작물의 병충해 조기 진단에 관한 연구가 활발히 진행되고 있다. 본 논문은 카메라 센서를 통해 받아온 작물의 잎사귀 이미지를 분석하여 병충해를 조기에 감지할 수 있는 이미지 프로세싱 기법에 대해 논한다. 본 논문은 개선된 K 평균 클러스터링 방법을 활용하여 잎사귀 질병 감염 여부를 진단하는 알고리즘을 제안한다. 잎사귀 감염 분류 실험을 통해, 제안한 알고리즘이 정성적인 평가에서 더 좋은 성능을 나타낸 것으로 분석되었다.

  • PDF

노인 운전자의 공격적인 운전 상태 검출 기법 (A Method of Detecting the Aggressive Driving of Elderly Driver)

  • 고동우;강행봉
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.537-542
    • /
    • 2017
  • 공격적인 성향의 운전은 자동차 사고의 주요한 원인이 된다. 기존 연구에서는 공격적 성향의 운전을 검출하기 위해, 주로 청년을 대상으로 연구가 이뤄졌으며 기계학습의 순수한 Clustering 또는 Classification 기법을 통해 이뤄졌다. 그러나 노인들은 취약한 신체적 조건에 의해 젊은 운전자와는 다른 운전 강도를 가지고 있어 기존의 방식으로는 검출이 불가능 하며, 데이터를 보정하는 등의 새로운 방법이 필요하다. 그리하여, 본 연구에서는 기존의 클러스터링 기법(K-means, Expectation - maximization algorithm)에, 새롭게 제안하는 ECA(Enhanced Clustering method for Acceleration data)기법을 추가하여, 주행 차량에 위치한 스마트폰으로부터 수집된 가속도 데이터를 분석하고 공격적인 운전 형태를 검출해 낸다. ECA는 모든 피험자의 데이터에서 K-means와 EM을 통해 검출된 군집군의 데이터 중 높은 강도의 데이터를 선별하여, 특징을 스케일링한 값을 통해 모델링한다. 본 방식을 통해 기존의 연구의 순수한 클러스터링 방식과는 달리, 모든 청장년 및 노인 실험 참가자 개인들의 공격적인 운전 데이터가 검출되었으며, 클러스터링 기법간의 비교를 통해 K-means 기법이 보다 높은 검출 효율을 갖고 있음을 확인했다. 또한, K-means 방식을 검출한 공격적인 운전 데이터에서는 젊은 운전자가 노인운전자에 비해 1.29배의 높은 운전 강도를 가지고 있음을 발견했다. 이와 같이 본 연구에서 제안된 방식은 낮은 운전 강도를 갖고 있는 노인의 데이터에서 공격적인 운전을 검출 가능하게 되었으며, 특히. 제안된 방법은 노인 운전자를 위한 맞춤형 안전운전 시스템을 구축이 가능하며, 추후 다양한 연구을 통해 이상 운전 상태를 검출하고 조기 경보하는데 활용이 가능할 것이다.

통행시간 분포 기반의 전철역 클러스터링 (Metro Station Clustering based on Travel-Time Distributions)

  • 공인택;김동윤;민윤홍
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.193-204
    • /
    • 2022
  • 스마트교통카드 데이터는 대표적인 모빌리티 데이터로 이를 이용하여 대중교통 이용행태를 분석하고 정책 개발에 활용할 수 있다. 본 논문은 이러한 연구의 하나로 전철 이용패턴을 이용하여 전철역들을 분류하는 문제를 다룬다. 전철역의 클러스터링을 다룬 기존 논문들은 이용행태 중 통행량만을 고려하였기에 본 논문은 이에 대한 보완적인 방법의 하나로 통행시간을 고려한 클러스터링을 제안한다. 각 역의 승객들을 출근 시간 출발, 출근 시간 도착, 퇴근 시간 출발, 퇴근 시간 도착 승객들로 분류한 다음 각각의 통행시간을 와이블 분포로 모형화하여 추정한 형상모수를 역의 특성값으로 정의하였다. 그리고 특성 벡터들을 K-평균 클러스터링 기법을 사용하여 클러스터링하였다. 실험결과 통행시간을 고려하여 역의 클러스터링을 수행하면 기존 연구의 클러스터링 결과와 유사한 결과가 나올 뿐만 아니라 더 세분화 된 클러스터링이 가능함을 관찰하였다.

데이터 마이닝의 전처리를 위한 K-means 알고리즘을 이용한 빈발패턴 생성 (Creation of Frequent Patterns using K-means Algorithm for Data Mining Preprocess)

  • 유희종;박지연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.336-339
    • /
    • 2008
  • 우리가 사용하는 데이터베이스 내에는 많은 양의 데이터 들이 들어 있으며, 계속적으로 그 양은 늘어나고 있다. 이러한 데이터들로부터 질의를 통해 얻을 수 있는 기본적이고 단순한 정보들과 달리 고급 정보를 얻게 해주는 방법이 데이터 마이닝이다. 데이터 마이닝의 기법 중에서 본 논문에서는 k-means 알고리즘을 사용하여 트랜잭션을 클러스터링 함으로써 데이터베이스의 트랜잭션 수를 줄여 연관규칙의 대표적인 알고리즘인 Apriori 알고리즘의 단점인 트랜잭션 스캔으로 인한 성능 저하를 개선하고자 한다.

상황인식 기반 클러스터링의 적응적 자율 학습 분할 알고리즘 (Context-awareness Clustering with Adaptive Learning Algorithm)

  • 전일규;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.612-614
    • /
    • 2022
  • 본 논문은 이동 노드간 클러스터링을 함에 있어 보다 효율적인클러스터링을 제공하고 유지하기 위한 딥러닝의 자율학습에 따른 군집적 알고리즘을 제안한다. 대부분 이동 노드의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 새롭게 입력되거나 변경된 데이터가 비교정보에서 오염된 정보로 분류될 경우 기존 분류된 클러스터링으로부터 오염된 정보로 이해되어 군집성을 저하시키는 요인으로 작용 할 수가 있다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 학습 모델을 제시 한다.

  • PDF

Interval Type-2 Possibilistic Fuzzy C-means 클러스터링을 위한 퍼지화 상수 결정 방법 (Determining the Fuzzifier Values for Interval Type-2 Possibilistic Fuzzy C-means Clustering)

  • 주원희;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제27권2호
    • /
    • pp.99-105
    • /
    • 2017
  • 일반적으로 type-1 fuzzy set 에 존재하는 불확실성을 보다 효율적으로 다루고 제어하기 위하여 Type-2 fuzzy set (T2 FS)이 널리 사용되고 있다. T2 FS에서 퍼지화 상수 (fuzzifier value) m은 이러한 불확실성을 처리하기 위한 가장 중요한 요소이다. 따라서 적절한 퍼지화 상수 값을 결정하는 연구는 여전히 지속되고 있고, 많은 방법들이 연구 되어 왔다. 본 논문에서는 주어진 패턴을 분류하기 위하여 Interval type-2 possibilistic fuzzy C-means (IT2PFCM) 클러스터링 방법을 사용한다. 클러스터링을 위해 사용된 IT2 PFCM 방법에서 각 데이터에 대하여 적응적으로 적절한 퍼지화 상수의 값을 계산하는 방법을 제안한다. 히스토그램 접근법을 통하여 각각의 데이터 포인트로부터 정보를 추출해 내고 추출된 정보를 이용하여 두 개의 퍼지화 상수인 $m_1$, $m_2$. 값을 결정한다. 이렇게 얻어진 값은 interval type-2 fuzzy의 최저 및 최고 멤버쉽 값을 결정하게 된다.

데이터 클러스터링을 활용한 게이미피케이션 환경에서의 플레이어 유형 분석 (An Analysis of Player Types using Data Clustering in Gamification)

  • 박성진;강범수;김성수;김상균
    • 한국게임학회 논문지
    • /
    • 제17권6호
    • /
    • pp.77-88
    • /
    • 2017
  • 본 연구의 목적은 데이터 클러스터링을 활용해 기존의 플레이어 유형 이론을 비교하고 검증하는 것이다. 연구 진행을 위해 A 대학교 2016년 2학기에 진행된 초대형 강의 수강생의 결과 데이터 235개를 활용했다. 본 연구에서는 K-평균(Means)과 적절한 클러스터 수를 결정하기 위해 실루엣(Silhouette) 평가기법을 적용했다. 적용한 플레이어 유형은 바틀의 2차원, 3차원 플레이어 유형, Ferro의 5 가지 유형, 브레인헥스이다. 연구결과에 따르면, 바틀의 2차원 플레이어 유형이 데이터 클러스터링 관점에서 가장 적합한 것으로 나타났다. 각 플레이어 유형 별 특성분포도 해석했다. 본 연구결과는 게이미피케이션을 적용하거나 개발 프로세스를 연구할 때 사용되는 플레이어 분석 부분에 영향을 미칠 것으로 예상된다.

그룹특징기반 슬라이딩 윈도우 클러스터링에서의 k-means와 k-medoids 비교 평가 (Comparison between k-means and k-medoids Algorithms for a Group-Feature based Sliding Window Clustering)

  • 양주연;심준호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.225-237
    • /
    • 2018
  • 대용량 데이터의 발생과 처리가 대중화되면서 대용량 데이터 스트림 처리에 대한 수요가 급격하게 증가하고 있다. 이 수요에 따라 다양한 대용량 데이터 처리 기술이 개발되고 있다. 한 분야로 주목받고 있는 방식은 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링이다. 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링은 윈도우가 이동할 때마다 새로운 클러스터를 생성한다. 기존의 슬라이딩 윈도우 상의 클러스터링 기법은 코어셋(Coreset)을 기반으로 데이터 스트림 클러스터링을 구현하고 있다. 이 연구에서는 코어셋을 활용한 그룹특징을 이용한 알고리즘 내에서 이용하는 클러스터링 알고리즘을 변경하였다. 그리고 이를 통해 제안 알고리즘과 기존 알고리즘의 파라미터 값 변화에 따른 성능 비교 실험을 진행하였다. 개선된 사항에 대해 논하여 두 알고리즘을 비교하고 실험자에게 파라미터에 따른 이용 방향을 제시한다.

FCM을 이용한 고장전류의 판별에 관한 연구 (Faults Current Discrimination Using FCM)

  • 정종원;지석준;이준탁;김광백
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2007년도 하계학술대회 논문집
    • /
    • pp.458-460
    • /
    • 2007
  • RBF 네트워크의 중간층은 클러스터링 하는 층으로 주어진 자료 집합을 유사한 클러스터들로 분류하는 것이다. 여기서 유사하다는 것은 입력 데이터들에 대한 특징 벡터 공간사이에서 한 클러스터내의 벡터들 간에 거리를 측정하여 정해진 반경 내에 존재하면 같은 클러스터로 분류하고 정해진 반경 내에 존재하지 않으면 다른 클러스터로 분류한다. 그러나 정해진 반경 내에서 클러스터링 하는 것은 잘못된 클러스터를 선택하는 단점을 가지게 된다. 그러므로 중간층을 결정하는 것은 RBF 네트워크의 전반적인 효율성에 큰 영향을 준다. 따라서 본 논문에서는 효율적으로 중간층을 결정하기 위한 방법으로 퍼지 C-Means 클러스터링 알고리즘을 이용하고자 하였다. 그리하여 본 논문에서는 고장 전류의 특성을 해석하여 그 원인을 판단, 분류하기 위하여 전력계통의 고장 기록 장치로부터 얻어지는 선로의 전류 데이터를 FCM을 이용 분류하여 다양한 고장 모드를 판별할 수 있었다.

  • PDF

데스크톱 그리드에서 자원 클러스터링을 이용한 작업 결과 검증에 관한 연구 (A Study on Task Result Verification using Resource Clustering in Desktop Grids)

  • 강지훈;송성진;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.176-178
    • /
    • 2015
  • 데스크톱 그리드에서는 휘발성과 이질성과 같은 동적 특성을 갖는 자원의 자율적인 수행에 의해 얻어진 작업 결과의 검증이 중요하다. 이를 위해, 본 논문에서는 자원의 동적 특성을 신뢰도와 결과반환확률로 정의하고 k-means 클러스터링 알고리즘을 적용하여 자원들을 자원 그룹으로 분류하고, 분류된 자원 그룹에 따라 작업의 복제수를 결정하는 자원 클러스터링 기반의 컬과 검증 기법을 제안한다.