• Title/Summary/Keyword: K-means 알고리즘

Search Result 769, Processing Time 0.032 seconds

An Implementation of Clustering Method using K-Means Algorithm on Multi-Dimensional Data (K-Means 알고리즘을 이용한 다차원 데이터 클러스터링 기법 구현)

  • Ihm, Sun-Young;Shin, HyunSoon;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1132-1134
    • /
    • 2013
  • K-Means 클러스터링 기법은 데이터마이닝 분야 중 클러스터링 분야에서 가장 널리 쓰이는 방법 중 하나로 주어진 데이터 셋에서 k개의 클러스터를 중심으로 데이터를 분할하는 기법이다. 최근의 데이터는 여러개의 속성을 고려해야 한다. 따라서 본 논문에서는 K-Means 클러스터링 기법을 소개하고, 또 K-Means 클러스터링 기법을 여러 개의 속성을 고려하기 위하여 다차원 데이터에 적용한 실험을 소개한다.

A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results (논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법)

  • Bae, Kyoung-Man;Hwang, Jae-Won;Ko, Young-Joong;Kim, Jong-Hoon
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.3
    • /
    • pp.214-221
    • /
    • 2010
  • The search-results clustering problem is defined as the automatic and on-line grouping of similar documents in search results returned from a search engine. In this paper, we propose a new search-results clustering algorithm specialized for a paper search service. Our system consists of two algorithmic phases: Category Hierarchy Generation System (CHGS) and Paper Clustering System (PCS). In CHGS, we first build up the category hierarchy, called the Field Thesaurus, for each research field using an existing research category hierarchy (KOSEF's research category hierarchy) and the keyword expansion of the field thesaurus by a word clustering method using the K-means algorithm. Then, in PCS, the proposed algorithm determines the category of each paper using top-down and bottom-up methods. The proposed system can be used in the application areas for retrieval services in a specialized field such as a paper search service.

Machine-Part Grouping in Cellular Manufacturing Systems Using a Self-Organizing Neural Networks and K-Means Algorithm (셀 생산방식에서 자기조직화 신경망과 K-Means 알고리즘을 이용한 기계-부품 그룹형성)

  • 이상섭;이종섭;강맹규
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.23 no.61
    • /
    • pp.137-146
    • /
    • 2000
  • One of the problems faced in implementing cellular manufacturing systems is machine-part group formation. This paper proposes machine-part grouping algorithms based on Self-Organizing Map(SOM) neural networks and K-Means algorithm in cellular manufacturing systems. Although the SOM spreads out input vectors to output vectors in the order of similarity, it does not always find the optimal solution. We rearrange the input vectors using SOM and determine the number of groups. In order to find the number of groups and grouping efficacy, we iterate K-Means algorithm changing k until we cannot obtain better solution. The results of using the proposed approach are compared to the best solutions reported in literature. The computational results show that the proposed approach provides a powerful means of solving the machine-part grouping problem. The proposed algorithm Is applied by simple calculation, so it can be for designer to change production constraints.

  • PDF

A study on the development of a program to check the severity of dysphagia patients using the K-means algorithm (K-means 알고리즘을 통한 연하 곤란 환자의 심각도를 확인하는 프로그램 개발 연구)

  • Choi, Dong-gyu;Jang, Jong-Wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.104-107
    • /
    • 2019
  • Modern people have abundant food and various forms of life compared to the past, but they have come to form an unhealthy diet, such as skipping breakfast and not eating in time in a busy life. When these eating habits are maintained for a long time, it leads to digestive trouble. The most easily occurring symptoms are called reflux esophagitis and dysphagia. Among them, dysphagia requires quick and accurate diagnosis as they develop into various forms of complications or are also identified as presymptoms of gastric and laryngeal cancers. The result of the diagnosis is still passively judged by the doctor and each of results are different depending on the doctor. The result of the diagnosis here means the severity. When they identify treatment or complications following the results of the diagnosis, the wrong diagnosis may lead to excessive or insufficient treatment. In this paper, to figure out the severity of dysphagia in the diagnosis of dysphagia, we studied the development of a program using the K-means algorithm in the processing of X-ray images for identifying residual food in epiglottic vallecula and pyriform sinus in the section leading to esophagus.

  • PDF

A Genetic Algorithm for Clustering in Data Mining

  • 정지원;최인찬
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.306-309
    • /
    • 2000
  • 본 논문에서는 데이터마이닝 문제에 클러스터링 기법을 적용할 때 발생할 수 있는 문제점 및 속성선택(feature selection)과 그룹 수 산정의 상호연관성을 살펴보고, 데이터 필드의 상대적 중요도와 최적의 그룹 수를 결정하는 수리적 모형을 제시한다. 또한, 이 모형을 풀기 위하여 K-means 알고리즘을 이용한 유전 알고리즘을 제시한다.

  • PDF

Binary Tree Architecture Design for Support Vector Machine Using Dynamic Time Warping (DTW를 이용한 SVM 기반 이진트리 구조 설계)

  • Kang, Youn Joung;Lee, Jaeil;Bae, Jinho;Lee, Seung Woo;Lee, Chong Hyun
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.6
    • /
    • pp.201-208
    • /
    • 2014
  • In this paper, we propose the classifier structure design algorithm using DTW. Proposed algorithm uses DTW result to design the binary tree architecture based on the SVM which classify the multi-class data. Design the binary tree architecture for Support Vector Machine(SVM-BTA) using the threshold criterion calculated by the sum columns in square matrix which components are the reference data from each class. For comparison the performance of the proposed algorithm, compare the results of classifiers which binary tree structure are designed based on database and k-means algorithm. The data used for classification is 333 signals from 18 classes of underwater transient noise. The proposed classifier has been improved classification performance compared with classifier designed by database system, and probability of detection for non-biological transient signal has improved compare with classifiers using k-means algorithm. The proposed SVM-BTA classified 68.77% of biological sound(BO), 92.86% chain(CHAN) the mechanical sound, and 100% of the 6 kinds of the other classes.

Dimensionality Reduction Using PCA for Edge Computing (Edge Computing 환경에서의 PCA를 이용한 Dimensionality 감축 기법)

  • Lim, Hwan-Hee;Kim, Se-Jun;Kim, Kyoung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.01a
    • /
    • pp.95-96
    • /
    • 2018
  • Edge Computing은 Cloud Computing의 단점을 보완하기 위해 등장 하였으나, 자원 제한을 가지고 있는 Edge Node에서 데이터 분석 및 처리해야 하는 문제점이 있다. 이를 해결하기 위해 K-means clustering 알고리즘과 PCA 기법을 이용해 차원 추축을 이용한 계산비용과 처리시간을 줄이는 기법을 제안하였다. PCA란, 차원 축소 및 데이터 압축에 사용되는 기계학습 알고리즘 중 하나이며, 데이터에서 중요한 정보만 추출해 차원을 줄일 수 있다. 이를 통해 제안한 기법이 기존의 Reduction first clustering second(RFCS) 기법에 비해 성능이 우수한 것을 확인할 수 있었다.

  • PDF

Lip Detection Algorithm Using Color Clustering (색상 군집화를 이용한 입술탐지 알고리즘)

  • Jeong, Jongmyeon;Choi, Jiyun;Seo, Ji Hyuk;Lee, Se Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.277-278
    • /
    • 2012
  • 본 논문에서는 색상 군집화를 이용한 입술탐지 알고리즘을 제안한다. 이를 위해 이미 많이 알려져 있는 AdaBoost를 이용한 얼굴탐지를 수행한다. 탐지된 얼굴영역에 Lab 컬러시스템을 적용 시킨 후 입술픽셀의 특징에 따른 색상 마커를 사용하여 피부영역을 추출한다. 추출된 피부영역에 대하여 K-means 색상 군집화를 통해 입술영역을 추출한다. 그리고 실험을 통해 입술탐지 결과를 확인하였다.

  • PDF

Clustering In Tied Mixture HMM Using Homogeneous Centroid Neural Network (Homogeneous Centroid Neural Network에 의한 Tied Mixture HMM의 군집화)

  • Park Dong-Chul;Kim Woo-Sung
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.31 no.9C
    • /
    • pp.853-858
    • /
    • 2006
  • TMHMM(Tied Mixture Hidden Markov Model) is an important approach to reduce the number of free parameters in speech recognition. However, this model suffers from a degradation in recognition accuracy due to its GPDF (Gaussian Probability Density Function) clustering error. This paper proposes a clustering algorithm, called HCNN(Homogeneous Centroid Neural network), to cluster acoustic feature vectors in TMHMM. Moreover, the HCNN uses the heterogeneous distance measure to allocate more code vectors in the heterogeneous areas where probability densities of different states overlap each other. When applied to Korean digit isolated word recognition, the HCNN reduces the error rate by 9.39% over CNN clustering, and 14.63% over the traditional K-means clustering.

Container Recognition System using Fuzzy RBF Network (퍼지 RBF 네트워크를 이용한 컨테이너 인식 시스템)

  • Kim, Jae-Yong;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.497-503
    • /
    • 2005
  • 본 논문에서는 퍼지 RBF 네트워크를 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 크기나 위치가 정형화되어 있지 않고 외부 잡음으로 인하여 식별자의 형태가 변형될 수 있기 때문에 일정한 규칙으로 찾기는 힘들다. 본 논문에서는 이러한 특성을 고려하여 컨테이너 영상에 대해 Canny 마스크를 이용하여 에지를 검출하고, 검출된 에지 정보에서 영상획득 시 외부 광원에 의해 수직으로 길게 발생하는 잡음들을 퍼지 추론 방법을 적용하여 제거한 후에 수직 블록과 수평 블록을 검출하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 4방향 윤광선 추적 알고리즘을 적용하여 개별 식별자를 추출한다. 개별 식별자 인식을 위해 퍼지 C-Means 알고리즘을 이용한 퍼지 RBF 네트워크를 제안하여 개별 식별자에 적용한다. 제안된 퍼지 RBF 네트워크는 퍼지 C-Means 알고리즘을 중간층으로 적용하고 중간층과 출력층 간의 학습에는 일반화된 델타 학습 방법과Delta-bar-Delta 알고리즘을 적용하여 학습 성능을 개선한다. 실제 컨테이너 영상을 대상으로 실험한 결과, 기존의 식별자 추출 방법보다 제안된 식별자 추출방법이 개선되었다. 그리고 기존의 ART2 기반 RBF 네트워크보다 제안된 퍼지 RBF 네트워크가 컨테이너 식별자의 학습 및 인식에 있어서 우수함을 확인하였다.

  • PDF