• 제목/요약/키워드: Means

검색결과 31,854건 처리시간 0.054초

An Improved K-means Document Clustering using Concept Vectors

  • Shin, Yang-Kyu
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권4호
    • /
    • pp.853-861
    • /
    • 2003
  • An improved K-means document clustering method has been presented, where a concept vector is manipulated for each cluster on the basis of cosine similarity of text documents. The concept vectors are unit vectors that have been normalized on the n-dimensional sphere. Because the standard K-means method is sensitive to initial starting condition, our improvement focused on starting condition for estimating the modes of a distribution. The improved K-means clustering algorithm has been applied to a set of text documents, called Classic3, to test and prove efficiency and correctness of clustering result, and showed 7% improvements in its worst case.

  • PDF

K-means Clustering using Grid-based Representatives

  • Park, Hee-Chang;Lee, Sun-Myung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.759-768
    • /
    • 2005
  • K-means clustering has been widely used in many applications, such that pattern analysis, data analysis, market research and so on. It can identify dense and sparse regions among data attributes or object attributes. But k-means algorithm requires many hours to get k clusters, because it is more primitive and explorative. In this paper we propose a new method of k-means clustering using the grid-based representative value(arithmetic and trimmed mean) for sample. It is more fast than any traditional clustering method and maintains its accuracy.

  • PDF

MUIRHEAD'S AND HOLLAND'S INEQUALITIES OF MIXED POWER MEANS FOR POSITIVE REAL NUMBERS

  • LEE, HOSOO;KIM, SEJONG
    • Journal of applied mathematics & informatics
    • /
    • 제35권1_2호
    • /
    • pp.33-44
    • /
    • 2017
  • We review weighted power means of positive real numbers and see their properties including the convexity and concavity for weights. We study the mixed power means of positive real numbers related to majorization of weights, which gives us an extension of Muirhead's inequality. Furthermore, we generalize Holland's conjecture to the power means.

Fuzzy k-Means Local Centers of the Social Networks

  • Woo, Won-Seok;Huh, Myung-Hoe
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.213-217
    • /
    • 2012
  • Fuzzy k-means clustering is an attractive alternative to the ordinary k-means clustering in analyzing multivariate data. Fuzzy versions yield more natural output by allowing overlapped k groups. In this study, we modify a fuzzy k-means clustering algorithm to be used for undirected social networks, apply the algorithm to both real and simulated cases, and report the results.

SCHUR CONVEXITY OF L-CONJUGATE MEANS AND ITS APPLICATIONS

  • Chun-Ru Fu;Huan-Nan Shi;Dong-Sheng Wang
    • 대한수학회지
    • /
    • 제60권3호
    • /
    • pp.503-520
    • /
    • 2023
  • In this paper, using the theory of majorization, we discuss the Schur m power convexity for L-conjugate means of n variables and the Schur convexity for weighted L-conjugate means of n variables. As applications, we get several inequalities of general mean satisfying Schur convexity, and a few comparative inequalities about n variables Gini mean are established.

K-Means 알고리즘을 이용한 계층적 클러스터링에서 클러스터 계층 깊이와 초기값 선정 (Selection of Cluster Hierarchy Depth and Initial Centroids in Hierarchical Clustering using K-Means Algorithm)

  • 이신원;안동언;정성종
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.173-185
    • /
    • 2004
  • 정보통신의 기술이 발달하면서 정보의 양이 많아지고 사용자의 질의에 대한 검색 결과 리스트도 많이 추출되므로 빠르고 고품질의 문서 클러스터링 알고리즘이 중요한 역할을 하고 있다. 많은 논문들이 계층적 클러스터링 방법을 이용하여 좋은 성능을 보이지만 시간이 많이 소요된다. 반면 K-means 알고리즘은 시간 복잡도를 줄일 수 있는 방법이다. 본 논문에서는 계층적 클러스터링 시스템인 콘도르(Condor) 시스템에서 간단하고 고품질이며 효율적으로 정보 검색 할 수 있도록 구현하였다. 이 시스템은 K-Means Algorithm을 이용하였으며 클러스터 계층 깊이와 초기값을 조절하여 $88\%$의 정확율을 보였다.

클러스터링 및 영상 분할을 위한 커널 기반의 Possibilistic 접근 방법 (A Kernel based Possibilistic Approach for Clustering and Image Segmentation)

  • 최길수;최병인;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제14권7호
    • /
    • pp.889-894
    • /
    • 2004
  • Fuzzy Kernel C-Means(FKCM) 알고리즘은 커널 함수를 통하여 구형의 데이터뿐만 아니라 Fuzzy C-Means(FCM)에서는 분류하기 힘든 복잡한 형태의 분포를 갖는 데이터를 분류할 수 있다. 하지만 FCM과 같이 노이즈에 대해서는 민감한 성질을 가진다. 이처럼 노이즈(noise)에 민감한 성질을 보완하기 위해서 본 논문에서는 Possibilistic C-Means 알고리즘에 커널 함수를 적용하였다. 제안한 Kernel Possibilistic C-Means(KPCM) 알고리즘은 일반적인 데이터에 대해 FKCM과 같은 성능의 클러스터링 수행이 가능하며 노이즈가 있는 데이터에 대해서는 FKCM보다 정확한 클러스터링을 수행할 수 있다.

AMI로부터 측정된 전력사용데이터에 대한 군집 분석 (Clustering load patterns recorded from advanced metering infrastructure)

  • 안효정;임예지
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.969-977
    • /
    • 2021
  • 본 연구에서는 Hierarchical K-means 군집화 알고리즘을 이용해 서울의 A아파트 가구들의 전력 사용량 패턴을 군집화 하였다. 차원을 축소해주면서 패턴을 파악할 수 있는 Hierarchical K-means 군집화 알고리즘은 기존 K-means 군집화 알고리즘의 단점을 보완하여 최근 대용량 전력 사용량 데이터에 적용되고 있는 방법론이다. 본 연구에서는 여름 저녁 피크 시간대의 시간당 전력소비량 자료에 대해 군집화 알고리즘을 적용하였으며, 다양한 군집 개수와 level에 따라 얻어진 결과를 비교하였다. 결과를 통해 사용량에 따라 패턴이 군집화 됨을 확인하였으며, 군집화 유효성 지수들을 통해 이를 비교하였다.

A Study on the Selection of Means of Transportation in International Logistics

  • Kim, Jin-Hwan
    • 동아시아경상학회지
    • /
    • 제10권2호
    • /
    • pp.55-69
    • /
    • 2022
  • Purpose - This study is a study to investigate the problem of the selection of means of transportation in international logistics by studying the basics of logistics activities, selection factors of transportation methods, and multimodal transportation. Research design, data, methodology - This study is composed of 5 chapters through literature study. Chapter 1 describes the functions and transportation system of international logistics, Chapter 2 selects transportation, Chapter 3 deals with maritime transportation and multimodal transportation, Chapter 4 describes multimodal transportation in terms of customer service, Chapter 5 addresses the implications and conclusions. Results - When looking at the problem of selecting a means of transportation, it is important that the parties involved in the transportation choose which means of transportation for their convenience and profit during the transportation process. Here, there will be factors to consider, including transportation cost, when selecting a means of transportation, and each means of transportation may have characteristics or advantages and disadvantages. Considering all these points, the adoption of multimodal transportation from a customer service point of view may be the answer. Conclusions - This study pays attention to the academic understanding related to the selection of means of transportation and to how usefully this thesis can be used in the selection of transportation related persons, especially shippers, from a practical level.

우연 요인이 수단-목표 관계의 지각에 미치는 효과 (A Study on the Effect of Happenstance Factors on the Perception of Means-Goal Relationship)

  • 이병관;김성은
    • 감성과학
    • /
    • 제19권1호
    • /
    • pp.11-20
    • /
    • 2016
  • 본 연구는 특정 수단으로 목표를 달성하는 과정에서 예기치 못한 추가적인 목표가 탐색되었을 때, 추가 목표에 대한 수단의 효과성 평가가 개인의 내재적인 우연수용성 수준에 의해 영향을 받는지를 검증하기 위해 수행되었다. 구체적으로, 본 연구는 우연수용성이 높거나 낮은 참가자들에게 특정 수단(운동과 저축)과 관련성이 높거나 낮은 추가적인 목표를 성취하는데 있어서 수단이 얼마나 효과적인지 평가하도록 하였다. 분석결과, 첫째, 우연수용성이 높은 사람들은 우연수용성이 낮은 사람들보다 원래의 목표외에 추가적인 목표들에 대해서도 현재의 수단이 더 효과가 있을것이라 평가하는 것으로 나타났다. 둘째, 그러나 이러한 결과는 추가적인 목표가 원래의 수단-목표 연결과 관련성이 높을 때에만 발견되었다. 즉, 추가적인 목표가 원래의 수단-목표 연결과 관련성이 낮은 경우에는 우연수용성이 높거나 낮은 사람들 간의 추가적인 목표에 대한 수단의 효과성 평가에서 차이가 발견되지 않았다. 목표 체계 이론(goal systems theory)과 우연수용성 개념을 중심으로 연구의 시사점과 추후 연구에 대한 논의가 이루어졌다.