• Title/Summary/Keyword: 이군집

Search Result 3,373, Processing Time 0.03 seconds

Cluster Merging Using Enhanced Density based Fuzzy C-Means Clustering Algorithm (개선된 밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병)

  • Han, Jin-Woo;Jun, Sung-Hae;Oh, Kyung-Whan
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.5
    • /
    • pp.517-524
    • /
    • 2004
  • The fuzzy set theory has been wide used in clustering of machine learning with data mining since fuzzy theory has been introduced in 1960s. In particular, fuzzy C-means algorithm is a popular fuzzy clustering algorithm up to date. An element is assigned to any cluster with each membership value using fuzzy C-means algorithm. This algorithm is affected from the location of initial cluster center and the proper cluster size like a general clustering algorithm as K-means algorithm. This setting up for initial clustering is subjective. So, we get improper results according to circumstances. In this paper, we propose a cluster merging using enhanced density based fuzzy C-means clustering algorithm for solving this problem. Our algorithm determines initial cluster size and center using the properties of training data. Proposed algorithm uses grid for deciding initial cluster center and size. For experiments, objective machine learning data are used for performance comparison between our algorithm and others.

Cluster analysis with Korean weather data: Application of model-based Bayesian clustering method (한국 기상자료의 군집분석: 베이지안 모델기반 방법의 응용)

  • Joo, Yong-Sung;Jung, Hyung-Joo;Kim, Byung-Jun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.1
    • /
    • pp.57-64
    • /
    • 2009
  • In this paper, 30 main cities are clustered based on precipitation, temperature, wind speed, photo period, and humidity. We found that the resulting clusters has strong relationships with geographical locations. These results make sense because, although Korea is a small country, Korean weather is known to have strong locality. The largest number of clusters is found when wind speed is used as an interested variable for clustering and the smallest number of clusters is found when photo period is used. The large number of clusters based on wind speed indicates that wind speed is affected easily by local geography.

  • PDF

Exploration of Hierarchical Techniques for Clustering Korean Author Names (한글 저자명 군집화를 위한 계층적 기법 비교)

  • Kang, In-Su
    • Journal of Information Management
    • /
    • v.40 no.2
    • /
    • pp.95-115
    • /
    • 2009
  • Author resolution is to disambiguate same-name author occurrences into real individuals. For this, pair-wise author similarities are computed for author name entities, and then clustering is performed. So far, many studies have employed hierarchical clustering techniques for author disambiguation. However, various hierarchical clustering methods have not been sufficiently investigated. This study covers an empirical evaluation and analysis of hierarchical clustering applied to Korean author resolution, using multiple distance functions such as Dice coefficient, Cosine similarity, Euclidean distance, Jaccard coefficient, Pearson correlation coefficient.

RSVP Flow Aggregation for end-to-end QoS on MPLS Network (MPLS망에서 종단간의 서비스 질을 보장하기 위한 RSVP 흐름 군집)

  • 김경일;김상하
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.383-385
    • /
    • 1998
  • MPLS망은 레이블 스위칭을 통해 고속의 라우팅은 제공하지만 서비스 질은 보장하지 않는다. 따라서 MPLS망을 통해 종단간 서비스 질을 보장하기 위한 방법으로 RSVP 흐름 군집을 이용한다. 즉, 입구 라우터와 출구 라우터 간의 흐름들이 요구하는 자원들의 군집하여 예약함으로써 각 흐름들을 요구하는 서비스 질을 보장하게 된다. 이와같이 각 흐름들이 요구하는 자원들을 군집하여 예약하는 이유는 각 흐름별로 예약하고 그 예약에 따라 처리를 하게 되었을 때 흐름 별 상태 정보 저장 및 처리하는 데 많은 비용이 들기 때문이다. 특히 이러한 흐름의 수가 매우 많은 코어 망에서 문제가 크다. 이처럼, 입구 라우터와 출구 라우터간의 흐름들이 요구하는 자원들을 군집하여 예약했을 때, 군집된 흐름들이 입구 라우터와 출구 라우터까지 레이블 스위칭을 통해 전달되면서 이렇게 예약된 자원을 이용하여 서비스 질을 보장 받을 수 있어야 한다. 본 논문에서는 군집된 RSVP 메시지를 통해 자원 예약이 이루어질 때 레이블을 할당하고 바인딩 시킴으로써(레이블이 자원 예약 상태 정보에 대한 구분자 역할을 함) 레이블 스위칭을 통해 패킷이 전달되면서 예약된 자원의 서비스를 받을 수 있게 된다. 자원예약 상태 정보를 레이블 운송 테이블에 저장함으로써 레이블 교환 시 자연적으로 자원 예약에 대한 구분이 됨으로 빠른 구분이 가능하다.

  • PDF

An Efficient Clustering using the Genetic Algorithm (진화 알고리즘을 적용한 효율적 군집화 기법)

  • Lee, Soo-Jung;Kwon, Hye-Ryun;Kim, Eun-Ju;Lee, Yill-Byung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.1017-1020
    • /
    • 2001
  • 최근 들어 관심의 대상이 되고 있는 CRM, eCRM은 비즈니스 분야에 중요한 역할을 담당하고 있다. 이를 위해 여러 방법들이 사용되고 있으나, 그 중 데이터 마이닝은 핵심 기술이라 할 수 있다. 다양한 데이터 마이닝 기법가운데 군집화 기법은, 데이터 집합을 유사한 데이터 개체들의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 과정이다. 그런데 기존의 군집화 알고리즘들은 사전에 군집의 개수를 미리 결정해져야 하며, 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 본 논문에서는 진화 알고리즘을 사용하여 자동적으로 적절한 군집의 개수를 결정하여 군집화 될 수 있도록 하고, 병렬 탐색을 통해 지역적 최적해에 수렴되는 문제점을 개선한 알고리즘과 적합도 함수를 제안한다.

  • PDF

Outlier Data Clustering using Factor Score (인자 점수를 이용한 이상치 데이터의 군집화)

  • 전성해;임민택;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.77-80
    • /
    • 2002
  • 이상치를 포함한 학습 데이터의 군집화 전략은 일반적으로 이상치를 포함하여 학습하거나, 이상치를 제거하는 두 가지 선택이 가능하다. 이상치를 제거하지 않고 학습에 반영시켜야 할 경우 한 개 또는 소수의 이상치가 독자적인 군집을 형성하거나 객관적인 군집화를 방해하는 문제가 발생할 수 있다. 이 때 주어진 학습 데이터의 군집 결과가 이상치의 영향으로부터 벗어나기 위해 원래의 학습 데이터에 대한 변환 작업을 거친 후 군집화를 수행할 수 있다. 이러한 변환 방법으로서 본 논문에서는 차원 축소의 기법으로 알려진 인자 분석의 점수를 사용하였다. 인자 점수로 변환된 학습 데이터에 대해 계층적 군집화, K-means 그리고 자기조직화 지도 등과 같은 군집화 알고리즘을 적용하면 이상치가 자신만의 군집을 별도로 형성하지 않고 다른 학습 데이터의 군집에 소속되면서 이상회의 영향으로부터 벗어남을 실험을 통하여 확인하였다.

  • PDF

Automatic Clustering Agent using PCA and SOM (PCA와 SOM을 이용한 자동 군집화 에이전트)

  • 박정은;김병진;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.67-70
    • /
    • 2003
  • 인터넷의 정보 홍수 속에서 원하는 정보를 정확하게 제시간에 얻기란 쉬운 일이 아니며, 따라서 이러한 작업을 대신해주는 에이전트의 역할이 점점 커지고 있다. 대부분의 이벤트들이 실시간에 발생되고 처리되어야 하는 인터넷 환경에서는 분석가가 군집화의 방법과 결과 해석에 지속적으로 관여하기 어렵기 때문에 이러한 분석가의 업무를 대신하는 지능화된 에이전트가 필요하게 된다. 본 논문에서는 특히 자율학습 군집화에 대한 자동화된 시스템으로서 자동 군집화 에이전트를 제안하며 이 시스템은 군집화 수행 에이전트와 군집화 성능 평가 에이전트로 이루어져 있다. 두 개의 에이전트가 서로 정보를 교환하면서 자동적으로 최적의 군집화를 수행한다. 군집화 과정에서는 데이터를 분석하는 분석가가 군집화의 방법과 결과 해석에 실시간으로 관여하기 어렵기 때문에 이러한 작업을 담당하는 지능화된 에이전트가 자동화된 군집화를 담당하면 효과적인 군집화 전략이 될 수 있다. 또한 UCI Machine Repository의 IRIS 데이터와 Microsoft Web Log Data를 이용한 실험을 통해 제안 시스템의 성능 평가를 수행하였다.

  • PDF

Analysis on the Forest Community Structure of the Area of Donghaksa-Nammaetap. Kyeryongsan National Park (계룡산국립공원 동학사-납매탐구간의 삼림군집구조 분석)

  • 최송현;조현서
    • Korean Journal of Environment and Ecology
    • /
    • v.14 no.4
    • /
    • pp.252-267
    • /
    • 2001
  • 계룡산국립공원 동학사-남매탑구간의 산림군집구조를 분석하기 위하여 64개 조사구를 설정하고 식생구조를 실시하였다. Classification의 기법 중 하나인 TWINSPAN을 이용하여 군집분리를 시도하였으며, 그 결과 소나무 군집(I), 굴참나무-소나무군집(II), 서어나무-굴참나무군집(III), 굴참나무-졸참나무군집(IV), 서어나무-까지박달군집(V), 신갈나무-서어나무군집(VI), 느티나무-졸참나무군집(VII) 그리고 느티나무군집(VIII)의 8개로 분리되었다. 연륜분석결과 이지역의 임령은 약 60년 안팍이었으며, 단위면적(100$\m^2$)당 평균출현종수는 15.0$\pm$3.2종. 평균출현개체수는 95.7$\pm$37.3주었다. 이상의 결과를 통해 계룡산국립공원이 동학사-남매탑구간 지역은 소나무림에서 굴참나무, 졸참나무, 신갈나무림을 거쳐 서어나무, 까지박달림으로 천이가 진행될것으로 예상되었다.

  • PDF

The Actual Vegetation of Nature Ecology Con-servation Area in Mt. Chiri (지리산 자연생태계보전구역의 식생)

  • 김준선;김갑태;주혜란
    • Korean Journal of Environment and Ecology
    • /
    • v.5 no.1
    • /
    • pp.9-24
    • /
    • 1991
  • To elucidate the actual vegetation of Nature Ecology Conservation area in Mt. Chiri, forest communities were classified phytosoclologically by species composition and phsiognomy. There included 13 forests ranging from temperate-cool zone to sub-cold zone in the surveyed area. Actual vegetation map was drawn on the basis of classified forest communities. The forest communities classified in the area were summarized as follows ; 1. Querus serrata community 2. Carpinus laxiflora community 3. Q. serrata-C. laxiflora community 4. Stewartia koreana community 5. Acer mono community 6. Carpinus cordata community 7. Fraxinus mandshurica community 8. Carpinus tschonoskii community 9. Pinus densiflora community 10. Querus mongolica Community 1) Rhododendron schlippenachii subcommunity 2) Lenedeza maximowiczii subcommunity 11. Abies nephrolepis community 12. Abies koreana community 1) Querus mongolica subcommunity 2) Pinus koraienis subcommunity 13. Rhododendron schlippenbachii community Among above forest communities, Querus serrata community distributed from 700m to 1,000m in the ridges, Carpinus laxiflora community in the valleys, Quercus mongolica community from 1,000m to 1,400m, and Abies koreana community and Abies nephrolepis community from 1,400m to 1,700m.

  • PDF

Modified Sequential Algorithm schema for Efficient Digital Image retrieval (Modified Sequential Algorithmic Schema를 이용한 디지털 사진의 효율적인 분류)

  • Lee, Sang-Lyn
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.237-240
    • /
    • 2007
  • 이 논문에서는 수정된 Sequential Algorithmic Schema를 이용해서 여러 장소를 이동하면서 찍은 디지털 이미지를 효율적으로 분류할 수 있는 방법을 제안한다. 제안하는 방법은 이웃 패턴들과 특징 정보의 연속성, 유사성을 가지며 들어오는 입력 패턴에 대해 기존의 모든 군집과 유사도를 비교하는 방법이 아니라 이전 군집의 정보와 유사도를 비교하여 군집에 포함시키거나 동적으로 군집을 생성하는 효율적인 군집화 방법이다. 제안한 방법은 실험을 통해서 기존의 군집화 기법에 성능 및 속도의 효율성을 증명하였다.

  • PDF