• 제목/요약/키워드: K-mean Cluster Analysis

검색결과 304건 처리시간 0.092초

클러스터 분석을 통한 종관기단분류 및 서울에서의 일 사망률과의 관련성 연구 (Synoptic Air Mass Classification Using Cluster Analysis and Relation to Daily Mortality in Seoul, South Korea)

  • 김지영;이대근;최병철;박일수
    • 대기
    • /
    • 제17권1호
    • /
    • pp.45-53
    • /
    • 2007
  • In order to investigate the impacts of heat wave on human health, cluster analysis of meteorological elements (e.g., temperature, dewpoint, sea level pressure, visibility, cloud amount, and wind components) for identifying offensive synoptic air masses is employed. Meteorological data at Seoul during the past 30 years are used. The daily death data at Seoul are also employed. Occurrence frequency of heat waves which is defined by daily maximum temperature greater than the threshold temperature (i.e., $31.2^{\circ}C$) was analyzed. The result shows that the frequency and duration of heat waves at Seoul are increasing during the past 30 years. In addition, the increasing trend of the frequency and duration clearly appears in late spring and early autumn as well as summer. Factor analysis shows that 65.1% of the total variance can be explained by 4 components which are linearly independent. Eight clusters (or synoptic air masses) were classified and found to be optimal for representing the summertime air masses at Seoul, Korea. The results exhibit that cluster-mean values of meteorological variables of an offensive air mass (or cluster) are closely correlated with the observed and standardized deaths.

A Benthic Polychaete Assemblage off the Korean South Coast(Gwangyang Bay and Yeosu Sound)

  • Kim, Yong-Hyun;Shin, Hyun-Chool
    • Fisheries and Aquatic Sciences
    • /
    • 제13권2호
    • /
    • pp.157-166
    • /
    • 2010
  • We investigated the benthic polychaete assemblage in Gwangyang Bay and Yeosu Sound in February 1997. The sediment was an almost entirely muddy facies. The benthic macrofauna comprised 295 species occurring at a mean density of 875 $indiv./m^2$. Polychaetes were the major faunal component; there were 94 species at mean density 765 $indiv./m^2$. The highest abundance and species richness occurred in the Myodo south and north channels, in the mouth of Gwangyang Bay, and in the Noryang channel mouth. The most abundant polychaete was Tharyx sp. (47.9%), followed in rank order by Heteromastus filiformis (9.6%), Melinna cristata (9.3%), and Lumbrineris longifolia (7.3%). Cluster analysis divided the study area into four station groups based on station similarities in benthic polychaete assemblages: the Glycinde-Prionospio cluster in the western inner bay, the H. filiformis cluster in the middle inner bay, the Melinna-Lumbrineris cluster in the Myodo south-north channel, and the Tharyx cluster in the eastern main channel region. The sediment type of Gwangyang Bay has changed gradually from sandy to muddy. Dominant species have also changed from Chone teres and Lagis bocki to Tharyx sp., which is a potential organic pollution indicator.

낙동강 중류 지역의 통합적 유역환경평가 및 유형화 (An Integrated Watershed Environmental Assessment and Classification of the Mid-Nakdong River Region)

  • 정성관;박경훈
    • 환경영향평가
    • /
    • 제13권3호
    • /
    • pp.137-151
    • /
    • 2004
  • Many of today's environmental problems are regional in scope and their effects overlap and interact. The purpose of this paper is to developed a simple method for an integrated assessment of environmental conditions across the Mid-Nakdong River Region, by combining data on land use, impervious cover, roads, streams, riparian areas, forest patches, population, pollutant loadings, soil erosion and topography. A cluster analysis was used to identify groups of sub-watersheds with similar environmental characteristics. The mean value for each group was used to find watershed that may be more vulnerable to future environmental degradation. Watersheds in cluster I and II had high amount of forest, but the amount of riparian vegetation was low. Watersheds in cluster III, which located in the middle Geumho River and the main course of Nakdong River, had a greater proportion of their agriculture, a greater proportion of agriculture on steep slopes, and less forest adjacent to streams. Watersheds in cluster IV and V were in the most urbanized areas of the region. The principal adverse impacts for watersheds in this group were high scores for urban area, impervious cover, pollutant loadings, population density, forest fragmentation, and low amounts of forest and riparian forest cover. Notwithstanding the exploratory nature of cluster analysis, it appears to be a useful tool for grouping watersheds with similar environmental characteristics.

반려동물 사료 추천시스템을 위한 유사성 측정 알고리즘에 대한 연구 (A Study of Similarity Measure Algorithms for Recomendation System about the PET Food)

  • 김삼택
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.159-164
    • /
    • 2019
  • ICT 기술 발전으로 강아지와 고양이등 반려동물 돌보기와 건강에 대한 관심도가 높아지고 있다. 본 논문에서는 반려동물 산업의 다양한 분야에 활용될 수 있도록 반려동물 사료의 성분 데이터를 기반으로 군집분석을 수행하고 적합한 서비스에 대해 고찰한다. 군집분석을 위해 시중에서 유통되고 있는 300여 개의 강아지 및 고양이 펫푸드를 대상으로 성분별 상관관계를 분석하여 유사성을 측정하며, Hierarchical, K-Means, Partitioning around medoids(PAM), Density-based, Mean-Shift 등의 다양한 클러스터링 기법을 활용하여 군집화 하여 분석한다. 또한 반려동물의 개인화 추천시스템도 제안한다. 본 논문의 연구 결과는 반려동물을 대상으로 한 사료 추천시스템 등의 맞춤형 개인화 서비스에 활용할 수 있다.

지형적 특성에 따른 월악산 신갈나무의 연륜생장과 기후와의 관계 (Relationships between Climate and Tree-Ring Growths of Mongolian Oaks with Various Topographical Characteristics in Mt. Worak, Korea)

  • 서정욱;박원규
    • 한국환경복원기술학회지
    • /
    • 제13권3호
    • /
    • pp.36-45
    • /
    • 2010
  • To analyze the relationship between climatic factors (monthly mean temperature and total precipitation) and tree-ring growths of Quercus mongolica Fischer (Mongolian oak) with different topographic sites in Mt. Worak, more than 10 trees were selected from each of seven stands. Two cores from each tree were measured for ring width. After crossdating, each ring-width series was double standardized by fitting first a negative exponential or straight regression line and secondly a 60-year cubic spline. Seven stands were categorized in two groups using cluster analysis for tree-ring index patterns. Cluster I (four stands) was located in higher elevation (550-812 m) with aspects of east, west and northwest, and cluster II (three stands) was located in rather lower election (330-628 m) with aspects of north and northwest. The aspects of two clusters were not significantly different. Response-function analysis showed a significant positive response to March precipitation for both clusters. It indicates that moisture supply during early spring season is important to radial growth because the cambial growths of ring-porous species, such as Mongolian oak, start before leaf growth. Cluster II showed a positive response to the precipitation of middle and late growing season, too.

확률적 reduced K-means 군집분석 (Probabilistic reduced K-means cluster analysis)

  • 이승훈;송주원
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.905-922
    • /
    • 2021
  • 라벨 없이 진행되는 비지도 학습 중 하나인 군집분석은 자료에 어떤 그룹이 내포되어 있는지 사전 지식이 없을 경우에 군집을 발굴하고, 군집 간의 특성 차이와 군집 안에서의 유사성을 분석하고자 할 때 유용한 방법이다. 기본적인 군집분석 중 하나인 K-means 방법은 변수의 개수가 많아질 때 잘 동작하지 않을 수 있으며, 군집에 대한 해석도 쉽지 않은 문제가 있다. 따라서 고차원 자료의 경우 주성분 분석과 같은 차원 축소 방법을 사용하여 변수의 개수를 줄인 후에 K-means 군집분석을 행하는 Tandem 군집분석이 제안되었다. 하지만 차원 축소 방법을 이용해서 찾아낸 축소 차원이 반드시 군집에 대한 구조를 잘 반영할 것이라는 보장은 없다. 특히 군집의 구조와는 상관없는 변수들의 분산 또는 공분산이 클 때, 주성분 분석을 통한 차원 축소는 오히려 군집의 구조를 가릴 수 있다. 이에 따라 군집분석과 차원 축소를 동시에 진행하는 방법들이 제안되어 왔다. 그 중에서도 본 연구에서는 De Soete와 Carroll (1994)이 제안한 방법론을 확률적인 모형으로 바꿔 군집분석을 진행하는 확률적 reduced K-means를 제안한다. 모의실험 결과 차원 축소를 배제한 군집분석과 Tandem 군집분석보다 더 좋은 군집을 형성함을 알 수 있었고 군집 당 표본 크기에 비해 변수의 개수가 많은 자료에서 기존의 비 확률적 reduced K-means 군집분석에 비해 우수한 성능을 확인했다. 보스턴 자료에서는 다른 군집분석 방법론보다 명확한 군집이 형성됨을 확인했다.

Improvement of location positioning using KNN, Local Map Classification and Bayes Filter for indoor location recognition system

  • Oh, Seung-Hoon;Maeng, Ju-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.29-35
    • /
    • 2021
  • 본 논문에서는 위치 측위의 정확도를 높일 수 있는 방안으로 KNN(K-Nearest Neighbor)과 Local Map Classification 및 Bayes Filter를 융합한 기법을 제안한다. 먼저 이 기법은 Local Map Classification이 실제 지도를 여러 개의 Cluster로 나누고, 다음으로 KNN으로 Cluster들을 분류한다. 그리고 Bayes Filter가 획득한 각 Cluster의 확률을 통하여 Posterior Probability을 계산한다. 이 Posterior Probability으로 로봇이 위치한 Cluster를 검색한다. 성능 평가를 위하여 KNN과 Local Map Classification 및 Bayes Filter을 적용하여서 얻은 위치 측위의 결과를 분석하였다. 분석 결과로 RSSI 신호가 변하더라도 위치 정보는 한 Cluster에 고정되면서 위치 측위의 정확도가 높아진다는 사실을 확인하였다.

K-means 클러스터링을 이용한 케이블 접속재 계면결함의 부분방전 분포 해석 (Partial Discharge Distribution Analysis on Interlace Defects of Cable Joint using K-means Clustering)

  • 조경순;홍진웅
    • 한국전기전자재료학회논문지
    • /
    • 제20권11호
    • /
    • pp.959-964
    • /
    • 2007
  • To investigate the influence of partial discharge(PD) distribution characteristics due to various defects on the power cable joints interface, we used the K-means clustering method. As the result of PD number(n) distribution analyzing on $\Phi-n$ graph, the phase angle($\Phi$) of cluster centroid shifted to $0^{\circ}\;and\;180^{\circ}$ increasing with applying voltage. It was confirmed that the PD quantify(q) and euclidean distance of centroid were increased with applying voltage from the centroid distribution analyzing of $\Phi-q$ plane. The dispersion degree was increased with calculated standard deviation of the $\Phi-q$ cluster centroid. The PD number and mean value on $\Phi-q$ graph were some different by electric field concentration with defect types.

K-평균법을 이용한 고속도로 사고분석구간 분할기법 개발 (Selecting Technique of Accident Sections using K-mean Method)

  • 이기영;장명순
    • 한국도로학회논문집
    • /
    • 제7권4호
    • /
    • pp.211-219
    • /
    • 2005
  • 교통사고 분석구간 선정은 유사한 사고유형을 하나의 동일집단으로 처리함으로써 분석의 효율성을 높이고, 효과적인 개선 사업을 위해 그 순위를 결정하는데 필요한 작업이다. 기존에는 도로이정에 기초하여 균등하게 분할하는 방법을 주로 사용하여 왔는데 사고간의 유사성을 전혀 고려하지 못하는 단점이 있다. 따라서 최근 도로이정보다는 사고간의 유사성을 고려하여 구간을 선정하는 방식인 Slider length 적용기법이 사용되고 있다. 본 연구에서는 Slider length 적용기법의 한 방법론으로써, 군집분석에 사용되는 비계층적 분류기법인 K-평균법을 사용하여 가장 인근거리에 발생된 사고들이 최대한 하나의 집단으로 분류될 수 있는 기법을 제시하고자 한다. 또한 이의 검증을 위해 경부고속도로 부산방향으로 총연장 25.6km구간에 대하여 균일간격에 의한 분할방식과 K-평균법을 이용한 분할방식에 대해 상호 비교를 통해 그 효율성을 검토하였으며, K-평균법이 사고의 유사성이나 인접성을 감안하여 효율적으로 분석구간 선정에 적용될 수 있음을 검증하였다.

  • PDF

인위적 데이터를 이용한 군집분석 프로그램간의 비교에 대한 연구

  • 김성호;백승익
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.35-49
    • /
    • 2001
  • 인터넷 비즈니스나 전자상거래와 연관되어 고객관계관리(Customer Relationship management :CRM)에 대한 관심이 널리 확산됨으로 해서 군집분석에 대한 관심이 한층 높아졌고, 다양한 군집분석 프로그램이 시장에 소개되어 지고 있다. 그런, 군집분석 프로그램들은 다른 데이터 분석 기법과는 달리 그들의 성능을 측정하기가 매우 힘들다. 본 논문에서는 이미 알려져 있는 군집구조를 지닌 인위적 데이터를 사용하여 다양한 군집분석 프로그램을 평가할 수 있는 하나의 방법론을 제시하고, 그 방법론의 유용성을 보여 주기 위해 현재 많이 사용하고 있는 네 가지의 군집분석 프로그램을 본 논문에서 제시한 방법론을 사용하여 평가하는데 그 주요 목적을 두고 있다. 본 연구에서 두 가지의 반복적 군집분석 프로그램(Convergent Cluster Analysis:CCA, SPSS의 Clementine), 전통적인 단순군집 프로그램(One-Shot Clustering Program: Howard-Harris 프로그램), 그리고 IBM의 데이터 마이닝 기법 중 하나인 데모그래픽 군집분석 프로그램의 성능을 비교한 결과, 군집분석을 위하여 다른 군집분석 방법 보다 좀 더 지능적으로 초기치를 생성한 CCA방법이 가장 우월한 성능을 보여 주었다.

  • PDF