• 제목/요약/키워드: K-means Cluster Analysis

검색결과 370건 처리시간 0.025초

Bootstrapping of Hanwoo Chromosome17 Based on BMS1167 Microsatellite Locus

  • Lee, Jea-Young;Lee, Yong-Won;Yeo, Jung-Sou
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.175-184
    • /
    • 2007
  • LOD scores and a permutation test for detecting and locating quantitative trait loci (QTL) from the Hanwoo economic trait have been described and we selected a considerable major BMS1167 locus for further analysis. K-means clustering analysis, for the major DNA marker mining of BMS1167 microsatellite loci in Hanwoo chromosome17, has been tried and three cluster groups divide four traits. The three cluster groups are classified according to eight DNA marker bps. Finally, we employed the bootstrap test method to calculate confidence intervals using the resampling method to find major DNA markers. We conclude that the major marker of BMS1167 locus in Hanwoo chromosome17 is only DNA marker 100bp.

  • PDF

ITO 이행단계 성공요인에 대한 가치체계모형 연구 (Value Structure Model of the Success Factor of ITO Transition)

  • 차환주;김자희
    • 한국경영과학회지
    • /
    • 제41권1호
    • /
    • pp.21-39
    • /
    • 2016
  • Although the demand for IT outsourcing (ITO) has increased recently because of the recent recession, concerns about business discontinuity in the transition phase cause companies to hesitate to adopt ITO. Therefore, a guideline to improve the prospects is needed. However, studies on the success factors of the transition phase in ITO are lacking. In this study, we develop an expert hierarchical value map (HVM) of the success of the transition phase in ITO by using cognition scientific methodologies. We empirically verify how success factors affect the success of the transition phase. Specifically, we derive an HVM of main stakeholders by using in-depth interviews and approaches, such as repertory grid technique (RGT) and laddering, based on means-end chain theory. We validate the success factors empirically through a bipolar analysis of RGT. Finally, we determine the most important cluster of success factors through cluster analysis.

일반국도 도로특성분류를 위한 통계적 군집분석과 Kohonen Self-Organizing Maps의 비교연구 (A Comparative Study on Statistical Clustering Methods and Kohonen Self-Organizing Maps for Highway Characteristic Classification of National Highway)

  • 조준한;김성호
    • 대한토목학회논문집
    • /
    • 제29권3D호
    • /
    • pp.347-356
    • /
    • 2009
  • 본 연구는 기존의 도로기능분류 정의와 방법론을 벗어나 교통특성에 따른 도로분류 방법론인 도로특성분류를 기초로 분석을 수행하였다. 도로특성분류에 대한 일련의 과정 중에서 다양한 교통특성을 반영하는 설명변수를 기초로 요인점수를 산출하고, 동질한 도로구간을 그룹핑하는 군집화 분석과정과 적정 군집수 도출에 따른 군집결과비교에 본 연구는 초점을 맞추었다. 도로분류를 위해 병합적 계층 군집분석인 Ward법, 비계층적 군집분석인 K-means법, 자율신경 회로망을 이용한 K-SOM을 사용하여 비교분석하였다. 각 군집기법에 대한 결과를 토대로 비교분석한 결과, 군집 수 5 이하에서는 K-means법, 군집 수 14 이상에서는 Kohonen selforganizing maps가 가장 우수한 것으로 나타났으며, 군집수 5~9사이에서는 Ward법과 Kmeans법의 군집 성능이 불규칙한 패턴을 보임에 따라 세밀한 결과분석을 통해 우수성을 결정하는 것이 바람직할 것으로 분석되었다. 본 연구결과는 다양한 교통특성을 고려한 도로구간의 군집 속성을 분석하고 예측하는 분류화 작업에 중요한 기초적인 자료로 사용될 것으로 기대된다.

군집분석을 이용한 우리나라 가뭄특성의 공간적 분석 (Spatial Analysis of Drought Characteristics in Korea Using Cluster Analysis)

  • 유지영;최민하;김태웅
    • 한국수자원학회논문집
    • /
    • 제43권1호
    • /
    • pp.15-24
    • /
    • 2010
  • 최근에는 확률강우량을 산정할 경우 지점빈도해석의 단점을 보완한 지역빈도해석법이 자주 실무에 적용되고 있으나, 가뭄에 관련한 연구에서는 대부분 아직까지 지점자료를 이용한 가뭄분석을 실시하고 있다. 본 연구에서는 가뭄의 지역적 특성 분석을 실시하기 위하여 필요한 동질한 가뭄특성을 지닌 지역을 구분하는 연구를 수행하였다. 본 연구에서는 기상청 강우관측 지점자료 중 30년 이상의 강우자료를 보유한 58개의 관측지점을 대상으로 표준강수지수(SPI)를 산정하여 가뭄의 심도, 지속기간, 강도, 발생빈도 등과 같은 가뭄특성인자를 생성하였다. 가뭄특성인자는 수문학적으로 동질한 특성을 지닌 지역을 구분하는데 중요한 정보를 제공한다. 본 연구에서는 다양한 가뭄특성인자를 효율적으로 활용하여 K-means 기법을 적용한 군집분석을 실시하여 동질한 가뭄특성을 지닌 지역을 6개 지역으로 구분하였다. 이러한 지역구분은 가뭄 특성의 공간적 해석을 가능하게 할 수 있고, 지점빈도 해석의 단점을 보완하는 지역빈도 해석도 가능하게 할 수 있다.

공간 밀도분석을 이용한 재정비 대상지 탐색에 관한 연구 (A Study on Exploring Urban Renewal Areas Using Spatial Density Analysis)

  • 김기중;고승욱;성진욱
    • 토지주택연구
    • /
    • 제14권2호
    • /
    • pp.35-50
    • /
    • 2023
  • 정비사업에 있어 공공의 역할이 강조되고 있는 상황에서 객관적으로 정비사업이 필요한 지역을 선제적으로 살펴보는 것은 매우 중요하다. 이 연구의 목적은 공간데이터를 활용하여 재정비가 필요한 지역을 탐색하고, 재정비 대상지 유형화 및 특성을 분석하는 것이다. 이를 달성하기 위해 공간데이터를 사용하여 커널밀도함수와 K-means 군집분석을 수행하였고, 재정비 대상지역 발굴 방법을 모색하였다. 주요연구결과 및 시사점을 요약하면 다음과 같다. 첫째, 개발 용적비와 노후도 지표를 기준으로 서울시 전역에 걸쳐 587개 재정비 대상지를 구획하였으며, 선도사업·신속통합기획 후보지 비교결과 절반 정도 일치성을 확인하였다. 둘째, 재정비 대상지는 공공에서 지정한 선도사업 후보지에 비하여 상대적으로 주거환경이 열악하였다. 셋째, 재정비 대상지는 통계적으로 뚜렷하게 유형화되지 않았으며, 사업요건별 유형화의 타당성을 확인하였다.

Anomalous Pattern Analysis of Large-Scale Logs with Spark Cluster Environment

  • Sion Min;Youyang Kim;Byungchul Tak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.127-136
    • /
    • 2024
  • 본 연구는 Spark 클러스터 환경에서 대용량 로그를 분석하여 시스템 이상과의 연관성을 탐색한다. 로그를 활용한 이상 감지 연구는 증가하고 있으나, 클러스터의 다양한 컴포넌트의 로그를 충분히 활용하지 못하고 이상과 시스템의 연관성을 고려하지 않는다는 한계가 있다. 따라서 본 논문에서는 정상과 비정상 로그의 분포를 분석하고, 로그 템플릿의 출현 여부를 통해 이상 감지 가능성을 탐색한다. Hadoop과 Spark를 활용하여 정상과 비정상 로그 데이터를 생성하고, t-SNE와 K-means 클러스터링을 통해 비정상 상황에서의 로그 템플릿을 찾아 이상 현상을 파악한다. 결과적으로, 비정상 상황에서만 발생하는 고유한 로그 템플릿을 확인하며 이를 통해 이상 현상 감지의 가능성을 제시한다.

CLUSTER ANALYSIS FOR REGION ELECTRIC LOAD FORECASTING SYSTEM

  • Park, Hong-Kyu;Kim, Young-Il;Park, Jin-Hyoung;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.591-593
    • /
    • 2007
  • This paper is to cluster the AMR (Automatic Meter Reading) data. The load survey system has been applied to record the power consumption of sampling the contract assortment in KEPRI AMR. The effect of the contract assortment change to the customer power consumption is determined by executing the clustering on the load survey results. We can supply the power to customer according to usage to the analysis cluster. The Korea a class of the electricity supply type is less than other country. Because of the Korea electricity markets exists one electricity provider. Need to further divide of electricity supply type for more efficient supply. We are found pattern that is different from supplied type to customer. Out experiment use the Clementine which data mining tools.

  • PDF

관광객의 갓김치에 대한 선호도에 미치는 영향요인 평가 (Measuring the Factor Influencing Tourist Preferences for Leaf Mustard Kimchi)

  • 정항진;강종헌
    • 한국식생활문화학회지
    • /
    • 제21권4호
    • /
    • pp.414-419
    • /
    • 2006
  • The purpose of this study was to measure the factor influencing tourist preferences for leaf mustard iimchi. Among 250 questionnaires, 230 questionnaires were utilized for the analysis. Frequencies, conjoint model, max. utility model, BTL model, Logit model, K-means cluster analysis, and one-way ANOVA analysis were used for this study. The findings from this study were as follows. First, the Pearson's R and Kendall's tau statistics showed that the model fitted the data well. Second, it was found that total respondents and three clusters regarded taste and price as the very important factor. Third, it was found that the first cluster most preferred product with light red color, plain package, and mild taste sold at a cheap price in factory. The second cluster most preferred product with light red color, plain package, and moderately pungent taste sold at a expensive price in factory. The third cluster most preferred product with dark red color, shaped package, and highly pungent taste sold at a cheap price in factory. Fourth, it was found that the first cluster most preferred simulation product with light red color, shaped package, and mild taste sold at a cheap price in factory. The second cluster most preferred simulation product with light red color, shaped package, and moderately pungent taste sold at a cheap price in factory. The third clutter most preferred simulation product with dark red color, shaped package, and highly pungent taste sold at a cheap price in factory.

Classification of Lower Body Types of Female Adults aged 18 to 69 based on 3D Body Scan Data - Focusing on the Front Type, Lateral-Front Type, and Lateral-Back Type -

  • Kim, Min Kyoung;Nam, Yun Ja
    • 한국의류산업학회지
    • /
    • 제18권1호
    • /
    • pp.91-102
    • /
    • 2016
  • This study classified the lower body types of female adults aged 18 to 69. The lower body was divided into front, lateral front, and lateral back. In order to understand the shape and somatotype of each segment, 592 people were analyzed based on girth, height, length, depth, width, angle and cross section distance for each segment. For data analysis, SPSS 18.0 was performed for descriptive statics, principal component analysis, K-means cluster analysis, ANOVA, and Duncan's test (as verification). Factor analysis was performed based on index values, calculation values, angles, and cross section distances. The measured items resulted in a.) 16 items were extracted to 5 factors in the case of the front factor (FF) of the lower body, and b.) 24 items were extracted to 6 factors in the case of lateral front factor (LFF) and lateral back factor (LBF). Each factor was put through K-means cluster analysis, classifying the lower bodies into one of four types of based on the front type (FT), the lateral front type (LFT), and the lateral back type (LBT) respectively. This study proposed an understanding of various lower body shapes by segmenting and classifying the lower body shapes for each type.

분포 통계 해석에 의한 계면 결함 부분방전 진단 (Partial Discharge Diagnosis of Interface Defect by the Distribution Statistical Analysis)

  • 조경순;이강원;김원종;홍진웅;신종열
    • 한국전기전자재료학회논문지
    • /
    • 제21권4호
    • /
    • pp.348-353
    • /
    • 2008
  • Most of the high voltage insulation systems, such as the power cable joint having hetero interface, are composed of more than two different insulators to improve insulating performance. The partial discharge(PD) in these hetero interface is expected to affect the total insulation performance. Thus, it is important to study electrical properties on these interfaces. This study described the influence of copper and semiconductive substance defects on $\Phi$-q-n distribution between the interface of the model cable joints to classify PD source. PD was sequentially detected for 600 cycles of the applied voltage. The K-means cluster analysis has been analyzed to investigate the $\Phi$-q-n distribution. The skewness-kurtosis(Sk-Ku) plot from K-means clustering results was defined to quantify cluster distribution and classify distribution patterns. The Sk-Ku plot is composed of skewness and kurtosis along abscissa and ordinate which indicate the asymmetry and the sharpness of distribution. As a result of the Sk-Ku plot, it was confirmed that the data was distributed in 1st 2nd and 3rd quadrant at copper foreign substance defect, but in case of semiconductive foreign substance, the data was distributed in 2nd quadrant only.