• 제목/요약/키워드: K-평균 군집법

검색결과 63건 처리시간 0.023초

K-Means 군집모형과 계층적 군집(교차효율성 메트릭스에 의한 평균연결법, Ward법)모형 및 혼합모형을 이용한 컨테이너항만의 클러스터링 측정에 대한 실증적 비교 및 검증에 관한 연구 (An Empirical Comparison and Verification Study on the Containerports Clustering Measurement Using K-Means and Hierarchical Clustering(Average Linkage Method Using Cross-Efficiency Metrics, and Ward Method) and Mixed Models)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제34권3호
    • /
    • pp.17-52
    • /
    • 2018
  • 본 논문에서는 K-Means 군집모형과 계층적 군집모형, 혼합모형으로, 아시아 38개 컨테이너항만 들의 2006년부터 2015년까지의 자료와 선석길이, 수심, 총면적, 크레인 수를 투입물, 컨테이너화물처리량을 산출물로 하여 국내대표 컨테이너항만 들(부산, 인천, 광양항)이 클러스터링 해야만 하는 항만들을 적출해 내는 측정방법을 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 10년간의 자료를 이용한 분석에서 클러스터링 후의 효율성 증가폭이 큰 순서대로 살펴보면 평균연결법[average linkage(AL)]은 42.04% 상승, Mixed Ward는 35.01% 상승, 경험법칙[rule of thumb(RT)]&Elbow는 30.47% 상승, Ward는23.65% 상승, Mixed AL는 23.25% 상승의 순서였다. 둘째, RT와 Elbow모형에 의한 국내항만들의 클러스터링을 살펴보면 (1)부산항은 두바이, 홍콩, 광저우, 칭타오, 포트 클랑, 싱가포르, 림찬방 (2)인천항은 하이파, 포트슐탄 카부스, 담만, 크호르 파칸, 탄중프리옥, 탄중퍼락, 동경, 나고야, 오사카, 카라치, 오아심, 마닐라, 다바오, 콜롬보, 킬롱, 방콕, (3)광양항은 아카바, 크호르 파칸, 광정우, 닝보, 칭타오, 포트 클랑, 카오슝, 림찬방 항과 클러스터링 해야만 하는 것으로 나타났다. 셋째, 최적 군집 수를 살펴보면 AL(6개), Mixed Ward(5개), RT&ELBOW (4개), Ward(5개), Mixed AL(6개)가 최적 군집 수인 것으로 나타났다. 넷째, 전문가 그룹에 의해서 선호되는 항만들과 본 실증분석결과에 의해서 도출된 국내항만들의 클러스터링 되는 항만들과의 일치성 여부는 부산항은 80%, 인천항은 17%, 광양항은 50%수준에서 일치하는 것으로 검증되었다. 본 논문이 제안하고 있는 정책적인 측면의 의미는 첫째, 항만정책입안자, 항만운영관리자들이 본 연구에서 사용한 모형들을 항만의 클러스터링에 도입하여 벤치마킹항만들을 선정해야만 한다. 둘째, 실증분석의 결과로서 도출된, 국내항만들의 참조항만, 클러스터링항만들에 대하여, 그들 항만들의 항만개발, 운영방안 등에 대한 내용을 비교 분석하고 벤치마킹이 필요한 부분은 신속하게 도입하여 실시하는 것이 필요하다는 점이다.

극치강수량의 시공간적 특성을 이용한 지역빈도분석 (Regionalization of Extreme Rainfall with Spatio-Temporal Pattern)

  • 이정주;권현한;김병식;윤석영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1429-1433
    • /
    • 2010
  • 수공구조물의 설계, 수자원 관리계획의 수립, 재해영향 검토 등을 수행할 때, 재현기간에 따른 확률개념의 강우량, 홍수량, 저수량 등을 산정하여 사용하게 되며, 보통 대상지역의 장기 수문관측 자료를 이용하여 수문사상의 확률분포를 산정한 후 재현기간을 연장하여 원하는 설계빈도에 해당하는 양을 추정하게 된다. 미계측지역 또는 관측자료의 보유기간이 짧은 지역의 경우는 지역빈도 분석 결과를 이용하게 된다. 지역빈도해석을 위해서는 강우자료들의 동질성을 파악하는 것이 가장 기본적인 과정이 되며 이를 위해 통계학적인 범주화분석이 선행되어야 한다. 지점 빈도분석의 수문학적 동질성 판별을 위해 L-moment 방법, K-means 방법에 의한 군집분석 등이 주로 사용되며 관측소 위치좌표를 이용한 공간보간법을 적용하여 시각화하고 있다. 강수량은 시공간적으로 변하는 수문변량으로서 강수량의 시간적인 특성 또한 강수량의 특성을 정의하는데 매우 중요한 요소이다. 이러한 점에서 본 연구를 통해 강수지점의 공간적인 좌표 및 강수량의 양적인 범주화에 초점을 맞춘 기존 지역빈도분석의 범주화 과정에 덧붙여 시간적인 영향을 고려할 수 있는 요소들을 결정하고 이를 활용할 수 있는 범주화 과정을 제시하고자 한다. 즉, 극치강수량의 발생 시기에 대한 정량적인 분석이 가능한 순환통계기법을 이용하여 관측 지점별 시간 통계량을 산정하고, 이를 극치강수량과 결합하여 시 공간적인 특성자료를 생성한 후 이를 이용한 군집화 해석 모형을 개발하는데 연구의 목적이 있다. 분석 과정에 있어서 시간속성의 정량화 및 일반화는 순환통계기법을 사용하였으며, 극치강수량과 발생시점의 속성자료는 각각의 평균과 표준편차를 이용하였다. K-means 알고리즘을 이용해 결합자료를 군집화 하고, L-moment 방법으로 지역화 결과에 대한 검증을 수행하였다. 속성 결합 자료의 군집화 효과는 모의데이터 실험을 통해 확인하였으며, 우리 나라의 58개 기상관측소 자료를 이용하여 분석을 수행하였다. 예비해석 단계에서 100회의 군집분석을 통해 평균적인 centroid를 산정하고, 해당 값을 본 해석의 초기 centroid로 지정하여, 변동적인 클러스터링 경향을 안정화시켜 해석이 반복됨에 따라 군집화 결과가 달라지는 오류를 방지하였다. 또한 K-means 방법으로 계산된 군집별 공간거리 합의 크기에 따라 군집번호를 부여함으로써 군집의 번호순서대로 물리적인 연관성이 인접하도록 설정하였으며, 군집간의 경계선을 추출할 때 발생할 수 있는 오류를 방지하였다. 지역빈도분석 결과는 3차원 Spline 기법으로 도시하였다.

  • PDF

군집분석을 통한 풍력자원 수평 공간 분포의 연직 변화에 관한 연구 (Study on vertical variation of horizontal wind energy resources distribution using clustering analysis)

  • 김민정;이화운;이순환;김동혁;정우식;김현구
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2009년도 춘계학술대회 논문집
    • /
    • pp.554-556
    • /
    • 2009
  • Wind classification for exact estimation of wind energy resources was carried out using numerically simulated wind data for three years. The MM5(a fifth-generation Mesoscale Model), developed at Penn State University and the National Center for Atmospheric Research (NCAR), was used to estimate the wind fields in this study. We also use a variant of the K-mean clustering to classify the wind district and define the relation between districts. Wind estimated at surface and 100 m high at Busan area is classified into the 10 and 7 classes, respectively. These discrepancies of wind districts pattern at surface and upper air meteorological data indicates the quantity of wind resources can be changed according to the level of wind data used in estimation. Therefore, the estimation of wind district classification by reasonable wind data is utilized to build the effective policy for wind energy dissemination.

  • PDF

한반도 주변 1000-hPa 고도장의 군집분석 (Cluster Analysis of the 1000-hPa Height Field around the Korean Peninsula)

  • 정영근
    • 한국지구과학회지
    • /
    • 제33권4호
    • /
    • pp.337-349
    • /
    • 2012
  • 본 연구에서는 1000 hPa면 고도 자료 및 K-평균 군집분석법을 활용하여 한반도 주변 기압배치를 분류하고, 각 유형의 특성을 조사하였다. 군집의 기준으로 기압배치 공간 형태의 유사성을 나타내는 패턴 상관계수를 사용하고, 유사성의 경계치로 0.8을 적용하여 대표적 기압배치 유형 11개를 얻었다. 이들은 시베리아 기단이 한반도 주변으로 장출하는 경로에 따라 3개, 북태평양 고기압의 중심 위치에 따라 3개, 시베리아 및 북태평양 기단의 영향권에서 기압골이 나타나는 유형 2개, 그리고 봄가을에 주로 나타나는 이동성 고기압형으로 고기압의 장축방향에 따라 3개 등이다. 각 기압 배치 유형의 출현빈도로부터 추정한 한반도에 영향을 주는 기단의 출현비율은 시베리아 기단 55.4%, 북태평양 기단 29.3%, 양쯔강 기단 12.8%, 오호츠크해 기단 2.5% 순이며, 한반도는 대륙에서 기원한 기단의 영향이 68.2%로 지배적이다. 한반도 주변 기압계는 겨울 기압배치 유형과 여름 기압배치 유형이 각기 대륙과 해양에 발달하는 정체성 기단으로부터 확장되는 고기압을 중심으로 하여 대조적으로 출현하고, 봄가을의 이동성 고기압형은 이들의 변환 과정에서 나타난다. 근래 여름 북태평양 고기압의 한반도 출현빈도가 감소하고 있다. 그리고 겨울 기압배치 유형의 출현이 봄가을에 자주 나타나면서 기압골을 갖는 기압배치 유형의 출현빈도가 증가하고, 이동성 고기압형은 거의 모든 계절에 나타나는 경향이 있다.

기온과 강수특성을 고려한 남한의 기후지역구분 (Classification of Climate Zones in South Korea Considering both Air Temperature and Rainfall)

  • 박창용;최영은;문자연;윤원태
    • 대한지리학회지
    • /
    • 제44권1호
    • /
    • pp.1-16
    • /
    • 2009
  • 본 연구에서는 기온과 강수특성을 함께 고려하여 남한의 기후지역을 구분하였다. 먼저 계절별 기온 및 강수량 분포를 살펴보았는데, 기온은 모든 계절에서 지형 및 위도에 의해 영향을 받았다. 강수량은 여름철에 집중되고 지역적으로는 강원 영동, 남해안, 제주에서 많았고 경북 중부지역에서 적은 분포를 보였다. 기온 및 강수량의 경험적 직교함수(Empirical Orthogonal Function)분석을 통해서 산출된 주성분점수를 입력변수로 하여 평균연결법과 Ward법을 이용한 군집분석을 수행하였다. Ward법은 지형, 위도, 해양의 효과와 기압계 이동 방향에 따른 특성을 잘 반영하였으며 행정구역에도 잘 맞게 구분되어 가장 좋은 군집결과를 보여주었다.

횡성호 일대의 어류군집 동태 (Study on the Dynamics of the Fish Community in the Lake Hoengseong Region)

  • 최재석;신현선;박승철;최준길
    • 생태와환경
    • /
    • 제38권2호통권112호
    • /
    • pp.188-195
    • /
    • 2005
  • 2000년부터 2004년까지 5년간 횡성호 일대의 어류군집 동태를 조사한 결과는 다음과 같다. 조사기간동안 출현한 어류는 총 10과 39종이었으며 이 중 한국고유종은 Rhodeus pseudosericeus 등을 포함하여 총 17종 (43.59%) 이었다. 우점종은 Acheilognathus lanceolatus (20.10%), Zacco platypus (15.94%), Z. temmincki (6.92%), Carassius cuvieri (6.33%), A. rhombeus (6.18%), Pungtungia herzi (5.13%), Pseudorasbora parva (4.93) 등이었다. 조사시기별 출현종을 근거로 생활형에 따른 어류군집은 담수가 되면서 점차 저서성 어종의 수가 감소하였고 부유성 어종이 증가하는 것으로 나타났다. 또한 조사시기별 유사도 분석을 한 결과 각 조사시기는 비가중치 평균연결법 (UPGMA)에 의해 3개의 그룹으로 나누어졌다. 한편 다른 인공호와 본 조사의 어류상을 근거로 유사도 분석을 한 결과 수계에 따라 2개의 그룹으로 나누어졌으며 같은 수계 내에서 다시 3개의 그룹으로 나누어졌다. 이 중 횡성호 어류군집의 현재 상태는 북한강 중류의 춘천-청평호와 유사한 것으로 나타났다.

속리산국립공원 법주사지구 소나무림 식생천이와 식생관리 연구 (Vegetation Succession and Vegetation Management of the Pinus densiflora S. et Z. Forest in the Beopjusa Area, Songnisan National $Park^{1a}$)

  • 이경재;기경석;최진우
    • 한국환경생태학회지
    • /
    • 제23권2호
    • /
    • pp.208-219
    • /
    • 2009
  • 본 연구는 속리산국립공원 법주사 주변 소나무림을 대상으로 식생구조를 규명하고 17년간의 식생구조 변화를 비교 분석하여 소나무림의 보전관리방안 수립을 목적으로 하였다. 조사대상지는 속리산국립공원 법주사지구 내 속리산관리사무소$\sim$법주사지구의 $3.6km^2$이다. 현존식생 조사결과 전체면적 360ha중 소나무 우점림은 64.7%이었고 소나무-낙엽활엽수 혼효림이 3.2%로 주로 계곡 사면과 능선에 걸쳐 소나무림이 분포하고 있었고 계곡 토지이용지 주변은 소나무와 낙엽활엽수가 혼효된 지역이 산재하였다. 조사구별 평균 상대우점치에 의한 우점종의 구성으로 식생유형을 분류한 결과 천이잠재성이 낮은 소나무군집, 천이잠재성이 높은 소나무군집, 천이진행중인 소나무군집, 도태중인 소나무군집으로 구분할 수 있었다. 17년간 식생구조 변화 분석결과 소나무군집의 천이경향은 천이잠재성이 낮은 소나무군집(소나무 순림)$\rightarrow$천이 잠재성이 높은 소나무군집(아교목층에 낙엽활엽수가 우점하는 소나무림)$\rightarrow$천이진행 중인 소나무군집(소나무-산벚나무군집, 소나무-졸참나무군집)$\rightarrow$도태중인 소나무군집(졸참나무-소나무군집, 갈참나무-소나무군집)$\rightarrow$낙엽활엽수혼효군집으로 발달하는 것으로 파악되었다. 소나무림 식생관리 방안으로 천이잠재성이 높은 소나무군집은 아교목층 낙엽활엽수를 제거하는 적극적인 관리가 필요하며 천이진행중인 소나무군집은 교목층 낙엽활엽수 가치치기 정도의 소극적인 관리가 필요하였다. 도태되는 소나무군집은 소나무림이 유지되기 어려우므로 낙엽활엽수림으로 자연적인 천이가 될 수 있도록 유지하는 방안을 제시하였다.

요인 및 군집분석을 이용한 지상 라이다 자료의 분류 (Classification of Terrestrial LiDAR Data Using Factor and Cluster Analysis)

  • 최승필;조지현;김열;김준성
    • 대한공간정보학회지
    • /
    • 제19권4호
    • /
    • pp.139-144
    • /
    • 2011
  • 본 연구는 지상라이다 자료에서 얻어진 색상정보(R, G, B)와 반사강도정보(I)를 동시에 이용하여 이를 통계학적 분류기법으로 서로의 연관성을 분석하여 라이다 자료에 대한 분류방법을 제시하였다. 이를 위하여 우선 변수 R,G,B 및 I를 사용하여 분산 을 극대화하는 요인을 추출하여 주요인과 각 변수들 간의 요인행렬을 산출하였다. 그러나 요인행렬은 기초자료를 축소시켜 보여주기는 하지만, 이로부터 어떤 변수들이 어떤 요인에 의해 높게 관계되는지 명확하게 알기 어렵기 때문에 직각회전방식 중에서 Varimax방법을 이용하여 회전된 요인행렬을 구하여 요인점수를 산출하였다. 그리고 비 계층적 군집화 방법인 K-평균법을 이용하여 요인분석으로 산출된 요인점수에 대하여 군집분석을 실시한 후, 지상라이다 자료의 분류 정확도를 평가하였다.

멜론 유전자원의 원예형질 특성 및 유연관계 분석 (Evaluation of horticultural traits and genetic relationship in melon germplasm)

  • 정재민;최성환;오주열;김나희;김다은;손병구;박영훈
    • Journal of Plant Biotechnology
    • /
    • 제42권4호
    • /
    • pp.401-408
    • /
    • 2015
  • 멜론(Cucumis melo L.) 유전자원 83 품종에 대한 형질특성 및 유전적 다양성을 분석하였다. 형질은 유묘, 잎, 줄기, 화기, 과실, 종자에 대해 총 35개 세부특성을 조사하고, 다변량(MANOVA) 분석을 하였다. 주성분 분석(PCA, principal component analysis) 결과 과중, 과장, 과경, 자엽길이, 종자직경, 종자길이 등 8개의 주성분이 전체 변량의 76.3% 를 나타내었다. 평균연관법(Average linkage method)을 사용한 83개의 멜론의 군집분석(Cluster analysis) 결과 coefficient 0.7에서 5개의 cluster로 분류되었다. Cluster I은 과특성에 있어 가장 높은 측정치를, Cluster II는 당도, Cluster V는 과의 성숙기간이 긴 품종들로 주로 구성되었다. 유전자형 분석은 Cucurbit Genomics Initiative (ICuGI) database에 공시된 15개의 Expressed-sequence Tag-Simple Sequence Repeat (EST-SSR) 마커를 이용하였으며 비가중평균결합법(UPGMA)을 통해 품종간 유연관계를 분석하고 6개의 군으로 분류하였다. 형태적 군집분석 결과와 유전적 군집분석 결과의 상관관계를 조사한 결과 상관계수(r) 값이 -0.11으로 매우 낮게 나타났다.

교통카드자료를 이용한 통행패턴분석과 정책활용방안 연구 -경기도를 중심으로- (A Study on Travel Pattern Analysis and Political Application using Transportation Card Data: In Gyeonggi-Do Case)

  • 빈미영;문주백;조창현
    • 한국경제지리학회지
    • /
    • 제15권4호
    • /
    • pp.615-627
    • /
    • 2012
  • 본 연구는 교통카드 데이터를 이용하여 대중교통 이용과 관련하여 통행패턴을 분석하였으며 교통정책에 활용할 수 있는 방안을 제시하였다. 교통카드 데이터는 경기도권역을 대상으로 하였고 활용방안으로 교통정책 의사결정자가 버스정류소 시설을 개선할 때 교통카드데이터에서 얻어질 수 있는 여러 변수를 이용하여 대상지를 선정한다는 시나리오를 설정하여 분석하였다. 분석결과, 의사결정방법론인 K평균 군집분석과 CHAID(Chi-squared automatic interaction detection)를 이용하였으며, 유의수준 p<0.01에서 정책에 유용하게 이용될 수 있는 결과를 얻었다. 또한 본 연구에서는 이러한 결과들을 근거로 교통카드데이터를 실제로 정책에 활용되기 위해서 개선되어야 할 정책적 함의를 제시하였다.

  • PDF