• 제목/요약/키워드: 군집분석자료

검색결과 1,009건 처리시간 0.031초

강우 관측소별 군집 및 경향성 분석을 활용한 효율적인 수자원 관리 (Efficient water resource management using cluster and trend analysis for each rainfall station)

  • 왕원준;신성철;강유진;이승민;김수전;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.115-115
    • /
    • 2023
  • 최근 기후변화의 영향으로 국내에서 강우량과 유출량의 변동성이 커짐에 따라 효율적으로 수자원을 관리하는 데 어려움을 겪고 있다. 따라서 수자원 관리 측면에서 강우관측소를 대상으로 군집 분석과 경향성 분석을 통해 사전에 강우 시계열 자료의 추세와 특징을 파악하면 용수 공급과 가뭄 및 홍수피해 저감 등에 효과적으로 대처할 수 있다. 본 연구에서는 2000년부터 2019년까지낙동강 유역의 64개 강우관측소를 대상으로 동질성 검정과 수정 Mann-Kendall (MK) 검정을 적용하여 강우 시계열 자료의 월별, 계절별, 연도별 경향성 분석을 수행하였다. 또한, 경향성이 나타나는 관측소별 세부지표(연평균 강우량, 표고 등)를 기준으로 K-means 군집 분석을 수행하여 군집별 강우 특성을 파악하고자 하였다. 분석을 수행한 결과 경향성 분석에선 3월, 4월, 11월, 12월, 봄 및 가을에는 강우량이 증가 추세를 보였고 1월, 5~9월, 여름과 연도별로는 감소 추세가 나타났다. 또한 군집 분석에서는 Silhouette analysis를 기반으로 최적의 군집 개수를 3개로 설정했을 때 군집별 강우 세부지표의 통계값이 관측소별 표고에 비례하는 특징이 나타났다. 연구를 통해 도출된 군집별 강우 특성과 관측소별 경향성 분석결과를 연계하면 강우량의 변동성을 고려한 효율적인 수자원 관리 방안을 마련하는 데 활용할 수 있을 것으로 판단된다.

  • PDF

자동화 K-평균 군집방법 및 R 구현 (Automated K-Means Clustering and R Implementation)

  • 김성수
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.723-733
    • /
    • 2009
  • K-평균 군집분석이 가지는 두 가지 근본적인 어려움은 사전에 미리 군집 수를 정해야 하는 문제와 초기 군집중심에 따라 결과가 달라질 수 있는 문제이다. 본 연구에서는 이러한 문제를 해결하기 위한 자동화 K-평균 군집분석 절차를 제안하고, R을 이용하여 구현한 결과를 제공한다. 자동화 K-평균 군집분석에서 제안된 절차는 처음 단계로서 계층적 군집분석을 행한 후 이를 이용하여 군집 수와 초기 군집수를 자동으로 정하고, 다음 단계로 이 결과를 이용하여 K-평균 군집분석을 수행하는 방법을 택하였다. 처음 단계에서 이용된 계층적 군집분석 방법으로는 Ward의 군집분석을 한 후에 Mojena의 규칙을 이용하여 군집 수를 정하는 방법을 택하거나, 모형근거 군집분석방법을 수행한 후에 BIC 값을 이용하여 군집 수를 정하는 방법을 이용하였다. 제안된 자동화 K-평균 군집절차에는 대량자료의 분석에도 용이하게 이용될 수 있도록 반복된 표본추출 방법을 이용하여 군집 수 및 군집 중심을 구하는 절차를 포함하였다. 구현된 R 프로그램은 www.knou.ac.kr/ sskim/autokmeans.r에서 제공하고 있다.

유사량 측정 유역 군집분석에 따른 분류 (Classification by Clustering Analysis for Watersheds Measuring Sediment Yield)

  • 신승숙;박상덕;박상연;윤민우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.114-114
    • /
    • 2017
  • 하천의 유사량 자료는 하상변동 예측, 저수지 퇴사량 추정, 유사조절 계획 수립 등 유역과 하천관리 그리고 하천 시설물 관리를 위해 필요하다. 최근 4대강 사업구간에 대한 담수용 보로 유입되는 유사량과 하천 유사의 종횡단적 분포와 하상변동량 등의 산정에 기초자료로 활용하고자 유사량 관측망이 구축되어 있다. 본 연구에서는 하천 유사량에 영향을 미치는 유역특성인자에 대한 군집분석을 통해 유사 발생 유역을 분류하고자 한다. 체계화된 유량 및 유사량 측정 방법에 의해 신뢰할만한 유량-총유사량 관계식을 갖는 유량조사사업단의 35개 유역을 대상으로 한다. 유역 군집분석을 수행하고자 유역과 하천에 대한 지형인자, 토양인자, 토지이용 등의 유역특성 매개변수 자료를 수집하였고, 매개변수별 유사도거리 산정에 오류를 줄이기 위해 매개변수를 무차원화 하였다. 유역의 비유사량은 유역면적, 유역경사, 토성, 토지이용 등에 영향을 받았다. K-means 기법에 의해 군집분석을 수행한 결과 유사량 측정 유역은 A, B, C, D 4개의 그룹으로 분류되었다. B그룹 유역은 첨두홍수량이 크고 발생시간이 짧은 유역 및 하천 조건을 가지고 있었으며, 직접유출이 증가하는 지표조건과 침식이 활발한 토양조건을 갖는 것으로 파악되었다. 그룹별로 실측 비유사량을 검토한 결과 B그룹에 포함된 유역의 유사량이 다른 유역에 비해 상대적으로 크게 발생하였다. 이러한 결과는 유역특성 매개변수의 군집분석을 통한 유역의 군집분류가 유역과 하천의 유사관리 측면에서 유용한 관리방안으로 활용될 수 있음을 의미한다.

  • PDF

군집화된 구간 중도절단자료에 대한 치유율 모형의 적용 (Cure Rate Model with Clustered Interval Censored Data)

  • 김양진
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.21-30
    • /
    • 2014
  • 치유율 모형(cure rate model)은 위험 그룹의 단조 감소에 대한 가정이 부적절한 경우에 적용될 수 있다. 예를 들어, 생존 분석에서 위험 그룹은 시간이 경과함에 따라 점점 감소하여 무한대의 시간대에는 영으로 수렴하며 이는 곧 생존 함수가 영으로 수렴함을 의미한다. 하지만 이러한 가정이 적합하지 못한 자료가 의약학, 사회학, 경제학 등에서 종종 발생된다. 즉, 어느 시점에 이르러 더 이상의 생존함수는 감소하지 않고 평행선을 보여주는 경우에 로그 순위검정(log rank test)과 Cox's 비례위험모형(proportional hazard model)의 적용은 바람직하지 못한 결론을 가져오게 된다. 이러한 자료에 대해 치유율 모형(cure rate model)에서는 사건 발생 취약 그룹(susceptible group)과 비취약 그룹(insusceptible group)으로 나누어 취약그룹에 대해서만 일반적인 생존 분석 방법을 적용하는 혼합 모형(mixture model)을 적용해왔다 (Berkson과 Gage, 1952). 본 연구에서는 이러한 치유율 모형을 군집화 구간 중도 절단 자료(clustered interval censored data)에 적용해 보고자 한다. 최근에 Kim과 Jhun (2008)은 구간 중도 절단자료에 대해 치유율 모형을 적용하였으며 본 연구에서는 그들의 방법을 군집화 자료로 확장할 것이다. 실제 자료 분석의 예로 금연자료를 분석할 것이다.

시계열자료의 효율적 군집분석을 위한 구간특징화와 계층적 베이지안 기법의 융합 (A Fusion of the Period Characterized and Hierarchical Bayesian Techniques for Efficient Cluster Analysis of Time Series Data)

  • 정영애;전진호
    • 디지털융복합연구
    • /
    • 제13권7호
    • /
    • pp.169-175
    • /
    • 2015
  • 주가지표처럼 동적이며 시간흐름을 따르는 시계열자료들을 이해하는 효과적인 방법은 주어진 시계열자료들에 대하여 모델을 결정함으로서 이해하는 것이 좋다. 주어진 자료들에 대한 모델 결정과정은 수집되어진 대용량 시계열자료 전체를 한 번에 다 살펴보는 것보다 자료를 특정의 중요한 몇 개의 하위그룹으로 군집화하여 각 군집별 모델결정을 통해 자료 전체를 이해하는 것이 효율적이다. 본 연구에서는 주어진 시계열자료들에 대하여 하위그룹으로의 효율적 군집화 과정 그리고 각 군집별 모델결정의 두 과정 중 첫 번째 과정인 하위집단으로 군집화 과정에 자료의 구간특징화 기법과 휴리스틱 베이지안기법의 융합을 이용하여 시간 및 계산비용을 감소시킬 수 있는 기법을 제안하였으며 실제적인 주가지표를 이용한 실험을 통해 제안하는 기법의 유효성을 확인하였다.

군집분석 및 커뮤니티 분석 기법을 활용한 직무분석 사례 연구 (A Case Study on Job Analysis Utilizing Cluster Analysis and Community Analysis)

  • 조일현
    • 컴퓨터교육학회논문지
    • /
    • 제7권1호
    • /
    • pp.151-165
    • /
    • 2004
  • 본 연구의 목적은 군집 분석(Cluster Analysis) 및 사회연결망 분석 기법의 일종인 커뮤니티(Community)기법을 활용한 직무 분석 사례를 소개하고 그 결과를 음미해 보는데 있다. 이러한 작업을 통해 기존에 활용되던 직무분석 기법을 보완할 수 있는 계량적 방법론을 구안해냄으로써 궁극적으로 역량기반 커리큘럼의 개발 및 교수체제 설계 시 보다 분석적, 과학적인 준거 자료를 확보할 수 있을 것으로 기대하였다. 본 연구를 위한 직무분석 자료는 국내 대규모 제조업체인 S사에서 인터뷰 및 설문을 통해 수집되었다. 이 자료를 활용하여 실시된 군집 분석의 결과 직무들 간의 유사성에 대한 군집 분석 결과는 공식적인 직무 분류체계와 상당한 차이를 보이고 있음이 판명되었다. 이는 조사된 모든 측면에서 일관되게 확인되었으며, 각 측면별로 다소 상이한 클러스터링 패턴을 보이고 있었다. 군집 분석에 이어 직무들 간의 상호 연결관계 네트워크에 대한 사회연결망분석이 실시되었는데, 그 결과 명확한 중심-주변 구조와 함께 클러스터링 구조를 갖고 있음을 확인할 수 있는데, 이는 공식적인 직무분류체계에서 예상할 수 있는 것과도 다르고 또한 직무 간 내용적 유사성 구조와도 차이가 있는 독특한 패턴을 보이고 있음을 보이고 있는 결과였다. 이러한 연구 결과를 통해서 직무분석을 위한 새로운 분석 알고리즘으로서 군질 분석 및 커뮤니티 분석 기법의 유용성이 확인되었다. 나아가 향후 교육체계 설계를 위해 선행되는 직무분석 시 유의할 점들을 논의하였다.

  • PDF

2009생활시간조사자료를 근거로 한 노년층의 여가프로파일 (The Leisure Profile of the Elderly Based on 2009 Time Use Survey Data)

  • 지현진
    • 한국노년학
    • /
    • 제32권3호
    • /
    • pp.675-687
    • /
    • 2012
  • 본 연구는 노년층의 인구통계학적 특성을 바탕으로 형성된 군집별 여가 시간량의 차이를 조사함으로써 세대 내 존재하는 다양한 속성에 따른 여가프로파일을 작성하는 것을 목적으로 한다. 이를 위해 2009생활시간조사자료 중 만 65세 이상 응답자가 이틀 동안 작성한 시간일지 5392부를 최종분석에 사용하였다. 자료 분석을 위해 기술분석, 상관분석, K-평균 군집분석, 분산분석, 사후분석(Scheffe)을 실시하였다. 연령, 성별, 교육수준, 월소득, 배우자유무, 경제활동여부, 거주지역에 따라 7개의 군집(군집명: 아직은 일을, 벗들과 취미생활을, 도시에서 다양한 여가를, 신앙 속에 우정과 취미생활을, 일하며 짬짬이 여가를, 변두리에서 여가를)이 형성되었으며, 군집별 여가 시간량의 차이를 살펴본 결과, 관람문화활동이나 물품구입활동을 제외하고는 대부분의 여가행동별 시간량은 군집 간에 유의한 차이를 보였다. 특히 노년층에게 일이나 배우자의 유무와 같은 사회적 역할의 상실이나 관계의 상실은 여가 시간량의 증감이나 행동유형에 차이를 만들어 내었다. 이러한 결과는 추후 노년층을 위한 여가서비스 및 정책을 기획하고 준비하는데 참고할만하다.

엔트로피 가중치 및 SVD를 이용한 군집 특징 선택 (Cluster Feature Selection using Entropy Weighting and SVD)

  • 이영석;이수원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.248-257
    • /
    • 2002
  • 군집화는 객체들의 특성을 분석하여 유사한 성질을 갖고 있는 객체들을 동일한 집단으로 분류하는 방법이다. 전자 상거래 자료처럼 차원 수가 많고 누락 값이 많은 자료의 경우 입력 자료의 차원축약, 잡음제거를 목적으로 SVD를 사용하여 군집화를 수행하는 것이 효과적이지만, SVD를 통해 변환된 자료는 원래의 속성 정보를 상실하기 때문에 군집 결과분석에서 원본 속성의 가치 해석이 어렵다. 따라서 본 연구는 군집화 수행 후 엔트로피 가중치 및 SVD를 이용하여 군집의 중요한 속성을 발견하기 위한 군집 특징 선택 기법 ENTROPY-SVD를 제안한다. ENTROPY-SVD는 자료의 속성들과 유사객체 군과의 묵시적인 은닉 구조를 활용하기 위하여 SVD를 이용하고 유사객체 군에 포함된 응집도가 높은 속성들을 발견하기 위하여 엔트로피 가중치를 사용한다. 또한 ENTROPY-SVD를 적용한 모델 기반의 협력적 여과기법의 추천 시스템 CFS-CF를 제안하고 그 효용성 및 효과를 평가한다.

다변량 분석을 이용한 국내 강설의 권역화 연구 (A Study on the Regionalization of Snowfall using Multivariate Analysis in Korea)

  • 이정식;신창동;김병철
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1591-1595
    • /
    • 2010
  • 국내의 경우 매년 발생하는 홍수에 대해서는 많은 분석과 대비를 하고 있지만, 겨울철 강설에 대한 연구는 미비한 실정이다. 본 연구에서는 기상청 산하 57개 관측지점의 30년 이상의 강설 자료를 수집하고 다변량 분석을 실시하였다. 국내 지역의 강설 동질성을 검정하기 위하여 주성분분석과 군집분석을 실시하였으며 본 연구의 수행으로 얻어진 결과를 요약하면 다음과 같다. 첫째, 본 연구에서는 지금까지 선행된 타 연구에 비하여 보다 많은 강설지점에 대한 다양한 강설특성자료를 이용함으로써 권역화 분석에 대한 타당성과 정확성을 확보할 수 있었다. 둘째, 주성분 및 군집분석으로 관측지점간의 수문학적 동질성 검정을 합리적이고 효율적으로 분석할 수 있었으며, 군집분석의 결과로부터 지형학적 영향을 고려한 강설의 권역화는 국내의 강설지역을 5개의 권역으로 분류하였다. 셋째, 각 강설성분의 권역별 평균값으로부터 각 권역별 강설의 양적 특성을 분석하였으며, 여러 가지 강설 성분을 종합적으로 이용하여 분석된 본 연구의 결과는 향후 재난방지 계획을 위한 강설의 수문학적 분석에 많은 도움을 주리라 사료된다.

  • PDF

오대산 국립공원 노인봉지역 식물군집구조분석 (Plant Community Structure Analysis in Noinbong area of Odaesan National Park)

  • 최송현;권전오;민성환
    • 한국환경생태학회지
    • /
    • 제9권2호
    • /
    • pp.156-165
    • /
    • 1996
  • 극상림의 군집구조를 분석하고 국립공원의 식생경관관리를 위한 기초자료를 마련하고자 오대산 국립공원의 노인봉지역에 12개 조사구를 선정하고 군집구조분석을 실시하였다. TWINSPAN 분석결과 군집은 서어나무-신갈나무군집(군집 1), 거제수나무-박달나무-서어나무군집(군집2)으로 분리되었다. 군집의 천이단계는 종조성, 유사도지수, 종다양성분석 결과 극상림단계 초기와 극상림으로 밝혀졌다. 종수 ? 개체수분석에서는 100m$^{2}$당 평균 120~130개체, 17종이 조사되었다. 흉고단면적과 흉고직경급별 분석에서는 교목층에서 신갈나무를 대신하여 서어나무, 거제수나무, 박달나무 등이 극상수종이 될 것이며 아교목층에서는 당단풍이 우점종을 이룰 것으로 판단되었다.

  • PDF