• Title/Summary/Keyword: 군집해석

Search Result 303, Processing Time 0.036 seconds

다목적 유전자 알고리즘을 이용한 강우자료의 군집해석 (Cluster Analysis of Precipitation Data Using Multi-Objective Genetic Algorithms)

  • 김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.558-561
    • /
    • 2005
  • 강우자료의 빈도해석을 위해서 널리 사용되고 있는 지점빈도해석기법은, 우리나라와 같이 구축된 강우자료의 자료년수가 충분하지 못한 경우에 신뢰도가 떨어지는 결과를 가져올 수 있다. 이런 단점을 극복하기 위해서, 최근에는 수문학적인 성질이 서로 비슷한 지점을 하나의 지역으로 설정해서 빈도해석을 실시하는, 지역빈도해석기법이 널리 사용되고 있다. 본 논문에서는 지역빈도해석에 사용되는 군집해석(cluster analysis)에 관한 연구로서, 다목적 유전자알고리즘을 이용해서 군의 개수와 군집도간의 상호관계를 밝혀내고 이를 지역빈도해석에 적용해서 군집해석의 효율성 및 적용성을 높이고자 한 연구이다.

  • PDF

상호정보량 기법을 이용한 군집분석의 적용성 연구 (Application of Cluster Analysis using Mutual Information)

  • 정영훈;김완수;정창삼;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

군집분석과 지역빈도해석을 이용한 확률강우량 추정에 대한 연구 (Study of Rainfall Quantile Estimation using Cluster Analysis and Regional Frequency Analysis)

  • 정영훈;정창삼;남우성;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.288-291
    • /
    • 2010
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 산정하고 지역빈도해석을 적용하기 위하여 한강유역에 대하여 지역구분을 실시하였다. 지역구분은 군집분석 방법인 Ward 방법, 평균연결법, Fuzzy-c means 방법, Two-Step 방법을 적용하였으며 군집분석을 수행하기 위해서 한강유역의 지점별 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 수행하였다. 그 중 Fuzzy-c means 방법을 이용한 지역구분이 적합한 것으로 나타났다. 또한 모든 지속기간에 대하여 적합성 척도를 산정한 결과 GLO 분포형이 적정분포형으로 나타났으며, 지역빈도해석 방법인 지수홍수법을 이용하여 산정한 확률강우량과 지점빈도해석으로 산정한 확률강우량과 비교하여 적용성을 판단하였다.

  • PDF

PCA와 SOM을 이용한 자동 군집화 에이전트 (Automatic Clustering Agent using PCA and SOM)

  • 박정은;김병진;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.67-70
    • /
    • 2003
  • 인터넷의 정보 홍수 속에서 원하는 정보를 정확하게 제시간에 얻기란 쉬운 일이 아니며, 따라서 이러한 작업을 대신해주는 에이전트의 역할이 점점 커지고 있다. 대부분의 이벤트들이 실시간에 발생되고 처리되어야 하는 인터넷 환경에서는 분석가가 군집화의 방법과 결과 해석에 지속적으로 관여하기 어렵기 때문에 이러한 분석가의 업무를 대신하는 지능화된 에이전트가 필요하게 된다. 본 논문에서는 특히 자율학습 군집화에 대한 자동화된 시스템으로서 자동 군집화 에이전트를 제안하며 이 시스템은 군집화 수행 에이전트와 군집화 성능 평가 에이전트로 이루어져 있다. 두 개의 에이전트가 서로 정보를 교환하면서 자동적으로 최적의 군집화를 수행한다. 군집화 과정에서는 데이터를 분석하는 분석가가 군집화의 방법과 결과 해석에 실시간으로 관여하기 어렵기 때문에 이러한 작업을 담당하는 지능화된 에이전트가 자동화된 군집화를 담당하면 효과적인 군집화 전략이 될 수 있다. 또한 UCI Machine Repository의 IRIS 데이터와 Microsoft Web Log Data를 이용한 실험을 통해 제안 시스템의 성능 평가를 수행하였다.

  • PDF

Dunn 지수를 이용한 최적 강수지역 군집수 분석 (The Analysis of Optimal Cluster Number of Precipitation Region with Dunn Index)

  • 엄명진;정창삼;남우성;정영훈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.87-91
    • /
    • 2011
  • 강수는 지역에 따라 발생양상이 매우 다른 자연현상 중 하나이다. 이러한 강수를 효과적으로 분석하여 확률강수량을 산정하기위해서 수문학에서는 다양한 방법이 시도되어 왔다. 우리나라에서는 지점빈도해석을 통한 확률강수량을 주로 사용해왔으나 최근 들어 Hosking and Wallis(1997)가 제안한 지역빈도해석을 활용을 적극 도모 하고 있는 중이다. 이러한 지역빈도해석 기법은 지점빈도해석 기법에 비하여 한정된 강수자료를 활용하는 측면 등 여러 가지 장점을 가진 확률 강수량 산정방법이다. 그러나 이 기법을 적용하여 확률강수량을 산정하기 위해서는 강수의 지역구분을 먼저 수행하여야 한다. 강수지역의 구분을 위해서는 여러 가지 기법이 존재하나 최근에는 Cluster 기법 중 K-means 방법이나 Fuzzy c-means 방법 등을 주로 적용하여 지역구분을 수행하고 있다. 그러나 K-means 방법이나 Fuzzy c-means 방법 등은 산정 방법내에서 최적 군집수를 결정할 수 있는 알고리즘이 없기 때문에 임의적으로 최적 군집수를 결정하여야 한다. 본 연구에서는 이러한 단점을 극복하기 위하여 Cluster 평가지수 중 하나인 Dunn 지수를 이용하여 최적 군집수를 제시하고자 한다. 본 연구에서 강수지역을 구분하기 위하여 적용한 인자는 월 평균 강수량, 연 평균 강수량, 월 최대 강수량, 경도, 위도, 고도 등이며, 이를 K-means, PAM 및 친근도 전파 기법을 통하여 강수지역을 구분하였다. 적정 군집수를 임의적으로 증가시켜 가면서 Dunn 지수를 산정하였다. 산정된 결과를 통하여 최적 군집수를 결정하였다.

  • PDF

통합 측도를 사용한 주성분해석 부공간에서의 k-평균 군집화 방법 (K-Means Clustering in the PCA Subspace using an Unified Measure)

  • 류재흥
    • 한국전자통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.703-708
    • /
    • 2022
  • k-평균 군집화는 대표적인 클러스터링 기법이다. 하지만 성능 평가 척도와 최소 개수의 군집을 정하는 방법에 대하여 통합하지 못한 한계가 있다. 본 논문에서는 수치적으로 최소 개수의 군집을 정하는 방법을 도입한다. 설명된 분산을 통합측도로 제시한다. 최소 개수의 군집과 설명된 분산 달성을 동시에 만족하려면 주성분 해석의 부공간에서 k-평균 군집화 방법을 수행해야한다는 것을 제시하고자 한다. 패턴인식과 기계학습에서 왜 주성분 분석과 k-평균 군집화를 순차적으로 수행하는가에 대한 설명을 원론적으로 제시한다.

스케일 성질을 이용한 군집 지역에서의 스케일 인자에 대한 연구 (Study on Scaling Exponent for Classification of Regions using Scaling Property)

  • 정영훈;김성훈;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.504-504
    • /
    • 2015
  • 수공구조물을 설계하기 위해서는 설계수문량을 빈도해석을 통해 산정할 수 있다. 빈도해석 중 지점빈도해석을 보완한 지역빈도해석을 적용하기 위해서는 군집분석을 통한 지역구분이 무엇보다 중요하다. 또한 스케일 성질(scaling property)은 강우의 시 공간적 특성을 지속기간별 관측된 강우자료를 이용하여 재현기간에 대한 지속기간의 함수로 강우의 IDF곡선을 제시할 수 있는 방법이다. 따라서 스케일 성질을 통해 군집된 지역에서의 강우자료에 적용하여 스케일 인자(scaling exponent)를 추정한 후 수문학적 동질성을 통계적 특성으로 설명하고자 한다. 본 연구를 수행하기에 앞서 군집 분석은 4개의 군집방법(평균연결법, Ward방법, Two-Step방법, K-means방법)을 적용하였고, 한강유역에 위치한 104개의 강우지점은 4개의 지역으로 구분하는 것이 적절하다고 판단되어 비계층적 방법인 k-means방법을 이용하여 지역을 구분하였다. 본 연구에서는 군집된 결과를 바탕으로 4개의 지역으로 구분된 지역에 포함된 강우지점을 대상으로 스케일 인자를 추정하고 수문학적 동질성을 통계적 방법으로 제시하고자 한다.

  • PDF

자기 조직화 지도와 계층적 군집화를 이용한 유전자 발현 데이터 군집화 기법 (Clustering of Gene Expression Data by using SOM and Hierarchical Clustering)

  • 박창범;이동환;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.784-786
    • /
    • 2003
  • 본 논문에서는 유전자 발현 데이터를 분석하는데 있어서 자기 조직화 지도와 계층적 군집화 기법을 상호 보완적으로 사용하여 사용자가 보다 직관적으로 군집화 결과를 해석할 수 있는 방법을 제안한다. 제안된 방법을 사용하면 빠른 처리 속도로 대용량 데이터 처리에 적합한 자기 조직화 지도의 장점을 살릴 수 있으며 계층적 군집화의 장점인 가시화 기능을 이용하여 자기 조직화 지도의 단점인 군집 경계에 대한 불명확성을 해소하여 군집화 결과를 사용자가 쉽게 이해하고 직관적으로 해석할 수 있도록 도와준다. 본 논문에서 제안된 방법의 효용성을 검증하기 위해 세 종류의 데이터를 사용하여 실험을 수행한 결과 제안된 방법이 기존 방법에 비해 더 나은 성능을 보이는 것을 확인할 수 있었다.

  • PDF

폐기물매립장 침출수내 미생물군집 구조 해석을 위한 T-RFLP의 활용 (T-RFLP Analysis of Microbial Community Structure in Leachate from Landfill Sites)

  • 유재철;;;이태호
    • 대한환경공학회지
    • /
    • 제32권4호
    • /
    • pp.369-378
    • /
    • 2010
  • 폐기물매립장의 안정화에는 미생물이 중요한 역할을 수행한다. 폐기물매립장에서 미생물군집 변화 모니터링에 말단 제한절편다형성(Terminal Restriction Fragment Length Polymorphism; T-RFLP)법의 활용 가능성을 평가하고자 박테리아의 16S rDNA 서열에 기초한 T-RFLP법으로 4개의 폐기물매립장 내부에서 채취한 침출수의 미생물군집 구조를 조사하였다. T-RFLP법을 사용하여 해석한 침출수 내 우점 미생물군집 구조와 일반적으로 널리 사용되고 있는 16S rDNA 클론 해석법에 의한 우점 미생물군집구조는 유사하였다. 또한, T-RFLP법을 이용하여 폐기물매립장의 구조, 매립 폐기물 종류, 운영기간이 다른 폐기물매립장 침출수의 우점 미생물군집 구조가 서로 다르게 나타나는 것을 확인 할 수 있었다. 따라서 T-RFLP법을 사용하여 폐기물매립장 침출수내 미생물군집 구조를 장기적으로 모니터링 한다면 많은 비용과 시간이 소요되는 클론해석법의 반복적인 수행 없이도 비교적 간단하게 폐기물매립장의 안정화 정도를 평가할 수 있을 것으로 기대한다.

한강 유역에서의 강우 지역빈도 해석 방법의 비교 연구 (Comparative Study of Regional Frequency Analysis Methods of Rainfall in Han River Basin)

  • 엄명진;임승택;남우성;조원철;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1072-1076
    • /
    • 2008
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 기본으로 각 지속기간별 L-모멘트값을 산정하고, 한강유역에 적합한 빈도해석기법을 정의하기 위하여 지역구분을 실시하였다. 지역구분을 위한 군집분석을 수행하기 위하여 각 지점별 기상학적 인자와 지형학적 인자를 변수로 사용하였다. 군집분석 기법인 Ward, 평균연결법, Fuzzy-c means, Two-Step방법을 이용하여 지역구분을 실시하였다. GIS를 이용하여 각 방법들을 이용하여 군집된 결과를 도시한 결과 Fuzzy-c means방법으로 구분된 지역구분이 적합한 것으로 나타났다. 또한 구분된 지역의 동질성 여부를 판단하고 적정 분포형을 선정하였으며 지점빈도해석 및 지역빈도해석을 통하여 빈도별 확률 수문량을 산정하였다. 산정된 결과의 정확도 알아보기 위해 모의발생을 시킨 후, 각 기법별로 산정된 상대 평균 제곱근 오차(Relative Root Mean Square Error, RRMSE)를 비교 분석한 결과 대체적으로 지수홍수법과 계층적 방법이 낮은 RRMSE를 나타냈다. 따라서 한강유역에서는 지수홍수법과 계층적 방법을 적용한 지역빈도해석이 적합한 것으로 판단된다.

  • PDF