• 제목/요약/키워드: 군집화 모형

검색결과 115건 처리시간 0.02초

자기조직화 지도를 위한 베이지안 학습 (Bayesian Learning for Self Organizing Maps)

  • 전성해;전홍석;황진수
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.251-267
    • /
    • 2002
  • Kohonen이 제안한 자기조직화 지도(Self Organizing Maps : SOM)는 매우 빠른 신경망 모형이다. 하지만 다른 신경망 모형과 마찬가지로 학습 결과에 대한 명확한 규칙을 제시하지 못할 뿐만 아니라 지역적 최적값으로 빠지는 경우가 종종 있다. 본 논문에서는 이러한 자기조직화 지도의 모형에 대한 설명력을 부여하고 전역 최적값으로 수렴할 수 있는 예측 성능을 갖는 모형으로서 자율학습 신경망에 베이지안 추론을 결합한 자기조직화 지도를 위한 베이지안 학습(Bayesian Learning for Self Organizing Maps ; BLSOM)을 제안한다. 이 방법은 기존의 자기조직화 지도가 지역적 해에 머물러 있는 것에 비해서 언제든지 전역적 해로 수렴함이 실험을 통하여 밝혀졌다.

군집 알고리즘을 이용한 순차적 이상치 탐지법 (A sequential outlier detecting method using a clustering algorithm)

  • 서한손;윤민
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.699-706
    • /
    • 2016
  • 검정절차가 생략된 이상치 탐지법은 구조적으로 수렁효과나 가면효과에 취약하기 때문에 다수의 이상치를 제대로 탐지하지 못할 때가 있다. 본 연구에서는 군집화에 의하여 구분된 소수 관찰치군을 이상치로 판정하는 방법에 보완될 검정절차를 다룬다. 이에 관련된 일반적인 방법은 탐지된 이상치 후보군의 개별적인 관찰치에 대해 다양한 종류의 t-검정을 수행하는 것이다. 본 연구에서는 이상치 후보군에 대한 검정을 수행하고 군집나무의 절단기준을 변경시켜 새로운 이상치군을 탐색해 나가는 순차적인 방법을 제안한다. 예제와 모의실험을 통해 제시된 방법과 기존의 방법들을 비교한다.

웹기반의 유량 군집화 EI 평가시스템을 이용한 SWAT 직접유출과 기저유출 평가 (SWAT Direct Runoff and Baseflow Evaluation using Web-based Flow Clustering EI Estimation System)

  • 장원석;문종필;김남원;유동선;금동혁;김익재;문유리;임경재
    • 한국물환경학회지
    • /
    • 제27권1호
    • /
    • pp.61-72
    • /
    • 2011
  • 유역 단위 수문 및 수질 평가 모형인 SWAT 모형을 이용한 유역 내 정확한 수문과 비점오염원 거동을 평가하기 위해서는 유역 적용에 앞서 모형의 정확성 평가가 우선시 되어야 한다. SWAT 모형의 수문 보정및 검정 시, Nash-Sutcliffe의 효율계수(EI)가 널리 사용되고 있다. 그러나 이러한 EI 값은 비교되어지는 값들의 범위 중 큰 값 즉, 수문 분석에 있어 고유량에 대해 민감하게 영향을 받는 것으로 알려져 있다. 그리하여 본 연구에서는 보다 정확한 수문 분석을 위해 K-means 군집화 알고리즘을 이용한 웹기반의 EI 평가시스템을 개발하였고, 이를 SWAT 모형의 수문 평가에 적용하였다. 본 연구의 결과 전체 유량의 EI 값은 높았지만, 수문성분에 따른 EI 값은 높지 않았다. SWAT 모형의 수문 보정 및 검정에 널리 활용되고 있는 SWAT auto-calibration tool은 전체 유량에 대해서는 높은 EI 값을 산정하는 것으로 보이지만, 직접유출과 기저유출 각각에 대한 유량 그룹 I 과 II 에 대해서는 대부분 음수(-)의 EI 값을 보였다. 그리하여 본 연구 결과를 통해 SWAT 모형의 수문성분 평가에 있어 보다 정확한 평가를 위해서는 직접유출과 기저유출에 대한 각각의 유량 그룹에 대해 양수(+)의 EI 값이 산정되도록 모형 보정 및 검정의 수행 필요할 것으로 사료된다.

다변량 통계분석을 이용한 준분포형 유출모형 매개변수 지역화 (Parameter Regionalization of Semi-Distributed Runoff Model Using Multivariate Statistical Analysis)

  • 이병주;정일원;배덕효
    • 한국수자원학회논문집
    • /
    • 제42권2호
    • /
    • pp.149-160
    • /
    • 2009
  • 본 연구에서는 미계측유역에 대한 준분포형 강우-유출모형을 적용하기 위한 방법으로 두 개의 다변량 통계기법인 주성분분석과 계층적 군집분석을 연계한 매개변수 지역화 기법을 제안하였다. 109개 중권역 유역에 대해 7개 유역특성인자(유역면적, 평균표고, 평균경사, 산림면적비, 포화토양수분량, 포장용수량, 영구위조점)를 추출하였으며 주성분분석을 수행한 결과 제1, 2 성분이 전체자료의 82.11%를 설명하는 것으로 나타났다. 제1성분은 유역위치, 제2성분은 유역규모와 관계가 있는 것으로 분석되었으며 이들 성분점수로부터 군집분석을 이용하여 103개 미계측유역을 6개 계측유역으로 분류한 결과 괴산댐 23개, 안동댐 6개, 임하댐 5개, 합천댐 21개, 용담댐 4개, 섬진강댐 44개의 미계측 유역을 포함하는 것으로 나타났다. 유출모형은 SWAT 모형을 선정하였으며 6개 계측유역에 대한 매개변수를 추정하였다. 매개변수 지역화 결과의 적용성을 평가하기 위해 미계측유역으로 가정한 소양, 충주, 대청댐 상류유역에 대해 지역화된 매개변수를 이용하여 유출해석을 수행한 결과 모형효율성계수가 0.8 이상으로 관측치와 적합도가 매우 높게 나타났다. 이상의 결과로부터 다변량 통계분석을 이용한 유출매개변수 지역화 방법은 미계측유역의 유출모의시활용 가능함을 확인하였다.

대출심사의 예측 정확도 향상을 위한 방법 제안 (Proposing the Method for Improving the Forecast Accuracy of Loan Underwriting)

  • 양유영;박상성;신영근;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1419-1429
    • /
    • 2010
  • 외환위기 이후 본격적으로 시작된 외국계 대형 은행의 국내 진출 및 선진 금융상품의 수입은 국내 은행 산업 구조와 환경을 변화시키고 경쟁을 가속화시켰다. 앞으로 일어날 변화 및 추세에 대한 정확한 예측은 경쟁이 치열한 환경에서 국내의 은행이 생존하고 발전하기 위해 필수적인 요소이며 그 중에서도 대출 신청 고객에 대한 승인 여부에 대한 예측은 대출 상품이 은행 경영에 있어 가장 큰 비중을 차지하는 수익의 원천이자 신용 리스크 관리의 중심이 된다는 점에서 큰 의미가 있다. 따라서 본 논문에서는 대출 심사 결과의 예측 정확성을 높이기 위한 방법을 제시하고자 한다. 수행 단계로는 상관관계 분석과 특징선택 기법을 통해 대출승인 결과에 유의한 영향을 주는 예측변수들을 선별하고 선별된 변수로 2-Step 군집화 기법을 통해 고객을 군집화 하였다. 이후 각 군집에 LR, NN, SVM 기법을 활용하여 구축한 예측 모형을 적용하여 정확도가 가장 높은 모형을 찾아보았다. 최종적으로 기존 방식의 대출 심사 모형에 LR, NN, SVM 예측 모형을 적용했을 때 산출된 결과와 제안한 모형의 결과를 비교하여 예측의 정확도를 평가하였다.

한국 하천의 지역별 유사특성의 군집화와 H-ADCP 기반 부유사 농도 관측 기법에의 활용 방안 (Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique)

  • 노효섭;손근수;김동수;박용성
    • 한국수자원학회논문집
    • /
    • 제55권1호
    • /
    • pp.43-57
    • /
    • 2022
  • 유사량 계측 기술의 발달로 초음파 도플러 유속계(ADCP)의 산란도가 부유사 농도와 관계가 있다는 특성을 이용해 부유사의 농도를 짧은 시간 간격으로 계측하여 부유사 관측의 비용과 위험 문제를 극복하고자 하는 노력이 지속되고 있다. 국내에는 자동 유량 관측소에 횡방향 ADCP (H-ADCP)가 설치되어 있어 실시간으로 부유사 농도를 계측하는 기술의 적용이 가능하지만 자동 유량 관측소와 부유사 관측소의 위치가 항상 일치하지는 않아 모든 관측소에서의 모형 개발은 불가한 실정이다. 본 연구에서는 이러한 문제를 극복하기 위해 H-ADCP가 설치된 유사량 관측소 9개소에 대해 부유사 농도를 계측하는 H-ADCP-SSC 관계식을 개발하고 그 결과의 적용성에 대해 고찰하였다. 그리고 부유사 관측소별로 나타나는 특징에 대해 알아보기 위해 한국 하천의 부유사 관측소 44개소의 유역면적, 부유사와 하상토의 입도분포, 유량-유사량 관계식 등의 유사특성 자료를 이용해 비지도 기계학습 기법인 가우시안 혼합 모형(GMM)으로 군집분석을 수행하였다. 군집화 결과, 유사량 관측소를 공간적으로 구분해낼 수 있었으며, 특히 하천의 본류와 지류의 유사 특징을 구분해낼 수 있었다. 결과적으로, H-ADCP-SSC 관계식과 부유사 관측소의 군집분석 결과를 종합해 H-ADCP-SSC 관계식이 개발되지 않은 자동 유량 관측소에서 관계식을 적용하는 부유사 농도를 실시간으로 계측할 수 있도록 하는 프로토콜을 제안하였다.

응집 계층 군집화 기법을 이용한 이종 공간정보의 M:N 대응 클래스 군집 쌍 탐색 (Detection of M:N corresponding class group pairs between two spatial datasets with agglomerative hierarchical clustering)

  • 허용;김정옥;유기윤
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.125-134
    • /
    • 2012
  • 본 연구는 두 공간정보의 대응 클래스 군집 쌍 탐색을 중심으로 의미론적 정합과정에서 발생하는 M:N 대응관계를 분석하는 방법을 제안한다. 객체의 공유 관계를 이용하여 클래스의 유사도를 측정하고 높은 유사도를 가지는 클래스들을 군집화함으로써 M:N 대응관계를 탐색하고자 한다. 클래스 사이의 유사도를 그래프 모형으로 표현하고 그래프 임베딩 기법을 적용하여 투영공간에서 클래스 사이의 거리가 클래스 중첩분석에 의한 국지적 유사도에 반비례하도록 개별 클래스들의 투영좌표를 계산하고 군집화를 수행함으로써 계층적 대응 군집 쌍을 탐색할 수 있다. 제안된 방법을 평가하기 위하여 경기도 수원시의 수치지형도와 연속지적도에 적용하여 수치지형도의 면 객체 레이어와 연속지적도의 필지 지목의 대응 군집 쌍을 탐색하였다. 탐색된 대응 클래스 쌍의 F-measure를 측정한 결과 약 0.80에서 0.35 사이의 다양한 값을 얻을 수 있었으며, 클래스 명칭과는 상이한 다양한 대응관계를 얻을 수 있었다.

정보적군집 크기를 가진 군집화된 구간 중도절단자료 분석을 위한결합모형의 적용 (Statistical Analysis of Clustered Interval-Censored Data with Informative Cluster Size)

  • 김양진;유한나
    • Communications for Statistical Applications and Methods
    • /
    • 제17권5호
    • /
    • pp.689-696
    • /
    • 2010
  • 구간중도 절단자료는 감염 자료, 종양 발생 자료등 그 발생 시간을 정확하게 관측할 수 없는 경우에 흔히 발생되는 자료로 정확한 사건 발생 시간대신에 발생 전 마지막 관측시점과 발생 후 첫 번째 관측시점으로 구성된다. 이러한 종류의 자료는 Sun (2006)에 의해 자세하게 논의되었으며 관측 개체간의 독립성 가정 하에서 여러 가지 방법들에 의해 분석되어져 왔다. 본 논문에서는 관측 개체들이 군집으로부터 발생하여 더 이상독립성 가정이 적절하지 못한 경우를 고려한다. 특히 반응변수인 사건 발생 시간이 군집의 크기와 연관되어 있을 때, 이를 고려하기 위한 결합 모형을 제시한다. 제안된 모형은 림프계 필라리아병의 실제 자료에 적용한다.

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 (Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM)

  • 전성해;오경환
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.277-282
    • /
    • 2003
  • 웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

자가조직화 지도 방법을 이용한 조절된 낙동강 내 동물플랑크톤 역동성의 모형화 (Patterning Zooplankton Dynamics in the Regulated Nakdong River by Means of the Self-Organizing Map)

  • 김동균;주기재;정광석;장광현;김현우
    • 생태와환경
    • /
    • 제39권1호통권115호
    • /
    • pp.52-61
    • /
    • 2006
  • 본 연구는 지난 10여년간의 (1994 ${\sim}$ 2003) 주간격의 자료를 이용한 자가조직화 지도 (SOM) 방법으로 낙동강 하류역 (물금: 낙동강 하구언으로부터 27 km 상류지점)에서 동물플랑크톤 군집 동태에 대한 계절별 유형화 분석을 하는데 목적이 있다. 담수생태계내의 먹이망에서 동물플랑크톤 군집의 역할은 매우 중요하나, 다른 군집 구성원들과의 비교 연구는 다소 미진하게 진행되었다. 비선형 모형 알고리즘인 SOM을 동물플랑크톤 군집 역동성과 강 환경 인자들과의 상관관계 파악을 위하여 적용하였다. 육수학적 환경 인자 (수온, 용존산소, pH, 세키투명도, 탁도, 클로로필 a 농도, 유량 등) 들을 동물플랑크톤 군집 구조(윤충류, 지각류 및 요각류)의 계절적 변화 유형파악을 위하여 사용하였다. 학습된 SOM 모형은 육수학적 환경인자와 연관 지어 지도상에 동물플랑크톤을 배치되었다. 동물플랑크톤의 주요 세 군집들은 계절별 변화 유형에 있어서 높은 유사성을 가지고 있었다. 다양한 육수학적 환경인자 중, 수온은 동물플랑크톤 군집 역동성과 매우 높은 연관관계를 나타내었다(특히, 지각류). SOM 모형은 여름기간 증가된 강 유량에 의해서 동물플랑크톤을 매우 저해하는 요인으로 표현되었다. 클로로필 a 농도는 우점한 초식성 동물플랑크톤 활성도에 의해 지도상에서 구획되었다. 본 연구는 비선형 방법을 이용한 육수학적 환경요인과 동물플랑크톤 역동성을 연관 지어 소개하였으며, 이러한 정보는 먹이망이라는 관점에서 볼 때, 강 생태계 관리에 유용한 정보로 활용될 것으로 사료된다.