• 제목/요약/키워드: 가우시안혼합분포군집

검색결과 11건 처리시간 0.032초

클러스터 확률 모형에 의한 지역화와 코풀라에 의한 가뭄빈도분석 (Regionalization using cluster probability model and copula based drought frequency analysis)

  • 무하마드 아잠;최현수;김형산;황주하;맹승진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.46-46
    • /
    • 2017
  • 지역가뭄빈도분석의 분위산정에 대한 신뢰성은 수문학적으로 균일한 지역으로 구분하기 위해 사용된 장기간의 과거 자료와 분석절차에 의해 결정된다. 그러나 극심한 가뭄은 매우 드물게 발생하며 신뢰 할 수 있는 지역빈도분석을 위한 지속기간이 충분치 않는 경우가 많이 발생한다. 이 외에도 우리나라의 복잡한 지형적 및 기후적 특징은 동질한 지역으로 구분하기 위한 통계적인 처리방법이 필요하였다. 본 연구에서 적용한 지역빈도분석은 여러 지역의 다양한 변수인 수문기상 특성을 분석하여 동질한 지역을 확인하고, 주요 가뭄변수(지속 시간 및 심각도)를 통합 적용하여 각각의 동질한 지역 분위를 추정함으로써 동질한 지역을 구분하는 해결책을 제시하였다. 본 연구에서는 가우시안 혼합 모형(Gaussian Mixture Model)을 기반으로 기반 군집분석 방법을 적용하여 최적의 동질한 지역을 구분하고 그 결과를 우도비검정 및 다른 유효성 검사 지수를 이용해서 확인하였다. 가우시안 혼합 모델에서 산정했던 매개변수를 방향저감 공간으로 표현하기 위해서 가우시안 혼합 모델방향 저감(GMMDR)방법을 적용하였다. 이 변수는 가뭄빈도분석을 위해 다양한 분포와 코풀라(copula) 적합도를 이용하여 추정 비교하였다. 그 결과 우리나라를 4개의 동질한 지역으로 나누게 되었다. 가우시안과 Frank copula를 이용한 Pearson type III(PE3) 분포는 우리나라의 가뭄 기간과 심각도의 공동 분포를 추정하는데 적합한 것으로 나타났다.

  • PDF

군집분석을 이용한 양파 감성사전 구축 (Construction of Onion Sentiment Dictionary using Cluster Analysis)

  • 오승원;김민수
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2917-2932
    • /
    • 2018
  • 우리나라 식생활에 밀접한 관련을 가지고 있는 채소인 양파의 수급불균형 해결을 위한 생산량 예측 모형 개발의 노력이 많은 연구를 통해 이뤄지고 있다. 하지만 양파의 수확기와 저장 가능성을 고려해 봤을 때 생산량 예측만으로는 수급불균형 해결이 어렵다. 따라서 본 논문에서는 양파의 생산량 정보와 가격의 다양한 요인이 포함되어 있으며 일상에서 쉽게 접할 수 있는 인터넷 기사를 이용하여 가격 예측을 위한 감성사전을 구축하고자 한다. 양파 기사는 2012년부터 2016년까지의 데이터를 사용하였고 도매시장 가격을 통한 문서구분을 통해 4가지 TF-IDF를 비교하여 적합한 TF-IDF를 사용하였다. 분석을 위하여 분할적 군집분석 중 k-means 군집, 밀도기반군집(DBSCAN; density based spatial cluster applications with noise), 가우시안혼합분포군집(GMM; Gaussian mixture model) 군집을 통하여 가격에 대한 긍정/부정 단어를 구분한 결과 GMM 군집이 의미 있는 긍정, 부정, 무정의 3개의 사전으로 구성되었다. 구축된 사전의 합리성을 비교하기 위하여 가격 상승 기사와 가격 하락 기사의 분류에 로지스틱 회귀분석을 적용한 결과 85.7%의 정확도로 구축된 사전의 합리성을 확인할 수 있었다.

시간단위 전력사용량 시계열 패턴의 군집 및 분류분석 (Clustering and classification to characterize daily electricity demand)

  • 박다인;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.395-406
    • /
    • 2017
  • 전력 공급 시스템의 효율적인 운영을 위해 전력수요예측은 필수적이다. 본 연구에서는 군집분석과 분류분석을 이용하여 일 단위 시간별 전력수요량 시계열 패턴의 유형을 살펴보고자 한다. 전력거래소에서 수집된 2008년 1월 1일부터 2012년 12월 31일까지의 일 단위 시간별 전력수요량 데이터를 추세성분, 계절성분, 오차 성분으로 구성된 시계열 자료로 변환하여 사용하였다. 추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법은 k-평균 군집분석 (k-means), 가우시안혼합모델 혼합 모델 군집분석 (Gaussian mixture model), 함수적 군집분석 (functional clustering)을 고려하였다. 주성분분석을 통해 24시간 자료를 2개의 요인로 축소한 후 k-평균 군집분석과 가우시안 혼합 모델, 함수적 군집분석을 수행하였다. 군집분석 결과를 토대로 2008년부터 2011년까지 총 4년간 데이터를 4가지 분류분석방법인 의사결정나무, RF (random forest), Naive bayes, SVM (support vector machine)을 통해 훈련시켜 2012년 군집을 예측하였다. 분석 결과 가우시안 혼합 분포기반 군집분석과 RF를 이용한 군집예측 결과의 성능이 가장 우수하였다.

혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화 (A Study on the Optimization of State Tying Acoustic Models using Mixture Gaussian Clustering)

  • 안태옥
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.167-176
    • /
    • 2005
  • 본 논문은 음성인식에 쓰이는 음향모델의 모델링 방법 중 결정트리 상태공유 모델링(DTST)을 기반으로 출력 확률 분포의 혼합 가우시안 수를 줄여 모델을 최적화하는 방법을 제안한다. DTST는 음성학적 지식을 포함할 수 있는 질의어 집합과 유사도를 기반으로 한 결정 방법을 이용하는 것이다. 이때 상태들의 출력 확률 분포의 혼합 가우시안 수를 늘려 인식률을 증가시킬 수 있게 된다. 본 논문에서는 인식률이 최대가 되는 지점에서 혼합 가우시안들을 군집화 하여 그 수를 줄이고자 한다. 군집화 시에 필요한 거리 측정 방법은 유클리드(Euclidean)와 바타챠랴(Bhattacharyya) 방법을 이용하였고, 새로운 가우시안은 거리가 최소가 되는 두 가우시안으로부터 평균과 분산을 다시 계산하여 생성하였다. 증권상장 회사명(STOCKNAME) 1,680개의 단어 데이터베이스를 구성하여 실험한 결과 바타챠랴 방법은 $97.2\%$의 인식률을 유지하면서 전체 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켰고, 유클리드 방법은 $96.9\%$의 인식률을 유지하면서 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켜 모델을 최적화할 수 있었다.

공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링 (Efficient Continuous Vocabulary Clustering Modeling for Tying Model Recognition Performance Improvement)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.177-183
    • /
    • 2010
  • 연속 어휘 인식 시스템에서는 통계적 방법에 의한 어휘 인식을 수행하기 위하여 확률분포를 이용하며 이는 음소 단위의클러스터링을사용하여모델링하여샘플들을기반으로 확률 파라미터를 추정한다. 어휘 검색 시 추정된 확률 파라미터로부터 인식 결과를 나타내는데 미리 정의되지 않은 음소와 추가되어진 음소로부터 인식률이 저하되는 문제점이 발생하며, 하나의 클러스터링으로 모델링하므로 가우시안 모델이 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 확률 분포의 혼합 가우시안 모델을 최적화하여 유사도를 기반으로 Euclidean과 Bhattacharyya 거리 측정 방법을 혼합한 군집화 모델을 제안하고, 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타내었다.

전기 사용량 시계열 함수 데이터에 대한 비모수적 군집화 (Nonparametric clustering of functional time series electricity consumption data)

  • 김재희
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.149-160
    • /
    • 2019
  • 본 연구는 2016년 7월부터 2017년 6월까지 인천 소재 A 대학교의 15분 단위의 일일 전기 사용량 시계열 데이터에 대해 functional data analysis 기법을 적용하여 군집화하고 각 군집의 특성을 파악하고 예측에 활용하고자 한다. 하루동안의 A 대학교의 전기 사용량은 패턴은 주중과 주말 에 큰 차이를 보이며 스플라인 기저함수로 FPCA 구한 후 이들에 대한 가우시안 분포의 혼합모형 기반 군집분석으로 3개의 군집화가 적절해 보인다. 각 군집에 대해 평균 함수, 확률밀도함수, 일들의 분포 등을 정리해 각 군집에 대한 정보와 특징을 보여준다.

깊이정보 기반의 혼합 가우시안 분포 히스토그램과 Mean Shift Filter를 이용한 깊이정보 맵 부호화 전처리 (Depth Map coding pre-processing using Depth-based Mixed Gaussian Histogram and Mean Shift Filter)

  • 박성희;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.175-177
    • /
    • 2010
  • 본 논문에서는 MPEG 의 3차원 비디오 시스템의 표준 깊이정보 맵에 대한 효율적인 부호화를 위하여 전처리 방법을 제안한다. 현재 3차원 비디오 부호화(3DVC)에 대한 표준화가 진행 중에 있지만 아직 깊이정보 맵의 부호화 방법에 대한 표준이 확정되지 않은 상태이다. 제안하는 기법에서는 우선, 입력된 깊이정보 맵에 대하여 원래의 히스토그램 분포를 가우시안 혼합모델(GMM)기반의 EM 군집화 기법에 의한 방법으로 분리 후, 분리된 히스토그램을 기반으로 깊이정보 맵을 여러 개의 영상으로 분리한다. 그 후 분리된 각각의 영상을 배경과 객체에 따라 다른 조건의 mean shift filter로 필터링한다. 결과적으로 영상내의 각 영역 경계는 최대한 살리면서 영역내의 화소 값에 대해서는 평균 연산을 취하여 부호화시 효율을 극대화 하고자 하였다. 실험조건은 $1024{\times}768$ 영상에 대해서 50 프레임으로 H.264/AVC base 프로파일로 부호화를 진행하였다. 최종 실험결과 bit rate는 대략 23% ~ 26% 정도 감소하고 부호화 시간도 다소 줄어드는 것을 확인 할 수 있었다.

  • PDF

영상분할을 위한 혼합 가우시안 함수 임계 값 결정 (Decision of Gaussian Function Threshold for Image Segmentation)

  • 정용규;최규석;허고은
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.163-168
    • /
    • 2009
  • 영상분할의 대부분의 방법들은 각 화소에서 관측되는 특징벡터로 표현하며 이들에 대하여 적절한 확률모델을 가정하게 된다. 이들 확률 모델을 결정하는 파라미터들을 통계적 방법으로 추정하여 이용하거나 각 특징 벡터간의 유사 도를 기반으로 하는 군집 알고리즘을 사용하여 분할을 수행하는 방법들을 이용한다. 이의 대표적인 방법인 EM알고리즘은 불완전한 데이터에서 미지의 파라미터에 대한 최대 우도를 계산하는 경우나 사후 확률 분포의 최대 값을 구하는 문제 등의 응용 분야가 매우 다양하지만 몇 가지의 구조적 문제점을 가지고 있다. 먼저 추정량의 성능이 시작점에 크게 의존한다는 것이며 따라서 우도 함수가 국부적 최대 값에 수렴한다는 것이다. 이러한 문제점을 해결하기 위하여 영상의 모든 레벨 값을 중심으로 형성된 가우시안 함수와 원 영상의 히스토그램을 혼합하여 영상의 새로운 히스토그램을 통해 임계 값을 설정하는 최적화된 영상분할 기법을 제시한다. 제안된 알고리즘은 MFC를 통해 구현하였으며 영상을 임계 값의 개수에 따라 다양하게 나누어 보았을 때 에지부분이 선명하게 나타나며 세밀하고 정확한 영상으로 분할됨을 확인할 수 있다.

  • PDF

혼합 가우시안 모델과 민쉬프트 필터를 이용한 깊이 맵 부호화 전처리 기법 (Depth Map Pre-processing using Gaussian Mixture Model and Mean Shift Filter)

  • 박성희;유지상
    • 한국정보통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.1155-1163
    • /
    • 2011
  • 본 논문에서는 깊이 맵(depth map)에 대한 효율적인 부호화를 위하여 전처리 기법을 제안한다. 현재 3차원 비디오 부호화(3D video coding : 3DVC)에 대한 표준화가 진행 중에 있지만 아직 깊이 맵의 부호화 방법에 대한 표준은 확정되지 않은 상태이다. 제안하는 기법에서는 먼저 입력된 깊이 맵의 히스토그램 분포를 가우시안 혼합모델(Gaussian mixture model : GMM) 기반의 EM(expectation maximization) 군집화 기법을 이용하여 분리한다. 분리된 히스토그램을 기반으로 깊이 맵을 여러 개의 레이어로 분리하게 된다. 분리된 각각의 레이어에서 배경과 객체의 포함여부에 따라 다른 조건의 민쉬프트 필터(mean shift filter)를 적용한다. 결과적으로 영상내의 각 영역 경계는 최대한 살리면서 영역내의 화소 값에 대해서는 평균 연산을 취하여 부호화시 효율을 극대화 하고자 하였다. 다양한 실험영상에 대하여 제안한 기법을 적용한 깊이 맵을 부호화하여 비트율(bit rate)이 감소하고 부호화 시간도 다소 줄어드는 것을 확인 할 수 있었다.

다중가우시안혼합모델을 이용한 소동물 심근경색 PET 영상의 정량적 평가 기술 (Quantitative Assessment Technology of Small Animal Myocardial Infarction PET Image Using Gaussian Mixture Model)

  • 우상근;이용진;이원호;김민환;박지애;김진수;김종국;강주현;지영훈;최창운;임상무;김경민
    • 한국의학물리학회지:의학물리
    • /
    • 제22권1호
    • /
    • pp.42-51
    • /
    • 2011
  • 전통적으로 심근 생존능을 식별하고 심근 관류를 정확히 평가하기 위한 도구로 핵의학영상이 이용되고 있으나 경색영역을 정의하기에는 어려움이 있다. 이에 본 연구에서는 극성지도의 분포를 분석하여 특성에 맞는 적응적 임계값을 이용하여 심근경색 모델을 정량적으로 평가하고자 하였다. 쥐 심근경색 모델은 왼쪽 관상동맥을 결찰시켜 제작하였다. 소동물PET 영상은 37 MBq $^{18}F$-FDG를 쥐의 꼬리정맥에 주사한 후 60분 섭취 후 Siemens Inveon SPECT/PET 스캐너를 이용하여 20분 동안 ECG 신호와 함께 획득하였고, OSEM 2D 알고리즘을 이용하여 재구성하였다. PET 영상의 심근 극성지도는 Siemens QGS 소프트웨어에 적합한 형식으로 변환 후 자동으로 심근 벽을 설정하여 작성하였다. 심근경색영역의 기준데이터는 TTC 염색으로 설정하였으며 전체 좌심실대비 염색된 영역의 백분율로 획득하였다. 최적의 임계값 설정을 위해 절대치 설정 방법, Otsu 알고리즘, 다중가우시안혼합모델(Multi Gaussian mixture model, MGMM)을 이용하여 평가하였다. 절대치 설정 방법은 10~90%까지 10%단위로 미리 정의 된 임계값을 이용하였고, Otsu 알고리즘은 영상 내에서 두 군집의 분산을 최대로 하는 임계값으로 설정하였다. MGMM 방법은 영상의 화소 강도를 분석하여 여러 개의 가우시안 분포함수(MGMM2, $\cdots$ MGMM4)로 반복 수행하여 최적의 가우시안 분포를 구하여 적응적 임계값을 설정하였다. 극성지도 평가지표는 각각의 알고리즘에서 측정된 임계값을 이용하여 이진화하고 전체 극성지도와 경색영역의 백분율로 획득한 후, TTC 염색으로 획득된 기준데이터와의 차이를 비교하였다. 그 차이는 절대치 방법의 20%에서 $7.04{\pm}3.44%$, 30%에서 $3.87{\pm}2.09%$, 40%에서 $2.15{\pm}2.07%$이었다. Otsu 방법은 $3.56{\pm}4.16%$이었으며 MGMM 방법은 $2.29{\pm}1.94%$이었다. 소동물 PET 극성지도에서는 30% 임계값이 조직학적 데이터와 비교하여 가장 작은 차이를 보였다. 그러나 TTC 염색으로 측정한 크기가 10% 이하에서는 MGMM 방법이 절대치 방법보다 작은 차이를 보였다(MGMM: 0.006%, 절대치방법: 0.59%). 이 연구에서는 심근경색 모델 평가를 위하여 생체영상 극성지도에서 다중가우시안혼합모델을 이용하여 평가하고자 하였다. MGMM은 사용자의 선택 없이도 자동적으로 영상 특성을 고려하여 적응적 임계값을 찾아주는 방법으로 극성지도에서 심근경색을 평가하는데 도움이 될 것으로 기대된다.