• 제목/요약/키워드: mixture gaussian

검색결과 507건 처리시간 0.026초

X-means 확장을 통한 효율적인 집단 개수의 결정 (Extensions of X-means with Efficient Learning the Number of Clusters)

  • 허경용;우영운
    • 한국정보통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.772-780
    • /
    • 2008
  • K-means는 알고리즘의 단순함과 효율적인 구현이 가능함으로 인해 군집화를 위해 현재까지 널리 사용되는 방법 중 하나이다. 하지만 K-means는 집단의 개수가 사전에 결정되어야 하는 근본적인 문제점이 있다. 이 논문에서는 BIC(Bayesian information criterion) 점수를 이용하여 효율적으로 집단의 개수를 추정할 수 있는 X-means 알고리즘을 확장한 두 가지 알고리즘을 제안한다. 제안한 방법은 기본적으로 X-means 방법을 따르면서 집단이 임의의 분산 행렬을 가질 수 있도록 함으로써 X-means 알고리즘이 원형 집단만을 허용함에 따른 over-fitting을 개선한다. 제안한 방법은 하나의 집단에서 시작하여 계속해서 집단을 나누어가는 하향식 방법으로, BIC score를 최대로 증가시키는 집단을 분할해 나간다. 제안한 알고리즘은 Modified X-means(MX-means)와 Generalized X-means(GX-means)의 두 가지로, 전자는 K-means 알고리즘을, 후자는 EM 알고리즘을 사용하여 현재 주어진 집단들에서 최적의 분할을 찾아낸다. MX-means는 GX-means보다 그 속도에서 앞서지만 집단들이 중첩 된 경우에는 올바른 집단을 찾아낼 수 없는 단점이 있다. GX-means는 실행 속도가 느린 단점이 있지만 집단들이 중첩된 경우에도 안정적으로 집단들을 찾아낼 수 있다. 이러한 점들은 일련의 실험을 통해서 확인할 수 있으며, 제안한 방법들이 기존의 방법들에 비해 나은 성능을 보임을 확인할 수 있다.

GM-NHMM 기반 토양함수 모의결과를 이용한 합성가뭄지수 개발 (A development of multivariate drought index using the simulated soil moisture from a GM-NHMM model)

  • 박종현;이주헌;김태웅;권현한
    • 한국수자원학회논문집
    • /
    • 제52권8호
    • /
    • pp.545-554
    • /
    • 2019
  • 가뭄평가 시 단일 수문인자를 활용하여 가뭄지수를 산정하고 가뭄의 출현, 심도 및 지속기간 등을 평가하는 것이 일반적이다. 하지만 가뭄은 여러 요인이 복합적인 연관성을 가지며 나타나는 현상이므로 단일인자로 가뭄을 평가하는 경우 불확실성 및 한계가 존재한다. 이에 따라 다양한 수문기상 특성을 고려할 수 있는 가뭄지수의 개발이 지속적으로 요구되고 있다. 본 연구에서는 강우량 및 토양수분을 이용하여 가뭄을 평가하고자 은닉 마코프 모형(Hidden Markov chain Model)기반의 토양수분 모의기법을 통해 과거(1973-2014년) 토양의 수분함량을 모의하였으며, Copula 함수를 활용하여 강우량과 토양수분을 동시에 고려한 합성가뭄지수를 산정하였다. 본 연구에서 제안된 토양수분산정 모델은 다중 회귀 모형의 모의결과와 비교를 통해 모델의 적합성을 검증하였으며, 가뭄의 지속기간과 심도를 고려하여 이변량 빈도해석을 수행하였다. 이변량 빈도해석결과 2015년 전라북도 지역에 발생하였던 가뭄은 약 20년의 재현기간을 갖는 것으로 분석되었다.

CTC를 적용한 CRNN 기반 한국어 음소인식 모델 연구 (CRNN-Based Korean Phoneme Recognition Model with CTC Algorithm)

  • 홍윤석;기경서;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.115-122
    • /
    • 2019
  • 지금까지의 한국어 음소 인식에는 은닉 마르코프-가우시안 믹스쳐 모델(HMM-GMM)이나 인공신경망-HMM을 결합한 하이브리드 시스템이 주로 사용되어 왔다. 하지만 이 방법은 성능 개선 여지가 적으며, 전문가에 의해 제작된 강제정렬(force-alignment) 코퍼스 없이는 학습이 불가능하다는 단점이 있다. 이 모델의 문제로 인해 타 언어를 대상으로 한 음소 인식 연구에서는 이 단점을 보완하기 위해 순환 신경망(RNN) 계열 구조와 Connectionist Temporal Classification(CTC) 알고리즘을 결합한 신경망 기반 음소 인식 모델이 연구된 바 있다. 그러나 RNN 계열 모델을 학습시키기 위해 많은 음성 말뭉치가 필요하고 구조가 복잡해질 경우 학습이 까다로워, 정제된 말뭉치가 부족하고 기반 연구가 비교적 부족한 한국어의 경우 사용에 제약이 있었다. 이에 본 연구는 강제정렬이 불필요한 CTC 알고리즘을 도입하되, RNN에 비해 더 학습 속도가 빠르고 더 적은 말뭉치로도 학습이 가능한 합성곱 신경망(CNN)을 기반으로 한국어 음소 인식 모델을 구축하여 보고자 시도하였다. 총 2가지의 비교 실험을 통해 본 연구에서는 한국어에 존재하는 49가지의 음소를 판별하는 음소 인식기 모델을 제작하였으며, 실험 결과 최종적으로 선정된 음소 인식 모델은 CNN과 3층의 Bidirectional LSTM을 결합한 구조로, 이 모델의 최종 PER(Phoneme Error Rate)은 3.26으로 나타났다. 이는 한국어 음소 인식 분야에서 보고된 기존 선행 연구들의 PER인 10~12와 비교하면 상당한 성능 향상이라고 할 수 있다.

한국 하천의 지역별 유사특성의 군집화와 H-ADCP 기반 부유사 농도 관측 기법에의 활용 방안 (Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique)

  • 노효섭;손근수;김동수;박용성
    • 한국수자원학회논문집
    • /
    • 제55권1호
    • /
    • pp.43-57
    • /
    • 2022
  • 유사량 계측 기술의 발달로 초음파 도플러 유속계(ADCP)의 산란도가 부유사 농도와 관계가 있다는 특성을 이용해 부유사의 농도를 짧은 시간 간격으로 계측하여 부유사 관측의 비용과 위험 문제를 극복하고자 하는 노력이 지속되고 있다. 국내에는 자동 유량 관측소에 횡방향 ADCP (H-ADCP)가 설치되어 있어 실시간으로 부유사 농도를 계측하는 기술의 적용이 가능하지만 자동 유량 관측소와 부유사 관측소의 위치가 항상 일치하지는 않아 모든 관측소에서의 모형 개발은 불가한 실정이다. 본 연구에서는 이러한 문제를 극복하기 위해 H-ADCP가 설치된 유사량 관측소 9개소에 대해 부유사 농도를 계측하는 H-ADCP-SSC 관계식을 개발하고 그 결과의 적용성에 대해 고찰하였다. 그리고 부유사 관측소별로 나타나는 특징에 대해 알아보기 위해 한국 하천의 부유사 관측소 44개소의 유역면적, 부유사와 하상토의 입도분포, 유량-유사량 관계식 등의 유사특성 자료를 이용해 비지도 기계학습 기법인 가우시안 혼합 모형(GMM)으로 군집분석을 수행하였다. 군집화 결과, 유사량 관측소를 공간적으로 구분해낼 수 있었으며, 특히 하천의 본류와 지류의 유사 특징을 구분해낼 수 있었다. 결과적으로, H-ADCP-SSC 관계식과 부유사 관측소의 군집분석 결과를 종합해 H-ADCP-SSC 관계식이 개발되지 않은 자동 유량 관측소에서 관계식을 적용하는 부유사 농도를 실시간으로 계측할 수 있도록 하는 프로토콜을 제안하였다.

지역의 사회·경제적 인자와 용수공급체계를 고려한 가뭄 위험도 평가 (Drought risk assessment considering regional socio-economic factors and water supply system)

  • 김지은;김민지;최시중;이주헌;김태웅
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.589-601
    • /
    • 2022
  • 가뭄은 자연적 현상이지만, 지역의 물리적 및 사회적 요소와 결합되어 피해가 발생한다. 특히, 각종 용수 공급 및 수요과 연관되어 사회 경제적으로 큰 피해를 야기시킨다. 비슷한 심도의 기상학적 가뭄에도 지역의 특성과 용수공급체계에 따라 실제로 발생하는 가뭄 피해는 다르다. 본 연구에서는 지역의 사회·경제적 인자와 용수공급체계를 고려하여 가뭄 위험도를 평가하였다. 노출성은 용수공급 과부족량을 나타내는 결합가뭄관리지수(JDMI)를 등급화하여 평가하였다. 취약성은 가뭄에 영향을 받는 10개의 사회·경제적 인자에 엔트로피, PCA 및 GMM를 적용하여 가중평균하여 평가하였다. 대응능력은 지역의 용수능력을 나타내는 인자들을 베이지안 네트워크에 적용하여 평가하였다. 위험도는 노출성, 취약성 및 대응능력을 통합하여 결정하였다. 용수공급 실패 사상의 발생 가능성을 의미하는 가뭄 노출성을 평가한 결과, 괴산군이 0.81로 가장 높게 나타났다. 가뭄 취약성의 경우, 대전광역시가 0.61로 매우 취약한 것으로 나타났다. 지역의 용수공급체계가 고려된 가뭄 대응능력을 평가한 결과, 세종시가 가뭄 대응능력이 가장 낮은 것으로 나타났다. 마지막으로 위험도를 평가한 결과, 청주시가 가장 높게 나타났다. 이러한 결과를 통해 가뭄에 대한 위험 및 취약 원인을 파악하였으며, 향후 지역의 특성을 고려한 가뭄 피해 저감 정책 마련이 가능하다.

ICT 의료시설 기반에서 종사자의 소방안전 지식과 대처방법 인식수준 (ICT Medical Service Provider's Knowledge and level of recognizing how to cope with fire fighting safety)

  • 김자숙;김자옥;안영준
    • 한국전자통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.51-60
    • /
    • 2014
  • 본 연구는 광주 전남지역 ICT 의료시설 기반에서 종사자를 대상으로 소방안전 지식과 대처방법 인식수준의 정도를 파악하고 차이를 조사하여 ICT 의료시설 기반에서 소방안전 대처방법 교육 매뉴얼의 기초자료를 제공하기 위하여 수행 되었다. 자료는 SPSS Win 14.0을 사용하여 분석하였다. 연구결과 ICT 의료시설 기반에서 종사자의 소방안전 지식은 10점 만점에 7.06점, 소방 대처방법 인식수준은 11점 만점에 6.61점이었다. ICT 의료시설 기반에서 종사자의 일반적 특성과 소방안전 대처방법 인식수준을 분석한 결과 성별(t=4.12, p<.001, 연령(${\chi}^2$=17.24, p<.001), 근무경력(${\chi}^2$=22.76, p<.001), 소방안전교육 경험 유무(t=6.10, p<.001), 소방안전에 대한 본인의 주관적 지식정도(${\chi}^2$=53.83, p<.001)에서 통계적으로 유의한 차이가 있었다. 따라서 ICT 의료시설 기반에서 종사자의 소방안전 대처를 증진하기 위해서는 강의 중심의 지식 전달 교육을 지양하고, 자기 주도적 학습, 개인별 맞춤학습, 협동 학습을 강조하는 다양한 콘텐츠 개발을 통한 실무 체험 중심의 소방안전 교육, 시뮬레이션을 이용한 환자분류체계별 배치와 광역 화재감지를 위한 적외선 레이저 연기검출, 다중포인트 통신 프로토콜에 의한 디지털 화재 방지 모니터링 시스템, 영상기반 화재검출, 화재감지를 위한 로봇 설계 및 테이터 처리등의 다학문적인 접근을 통한 ICT 의료시설 기반에서 소방안전 대처에 관한 교육 매뉴얼의 개발이 필요하다고 사료된다.

방향성매매를 위한 지능형 매매시스템의 투자성과분석 (Analysis of Trading Performance on Intelligent Trading System for Directional Trading)

  • 최흥식;김선웅;박성철
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.187-201
    • /
    • 2011
  • 방향성(Direction)과 변동성(Volatility)에 대한 분석은 증권투자를 위한 시장분석의 기초가 된다. 변동성분석이 옵션 투자에서 중요하다면 주식이나 주가지수선물투자는 방향성분석에 의하여 투자성과가 결정된다. 기존의 금융분석에서 기계학습을 이용한 방향성에 대한 연구는 주가나 투자위험의 예측을 중심으로 이루어졌으며, 최근에 와서야 실전투자를 위한 매매시스템(trading system) 개발에 대한 연구가 이루어지고 있다. 인공지능형 주가예측모형에서는 ANN(artificial neural networks), fuzzy system, SVM(Support Vector Machine) 등의 기법이 주로 활용되고 있다. 본 연구에서는 방향성매매를 위한 지능형 기계학습방법 중에서도 패턴인식에서 좋은 성과를 보이고 있는 은닉마코프 모형(Hidden Markov Model)을 이용한다. 실무적으로는 방향성 예측을 위해 주로 주가의 추세분석(Trend Analysis)을 활용한다. 다양한 기술적 지표를 이용한 추세분석에 기반한 시스템트레이딩(System Trading) 기법은 실전투자에서 점차 확대추세에 있다. 본 연구에서는 시스템트레이딩 기법 중 실무에서 많이 이용되는 이동평균교차전략(moving average cross)에 연속 은닉마코프모형을 적용한 지능형 매매시스템을 제안하고, 실제 주가자료를 이용한 시뮬레이션 결과를 제시한다. 세계적 선물시장으로 성장한 KOSPI200 선물시장에서 제안된 매매시스템의 장기간의 투자성과를 분석하기 위하여 지난 21년 동안의 KOSPI200 주가지수자료를 실증 분석하였다. 분석결과는 KOSPI200 주가지수선물의 방향성매매에서 제안된 CHMM기반 지능형 매매시스템이 실전에서 일반적으로 활용되는 시스템트레이딩 기법의 투자성과를 개선할 수 있음을 보여주었다.