• 제목/요약/키워드: 베이지안 분류

검색결과 200건 처리시간 0.032초

동적 베이지안 분류기와 이변량 가뭄빈도분석을 통한 우리나라 미래 가뭄 전망 (Prediction of future drought in Korea using dynamic Bayesian classifier and bivariate drought frequency analysis)

  • 김혁;김민지;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.193-193
    • /
    • 2023
  • 여러 기후변화 시나리오에 의하면 기상재해의 발생빈도 및 강도가 증가할 것으로 예상된다. 그중 가뭄은 강수량 부족, 하천유량 감소, 토양 함수량 감소, 용수 수요량 증가 등의 다양한 요인으로 인해 발생하며, 한 가지 형태뿐만 아니라 복합적인 형태로 발생할 수 있다. 또한, 우리나라는 지역마다 기후 특성의 편차가 있어 기후변화에 따른 가뭄 취약성과 대응 능력이 지역마다 다르게 나타난다. 따라서 가뭄에 대응하기 위해서는 다양한 요인을 고려한 통합가뭄지수를 활용해야 하며, 미래의 기후변화를 고려하여 종합적으로 가뭄을 평가해야 한다. 본 연구에서는 동적 베이지안 분류기(DNBC) 기반의 통합가뭄지수를 활용하여 우리나라 전국에 대해 수문학적 위험도를 분석하고 미래 가뭄을 전망하였다. 기상학적, 수문학적, 농업적 및 사회경제적 요인을 고려한 통합가뭄지수를 산정하기 위하여 DNBC 분류기의 인자로 기후변화 시나리오 기반의 기상학적 가뭄지수 SPI, 수문학적 가뭄지수 SDI, 농업적 가뭄지수 ESI와 사회경제적 가뭄지수 WSCI를 활용하였다. 산정된 통합가뭄지수의 시계열을 기반으로 심도와 지속기간을 추출하고, 코플라 함수를 활용한 이변량 가뭄빈도분석을 수행하였다. 이후, 이변량 가뭄빈도분석에 의해 산정된 재현기간을 활용하여 수문학적 위험도를 산정하였다. 그 결과, P1(2021~2040) 기간이 수문학적 위험도 R=0.588로 가장 높은 위험도를 나타냈으며, 이후 P2(2041~2070) 기간까지 감소하였다가 P3(2071~2099) 기간에 다시 증가하는 추세를 보였다. P1(2021~2040) 기간과 P3(2071~2099) 기간은 영산강 유역이 각각 R=0.625(P1), R=0.550(P3)으로 가장 높은 위험도를 나타냈으나, P2(2041~2070) 기간은 금강 유역이 수문학적 위험도 R=0.482로 가장 높게 나타났다. 본 연구결과를 통해 향후 미래 가뭄에 대한 가뭄계획 수립 시에 기초자료로서 활용성이 높을 것으로 기대된다.

  • PDF

서베일런스에서 베이지안 분류기를 이용한 객체 검출 및 추적 (Object Detection and Tracking using Bayesian Classifier in Surveillance)

  • 강성관;최경호;정경용;이정현
    • 디지털융복합연구
    • /
    • 제10권6호
    • /
    • pp.297-302
    • /
    • 2012
  • 본 논문은 이미지 상황분석을 기반으로 하여 객체 검출 및 추적 방법을 제안한다. 제안하는 방법은 배경이 복잡한 형태이거나 배경이 동적으로 움직일 때에도 일관성 있는 결과를 얻을 수 있다. 입력 영상의 상황분석은 K-means와 RBF의 하이브리드 네트워크를 이용하여 수행되어진다. 제안된 객체 검출은 일정하지 않은 객체 이미지 때문에 생기는 영향을 감소시키기 위해 상황 기반 적응적 베이지안 네트워크를 이용한다. 본 논문에서는 학습 속도를 높이기 위해 2D Haar 웨이블릿 변형을 이용한 특징 벡터 생성기와 베이지안 판별식 방법을 이용하여 학습 시간이 적게 걸리며 학습 데이터의 변화에 일정한 성능을 갖는 방법론을 제안하였다. 제안하는 방법을 개발하여 실환경에 적용한 결과 검출하고자 하는 물체가 예측 영역을 넘나들거나 다른 불확실한 변화에도 안정적으로 반응함을 알 수 있었다. 실험 결과는 기존의 방법들에서 사용되었던 다양한 데이터 집합에 적용하였을 때 우수한 성능을 보여준다.

제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교 (Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D))

  • 박재철;김민호;이제영
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.573-585
    • /
    • 2018
  • 본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned 방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구 (Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis)

  • 강창민;어균선;이건창
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.1-19
    • /
    • 2022
  • 온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS(Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naive Bayes), NB (Naive Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.

베이지안 네트워크 기반의 변형된 침입 패턴 분류 기법 (Modificated Intrusion Pattern Classification Technique based on Bayesian Network)

  • 차병래;박경우;서재현
    • 인터넷정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.69-80
    • /
    • 2003
  • 프로그램 행위 침입 탐지 기법은 데몬 프로그램이나 루트 권한으로 실행되는 프로그램이 발생시키는 시스템 호출들을 분석하고 프로파일을 구축하여 변형된 공격을 효과적으로 탐지한다. 본 논문에서는 베이지안 네트워크와 다중 서열 정렬을 이용하여 여러 프로세스의 시스템 호출간의 관계를 표현하고, 프로그램 행위를 모델링하여 변형된 이상 침입 행위를 분류함으로써 이상행위를 탐지한다. 제안한 기법을 UNM 데이터를 이용한 시뮬레이션을 수행하였다.

  • PDF

사용자 행동 패턴을 기반으로 가중치를 부여한 스팸 메일 필터링 (Weighting based User Behavior Pattern for Filtering Spam Mail)

  • 한아성;김현준;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.389-394
    • /
    • 2007
  • 스팸 메일의 비율은 지속적으로 증가하여 최근 전체 이메일의 92.6%가 스팸 메일인 것으로 드러났다. 본 논문에서는 시간의 경과에 따른 사용자의 액션 패턴을 기반으로 사용자의 관심에 따른 가중치를 적용하여 스팸 메일 여부를 가리는 방법을 다룬다. 액션간의 관계와 액션 사이의 시간에 따라 가중치를 차별화함으로써 얼마나 높은 필터링 성능을 보일 수 있는 지, 또한 학습 속도 향상에 얼마나 기여할 수 있는지를 측정할 것이다. 실험에서는 실제 메일 데이터를 이용하여 베이지안 분류자, 가중치가 부여된 베이지안 분류자와 본 논문이 제안하는 시스템의 학습 성능의 향상 속도를 비교할 것이다. 또한 제안된 시스템이 Concept Drift와 적응 학습, 그리고 개인화를 어떻게 다룰 지를 보일 것이다.

  • PDF

정규 혼합분포를 이용한 준지도 학습 (Semi-Supervised Learning by Gaussian Mixtures)

  • 최병정;채윤석;최우영;박창이;구자용
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.825-833
    • /
    • 2008
  • 혼합모형을 이용한 판별분석은 다중 분류문제를 해결하는데 유용한 방법으로서 준지도 학습으로 확장될 수 있다. 본 논문에서는 정규 혼합분포를 이용한 준지도 학습 방법에서 혼합 모형의 하위 구성요소 개수 선택 기준을 연구하고자 한다. 하위 구성요소 선택 기준으로서 베이지안 정보량을 사용하였고 모의실험을 통해 이 방법의 유용성을 규명하였다.

가상예제를 이용한 수치 및 범주 속성 데이터의 분류 성능 향상 (Improving Classification Accuracy for Numerical and Nominal Data using Virtual Examples)

  • 이유정;강재호;강병호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주속성 및 수치속성 데이터에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이터를 대상으로 한 반면 본 연구에서는 범주속성 데이터에 대해서도 가상예제를 적용하여 효과를 확인하였다. 그리고 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 한 기존 연구들과는 달리 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이터와 수치 속성을 포함한 데이터를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

  • PDF

오분류된 이진자료에서 Agresti-Coull유형의 신뢰구간에 대한 이론적 고찰 (Theoretical Considerations for the Agresti-Coull Type Confidence Interval in Misclassified Binary Data)

  • 이승천
    • Communications for Statistical Applications and Methods
    • /
    • 제18권4호
    • /
    • pp.445-455
    • /
    • 2011
  • 표본추출에서 오분류된 이진자료는 흔히 발생될 수 있는 현실적인 문제이지만 통계적 방법론은 상대적으로 제한적이라고 할 수 있다. 특히, 모비율의 구간추정 문제는 고전적인 Wald 방법에 의존하고 있었다. 그러나 최근 이승천과 최병수 (2009)에서 Agresti-Coull 방법을 적용하고 새로운 구간추정 방법을 제시하였으며, 수치적인 방법에 의해 Agresti-Coull 신뢰구간의 효율성을 주장하였다. 본 연구에서는 오분류된 이진자료에 대한 베이지안 모형을 다루었으며, 베이지안 모형이 Agresti-Coull 신뢰구간의 이론적 배경이 될 수 있는지 살펴 보았다.

분류기 성능 향상을 위한 범주 속성 가상예제의 생성과 선별 (Generation and Selection of Nominal Virtual Examples for Improving the Classifier Performance)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1052-1061
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주 속성 데이타에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이타를 대상으로 하였고, 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 하였다. 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 범주 속성 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이타를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.