• 제목/요약/키워드: 베이지안 분류

검색결과 200건 처리시간 0.027초

효율적인 컨텍스트 분류를 위한 베이지안 네트워크 구조의 제한 학습 (Constrained Learning Method of Bayesian Network Structure for Efficient Context Classification)

  • 황금성;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.112-114
    • /
    • 2004
  • 지능형 로봇 에이전트 기술이 발전하면서 서비스 질을 높이기 위한 방법으로 컨텍스트의 활용성이 부각되고 있다. 하지만 컨텍스트 분류 기술들은 아직까지 초기 개발 단계이며 다양한 방법들이 시도되고 있다. 본 논문에서는 전문가의 지식과 학습된 지식을 함께 적용할 수 있고 사람이 그 내용을 이해하기 유리한 베이지안 네트워크(BN)를 이용한 컨텍스트 분류 방법을 제안한다. 일반적인 BN 구조 학습에 사전 지식 및 방향성, 연결 관계 범위를 부여할 수 있는 제한(Constraint)을 적용한 효율적인 컨텍스트 분류 방법을 소개하고, 몇 가지 비교 실험을 통해 기존 방법에 비해 전문가의 개입이 줄어들고 좀 더 신뢰성 있는 컨텍스트 분류기를 얻을 수 있음을 보인다.

  • PDF

온톨로지와 Semantic Enrichment를 이용한 스팸 메일 필터링 시스템 (Spam Mail Filtering System using Ontology and Semantic Enrichment)

  • 김현준;김흥남;정재은;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.553-555
    • /
    • 2004
  • 최근 인터넷의 급속한 성장과 더불어 전자메일(I-Mail)은 의사교환의 필수적인 매체로 사용 되어지고 있다. 그러나 편리하고 비용이 들지 앉는 장정을 이용해 엄청난 양의 스맴 메일이 매일같이 솎아져 오고, 이를 해결하기 위한 다양한 연구들이 제시되어져 왔다. 특히. 문서 분류에 널리 쓰이는 베이지안 분류자(Bayesian classifier)가 가장 널리 이용되어지고 있는데, 정확도와 재현율에서 비교적 우수한 성능을 보이고 있다. 그러나 몇 가지 문제점을 갖고 있는데, 첫째, 사전에 사용자에 의해 스팸. 논스팸 메일에 대한 충분한 학습이 선행되어야 하는 정, 둘째, 필터링을 위한 연산시간이 소요되는 점, 셋째, 필터링의 대상이 되는 메일 본문의 내용이 적을 경우 정확한 필터링이 어렵다는 정 등의 문제점이 있다. 본 논문에서는 마지막 문제점으로 지적된 메일 본문의 내용이 적을 경우 즉, 연산을 위한 특징적인 단어들의 부족으로 정확한 분류가 불가능한 경우의 해결방안으로 온틀로지와 Semantic Enrichment 기법을 이용한 스팸 메일 필터링 시스템을 제안한다. 실험 결과, 제안하는 시스템이 베이지안 분류자를 이용한 분류 시스템보다 정확도에서 4.1%, 재현율에서 10.5%. 그리고 F-measure에서 7.64%의 성능향상을 보였다.

  • PDF

베이지안 네트워크 기반 계층적 CPV 태양광 추적 시스템 (A Hierarchical CPV Solar Generation Tracking System based on Modular Bayesian Network)

  • 박수상;양견모;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권7호
    • /
    • pp.481-491
    • /
    • 2014
  • 지구 온난화 문제와 화석 연료 양의 한계 때문에 재생 가능한 전력 생산에 대한 관심이 증가하고 있다. 특히 재생 에너지 중 태양광 에너지의 전력 생산 비율은 점차 증가함에 따라 집광형 태양광발전 시스템은 높은 전력 생산량으로 각광받고 있다. 하지만 이 시스템은 태양광 중첩률이 높을 때 가장 높은 발전 효율을 내기 때문에 허용 오차 범위가 작은 정밀 태양 추적 시스템이 필요하다. 본 논문에서는 복잡한 환경에 대응할 수 있는 베이지안 네트워크와 나이브 베이즈 분류기를 이용한 계층적 추적 시스템을 제안한다. 베이지안 네트워크는 불완전하고 불확실한 상황을 모델링 하는데 강력한 모델로 충분한 양의 데이터가 없을 경우에도 도메인 지식을 바탕으로 네트워크를 설계할 수 있다는 장점이 있다. 제안하는 계층적 확률 시스템에서는 불확실한 하늘 상황을 9개로 분류하고 모듈형 베이지안 네트워크를 이용하여 현재 날씨 상황을 추론한다. 또한 나이브 베이즈 분류기를 이용하여 추론된 날씨 상황을 고려한 효율적인 추적 방법을 분류하고 선택한다. 베이지안 네트워크의 유용성을 평가하기 위해 실제 날씨 데이터를 수집하였고 평균 93.9%의 정확도(Accuracy)를 보였다. 또한, 제안하는 시스템과 핀홀 카메라 시스템의 태양광발전 효율을 비교한 결과 약 16.58%의 성능이 향상됨을 확인하였다.

대사증후군의 예측 모델링을 위한 베이지안 네트워크의 속성 순서 최적화 (An Attribute Ordering Optimization in Bayesian Networks for Prognostic Modeling of the Metabolic Syndrome)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.1-3
    • /
    • 2006
  • 대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말하며, 최근 경제여건의 향상 및 식생활 습관의 변화와 함께 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학분야에서 질병의 진단이나 예측모델을 구성하기 위한 방법으로 유용하게 사용되고 있다. 베이지안 네트워크의 구조를 학습하는 대표적인 알고리즘인 K2 알고리즘은 속성이 입력되는 순서의 영향을 받으며, 따라서 이 또한 하나의 주제로써 연구되어 왔다. 본 논문에서는 유전자 알고리즘을 이용하여 베이지안 네트워크에 입력되는 속성 순서를 최적화하며 이 과정에서 의학지식을 적용해 효율적인 최적화가 가능하도록 하였다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행한 결과 속성 순서 최적화 후에 이전보다 향상된 예측율을 보였으며 또한 다층 신경망, k-최근접 이웃 등을 이용한 다른 모델보다 더 높은 예측율을 보였다.

  • PDF

만성 폐쇄성 폐질환을 이용한 노모그램 구축과 비교 (Comparison of nomogram construction methods using chronic obstructive pulmonary disease)

  • 서주현;이제영
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.329-342
    • /
    • 2018
  • 노모그램은 질병의 위험 요인과 예측 확률을 쉽게 이해할 수 있도록 시각적으로 표현하는 통계적 도구이다. 본 논문은 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)의 위험 요인을 이용하여 로지스틱 회귀모형과 순수 베이지안 분류기 모형의 노모그램을 구축하고 이를 비교하였다. 분석 데이터는 국민건강영양조사 6기(2013-2015)를 이용하여 진행하였다. 총 6개의 위험 요인을 이용하였다. 그리고 로지스틱 회귀모형, 순수 베이지안 분류기 모형과 각각의 구축 방법을 이용하여 만성 폐쇄성 폐질환의 노모그램을 제시하였다. 또한, 구축된 두 노모그램을 비교하여 유용성을 살펴보았다. 마지막으로 ROC curve와 Calibration plot을 통하여 각 노모그램을 검증하였다.

Reversible Jump MCMC와 베이지안망 학습에 의한 데이터마이닝 (Data Mining Using Reversible Jump MCMC and Bayesian Network Learning)

  • 하선영;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.90-92
    • /
    • 2000
  • 데이터마이닝 문제는 데이터를 그 속성들에 따라 분류하여 예측하는 것뿐만 아니라 분류된 속성들간의 연관성에 대해 잘 설명할 수 있어야 한다. 일반적으로 변수들간의 연관성을 잘 설명할 수 있으면서도 높은 예측력을 가지는 방법으로는 베이지안 네트웍 분류자(Bayesian network classifier)가 있다. 그러나 이것은 데이터 마이닝과 같은 대용량 데이터에서는 성능이 떨어지는 단점이 있다. 이에 이 논문에서는 최근 RBF 신경망이 입력변수 선정문제에 성공적으로 적용된 Reversible Jump Markov Chain Monte Carlo 방법을 이용하여 최적의 입력변수들만을 선택하여 베이지안 네트웍을 학습하는 Selective BN Augmented Naive-Bayes Classifier를 새로운 방안으로 제안하고 이를 실제 데이터마이닝 문제에 적용한 결과를 제시한다.

  • PDF

모바일 컨텍스트 로그를 사용한 속성별 베이지안 네트워크 기반의 랜드마크 예측 모델 학습 (Learning Predictive Models of Memory Landmarks based on Attributed Bayesian Networks Using Mobile Context Log)

  • 이병길;임성수;조성배
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.535-554
    • /
    • 2009
  • 모바일 장비에서 수집되는 정보는 개인의 기억을 보조하기 위한 수단으로 활용될 수 있지만, 그 양이 너무 많아 사용자가 효과적으로 검색하기에는 어려움이 있다. 데이터를 사람의 기억과 유사한 에피소드 방식으로 저장하기 위해 중요 이벤트인 랜드마크를 탐지하는 것이 필요하다. 본 논문에서는 사용자에게 새로운 서비스를 제공하기 위해서 다양한 컨텍스트 로그 정보로부터 자동으로 랜드마크를 찾아내는 속성별 베이지안 랜드마크 예측 모델을 제안한다. 랜드마크 예측 정확도를 높이기 위해 요일별, 주간별로 데이터를 나누고 다시 수집된 경로에 따른 속성으로 분류하여 학습을 통해 베이지안 네트워크를 생성하였다. 노키아의 로그데이터로 실험한 결과, 베이지안 네트워크를 사용한 방법이 SVM을 사용한 방법보다 예측성능이 높았으며, 주간별 및 요일별로 설계한 베이지안 네트워크에 비해 제안한 방법인 속성별 베이지안 네트워크의 성능이 가장 우수하였다.

  • PDF

순수 베이지안 분류기 모델을 사용하여 이상지질혈증을 예측하는 노모 그램 구축 (Nomogram building to predict dyslipidemia using a naïve Bayesian classifier model)

  • 김민호;서주현;이제영
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.619-630
    • /
    • 2019
  • 이상지질혈증은 한국인의 대표적인 성인병이며 지속적인 관리가 필요한 만성질환이다. 또한 고혈압이나 당뇨병과 함께 심혈관계 질환의 위험 요인으로 잘 알려져 있다. 하지만 혈관 질환은 검사 없이는 질병 판단을 하기 어려운 것이 현실이다. 본 연구에서는 이상지질혈증의 인지와 예방을 위하여 관련된 위험 요인을 확인한다. 이들을 종합하여 시각화하면서 발병률 예측까지 가능한 통계적 도구 노모그램을 구축하였다. 데이터는 국민건강영양조사 6기, 7기 제1차년도 (2013-2016) 데이터를 사용하였다. 분석 순서로는 먼저 이상지질혈증의 총 12가지 위험 요인을 교차분석을 통해 확인하였다. 그리고 순수 베이지안 분류기를 이용하여 이상지질혈증에 대한 모형으로 노모그램을 구축하였다. 구축한 노모그램은 ROC 곡선과 Calibration plot을 사용하여 신뢰성을 검증하였다. 마지막으로 이전에 제시했던 로지스틱 노모그램과 본 연구에서 제안한 베이지안 노모그램을 비교하였다.

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

동적 베이지안 네트워크를 이용한 델티모달센서기반 사용자 행동인식 (Activity Recognition based on Multi-modal Sensors using Dynamic Bayesian Networks)

  • 양성익;홍진혁;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권1호
    • /
    • pp.72-76
    • /
    • 2009
  • 최근 유비쿼터스 컴퓨팅에 대한 관심이 높아지면서 유비쿼터스 환경에서의 서비스를 위한 인간과 컴퓨터의 상호 작용, 특히 인간의 행동을 인식하는 연구가 활발히 진행되고 있다. 기존의 영상기반 연구와는 달리 모바일 환경에 적합하도록 가속도 센서, 생리신호 센서 등 다양한 센서들을 활용하여 사용자의 행동을 인식하는 기법이 연구되고 있다. 본 논문에서는 멀티모달 센서들을 통합하고 동적 베이지안 네트워크를 계층적으로 구성하여 사용자의 행동을 인식하는 방법을 제안한다. 연산량이 비교적 적은 베이지안 네트워크로 전반적인 사용자 행동을 추론하고 획득된 각 행동의 확률순으로 동적 베이지안 네트워크를 구성한다. 동적 베이지안 네트워크는 OVR(One-Versus-Rest) 전략으로 학습되며, 확률순으로 행동이 검증되어 임계치를 넘는 경우 선택된 행동보다 낮은 확률의 행동에 대한 동적 베이지안 네트워크를 검증하지 않아 추론 연산량을 줄인다. 본 논문에서는 가속도 센서와 생리적 신호 센서를 기반으로 총 8가지의 행동을 인식하는 문제에 제안하는 방법을 적용하여 평균적으로 97.4%의 분류 정확률을 얻었다.