• 제목/요약/키워드: naive Bayesian classifier

검색결과 50건 처리시간 0.03초

Fast Conditional Independence-based Bayesian Classifier

  • Junior, Estevam R. Hruschka;Galvao, Sebastian D. C. de O.
    • Journal of Computing Science and Engineering
    • /
    • 제1권2호
    • /
    • pp.162-176
    • /
    • 2007
  • Machine Learning (ML) has become very popular within Data Mining (KDD) and Artificial Intelligence (AI) research and their applications. In the ML and KDD contexts, two main approaches can be used for inducing a Bayesian Network (BN) from data, namely, Conditional Independence (CI) and the Heuristic Search (HS). When a BN is induced for classification purposes (Bayesian Classifier - BC), it is possible to impose some specific constraints aiming at increasing the computational efficiency. In this paper a new CI based approach to induce BCs from data is proposed and two algorithms are presented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with the ALARM, as well as other six UCI and three artificial domains revealed that the proposed approach tends to execute fewer comparison tests than the traditional PC. The experiments also show that the proposed algorithms produce competitive classification rates when compared with both, PC and Naive Bayes.

계층적인 가버 특징들과 베이지안 망을 이용한 필기체 숫자인식 (Hierarchical Gabor Feature and Bayesian Network for Handwritten Digit Recognition)

  • 성재모;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.1-7
    • /
    • 2004
  • 본 논문에서는 필기체 숫자인식을 위해서 계층적으로 서로 다른 레벨의 정보를 표현할 수 있는 구조화된 특징들의 추출 방법과 특징들 사이에 의존도를 이용하여 분류하는 베이지안 망을 제안한다. 이러한 계층적 특징들을 추출하기 위해서 레벨 단위로 가버 필터들을 정의하고, FLD(Fisher Linear Discriminant) 척도를 이용하여 최적화된 가버 필터들을 선택한다. 계층적 가버 특징들은 최적화된 가버 특징들을 이용하여 추출되며, 하위 레벨일수록 더욱 국부적인 정보를 표현한다. 추출된 계층적 가버 특징들의 분류성능 향상을 위해서 가버 특징들 사이의 계층적 의존도를 이용하는 베이지안 망을 생성한다. 본 논문에서 제안하는 방법은 naive Bayesian 분류기, k-nearest neighbor 분류기, 그리고 신경망 분류기들과 함께 필기체 숫자인식에 적용되어 계층적 가버 특징들의 효율성과 계층적 의존도를 이용하는 베이지안 망은 분류성능을 향상시킬 수 있다는 것을 보여준다.

망막 질환 진단을 위한 베이지안 네트워크에 기초한 데이터 분석 (Bayesian Network-based Data Analysis for Diagnosing Retinal Disease)

  • 김현미;정성환
    • 한국멀티미디어학회논문지
    • /
    • 제16권3호
    • /
    • pp.269-280
    • /
    • 2013
  • 본 논문에서 망막 질환 요인간의 의존도 분석을 위해 효율적인 분류기를 활용할 수 있는 방안을 제시하였다. 먼저 여러 베이지안 네트워크 중에서 TAN (Tree-Augmented Naive Bayesian Network), GBN(General Bayesian Network)과 Markov Blanket으로 특징축소된 GBN과의 분류성능과 예측정확률을 비교분석하였다. 그리고 처음으로, 높은 성능을 보인 TAN을 망막 질환 임상데이터의 의존도 분석에 적용하였다. 의존도 분석 결과, 망막 질환의 진단과 예후 예측에 활용의 가능성을 보였다.

관계 기반 특징을 이용한 트위터 스패머 탐지 (Spammer Detection using Features based on User Relationships in Twitter)

  • 이찬식;김준태
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.785-791
    • /
    • 2014
  • 트위터는 페이스북과 더불어 전 세계적으로 인기 있는 SNS(Social Network Service)이다. 트위터에서 이메일 인증 방식을 악용하여 대량 생성된 스패머 계정은 유해한 콘텐츠로 트위터 사용자들에게 불편함을 준다. 본 논문에서는 이러한 문제를 해결하고자 관계 기반 특징을 이용한 스패머 탐지 기법을 제안한다. 관계 기반 특징이란 사용자의 호감 정도를 표현할 수 있는 친구 관계 특징과 사용자 간의 유사성을 나타낼 수 있는 유형 관계 특징들을 의미한다. 기존의 스패머 탐지 기법과 본 논문에서 제안하는 탐지 기법의 성능을 스패머의 비율을 3%에서 30%까지 변화시키면서 비교 실험한 결과, 본 논문에서 제안하는 기법이 Naive Bayesian Classifier와 Decision Tree 모두에서 더 우수한 성능을 보였다.

베이지안 분류기를 이용한 소프트웨어 품질 분류 (Software Quality Classification using Bayesian Classifier)

  • 홍의석
    • 한국IT서비스학회지
    • /
    • 제11권1호
    • /
    • pp.211-221
    • /
    • 2012
  • Many metric-based classification models have been proposed to predict fault-proneness of software module. This paper presents two prediction models using Bayesian classifier which is one of the most popular modern classification algorithms. Bayesian model based on Bayesian probability theory can be a promising technique for software quality prediction. This is due to the ability to represent uncertainty using probabilities and the ability to partly incorporate expert's knowledge into training data. The two models, Na$\ddot{i}$veBayes(NB) and Bayesian Belief Network(BBN), are constructed and dimensionality reduction of training data and test data are performed before model evaluation. Prediction accuracy of the model is evaluated using two prediction error measures, Type I error and Type II error, and compared with well-known prediction models, backpropagation neural network model and support vector machine model. The results show that the prediction performance of BBN model is slightly better than that of NB. For the data set with ambiguity, although the BBN model's prediction accuracy is not as good as the compared models, it achieves better performance than the compared models for the data set without ambiguity.

나이브 베이지안 분류기를 이용한 이상전파에코 식별방법에 대한 연구 (A Study on Anomalous Propagation Echo Identification using Naive Bayesian Classifier)

  • 이한수;김성신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.89-90
    • /
    • 2016
  • 이상전파에코는 대기 관측을 위해서 사용되는 레이더 전파가 온도나 습도에 의해서 발생하는 이상굴절 신호로, 지상에 설치된 기상레이더에 자주 발생하는 대표적인 비기상에코 중 하나이다. 기상예보의 정확도를 높이기 위해서는 레이더 데이터의 정확한 분석이 요구되기 때문에 전 세계적으로 이상전파에코의 식별 및 제거에 대한 연구가 수행되어 오고 있다. 본 논문에서는 레이더 관측변수인 반사도와 고도 정보와 나이브 베이지안 분류기를 이용하여 이상전파에코를 식별 및 제거하는 방법에 대한 연구를 수행하였다. 실제 이상전파에코 발생 사례를 통하여 구현한 나이브 베이지안 분류기를 검증한 결과, 우수한 정확도를 가지고 분류가 수행되는 것을 확인할 수 있었다.

  • PDF

나이브 베이지안을 사용한 성명에 대한 성별 구분 연구 (A Study on Sex Classification of a Name using Naive Bayesian)

  • 임명재;정진표;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.155-159
    • /
    • 2013
  • 본 논문은 Naive Bayesian분류기를 사용하여 성명의 성별을 구분하는 시스템을 구현 하였다. 국내인 성명은 외국인 성명과는 다르게 사람을 지칭할 때 쓰는 대명사의 성별불일치 현상이 있다. 하지만 국내인 성명의 특성으로 남자로 자주 쓰이는 이름과 여자로 자주쓰이는 이름을 구분하게 하였다. 그리고 고유명사등, 성별이 애매한 이름들도 포함하였기 때문에 다소 정확율이 떨어지는 것을 확인 할 수가 있었다. 본 논문의 실험 결과로는 국내인 남자는 84%, 여자는 88%의 정확율을 보였으며, 총합 86%의 정확율과 외국인 성명은 남자는 80%, 여자는 84%로 총합 83%의 정확율을 보이고 있다.

나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템 (Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule)

  • 조한철;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.223-225
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.

  • PDF

만성 폐쇄성 폐질환을 이용한 노모그램 구축과 비교 (Comparison of nomogram construction methods using chronic obstructive pulmonary disease)

  • 서주현;이제영
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.329-342
    • /
    • 2018
  • 노모그램은 질병의 위험 요인과 예측 확률을 쉽게 이해할 수 있도록 시각적으로 표현하는 통계적 도구이다. 본 논문은 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)의 위험 요인을 이용하여 로지스틱 회귀모형과 순수 베이지안 분류기 모형의 노모그램을 구축하고 이를 비교하였다. 분석 데이터는 국민건강영양조사 6기(2013-2015)를 이용하여 진행하였다. 총 6개의 위험 요인을 이용하였다. 그리고 로지스틱 회귀모형, 순수 베이지안 분류기 모형과 각각의 구축 방법을 이용하여 만성 폐쇄성 폐질환의 노모그램을 제시하였다. 또한, 구축된 두 노모그램을 비교하여 유용성을 살펴보았다. 마지막으로 ROC curve와 Calibration plot을 통하여 각 노모그램을 검증하였다.

Na$ddot{i}$ve-Bayesian Classifier를 이 용한 전자 카탈로그 자동 분류 시스템 (Extending Na$ddot{i}$ve Bayesian Classifier for Catalog Classification Systems)

  • 서광훈;이경종;김현철;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.91-93
    • /
    • 2004
  • B2B Marketplace상에서의 거래에서 나타나는 주요한 특징은 다품종 및 대량의 물품 거래가 n:n거래 관계에 놓여있다는 점과 거래자가 원활한 거래 및 기업 내 관리를 위해 각자의 전자 카탈로그를 이용한 거래를 원한다는 정이다. 하지만 개별적인 전자 카탈로그 사용과 미흡한 표준안은 전자 카탈로그 상호 연계의 걸림돌이 되어 시장 형성의 걸림돌이 되고 있다. B2B Marketplace는 표준 분류체계를 중심으로 거래 대상 상품을 재분류하여 구매 당사자간의 거래 대상 물품에 대한 상호 애핑을 지원하는 방법 등으로 이를 충족시키려 하고 있다. 하지만 요청되는 다량의 물품에 대해 매번 분류를 수행해야 하는 고비용의 작업이라는 문제점이 있다. 본 논문에서는 이를 극복하기 위하여 기계학습 기법을 이용한 전자 카탈로그 상품 자동분류기를 모델링하고 이를 구현하는 것에 초점을 두었다. 상품의 속성별로 분류에 끼치는 영향력이 다론 것이라는데 착안하여 전자 카탈로그를 상품 단위로 재 모델링 하였으며 속성별 정보가 풍부하지 못한 정물 극복하기 위하여 속성값을 어휘 단위로 구분한 데이터를 추가 하는 확장 모델을 정의하였다. 또한 해당 모델을 학습시키기 위한 알고리즘으로는 속성별로 다른 가중치를 부여 할 수 있도록 확장된 Naive Bayesian Classifier를 고안하였다. 그리고 이론 B2B Market Place상의 실 데이터에 적용하여 고안된 모델의 유효성을 검증하였다.

  • PDF