• 제목/요약/키워드: Bayes

검색결과 921건 처리시간 0.021초

Naive Bayes 문서 분류기를 위한 점진적 학습 모델 연구 (A Study on Incremental Learning Model for Naive Bayes Text Classifier)

  • 김제욱;김한준;이상구
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.331-341
    • /
    • 2001
  • 본 논문에서는 Naive Bayes 문서 분류기를 위한 새로운 학습모델을 제안한다. 이 모델에서는 라벨이 없는 문서들의 집합으로부터 선택한 적은 수의 학습 문서들을 이용하여 문서 분류기를 재학습한다. 본 논문에서는 이러한 학습 방법을 따를 경우 작은 비용으로도 문서 분류기의 정확도가 크게 향상될 수 있다는 사실을 보인다. 이와 같이, 알고리즘을 통해 라벨이 없는 문서들의 집합으로부터 정보량이 큰 문서를 선택한 후, 전문가가 이 문서에 라벨을 부여하는 방식으로 학습문서를 결정하는 것을 selective sampling이라 한다. 본 논문에서는 이러한 selective sampling 문제를 Naive Bayes 문서 분류기에 적용한다. 제안한 학습 방법에서는 라벨이 없는 문서들의 집합으로부터 재학습 문서를 선택하는 기준 측정치로서 평균절대편차(Mean Absolute Deviation), 엔트로피 측정치를 사용한다. 실험을 통해서 제안한 학습 방법이 기존의 방법인 신뢰도(Confidence measure)를 이용한 학습 방법보다 Naive Bayes 문서 분류기의 성능을 더 많이 향상시킨다는 사실을 보인다.

  • PDF

A Novel Posterior Probability Estimation Method for Multi-label Naive Bayes Classification

  • Kim, Hae-Cheon;Lee, Jaesung
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.1-7
    • /
    • 2018
  • A multi-label classification is to find multiple labels associated with the input pattern. Multi-label classification can be achieved by extending conventional single-label classification. Common extension techniques are known as Binary relevance, Label powerset, and Classifier chains. However, most of the extended multi-label naive bayes classifier has not been able to accurately estimate posterior probabilities because it does not reflect the label dependency. And the remaining extended multi-label naive bayes classifier has a problem that it is unstable to estimate posterior probability according to the label selection order. To estimate posterior probability well, we propose a new posterior probability estimation method that reflects the probability between all labels and labels efficiently. The proposed method reflects the correlation between labels. And we have confirmed through experiments that the extended multi-label naive bayes classifier using the proposed method has higher accuracy then the existing multi-label naive bayes classifiers.

Constrained 베이즈 추정방식의 제품 품질관리 활용방안에 관한 연구 (A Study on the Application of Constrained Bayes Estimation for Product Quality Control)

  • 김태규;김명준
    • 품질경영학회지
    • /
    • 제43권1호
    • /
    • pp.57-66
    • /
    • 2015
  • Purpose: The purpose of this study is to apply the constrained Bayesian estimation methodology for product quality control process and prove the effectiveness of the product management by comparing with the well-known Bayes estimator through data performance result. Methods: The Bayes and constrained Bayes estimators were produced based on the theoretical background and for confirming the effectiveness of suggested application, the deviation index was defined and calculated for the comparison. Results: The statistical analysis result shows that applying the suggested estimation methodology, that is, constrained Bayes estimator improves the effectiveness of the index with regard to reduce the error by matching the first two empirical moments. Conclusion: Considering the advanced Bayesian approaches such as constrained Bayes estimation for the product quality control process, the newly defined deviation index reduces the error for estimating the parameter histogram which is reflected both location and deviation parameters and furthermore various Bayesian perspective approaches seems to be meaningful for managing the product quality control process.

Bayes 결정이론에 기반을 둔 능동카메라 환경에서의 이동 물체의 검출 및 추적 (Moving Object Tracking in Active Camera Environment Based on Bayes Decision Theory)

  • 배수현;강문기
    • 방송공학회논문지
    • /
    • 제4권1호
    • /
    • pp.22-31
    • /
    • 1999
  • 이동물체 추적 시스템은 감시, 방송, 영상회의 등의 시스템에 관한 품질 및 처리 효율을 개선시킨다. 본 논문에서는 능동 카메라 환경에서 이동물체의 검출 및 추적을 위한 개선된 bayes 결정이론을 제안한다. 제안한 시스템은 손실함수를 최소화 하는 최적의 패턴 클래스를 선택할 수 있도록 결정함수를 제공해주는 bayes 결정이론에 기반을 둔다. bayes 결정은 연속적인 영상을 통계적으로 분석하고, 능동카메라 환경에서 물체와 배경에 맞게 각 픽셀에 존재하는 pdf를 재구성 함으로써 이동 물체의 영역을 찾아낸다. 제안된 방법에 의해 만들어진 시스템은 능동카메라 환경에서 이동물체의 영역을 명확하게 찾아내고 그 영역을 표시함을 실험결과를 통해 알 수 있다. 본 논문에서는 제안된 방법과 기존의 방법들을 성능면에서 비교함으로서, 제안된 시스템이 정확하고, 노이즈에 대한 대처능력이 우수함을 알 수 있다.

  • PDF

Map-Reduce 프로그래밍 모델 기반의 나이브 베이스 학습 알고리즘 (Naive Bayes Learning Algorithm based on Map-Reduce Programming Model)

  • 강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.208-209
    • /
    • 2011
  • 본 논문에서는, 맵-리듀스 모델 기반에서 나이브 베이스 알고리즘으로 학습과 추론을 수행하는 방안에 대해 소개하고자 한다. 이를 위해 Apache Mahout를 이용하여 분산 나이브 베이스 (Distributed Naive Bayes) 학습 알고리즘을 University of California, Irvine (UCI)의 벤치마크 데이터 집합에 적용하였다. 실험 결과, Apache Mahout의 분산 나이브 베이스 학습 알고리즘은 일반적인 WEKA의 나이브 베이스 학습 알고리즘과 그 성능면에서 큰 차이가 없음을 알 수 있었다. 이러한 결과는, 향후 빅 데이터 환경에서 Apache Mahout와 같은 맵-리듀스 모델 기반 시스템이 기계 학습에 큰 기여를 할 수 있음을 나타내는 것이다.

  • PDF

베이지안 기법 기반의 댐 예측유입량 산정기법 개발 및 평가 (Development and evaluation of dam inflow prediction method based on Bayesian method)

  • 김선호;소재민;강신욱;배덕효
    • 한국수자원학회논문집
    • /
    • 제50권7호
    • /
    • pp.489-502
    • /
    • 2017
  • 본 연구에서는 충주댐 유역에 대해 다목적 댐 예측유입량 산정기법 BAYES-ESP를 개발하고 평가하였다. BAYES-ESP 기법은 기존 ESP (Ensemble Streamflow Prediction) 기법에 베이지안 이론을 적용하여 개발하였으며, 수문모델은 ABCD를 활용하였다. 입력자료는 기온, 강수량 자료와 댐 관측유입량 자료를 활용하였으며, 기온 및 강수량은 기상청, 국토교통부, 한국수자원공사의 지점관측자료, 댐 관측유입량은 한국수자원공사의 자료를 이용하였다. 적용성 평가방법은 시계열 분석과 Skill Score를 활용하였으며, 평가기간은 1986~2015년이다. 시계열 분석 결과 ESP 댐 예측유입량(ESP)는 매년 전망값의 큰 차이가 없었으며, 다우년 및 과우년의 예측성이 떨어지는 것으로 나타났다. BAYES-ESP 댐 예측유입량(BAYES-ESP)는 ESP가 관측유입량에 비해 과소모의하는 경향을 보정하였으며, 특히 다우년에 개선효과가 있는 것으로 나타났다. 월별 평균 댐 관측유입량과의 Skill Score 비교분석결과 ESP는 1~3월에 SS가 비교적 높은 값을 보였으며, 나머지 월에는 음의 값을 나타내었다. BAYES-ESP는 ESP와 관측 값 간의 선형적 관계를 갖는 1~3월에 ESP의 정확도를 향상시키는 것으로 나타났다. ESP 기법은 국내 강수특성상 우리나라에 적용하기에는 한계가 있었으며, 이를 개선한 BAYES-ESP 기법은 댐 유입량 예측연구에 가치가 있다고 판단된다.

무선 센서 망에서 MAC 방식을 위한 Bayes 중지 규칙 (Bayes Stopping Rule for MAC Scheme Wireless Sensor Networks)

  • 박진경;최천원
    • 대한전자공학회논문지TC
    • /
    • 제45권7호
    • /
    • pp.53-61
    • /
    • 2008
  • 본 논문에서 줄기 노드는 mesh 토폴로지의 중추 망을 이루고 각 줄기 노드는 주변의 잎 노드와 함께 별 토폴로지의 부속망을 형성하는 무선 센서 망을 고려한다. 이러한 무선 센서 망에서 잎 노드로부터 줄기 노드로의 패킷 전달을 지원하는 MAC 방식을 설계할 때 반드시 다음 사항을 유념해야 한다. 첫째, 잎 노드는 일반적으로 배터리로부터 전력을 공급받는데 이러한 배터리를 교체하거나 충전하기가 어렵다. 둘째, 무선 센서 망은 흔히 주기적으로 데이타를 수집하여 갱신하기 위해 파송된다. 데이타 조각의 전달이 지연되면 싱크 노드의 데이타 처리가 지연되고 결과적으로 데이타 조각 자체를 폐기해야 할 수도 있다. 셋째, 무선 센서 망에서는 시그널링이 극도로 제약되고 복잡한 계산이 곤란하다. 이러한 점을 고려할 매 MAC 방식은 에너지를 절약하고 패킷 전달에서 적시성을 지원할 수 있어야 하며 동시에 단순하고 로버스트해야 한다. 본 논문에서는 무선 센서망의 MAC 방식으로 ALOHA의 수정판을 제안한다. ALOHA 제안 판은 ALOHA 원판의 단순함과 로버스트함을 보전하면서 매번 패킷의 전달을 시도하기에 앞서 잎 노드가 중지 혹은 계속을 결정하는 특징을 갖는다. 이러한 결정을 위해 본 논문에서는 Bayes 중지 규칙을 제안한다. Bayes 중지 규칙은 에너지, 적시성 고리고 throughput 손실이 반영된 Bayes 위험을 최소화하는 중지 규칙으로 잎 노드가 오직 전달 시도에 관한 선험적 지식과 자신의 전달 시도 경험에만 의존하여 중지 혹은 계속을 결정하므로 실용적이다. 계량적 결과로부터 Bayes 중지 규칙이 도입된 ALOHA 제안 판은 무선 센서 망의 열악한 환경에서 유용함을 확인한다.

An Empiricla Bayes Estimation of Multivariate nNormal Mean Vector

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제15권2호
    • /
    • pp.97-106
    • /
    • 1986
  • Assume that $X_1, X_2, \cdots, X_N$ are iid p-dimensional normal random vectors ($p \geq 3$) with unknown covariance matrix. The problem of estimating multivariate normal mean vector in an empirical Bayes situation is considered. Empirical Bayes estimators, obtained by Bayes treatmetn of the covariance matrix, are presented. It is shown that the estimators are minimax, each of which domainates teh maximum likelihood estimator (MLE), when the loss is nonsingular quadratic loss. We also derive approximate credibility region for the mean vector that takes advantage of the fact that the MLE is not the best estimator.

  • PDF

Bayes Estimation for the Rayleigh Failure Model

  • Ko, Jeong-Hwan;Kang, Sang-Gil;Shin, Jae-Kyoung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.227-235
    • /
    • 1998
  • In this paper, we consider a hierarchical Bayes estimation of the parameter, the reliability and hazard rate function based on type-II censored samples from a Rayleigh failure model. Bayes calculations can be implemented easily by means of the Gibbs sampler. A numerical study is provided.

  • PDF

Estimation of the parameter in an Exponential Distribution using a LINEX Loss

  • 우정수;이화정;은갑숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.1-10
    • /
    • 2002
  • A Bayes estimator of the scale parameter in an exponential distribution will be considered by a LINEX error, then the risk of the Bayes estimator using a LINEX loss will be compared with that of a Bayes estimator using a square error.

  • PDF