• 제목/요약/키워드: 베이지안 확률 모델

검색결과 101건 처리시간 0.025초

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

베이지안 네트워크를 이용한 동영상 기반 라이프 로그의 분석 및 의미정보 추출 (Context Extraction and Analysis of Video Life Log Using Bayesian Network)

  • 정태민;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.414-418
    • /
    • 2010
  • 최근 라이프 로그의 수집과 관리에 관련된 연구가 많이 진행 중에 있다. 또 핸드폰 카메라, 디지털 카메라, 캠코더 등의 발전으로 자신의 일상생활을 비디오로 저장하고, 인터넷을 통해 공유하는 사람도 증가하고 있다. 비디오 데이터는 많은 정보를 포함하고 있는 라이프 로그의 한 예로. 동영상의 촬영 및 수집이 활발해짐에 따라 동영상의 메타정보를 생성하고, 이를 이용해 동영상 검색과 관리에 이용하려는 연구들이 진행 중이다. 본 논문에서는 라이프 로그를 수집하고 수집된 동영상과 라이프 로그를 이용하여 의미정보를 추출하는 시스템을 제안한다. 의미정보란 사용자의 행동을 나타내는 정보로써 컴퓨터 사용, 식사, 집안일, 이동, 외출, 독서, 휴식, 일, 기타로 9가지의 의미정보를 추출한다. 제안하는 방법은 사용자로부터 GPS, 가속도센서, 캠코더를 이용해 실제 데이터를 수집하고, 전처리 과정을 통하여 특징을 추출한다. 이때 추출될 특징은 위치정보와 사용자의 상태정보 그리고 영상처리릍 통한 RGB와 HSL 색공간의 요소와 MPEG-7의 EHD(Edge Histogram Descriptor). CLD(Color Layout Descriptor)이다. 추출된 특징으로부터 사람 행동과 같은 불안정한 상황에서 강점을 보이는 확률모델 네트워크인 베이지안 네트워크를 이용하여 의미정보를 추출한다. 제안하는 방법의 유용성을 보이기 위해 실제 데이터를 수집하고 추론하고 10-Fold Cross-validation을 이용하여 데이터를 검증한다.

  • PDF

베이지안 추론을 이용한 VLOC 모형선 구조응답의 확률론적 시계열 예측 (Probabilistic Time Series Forecast of VLOC Model Using Bayesian Inference)

  • 손재현;김유일
    • 대한조선학회논문집
    • /
    • 제57권5호
    • /
    • pp.305-311
    • /
    • 2020
  • This study presents a probabilistic time series forecast of ship structural response using Bayesian inference combined with Volterra linear model. The structural response of a ship exposed to irregular wave excitation was represented by a linear Volterra model and unknown uncertainties were taken care by probability distribution of time series. To achieve the goal, Volterra series of first order was expanded to a linear combination of Laguerre functions and the probability distribution of Laguerre coefficients is estimated using the prepared data by treating Laguerre coefficients as random variables. In order to check the validity of the proposed methodology, it was applied to a linear oscillator model containing damping uncertainties, and also applied to model test data obtained by segmented hull model of 400,000 DWT VLOC as a practical problem.

모바일 감시 로봇을 위한 실시간 움직임 추정 알고리즘 (Real-Time Motion Estimation Algorithm for Mobile Surveillance Robot)

  • 한철훈;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제19권3호
    • /
    • pp.311-316
    • /
    • 2009
  • 본 논문에서는 파티클 필터(Particle Filter)를 사용한 모바일 감시 로봇을 위한 실시간 움직임 추정 알고리즘을 제안한다. 파티클 필터는 몬테카를로(Monte Carlo) 샘플링 방법을 기반으로 사전분포확률(Prior distribution probability)와 사후분포확률(Posterior distribution probability)을 가지는 베이지안 조건 확률 모델(Bayesian conditional probabilities model)을 사용하는 방법이다. 그러나 대부분의 파티클 필터에서는 초기 확률밀도(Prior probability density)를 임의로 정의하여 사용하지만, 본 논문에서는 Sum of Absolute Difference (SAD)를 이용하여 초기 확률밀도를 구하고, 이를 파티클 필터에 적용하여 모바일 감시 로봇 환경에서 임의로 움직이는 물체를 강인하게 실시간으로 추정하고 추적하는 시스템을 구현하였다.

t-링크를 갖는 마코프 이항 회귀 모형을 이용한 인도네시아 어린이 종단 자료에 대한 베이지안 분석 (Bayesian inference of longitudinal Markov binary regression models with t-link function)

  • 심보현;정윤식
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.47-59
    • /
    • 2020
  • 본 논문에서는 마코프 이항 회귀 모형의 시차가 알려져 있거나 그렇지 않은 경우일 때, t-링크 함수를 갖는 종단적 마코프 이항 회귀 모형을 제시한다. 일반적으로, 이항 회귀 모형에서는 로직 모형이나 프로빗 모형이 주로 사용된다. t-링크 함수는 t 분포가 자유도가 커질수록 정규분포로 근사하기 때문에 프로빗 모형을 대신 더 많은 유연성을 위해 사용될 수 있다. 게다가 마코프 회귀모형은 종단 자료에 대해 사용될 수 있다. 우리는 마코프 회귀 모형의 시차를 결정하기 위해 베이지안 방법을 제시하고자 한다. 특히, 각 모델의 차수에 대해 알고 있는 경우에는 DIC를 기준으로 모델 비교를 실시하였다. 모델의 차수에 대해 모르는 경우에는 가능한 모델들의 사후 확률을 이용하였다. 복잡한 베이지안 계산을 해결하기 위하여 Albert와 Chib (1993), Kuo와 Mallick (1998)과 Erkanli 등 (2001)의 방법을 이용하여 모델을 재설정하였다. 제안하는 방법은 시뮬레이션 데이터와 Somer 등 (1984)에 의해 조사된 인도네시아 어린이 종단 데이터에 적용했다. 마코프 이항 회귀모형의 순서에 대해서 아는 경우와 모르는 경우를 각각 가정하여 최적의 모델을 알아보기 위해 MCMC 방법을 사용하였다. 또한, 매트로폴리스 해스팅 알고리즘의 수렴성을 점검하기 위해 Gelman과 Rubin의 진단을 이용했다.

잠재그룹 포아송 모형을 이용한 전립선암 환자의 베이지안 그룹화 (Bayesian Clustering of Prostate Cancer Patients by Using a Latent Class Poisson Model)

  • 오만숙
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.1-13
    • /
    • 2005
  • 최근 많은 연구자와 실무자들이 모집단에 내재해 있는 여러 다른 그룹(class, segment)간의 이질성을 밝혀내고 객체들을 그룹별로 세분화하는 방법 중 하나로 잠재그룹 모델(Latent class model)을 고려하고 있다. 이 논문에서는 2000년도에 국립 암 센터에 접수된 한국 내 연령별 전립선암 사망자수 자료를 기반으로, 잠재그룹 포아송 모형을 이용하여 전립선암 환자의 연령에 따른 그룹화를 시도한다. 최우추정법 등 고전적 추론방법의 한계를 극복하기 위하여 Markov Chain Monte Carlo (MCMC) 방법을 도구로 한 베이지안 추정 방법을 제안한다. 제안된 베이지안 방법의 장점은 용이한 모수추정과 추정오차의 제공, 그리고 각 객체의 소속그룹의 판정과 이에 따르는 오차, 즉, 객체의 각 군집에 속할 확률, 도 구할 수 있다는 것이다. 또한 주어진 자료들에 대해 가장 적합한 그룹의 수를 결정하는 방법을 제시하여 그룹의 수나 세분화의 근거를 사전에 제공하지 않아도 자료가 주는 정보로부터 이들을 자동으로 결정하는 방법을 제시한다.

불확실한 장면의 효과적인 인식을 위한 베이지안 네트워크의 온톨로지 기반 제한 학습방법 (A Constrained Learning Method based on Ontology of Bayesian Networks for Effective Recognition of Uncertain Scenes)

  • 황금성;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권6호
    • /
    • pp.549-561
    • /
    • 2007
  • 영상을 분석하여 얻은 증거를 바탕으로 장면의 의미를 추론하고 해석하는 것을 시각 기반 장면 이해라고 하며, 최근 인과적인 판단 및 추론 과정을 모델링하기에 유리한 베이지안 네트워크(BN)를 이용한 확률적인 접근 방법이 활발히 연구되고 있다. 하지만 실제 환경은 변화가 많고 불확실하기 때문에 의미 있는 증거를 충분히 확보하기 어려울 뿐만 아니라 전문가에 의한 설계로 유지하기 어렵다. 본 논문에서는 증거 및 학습 데이타가 부족한 장면인식 문제에서 효율적인BN 구조로 계산 복잡도가 줄어들고 정확도는 향상될 수 있는 BN 학습방법을 제안한다. 이 방법은 추론 대상 환경의 도메인 지식을 온톨로지로 표현하고 이를 제한적으로 사용하여 효율적인 계층구조의 BN을 구성한다. 제안하는 방법의 평가를 위하여 9종류의 환경에서 90장의 영상을 수집하고 레이블링하여 실험하였다. 실험 결과, 제안하는 방법은 증거의 수가 적은 불확실한 환경에서도 좋은 성능을 내고 학습의 복잡도가 줄어듦을 확인할 수 있었다.

컴퓨터모델의 확률적 보정 및 탄소성 압착문제의 신뢰도분석 응용 (Probabilistic Calibration of Computer Model and Application to Reliability Analysis of Elasto-Plastic Insertion Problem)

  • 유민영;최주호
    • 대한기계학회논문집A
    • /
    • 제37권9호
    • /
    • pp.1133-1140
    • /
    • 2013
  • 컴퓨터 해석모델은 물리현상을 바탕으로 단순화된 모델을 구축하고 해를 구하는 유용한 도구이나, 많은 경우 단순화 가정 또는 입력변수 정보의 미비나 불확실성으로 인해 실제와 차이가 발생한다. 본 연구에서는 이러한 문제에 대해 베이지안 확률이론을 이용하여 실측데이터를 통해 해석모델을 보정하는 방법을 소개하고 이를 파이로 작동기구의 탄소성 압착 문제에 적용한다. 파이로 작동기구는 고에너지의 재료를 원격으로 폭발시켜 작동하는 장치로 그 작동의 신속한 계산을 위해서 단순한 수학모델을 구축하고 실험데이터를 토대로 미지의 입력변수를 확률적으로 보정하였다. 이 때, 확률적 추정을 위해서는 현대적 계산통계기법의 하나인 Markov Chain Monte Carlo 기법을 이용하였으며, 최종적으로 그 결과를 압착거동해석에 활용하여 작동기구의 신뢰도를 평가하였다.

모바일 소셜 네트워크 서비스를 위한 사용자 컨텍스트의 확률추론 (Probabilistic Inference of User's Context for Mobile Social Network Services)

  • 민준기;장수형;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.361-365
    • /
    • 2010
  • 소셜 네트워크는 관심사가 유사한 사람을 찾거나 정보를 교환하는 주요한 수단으로 최근 각광받고 있다. 특히 페이스북(Facebook) 이나 싸이월드 등과 같이 인터넷상에서 제공되던 소셜 네트워크 서비스는 이제 휴대폰 영역으로 확장되고 있다. 휴대폰은 개인이 향상 소유하고 다니기 때문에 개인정보의 취득이 쉬우며, 센서 기술의 발달로 다양한 종류의 데이터를 함께 수집할 수 있다. 따라서 이를 모바일 소셜 네트워크 서비스에 활용하면 기존의 인터넷기반 소셜 네트워크 서비스와의 차별화를 이룰 수 있다. 이를 위해 본 논문에서는 확률추론 모델인 베이지안 네트워크를 이용하여 사용자와 주변 사람들간의 친밀도나 관계 등의 모바일 소셜 컨텍스투를 추출하는 방법을 제안한다. 이는 모바일 소셜 네트워크 서비스에 중요한 정보로 활용 가능하며, 본 논문에서는 실제 수집한 데이터를 기반으로 그 가능성을 검증하였다.

모바일 및 웨어러블 센서 데이터를 이용한 다양한 식사상황 인식 시스템 (A Context Recognition System for Various Food Intake using Mobile and Wearable Sensor Data)

  • 김기훈;조성배
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.531-540
    • /
    • 2016
  • 최근 모바일 환경의 다양한 센서 정보를 이용한 상황인지 서비스가 활발히 연구되고 있다. 본 논문에서는 모바일 및 웨어러블 센서 데이터를 사용해 다양한 맥락에서 나타날 수 있는 사용자의 식사상황을 효과적으로 인식할 수 있는 확률모델을 제안한다. 식사행위와 관련된 상황들을 체계적으로 모델링하기 위해 행위이론의 4가지 행위 요소 및 육하원칙의 5가지 구성 요소들을 모바일 및 웨어러블의 저수준 센서 데이터로 추론 가능한 범위에 맞게 통합하여 인식모델을 구축하고, 트리구조의 베이지안 네트워크 모델링 방식을 사용하여 인식의 경량화를 시도하였다. 제안하는 시스템의 유용성을 입증하기 위하여 1주일간 다양한 배경의 4명 사용자로부터 식사상황 및 일상생활에 대한 383분의 데이터를 수집하였다. 실험결과 기존의 대표적인 분류기들과 비교하여 상대적으로 우수한 인식률(93.21%)이 도출되는 것을 확인하였다. 또한 실제 시나리오를 통한 내부 분석을 수행하여 인식에 사용되는 각 요소들의 유용성을 검증하였다.