• 제목/요약/키워드: 베이지안 통계적 접근

검색결과 9건 처리시간 0.023초

대화기반 사용자 피드백을 이용한 베이지안 네트워크 파라메터 학습 (Learning Bayesian Network Parameters using Dialogue based User Feedbacks)

  • 임성수;이승현;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.419-422
    • /
    • 2010
  • 사용자와 환경의 변화에 적응하기 위해서 베이지안 네트워크의 다양한 학습 방법들이 연구되고 있다. 기존의 많은 학습방법에서는 학습 데이터로부터 통계적 방법을 통해서 베이지안 네트워크 모델을 학습하는데, 이러한 접근 방법은 학습 데이터를 수집하기 어려운 문제에 적용하기 힘들며, 사용자의 의도를 데이터의 패턴들로만 학습하므로 직접적으로 사용자의 의도를 반영할 수 없다. 본 논문에서는 대화에 기반하여 사용자의 의도를 직접적으로 수집하고, 이로부터 베이지안 네트워크의 파라메터를 학습하는 방법을 연구한다. 제안하는 방법에서는 사용자와의 대화를 통해서 현재의 모델의 잘못된 점 혹은 개선점을 직접적으로 입력 받고, 이를 바탕으로 베이지안 네트워크 모델을 수정하여 데이터의 수집 없이 빠른 시간에 사용자가 원하는 모델을 학습 할 수 있다. 기존의 통계적 기법을 이용한 대표적인 베이지안 네트워크 파라메터 학습 방법인 최대우도 추정(Maximum Likelihood Estimation; MLE) 방법과 제안하는 방법을 비교하여 제안하는 방법의 유용성을 확인한다.

  • PDF

Understanding Bayesian Statistics

  • 정윤식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.61-68
    • /
    • 2002
  • 통계학은 불확실성(uncertainty)에 대한 연구이다. 베이지안 통계 방법은 불확실성 아래서 통계 추론과 의사 결정 모두를 위한 완전한(complete) 패러다임을 제공한다. 베이지안 방법론은 합리적인 초기 정보와 결합하는 것을 가능하게 만들고, 전통적인 통계적 방법론에 의하여 직면하는 많은 어려움들을 풀 수 있는 coherent 방법론을 제공하면서 엄격한 수학적 기본에 근거하고 있다. 베이지안 패러다임은 일반적인 용어로써 확률이란 단어의 사용을 가장 잘 어울리게 하는 불확실성의 조건부 측도(conditional measure of uncertainty)로써 확률의 해석에 근거한다. 관심있는 것에 대한 통계적 추론은 증거의 관점에서 그 값에 대한 불확실성의 변형으로써 묘사되며, 베이즈 정리(Bayes' theorem)는 이러한 변형이 어떻게 만들어지는 가를 자세히 설명할 수 있다. 베이지안 방법들은 전통적인 통계적 방법론에 접근할 없는 복잡하고, 다양한 구조적 문제들에 응용할 수 있다.

  • PDF

지구물리 자료의 고속 베이지안 역산 (Fast Bayesian Inversion of Geophysical Data)

  • 오석훈;권병두;남재철;이덕기
    • 지구물리
    • /
    • 제3권3호
    • /
    • pp.161-174
    • /
    • 2000
  • 베이지안 역산(Bayesian inversion)은 불충분한 자료를 가지고 지하구조를 추정해야 하는 지구물리자료의 해석에 있어서 안정적이고 신뢰를 줄 수 있는 방법 중의 하나이다. 관측 자료가 측정 과정부터 불확실성을 함유하고 있으며, 역산에 이용되는 이론 자료 또한 모델의 매개변수화에 따른 각종 불확실성을 포함하고 있다. 따라서 지구물리 자료의 역산은 확률적으로 접근하는 것이 가장 바람직하며 베이지안 역산은 이에 대한 처리뿐만 아니라, 추정에 대한 신뢰도와 불확실성에 대한 이론적 근거를 제공한다. 그러나 대부분의 베이지안 역산이 고차원의 적분을 필요로 하므로 몬테 카를로 방법과 같은 대규모의 계산이 요구되는 방법에 의해 사후 확률분포가 구해지는 경우가 많다. 이는 특히 지구물리 자료와 같이 고도의 비선형 자료에 대하여 매우 적합한 접근 방법이기는 하지만, 점차 현장화, 고속화되어가는 자료의 해석 경향에 맞추어 간략하게 사후 확률분포를 근사한 수 있는 기법의 연구 또한 필요하다. 따라서 이 연구에서는 관측자료와 사전 확률분포가 정규분포에 의해 근사 될 수 있는 지구물리자료에 대한 베이지안 역산에 대해 논의 하고자 한다. 사전 확률분포의 작성을 위해 지구통계학적 기법이 이용되었으며, 관측자료의 통계적 불화실성을 추정하기 위해 교차 검사(cross-validation) 방법을 이용하여 공분산(covariance)을 유도하고 그것에 의한 우도 함수(likelihood function)를 작성하였다. 베이지안 해석을 위해 두 확률분포를 곱하여 근사적인 사후 확률분포를 얻을 수 있었으며, 이에 대해 최적화(optimization) 기법을 이용하여 최대 사후 확률(Maximum a Posterior)을 따르는 지하 구조를 얻을 수 있었다. 또한 사후 확률 분포의 공분산 항을 이용하여 지하 비저항 구조를 시뮬레이션 하여 불확실성분석을 수행하였다.

  • PDF

베이지안 추론법을 이용한 부식된 배관의 통계적 수명예측 (Statistical Life Prediction of Corroded Pipeline Using Bayesian Inference)

  • 노유정
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2401-2406
    • /
    • 2015
  • 배관은 대형기계설비에서 다양한 작동유체를 운반하는데 사용되는데, 대형시스템의 성능을 유지하기 위해서는 부식된 배관의 잔존 수명을 정확히 예측될 필요가 있다. 하지만, 배관 형상, 물성치, 부식률 등 배관의 수명에 영향을 미치는 요인들의 불확실성이 크기 때문에 부식 잔존 수명을 정확히 예측하기 힘들다. 본 연구에서는 통계적인 접근방법인 베이지안 추론법을 이용하여 부식 잔존 수명을 예측하는 방법을 제안하였다. 여기서, 배관의 파손 확률은 베이지안 법칙을 기반으로 시간에 따른 배관 파손 압력에 관한 사전 정보와 실험데이터를 이용하여 계산되고, 부식 잔존 수명은 10%의 파손 확률을 갖는 경과시간으로 계산되었다. 예제에서는 부식에 영향을 미치는 주요인자로부터 10개와 50개의 데이터를 생성하여 배관의 파손 확률 및 배관의 잔존수명을 예측하였으며 가정한 실제 잔존수명과의 비교를 통해 제안한 방법을 검증하였다.

모수, 비모수, 베이지안 출산율 모형을 활용한 합계출산율 예측과 비교 (A comparison and prediction of total fertility rate using parametric, non-parametric, and Bayesian model)

  • 오진호
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.677-692
    • /
    • 2018
  • 최근 2017년 우리나라 합계출산율은 1.05명로 2005년 1.08명 수준으로 회귀하는 현상을 보이고 있다. 1.05명은 인구대체선(2.1명), 안전선(1.5명)과도 거리가 먼 초저출산 수준이고 마치 초저출산 덫에 빠질 우려가 있다. 이에 합계출산율의 합리적인 예측과 이를 통한 출산정책에 유용한 자료를 제공하는 것은 그 어느 때 보다도 중요하다. 그 동안 다양한 통계적 방법으로 합계출산율 추이를 예측하였는데, 데이터 완비성이 높고 품질이 좋은 경우 모형 접근인 모수적 방법, 데이터 추이가 단절되거나 변동이 심한 경우 평활과 가중치를 적용한 비모수적 방법, 데이터 부족과 품질 등으로 선진국의 출산율 3단계 전이현상을 참고하여 이들의 사전분포를 활용하는 베이지안 방법 등이 적용되어 왔다. 본 연구는 최근 변동이 심한 우리나라 출산율에 모수, 비모수, 그리고 베이지안 방법을 적용하여 추정과 예측을 실시하고 도출된 결과 비교를 통해 적합성과 타당성 측면에서 어떤 방법이 합리적인지 모색하고자 한다. 분석결과 합계출산율 예측값 순위는 통계청 합계출산율이 가장 높고, 베이지안, 모수, 비모수 순으로 나타났다. 2017년 TFR 1.05명 수준을 감안할 때 모수, 비모수모형으로 도출된 합계출산율 예측값이 합리적이다. 또한 출산율 자료완비성이 높고 품질이 우수할 경우 계산 효율성과 적합도 관점에서 모수적 추정과 예측 접근 방법이 타 방법보다 우수한 것으로 도출되었다.

혼합효과모형의 리뷰 (Review of Mixed-Effect Models)

  • 이영조
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.123-136
    • /
    • 2015
  • 관측 가능한 변수들 사이의 관계를 묘사한 갈릴레오의 물리학 법칙 발견 이후, 과학은 큰 성과를 거두며 발전해왔다. 그러나, 관측할 수 없는 변량효과를 함께 이용하여 더 많은 자연 현상을 설명할 수 있게 되었고, 이를 이용한 최초의 통계적 모형인 혼합효과모형이 소개되었다. 계산기술의 발달과 더불어 복잡한 현상에 대한 추론을 위하여 혼합효과모형은 그 중요성이 더욱 커지고 있다. 이러한 혼합효과모형은 최근 다단계 일반화 선형모형을 포함한 여러 모형으로 확장되었으며, 관측할 수 없는 변량효과를 추론하기 위한 다단계 가능도가 제시되었다. 혼합효과모형 특집호를 통해 이러한 모형들이 여러 통계학적 문제점을 해결하는 과정을 제시하고, 앞으로 어떤 확장이 추가적으로 요구되는 지에 대하여 논할 것이다. 빈도록적 접근법과 베이지안 접근법을 함께 다룬다.

Turning Point Analysis를 이용한 실시간 교통량 변화 검지 방법론 개발 (Methodology for Real-time Detection of Changes in Dynamic Traffic Flow Using Turning Point Analysis)

  • 김형주;장기태;권오훈
    • 대한교통학회지
    • /
    • 제34권3호
    • /
    • pp.278-290
    • /
    • 2016
  • 연속교통류 운영 및 설계에서는 최대통과교통류율에 따른 교통류 상태변화 분석이 중요하다. 최대통과교통류율은 연속교통류 운영상태를 평가함에 있어 기준이 되고 있으며, 병목현상과 같은 지 정체 발생시 최대통과교통류율이 급격히 감소하게 된다. 현재까지 이러한 연속교통류 운영과 관련된 다양한 연구들이 수행되었지만, 변화되는 교통량을 명확하게 식별하지 못하고 있다. 이에 본 연구에서는 교통운영 및 설계 등의 다양한 연구를 수행하는 데 있어 가장 중요한 실시간 교통량 변화 검지 방법론에 대한 연구를 실시한다. 이를 위하여 도시고속도로 자유로 구간의 24시간 레이더검지기의 시계열 자료를 이용하며, 교통류 상태 구분에는 통계적 기법의 일환인 터닝포인트 분석(Tunring Point Analysis, 이하 TPA)를 적용한다. TPA는 베이지안 접근법(bayesian approach)을 이용하며, 차량도착은 포아송 분포로 가정한다. 분석대상 구간에 대한 터닝포인트(Turning Point, 이하 TP)를 도출하였으며, 교통량이 변화되는 시점을 확인할 수 있었다. 또한 실시간 교통상태변화 검지를 위한 방법으로 TP지속시간을 설정하여 분석을 실시하였으며, 실시간으로 교통량의 변화를 검지하였다. 이는 기존의 직관적이고 경험적인 접근법의 한계를 극복할 수 있는 장점을 가지며, 실시간으로 교통량 변화를 식별할 수 있어 램프미터링(ramp-metering), 가변차로 등의 교통운영관리에 적용이 가능하다.

유연한 선부합 ICM 방식에 의한 탁본영상복원 (A Flexible Line-Fitting ICM Approach for Takbon Image Restoration)

  • 황재호
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.525-532
    • /
    • 2006
  • 아이징(Ising)모델화 된 이진 탁본영상을 유연한 선부합 ICM(Iterated conditional modes) 방식으로 영상복원하는 새로운 기법을 제시한다. 기본적으로 탁본영상은 획 구성상 정보 영역과 배경 영역의 두 극단으로 나누어져야 한다. 종래의 ICM적 접근이 부분적 사각구도(四角構圖)의 점처리에 근거하였음에 비해 본 연구의 주된 아이디어는 선처리이다. 기하학적 구조를 구하기 위해 현재고려중인 화소의 배열 위치를 중심으로 다수의 선형부합함수들을 발생시킨다. 부합함수들의 경사도와 크기들의 집합에 베이즈적 판별 논리를 적용하여 현재고려중인 화소의 영역을 판단한다. 영역판별 결과는 이진 색도이다. 이 경우 매 단계별 영역귀속 판단은 영역 안과 밖에서의 차별된 추적 양상에 관한 확률적 반복성에 의존한다. 마지막으로 시뮬레이션을 통해 이진 탁본영상에 대하여 본 알고리즘의 효과를 확인하였다.

다사건 시계열 자료 분석을 위한 베이지안 기반의 통계적 접근의 응용 (A Bayesian Approach for the Analysis of Times to Multiple Events : An Application on Healthcare Data)

  • 석준희;강영선
    • 한국경영과학회지
    • /
    • 제39권4호
    • /
    • pp.51-69
    • /
    • 2014
  • Times to multiple events (TMEs) are a major data type in large-scale business and medical data. Despite its importance, the analysis of TME data has not been well studied because of the analysis difficulty from censoring of observation. To address this difficulty, we have developed a Bayesian-based multivariate survival analysis method, which can successfully estimate the joint probability density of survival times. In this work, we extended this method for the analysis of precedence, dependency and causality among multiple events. We applied this method to the electronic health records of 2,111 patients in a children's hospital in the US and the proposed analysis successfully shows the relation between times to two types of hospital visits for different medical issues. The overall result implies the usefulness of the multivariate survival analysis method in large-scale big data in a variety of areas including marketing, human resources, and e-commerce. Lastly, we suggest our future research directions based multivariate survival analysis method.