• 제목/요약/키워드: 베이지안 예측모형

검색결과 78건 처리시간 0.023초

A Comparison study of Hybrid Monte Carlo Algorithm

  • 황진수;전성해;이찬범
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.135-140
    • /
    • 2000
  • 베이지안 신경망 모형(Bayesian Neural Networks Models)에서 주어진 입력값(input)은 블랙 박스(Black-Box)와 같은 신경망 구조의 각 층(layer)을 거쳐서 출력값(output)으로 계산된다. 새로운 입력 데이터에 대한 예측값은 사후분포(posterior distribution)의 기대값(mean)에 의해 계산된다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 가능도함수(likelihood functions)를 통해 계산되어진 사후분포는 매우 복잡한 구조를 갖게 됨으로서 기대값의 적분계산에 대한 어려움이 발생한다. 이때 확률적 추정에 의한 근사 방법인 몬테칼로 적분을 이용한다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 우수한 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘과 기존에 많이 사용되고 있는 Gibbs sampling, Metropolis algorithm, 그리고 Slice Sampling등의 몬테칼로 방법들을 비교한다.

  • PDF

베이지안 다계층모형을 이용한 가격인상에 따른 판매량의 동적변화 추정 및 예측 (Estimation of Dynamic Effects of Price Increase on Sales Using Bayesian Hierarchical Model)

  • 전덕빈;박성호
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.798-805
    • /
    • 2005
  • Estimating the effects of price increase on a company's sales is important task faced by managers. If consumer has prior information on price increase or expect it, there would be stockpiling and subsequent drops in sales. In addition, consumer can suppress demand in the short run. Above factors make the sales dynamic and unstable. We develop a time series model to evaluate the sales patterns with stockpiling and short term suppression of demand and also propose a forecasting procedure. For estimation, we use panel data and extend the model to Bayesian hierarchical structure. By borrowing strength across cross-sectional units, this estimation scheme gives more robust and reasonable result than one from the individual estimation. Furthermore, the proposed scheme yields improved predictive power in the forecasting of hold-out sample periods.

  • PDF

대학수학능력시험 직업탐구영역의 「컴퓨터 일반」 교과 문항 분석 (Test Analysis of the 「General Computer」 in College Scholastic Ability Test)

  • 김종혜;김용;김자미;이원규
    • 컴퓨터교육학회논문지
    • /
    • 제9권6호
    • /
    • pp.11-18
    • /
    • 2006
  • 본 연구는 2005년, 2006년 대학수학능력시험 직업탐구영역의 "컴퓨터 일반" 문항을 질적 연구와 양적연구로 분석하였다. 질적 연구로 내용 타당도 검사를 실시하고, 양적연구로 2-모수 문항 반응 모형에 근거한 베이지안(Bayesian) 1.0을 이용하여 문항의 난이도 및 변별도를 측정하였으며 고전검사이론 프로그램인 테스트안(Testan) 1.0을 이용하여 문항의 신뢰도 및 오답지를 분석하였다. "컴퓨터 일반" 영역의 문항들을 분석하여 문항의 질을 높이고 난이도의 정확한 예측을 하여 보다 신뢰도와 변별력 있는 문항을 개발하기 위한 자료로 제시하고자 한다.

  • PDF

직관 실험 및 코퍼스를 바탕으로 한 의미 중의성 해소 계산 모형 연구 (A Study on the Computational Model of Word Sense Disambiguation, based on Corpora and Experiments on Native Speaker's Intuition)

  • 김동성;최재웅
    • 인지과학
    • /
    • 제17권4호
    • /
    • pp.303-321
    • /
    • 2006
  • 본 논문은 의미 중의성 해소에 대한 화자의 직관의 계산 모형에 대한 연구로 Harris (1964)의 '분포가설'에 근거하여 핵심어와 공기하는 어휘들에 대한 분포적 정규성을 포착하는 언어 직관의 계산 모형을 제안한다. 이를 위해 분포적 정규성에 대한 화자의 처리 계산 모형을 파악하기 위하여 심리언어학적 실험을 실시하고 그 결과를 분석한다. 계산 모형으로는 논리 모형, 확률 모형, 그리고 확률 추론 모형의 세가지 모형이 설정되었다. 실험은 두 가지로 구성되었다. 첫 번째는 100만 어절 코퍼스에서 추출된 문장을 화자 직관으로 의미를 식별하는 실험이었다. 이 실험에서는 응답간 일치도가 98%로 나왔다. 두 번째 실험은, 제한된 환경에서 실험자의 반응을 관찰하기 위한 것으로, 분열문이라는 환경을 통해 핵심어와 공기어사이의 의미 관계를 살펴보았다. 또한 100만 어절 코퍼스에서 관찰된 수치와 실험에서 관찰된 관찰치사이의 상관성을 피어슨의 상관계수로 측정하였다. 그러한 측정 결과 실제 코퍼스에서 관찰되는 현상은 논리모형과 상관성이 있었고, 제한된 환경에서 실시한 결과는 확률 모형과 상관성이 있었다. 이 실험결과는 논리 모형이 우선적으로 의미 분류에 관여하나, 만약 논리 모형이 적용되지 않을 경우 확률 모형이 관여함을 보여 준다. 아울러 의미 결정 모형의 관점에서는 논리 모형이 정확하게 직관모형을 예측할 수 있었고, 확률추론 모형도 직관모형을 근사치에 가깝게 예측할 수 있었다.

  • PDF

데이터마이닝 모형을 활용한 호흡기질환의 주요인 선별 (Identification of major risk factors association with respiratory diseases by data mining)

  • 이제영;김현지
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.373-384
    • /
    • 2014
  • 데이터 마이닝이란 대량의 데이터나 복잡한 구조의 데이터들을 정교한 통계분석과 모델링 테크닉을 이용하여 정확히 식별되지 않는 패턴이나 자료간의 상관관계를 밝혀내어 여러 가지 결과를 예측해 내는 통계적 기법이다. 이러한 데이터 마이닝 기법은 금융, 통신, 유통, 의학 등 다양한 분야에 활용되는데, 본 연구에서는 의학 분야에 적용하여 호흡기질환에 영향을 끼치는 요인을 선별하였다. 분석은 2012년도 경상북도 지역사회건강조사에 참여한 사람 중 의사에게서 폐결핵, 천식, 알레르기성 비염을 진단받은 경험이 있는 호흡기질환군과 건강군으로 정리한 자료를 대상으로 하였다. 호흡기질환이 영향을 끼치는 주요인을 선별하기 위해 인공신경망, 로지스틱 회귀모형, 베이지안 네트워크, C5.0, CART 기법을 이용하였다. 공정한 모형 평가를 위해 전체 데이터를 훈련용 데이터와 검증용 데이터로 나누었고, 훈련용 데이터에서 설정된 모형을 검증용 데이터에 적용하여 정확도를 비교하였다. 그 결과 CART가 최적 모형으로 선정되었으며 CART의 의사결정나무를 통하여 우울감 인지 여부, 현재 흡연여부, 스트레스 인지 여부 순으로 호흡기질환에 영향을 주는 것으로 나타났다. 그리고 호흡기질환의 주요인들에 대한 오즈비를 구하여 개별적인 영향력에 대해서도 밝혔다.

확장된 베이지안 정보기준을 이용한 경기지표의 변동성 분석 연구 (A Study on the Volatility Analysis of Economic Indicators Using Extended Bayesian Information Criteria)

  • 전진호
    • 한국산학기술학회논문지
    • /
    • 제18권4호
    • /
    • pp.260-266
    • /
    • 2017
  • 우리나라 뿐만 아니라 세계경제는 산업화시대, 정보화시대를 거쳐 4차 산업혁명을 바라보는 현재까지 다양한 시장 친화적인 정책들을 지속적으로 수행하며 새로운 경제질서를 모색하고 있다. 그 결과 경제시장의 규모가 지속적으로 커짐과 동시에 시장 변화에 영향을 미치는 요인도 다양해졌다. 이에 따라, 많은 기업의 의사결정자들에게는 급격하게 동적으로 변화하는 경제시장에서 정확하고 효과적인 의사결정을 위해 경제시장을 정확하게 분석, 예측하는 문제가 의사결정자의 역량으로서 중요한 이슈가 되었다. 본 연구에서는 복잡 다양한 경제시장 환경의 정확한 분석 및 예측을 위한 최적화된 모델링의 결정을 위해 기존의 제한된 정보기준에서 확장된 정보기준을 적용하여 예측 모형의 정확도와 유성성을 향상시키고자 한다. 실험을 통해, 본 연구에서 적용된 확장된 정보기준의 유용성을 검증하기 위해 KOSPI 자료를 대상으로 실험한 본 연구와 기존의 연구를 비교한다. 실험 결과, 확장된 정보기준을 적용하는 것이 기존의 정보기준을 사용하는 것보다 향상된 예측정확도를 보여 유용성을 확인하였다.

변종 몬테 칼로 신경망을 이용한 패턴 분류 (Pattern Classification Using Hybrid Monte Carlo Neural Networks)

  • 전성해;최성용;오임걸;이상호;전홍석
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.231-236
    • /
    • 2001
  • 일반적인 다층 신경망에서 가중치의 갱신 알고리즘으로 사용하는 오류 역전과 방식은 가중치 갱신 결과를 고정된(fixed) 한 개의 값으로 결정한다. 이는 여러 갱신의 가능성을 오직 한 개의 값으로 고정하기 때문에 다양한 가능성들을 모두 수용하지 못하는 면이 있다. 하지만 모든 가능성을 확률적 분포로 표현하는 갱신 알고리즘을 도입하면 이런 문제는 해결된다. 이러한 알고리즘을 사용한 베이지안 신경망 모형(Bayesian Neural Networks Models)은 주어진 입력값(Input)에 대해 블랙 박스(Black-Box)와같은 신경망 구조의 각 층(Layer)을 거친 출력값(Out put)을 계산한다. 이 때 주어진 입력 데이터에 대한 결과의 예측값은 사후분포(posterior distribution)의 기댓값(mean)에 의해 계산할 수 있다. 주어진 사전분포(prior distribution)와 학습데이터에 의한 우도함수(likelihood functions)에 의해 계산한 사후확률의 함수는 매우 복잡한 구조를 가짐으로 기댓값의 적분계산에 대한 어려움이 발생한다. 따라서 수치해석적인 방법보다는 확률적 추정에 의한 근사 방법인 몬테 칼로 시뮬레이션을 이용할 수 있다. 이러한 방법으로서 Hybrid Monte Carlo 알고리즘은 좋은 결과를 제공하여준다(Neal 1996). 본 논문에서는 Hybrid Monte Carlo 알고리즘을 적용한 신경망이 기존의 CHAID, CART 그리고 QUEST와 같은 여러 가지 분류 알고리즘에 비해서 우수한 결과를 제공하는 것을 나타내고 있다.

  • PDF

다중 Logistic 회귀분석을 통한 침수지역의 확률적 도출 (The probabilistic estimation of inundation region using a multiple logistic regression analysis)

  • 정민규;김진국;오랑치맥 솜야;권현한
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.121-129
    • /
    • 2020
  • 도시화로 인한 불투수층 증가와 하천 주변 개발은 홍수 시 위험에 노출되는 재해요인의 증가뿐 아니라 피해의 파급을 발생시켜 홍수 관리 측면에서 어려움을 낳는다. 홍수 방재대책을 위해서는 도시지역에 분포하는 다양한 지표면 공간특성을 반영하여 침수가 예상되는 지역에 대한 파악이 우선시되어야 한다. 본 연구에서는 도시하천의 홍수 위험지역을 대상으로 확률적 홍수위험 평가가 수행되었다. 홍수와 관련된 지형적 영향요인인 고도, 경사, 유출곡선지수, 하천까지 거리를 예측변수로 하여 하천 주변 침수 예상지역을 설명하기 위해 모형의 학습데이터로 100년 빈도 홍수위험 지도가 사용되었다. 연구 대상 지역은 격자로 변환하여 Bayesian Logistic 회귀분석을 수행하여 각 격자별로 홍수영향요인이 침수 여부를 설명하는 모형을 구축하였다. 최종적으로 모형을 통해 대상 지역 전체에 대하여 침수위험도를 확률적으로 제시하였다.

피해파급에 대한 고찰을 통한 전력 및 상수도 네트워크의 강건성 예측 (Robustness Estimation for Power and Water Supply Network : in the Context of Failure Propagation)

  • 이슬비;박문서;이현수
    • 한국건설관리학회논문집
    • /
    • 제19권3호
    • /
    • pp.33-42
    • /
    • 2018
  • 손상된 라이프라인 시스템의 공공서비스 제공 지연 예측은 지진 대응 체계 마련의 첫 단계이다. 그러나 라이프라인 시스템의 서비스제공가능도는 개별 구조물의 물리적 손상뿐만 아니라 인접한 구조물들로부터의 피해파급에 의해 변동될 수 있다. 이에 본 연구는 라이프라인 시스템의 기능 저하를 유발하는 공통원인피해와 연쇄피해의 발생 확률을 추론하기 위해 베이지안 모형을 작성하고 피해의 인과관계를 고려하여 최종 수요자 중심의 네트워크 강건성을 평가하는 방안을 제시하였다. 또한 완화대책에 따른 네트워크 강건성을 분석하기 위해 국내 대구경북지역의 전력 및 상수도 시스템을 대상으로 지진 규모에 따른 공공서비스의 공급 지연 확률을 예측하였다. 그 결과 사례 지역의 경우 안정적인 전력과 상수 수급을 위해 라이프라인 네트워크를 구성하는 노드들 간 피해파급을 저감하는 것이 효과적임을 확인하였다. 본 연구는 지진 피해 진단의 다양한 불확실성 간 인과관계를 도식화하였다는 데에 의의가 있으며, 지속 가능한 공공서비스 확보를 위한 지역단위 대책 수립을 지원할 수 있을 것으로 기대된다.

Monte-Carlo expectation-maximaization 방법을 이용한 무응답 모형 추정방법 (An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm)

  • 최보승;유현상;윤용화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.587-598
    • /
    • 2016
  • 각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.