• 제목/요약/키워드: 베이지안 모형선택

검색결과 59건 처리시간 0.016초

데이터마이닝의 베이지안 망 기법을 이용한 교통수단선택 모형의 설계 및 구축 (Design and Implementation of Travel Mode Choice Model Using the Bayesian Networks of Data Mining)

  • 김현기;김강수;이상민
    • 대한교통학회지
    • /
    • 제22권2호
    • /
    • pp.77-86
    • /
    • 2004
  • 데이터마이닝 (Data Mining)은 대용량의 데이터에 존재하는 관계, 패턴, 규칙 등을 효율적으로 탐색하여 이를 모형화함으로써, 유용한 정보로 추출 변환하는 일련의 과정이다. 특히 베이지안 망 (Bayesian Network)은 신경망, 유전자알고리즘 퍼지이론 등과 더불어 데이터마이닝의 중요한 기법 중의 하나로서 베이지안 통계 이론(Bayesian Statistics Theory)를 적용하여 변수들간의 확률적인 관계를 기호화함으로써, 설명변수들과 종속변수들간의 인과관계를 파악할 수 있다. 이 연구는 기존에 적용된 바가 없는 데이터마이닝의 베이지안 망을 이용하여 수도권 교통수단선택 모형을 구축한다. 2002년도 수도권 가구통행실태조사 자료의 사회 경제적 특성과 교통체계 특성을 반영하여 베이지안 망을 이용한 교통수단선택 모형을 설계 구축하여, 각 변수들간의 상관관계와 인과관계를 분석함으로써, 설명변수인 성과 연령의 구성비가 변하였을 때, 교통수단선택의 변화율(확률)을 예측한다. 이 연구를 통해 현실에서는 내재하나 설명변수간의 복잡한 상관성을 배제하고 설명변수들과 교통수단선택간의 단순한 직선관계를 가정하는 기존 교통수단선택 모형의 한계를 극복할 수 있는 가능성을 제시한다. 또한 선택되지 않은 교통수단에 대한 정보의 부족으로 인한 교통수단선택 모형 구축의 어려움을 극복한다. 또한 다양한 교통정책에 따른 교통수단선택의 변화를 실시간으로 시뮬레이션 할 수 있는 방법론을 개발한다.

부분 베이즈요인을 이용한 K개로 로그정규분포의 상등에 관한 베이지안 다중검정 (Bayesian Testing for the Equality of K-Lognormal Populations)

  • 문경애;김달호
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.449-462
    • /
    • 2001
  • 베이지안 다중 검정방법(multiple hypothesis test)은 여러 통계모형에서 성공적인 결과를 주는 것으로 알려져있다. 일반적으로, 베이지안 가설검정은 고려중인 모형에 대한 사후확률을 계산하여 가장 높은 확률은 갖는 모형을 선택하기 때문에 귀무가설의 기각여부에만 관심을 가지는 고전적인 분산분석 검정과는 달리 좀 더 구체적인 모형을 선택할 수 있는 장점이 있다. 이 논문에서는 독립이면서 로그정규분포를 따르는 K($\geq$3)개 모집단의 모수에 대한 가설 검정방법으로 O’Hagan(1995)이 제안한 부분 베이즈 요인을 이용한 베이지안 방법을 제안한다. 이 때 모수에 대한 사전분포로는 무정보적 사전분포를 사용한다. 제안한 검정 방법의 유용성을 알아보기 위하여 실제 자료의 분석과 모의 실험을 이용하여 고전적인 검정방법과 그 결과를 비교한다.

  • PDF

준모수적 계층적 선택모형에 대한 베이지안 방법 (A Bayesian Method to Semiparametric Hierarchical Selection Models)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.161-175
    • /
    • 2001
  • 메타분석(Meta-analysis)은 서로 독립적으로 연구되어진 결과들을 전체적인 하나의 결과로 도출하기 위해 사용되어지는 통계적 방법이다. 이러한 통계적 방법을 설명할 모형으로는 선택모형(selection model)을 포함한 계층적 모형(hierarchical model)을 사용하며, 이러한 모형들은 베이지안 메타분석에 유용한 것으로 알려져 있다. 그러나, 메타분석의 자료들은 일반적으로 출판편의(publication bias)를 갖고 있으므로 이를 극복하고자 가중함수(weight function)를 이용하여 분포함수를 새롭게 정의하여 사용한다. 최근에 Silliman(1997)은 계층적 모형(hierarchical model)에 가중함수를 첨부한 계층적 선택모형(hierarchical selection model)을 정의하고 모수적 베이지안 방법을 제시하였다. 본 연구에서는 미관측된 연구효과에 디리슈레 과정 사전분포(Dirichlet process prior)를 적용한 준모수적 계층적 선택모형(semiparametric hierarchical selection models)을 소개한다. 여기서 제시된 준모수적 계층적 선택모형을 베이지안 방법으로 추정하기 위하여 마코프 연쇄 몬테칼로(Markov chain Monte Carlo)방법을 이용한다. 제시된 방법을 적용하기 위하여 실제 자료(Johnson, 1993)인 충치를 예방하기 위한 두 가지의 예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구를 이용하여 메타분석을 한다.

  • PDF

지수 생존 모형에서의 베이지안 모형 선택 (Bayesian model selection in exponential survival models)

  • 정윤식;김미숙
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.57-71
    • /
    • 2002
  • 본 논문에서는 지수생존 모형의 형태들로써 단순 지수모형, 변환 점 지수모형과 유한 혼합 지수모형 등 세 가지 모형을 소개한다. 이러한 모형들 중에서, 최적의 모형을 찾기 위하여 Gelfand와 Ghosh(1998)의 방법을 이용한 모형 선택 방법을 제안한다. 이때, 계산상의 어려움을 피하기 위하여 자료 확장 기법(Tanner와 Wong, 1987)과 깁스 샘플러(Gelfand와 Smith, 1990)를 사용하였다. 제안된 베이지안 방법을 설명하기 위하여 모의 실험 자료와Stangl의 항 우울제 자료에 적용한다. 모형 선택 방법은 사전 분포와 모형 선택 기준의 가중치에 민감하지 않다는 것을 제한된 우리의 실험으로 알 수 있었다.

시뮬레이션을 통한 베이즈요인에 의한 모형선택의 비교연구 : 포아송, 음이항모형의 선택과 정규, 이중지수, 코쉬모형의 선택 (Comparative Study of Model Selection Using Bayes Factor through Simulation : Poisson vs. Negative Binomial Model Selection and Normal, Double Exponential vs. Cauchy Model Selection)

  • 오미라;윤소영;심정욱;손영숙
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.335-349
    • /
    • 2003
  • 본 논문에서는 포아송분포 대 음이항분포, 그리고 정규분포, 이중지 수분포 대 코쉬분포에 대한 모형선택을 위하여 베이지안 방법을 사용한다. 각 모수에 대한 사전분포로는 무정보 부적절 사전분포의 가정 하에, 베이지안 모형선택을 위하여 O'Hagan (1995)의 부분적 베 이즈요인을 이용하였다. 실제자료와 모의 실험 자료의 분석을 통하여 부분적 베이즈요인의 유용성을 Berger와 Pericchi (1996, 1998)의 내재적 베이즈요인들과 함께 비교 검토해 본다.

제2종 중단모형에서 FRACTIONAL BAYES FACTOR를 이용한 신뢰수명 모형들에 대한 베이지안 모형선택 (Bayesian Model Selection of Lifetime Models using Fractional Bayes Factor with Type ?$\pm$ Censored Data)

  • 강상길;김달호;이우동
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.427-436
    • /
    • 2000
  • 이 논문에서는 신뢰수명자료의 분석에 많이 사용되는 지수분포, 와이블분포, 로그정규분포에 대해, 현재의 자료가 어느 분포에 가장 적합한가를 알아보기 위한 베이자안 모형 선택방법을 제안한다. 일반적으로, 모수에 대한 사전분포가 부적절 분포인 경우, 베이즈 요인(Bayes factor)은 미지의 상수를 포함한다. 이러한 문제점을 해결하기 위하여 O’Hagan(1995)에 의해 제안된 fractional Bayes factor를 이용하여 자료를 가장 적합시키는 모형을 찾는다. 특히, 제2종 중도절단자료가 주어진 경우. 이 자료를 이용한 베이지안 모형선택에 대한 연구는 거의 이루어진 바가 없다. 실제 자료와 인위적인 자료를 이용하여 로그정규분포, 지수분포, 와이블모형중 어느 모형에 가장 잘 적합한지를 검정하는 예를 보인다.

  • PDF

MCMC를 이용한 비동질적 포아송과정에서 일반화 순서통계량 모형의 연구

  • 최기헌;김희철
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.753-763
    • /
    • 1997
  • 컴퓨터의 발전에 따른 MCMC를 비동질적 포아송 과정에 이용하였다. 베이지안 추론에서 조건부 분포를 가지고 사후분포를 결정하는데 있어서의 계산 문제를 고려하였다. 특히 분포가 이중지수, 곰페르츠, 랄리, 감마, 그리고 검벨인 일반 순서통계량 모형에 대하여 깁스 샘플링과 메트로폴리스 알고리즘을 활용한 베이지안 계산과 모형선택을 제시하였다.

  • PDF

왜도 타원형 분포를 이용한 준모수적 계층적 선택 모형 (Semiparametric Bayesian Hierarchical Selection Models with Skewed Elliptical Distribution)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.101-115
    • /
    • 2003
  • 본 논문에서는 Chen, Dey와 Shao(1999), Branco와 Dey(2001)가 제안한 왜도가 있는 두터운 꼬리를 가지는 오차 분포와 디리슈레 과정 사전분포를 이용한 베이지안 메타분석 (meta-analysis)을 하고자 한다. 베이지안 메타분석을 위하여 가중함수를 고려한 계층적 선택 모형을 이용한다. 이때의 오차항은 왜도가 있는 비정규 분포로 가정한다. 이를 위하여 우선 왜도 타원형 분포의 일반적인 족을 소개한다 이 분포족중 왜도 정규분포와 왜도 t 분포를 오차항 분포로 이용한 베이지안 계층적 선택 모형을 고려하며, 이 때 발생하는 복잡한 베이지안 계산은 MCMC 방법으로 해결한다. 마지막으로, 실제 자료(Johnson, 1993)인 두 가지의 충치예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구 자료를 이용하여 본 연구에서 제시된 베이지안 방법을 이용하여 메타분석을 한다.

정규확률변수 관측치열에 대한 베이지안 변화점 분석 : 서울지역 겨울철 평균기온 자료에의 적용 (Bayesian Change Point Analysis for a Sequence of Normal Observations: Application to the Winter Average Temperature in Seoul)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.281-301
    • /
    • 2004
  • 본 논문에서는 일변량 정규분포를 따르는 확률변수의 관측치열에 대한 변화점 문제(change point problem)를 고찰한다. 변화점의 존재유무, 그리고 만일 변화점이 존재한다면 어떠한 유형으로 발생했는지 즉, 변화점 발생 이후로 평균만 변화, 분산만 변화, 또는 평균과 분산 모두가 변화했는지를 밝힌다. 가능한 여러 유형의 변화모형들 가운데 최적의 모형을 선택하기 위해 베이지안 모형선택 기법을 이용하고, 선택된 모형에 내재된 모수를 추정 하기 위해 메트로폴리스-혜스팅스 알고리 즘을 포함한 깁스샘플링 을 이용한다. 이러한 방법론은 모의실험을 통해 검토되고, 또한 서울지역의 겨울철 평균기온 자료에 적용된다.

소프트웨어 신뢰모형에 대한 베이지안 접근 (Bayesian Approach for Software Reliability Models)

  • 최기헌
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권1호
    • /
    • pp.119-133
    • /
    • 1999
  • 마코브체인 몬테칼로 방법을 소프트웨어 신뢰모형에 이용하였다. 베이지안 추론에서 조건부 분포를 가지고 사후분포를 결정하는데 있어서의 계산 문제를 고찰하였다. 특히 레코드값을 통계량을 갖고서 혼합과정과 중첩과정에 대하여 깁스샘플링 알고리즘과 메트로폴리스 알고리즘을 활용하여 베이지안 계산과 모형 선택을 제시하고 모의실험자료를 이용하여 수치적 인 계산을 시행하고 그 결과를 비교하였다.

  • PDF