• 제목/요약/키워드: Bayesian 모형

검색결과 398건 처리시간 0.027초

한우의 도체형질 유전모수 추정을 위한 REML과 Bayesian via Gibbs Sampling 방법의 비교 연구 (Comparison between REML and Bayesian via Gibbs Sampling Algorithm with a Mixed Animal Model to Estimate Genetic Parameters for Carcass Traits in Hanwoo(Korean Native Cattle))

  • 노승희;김병우;김효선;민희식;윤호백;이득환;전진태;이정규
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.719-728
    • /
    • 2004
  • 본 연구는 한우의 도체형질들에 대한 유전적 변이를 분석방법에 따라 어떠한 차이가 있는지를 알아보고자 한우 후대검정자료를 이용하여 분석하였다. 분석에 이용된 도체성적 관련 자료는 가축개량사업소와 한우개량단지에서 1996 년부터 2001 년까지 태어난 후대검정우 1526두로부터 조사었다. 한우에 있어서 주요 개량형질인 육량과 육질에 영향하는 도체중, 도체율,배최장근단면적, 등지방두께, 근내지방도를 대상으로 유전력과 유전상관을 추정하였다. 유전모수 추정에 있어서 REML 분석법과 Bayesian추론방법으로써 Gibbs Sampling 분석법을 사용하였는데 각각의 모수들에 대한 Gibbs Sampler는 100,000회 실시하였고 초기 1,000회는 모수의 사후분포에 대한 부정확성으로 간주하여 모수의 사후분포특성 규명에서 제외하였다. 각각의 형질들에 대한 유전변이는 이러한 두 가지 분석방법을 상호 비교 함으로써 최적의 통계분석 방법을 모색하였다. 도체형질에 대한 유전력 추정은 REML 방법을 통한 추정에서는 근내지방도가 0.51로 고도의 유전력을 보였고, 도체율이 0.25로 중도의 유전력이 추정되었다. Gibbs Sampling 방법을통한 추정에서도 근내지방도가 0.54로 고도의 유전력을 도체율에서 0.25로 중도의 유전력을 보였다. REML 분석방법과 Gibbs Sampling 분석방법에서의 유전력은 다소 큰 차이는 보이지 않았으나, 대체로 Gibbs Sampling 방법으로 분석한 유전력 추정치가 높게 추정되었다. 그리고, 유전상관분석에서는 REML 방법을 통한 분석에서 도체중과 배최장근단면적에서 0.651 로 높은 정의 유전상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.139로 부의 유천상관을 나타내었다. Gibbs Sampling 방법에서는 도체중과 도체율, 배최장근단면적에서 각각 0.814, 0.695으로 높은 정의 상관을 나타내었고, 배최장근단면적과 등지방두께에서 -0.126으로 부의상관을 나타내었다. Gibbs Sampling방법을 통한 분석에서 특정 형질간 유전상관이 높게 나타났으며, 다소 큰 차이를 보이지 않았다. REML 분석방법과 Bayesian Inference를 바탕으로 한 Gibbs Sampling 분석에서 모수 추정은 큰 차이를 보이지 않았다. 따라서 방대한 현장정보를 활용하여 보다 정확한 모수 추정을 수행하기 위해서는 분석모형에 대한 계수행렬의 역행렬 계산을 통한 REML 방법의 한계성을 극복할 수 있는 방법으로써 Gibbs Sampling 분석 방법이 가능할 것으로 사료된다.

계층적 베이즈 모형을 이용한 대학등록금에 대한 부모님의 경제적 지원 영향 분석 (Effects of Financial College Tuition Support by Korean Parents using a Hierarchical Bayes Model)

  • 오만숙;오현숙;오민정
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.267-280
    • /
    • 2013
  • 최근 한국 사회에서 경제적, 정치적, 사회적 이슈가 되고 있는 대학 등록금의 경제적 부담에 영향을 미치는 요인들에 대한 분석을 위하여 통계청에서 실시한 '2010년도 사회조사'에서 수집된 자료를 기반으로 지역을 계층으로 하는 베이지안 계층모형을 이용한 분석을 수행하였다. 등록금의 70% 이상을 부모님이 지원하는가에 대한 이항 반응변수에 대하여 계층적 프로빗 모형을 설정한 후 설명변수들에 대한 요인분석을 실시하여 설명변수를 압축하고 마코브체인 몬테칼로 기법을 적용하여 모수를 추정하였다. 자료의 분석 결과, 많은 지역에서 소득과 정신적 스트레스 요인이 부모님의 등록금에 대한 경제적 지원과 유의한 관련이 있음을 보여주었다. 소득이 높은 부모일수록 자녀의 대학 등록금을 지원하며 부모로부터 경제적 지원을 받는 학생일수록 정신적 스트레스를 덜 받는 것으로 나타나 부모의 소득이 자녀의 정신건강에 유의한 영향을 미침을 보여 주었다. 반면에, 성별, 생활건강, 학교 만족도는 대부분의 지역에서 부모님의 등록금 지원과 유의한 관련이 없었다. 스트레스 또는 소득과 부모님의 지원에 대한 지역별 차이를 보면, 강원도 지역 학생들이 부모님의 지원이 낮을 경우 가장 정신적 스트레스를 많이 받는 것으로 나타났으며 소득이 많을수록 부모님의 지원 가능성이 높아지는 경향은 지방 행정도에 비하여 대도시에서 더 뚜렷하게 나타남을 알 수 있었다.

교차로 신호위반 단속카메라 설치가 차량사고에 미치는 영향 (Safety Impacts of Red Light Enforcement on Signalized Intersections)

  • 이상혁;이용두;도명식
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.93-102
    • /
    • 2012
  • 도시지역의 교통사고 중 교차로와 관련한 교통사고가 교통사고 건수와 교통사고 심각도에서 가로구간이나 횡단보도 관련 교통사고에 비해 높게 나타나고 있다. 특히 교차로에서 신호위반으로 인한 교통사고는 다른 교통사고유형과는 달리 중상과 경상에 관련된 교통사고비율이 높은 것으로 나타나고 있다. 이에 우리나라는 물론이고 많은 외국에서 신호위반으로 인한 교차로 교통사고를 줄이기 위하여 교차로 신호위반 단속카메라를 설치하고 있다. 이와 더불어 교차로 신호위반 단속카메라의 교통사고 감소에 미치는 효용에 대한 연구가 계속 이루어지고 있으나 신호위반 단속카메라만의 효과를 분석하기란 쉽지가 않다. 따라서 본 연구에서는 미국 Illinois주 Chicago시의 다운타운의 교차로 관련 데이터를 이용하여 SPF모형을 개발하고 개발된 모형을 활용하여 EB방법으로 교차로 신호위반 단속카메라의 효용에 대하여 분석하였다. 분석 결과, 목표로 지정한 교통사고 유형(측면직각추돌, 후방추돌, 같은 방향 측면추돌, 반대 방향 측면추돌, 회전시 추돌, 그리고 정면충돌)과 전체 교통사고유형 모두가 교차로 신호위반 단속카메라의 영향을 받는 것으로 나타났다. 전반적으로 신호위반 단속카메라 사망사고가 약 26% 감소한 것으로 나타났으며, 전체 사고는 5.49% 증가하는 것으로 나타났다. 또한 대물교통사고의 경우 3.23% 증가하는 것으로 나타났다. 또한 목표로 한 사고유형에 대한 교통사고효과 분석에서는 사망사고는 약 38% 감소한 것으로 나타났으며 전체 사고의 경우 1.46% 증가하는 것으로 나타났다. 또한 대물교통사고의 경우 1.16% 증가하는 것으로 나타났다.

자동화 K-평균 군집방법 및 R 구현 (Automated K-Means Clustering and R Implementation)

  • 김성수
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.723-733
    • /
    • 2009
  • K-평균 군집분석이 가지는 두 가지 근본적인 어려움은 사전에 미리 군집 수를 정해야 하는 문제와 초기 군집중심에 따라 결과가 달라질 수 있는 문제이다. 본 연구에서는 이러한 문제를 해결하기 위한 자동화 K-평균 군집분석 절차를 제안하고, R을 이용하여 구현한 결과를 제공한다. 자동화 K-평균 군집분석에서 제안된 절차는 처음 단계로서 계층적 군집분석을 행한 후 이를 이용하여 군집 수와 초기 군집수를 자동으로 정하고, 다음 단계로 이 결과를 이용하여 K-평균 군집분석을 수행하는 방법을 택하였다. 처음 단계에서 이용된 계층적 군집분석 방법으로는 Ward의 군집분석을 한 후에 Mojena의 규칙을 이용하여 군집 수를 정하는 방법을 택하거나, 모형근거 군집분석방법을 수행한 후에 BIC 값을 이용하여 군집 수를 정하는 방법을 이용하였다. 제안된 자동화 K-평균 군집절차에는 대량자료의 분석에도 용이하게 이용될 수 있도록 반복된 표본추출 방법을 이용하여 군집 수 및 군집 중심을 구하는 절차를 포함하였다. 구현된 R 프로그램은 www.knou.ac.kr/ sskim/autokmeans.r에서 제공하고 있다.

한계와 이상치가 있는 결측치의 로버스트 다중대체 방법 (Robust multiple imputation method for missings with boundary and outliers)

  • 박유성;오도영;권태연
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.889-898
    • /
    • 2019
  • 항목 무응답(item missing)이 발생한 설문조사에서 결측이 포함된 변수에 이상치(outlier)의 존재와 다른 설문문항 항목과의 논리적 한계(boundary) 조건들이 유의미하다면 결측치 대체문제는 매우 복잡해진다. 한계가 있는 결측값들을 포함한 변수에 이상치가 존재하는 경우, 기존의 회귀분석에 근거한 결측치 대체방법은 편향된 대체값 그리고 한계를 만족하지 않은 대체값을 제시할 가능성이 있다. 이에 본 논문은 회귀모형에 기반을 두고 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건이 자료에 존재하는 경우, 다양한 로버스트 회귀모형과 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다. 이를 위해 이들 방법들의 최적의 조합을 다양한 시나리오별로 모의실험을 통하여 찾아보고 이에 대하여 논의하였다.

확률강우량 추정을 위한 확률분포함수의 매개변수 추정법에 대한 신뢰성 평가 (Reliability Evaluation of Parameter Estimation Methods of Probability Density Function for Estimating Probability Rainfalls)

  • 한정우;권현한;김태웅
    • 한국방재학회 논문집
    • /
    • 제9권6호
    • /
    • pp.143-151
    • /
    • 2009
  • 최근의 극한 수문사상은 홍수, 가뭄과 같은 심각한 재해를 발생시킨다. 많은 연구자들은 불확실한 미래의 확률강우량 및 유출량의 예측을 위해 많은 노력을 하고 있다. 본 연구에서는 불확실성이 낮은 확률강우량의 산정을 위하여 매개변수 추정법을 평가하였다. 인천, 강릉, 광주, 부산, 추풍령 관측소를 연구 대상 관측소로 선정하여 자료를 수집하였고, ARMA모형을 이용하여 합성강우자료를 구축하였다. 본 연구에서는 극치강우사상에 적합한 것으로 알려진 Gumbel 분포와 GEV 분포모형에 대한 매개변수를 최우도법과 베이지안 추론방법을 사용하여 추정하였으며, Bootstrap 방법을 이용하여 확률강우량의 신뢰구간 길이를 추정하였다. 매개변수 추정 방법별 산정된 확률강우량의 신뢰구간 길이를 비교함으로서 불확실성이 낮은 확률강우량을 산정할 수 있는 매개변수 추정방법을 선정하였다.

그리드 단체 위의 디리슐레 분포에서 마르코프 연쇄 몬테 칼로 표집 (MCMC Algorithm for Dirichlet Distribution over Gridded Simplex)

  • 신봉기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.94-99
    • /
    • 2015
  • 비모수 베이스 통계학, 확률적 표집에 기반한 추론 등이 기계학습의 주요 패러다임으로 등장하면서 디리슐레(Dirichlet) 분포는 최근 다양한 그래프 모형 곳곳에 등장하고 있다. 디리슐레 분포는 일변수 감마 분포를 벡터 분포로 확장한 형태의 하나이다. 본 논문에서는 감마 분포를 갖는 임의의 자연수 X를 K개의 자연수의 합으로 임의 분할 할 때 각 부분의 크기 비율을 디리슐레 분포에서 표집하는 방법을 제안한다. 일반적으로 디리슐레 분포는 연속적인 (K-1)-단체(simplex) 위에 정의 되지만 자연수로 분할하는 표본은 자연수라는 조건 때문에 단체 내부의 이산 그리드 점에만 정의된다. 본 논문에서는 단체 위의 그리드 상의 이웃 점들의 확률 분포로부터 마르코프연쇄 몬테 칼로(MCMC) 제안 분포를 정의하고 일련의 표본들의 마르코프 연쇄를 구현하는 알고리듬을 제안한다. 본 방법은 마르코프 모델, HMM 및 준-HMM 등에서 각 상태별 시간 지속 분포를 표현하는데 활용 가능하다. 나아가 최근 제안된 전역-지역(global-local) 상태지속 분포를 동시에 모형화하는 감마-디리슐레 HMM에도 응용가능하다.

수준에서의 변화에 적응하는 구조모형 (An Adaptive Structural Model When There is a Major Level Change)

  • 전덕빈
    • 한국경영과학회지
    • /
    • 제12권1호
    • /
    • pp.19-26
    • /
    • 1987
  • In analyzing time series, estimating the level or the current mean of the process plays an important role in understanding its structure and in being able to make forecasts. The studies the class of time series models where the level of the process is assumed to follow a random walk and the deviation from the level follow an ARMA process. The estimation and forecasting problem in a Bayesian framework and uses the Kalman filter to obtain forecasts based on estimates of level. In the analysis of time series, we usually make the assumption that the time series is generated by one model. However, in many situations the time series undergoes a structural change at one point in time. For example there may be a change in the distribution of random variables or in parameter values. Another example occurs when the level of the process changes abruptly at one period. In order to study such problems, the assumption that level follows a random walk process is relaxed to include a major level change at a particular point in time. The major level change is detected by examining the likelihood raio under a null hypothesis of no change and an alternative hypothesis of a major level change. The author proposes a method for estimation the size of the level change by adding one state variable to the state space model of the original Kalman filter. Detailed theoretical and numerical results are obtained for th first order autoregressive process wirth level changes.

  • PDF

반응표면법기반 강건파라미터설계에 대한 문헌연구: 실험설계, 추정 모형, 최적화 방법 (A literature review on RSM-based robust parameter design (RPD): Experimental design, estimation modeling, and optimization methods)

  • ;신상문
    • 품질경영학회지
    • /
    • 제46권1호
    • /
    • pp.39-74
    • /
    • 2018
  • Purpose: For more than 30 years, robust parameter design (RPD), which attempts to minimize the process bias (i.e., deviation between the mean and the target) and its variability simultaneously, has received consistent attention from researchers in academia and industry. Based on Taguchi's philosophy, a number of RPD methodologies have been developed to improve the quality of products and processes. The primary purpose of this paper is to review and discuss existing RPD methodologies in terms of the three sequential RPD procedures of experimental design, parameter estimation, and optimization. Methods: This literature study composes three review aspects including experimental design, estimation modeling, and optimization methods. Results: To analyze the benefits and weaknesses of conventional RPD methods and investigate the requirements of future research, we first analyze a variety of experimental formats associated with input control and noise factors, output responses and replication, and estimation approaches. Secondly, existing estimation methods are categorized according to their implementation of least-squares, maximum likelihood estimation, generalized linear models, Bayesian techniques, or the response surface methodology. Thirdly, optimization models for single and multiple responses problems are analyzed within their historical and functional framework. Conclusion: This study identifies the current RPD foundations and unresolved problems, including ample discussion of further directions of study.

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 (Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM)

  • 전성해;오경환
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.277-282
    • /
    • 2003
  • 웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.