• 제목/요약/키워드: Bayesian validation method

검색결과 43건 처리시간 0.02초

베이지안 회귀를 이용한 국내 홀스타인 젖소의 유량형질 관련 DGAT1유전자 효과 검증 (Validation of diacylglycerol O-acyltransferase1 gene effect on milk yield using Bayesian regression)

  • 조광현;조충일;박경도;이준호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1249-1258
    • /
    • 2015
  • 젖소의 유생산 형질에 가장 큰 영향을 미치는 유전자들 중 하나로 알려진 DGAT1 유전자의 효과를 국내 젖소 종축의 고밀도 유전체 정보를 이용하여 검증하기 위하여 본 연구를 수행하였다. 국내 젖소 씨수소로 구성된 353두의 고밀도 유전체 정보, 혈통, 추정 육종가 및 신뢰도 정보를 수집하였으며, 단일염기다형성 효과를 추정하기 위한 종속변량으로 가장 정확한 유전체 육종가를 예측할 수 있는 DeRegressed EBV를 산출하여 분석에 이용하였다. BovineSNP50 v2 패널을 이용하여 구명한 고밀도 유전자형 정보 중 유효성검증 과정을 통하여 41,051개 SNP을 선정하였으며, 각 단일 염기다형성의 실제적 유전체 육종가 기여도를 확인하기 위하여 유전체 선발방법 중 하나인 베이즈B (pi=0.99) 방법을 이용하여 SNP 효과를 추정하였다. 1메가 베이스페어의 구간으로 구성된 유전체 전장의 2,516개 윈도우 별 유전분산 설명력을 계산한 결과 상위 1, 3 윈도우가 DGAT1유전자 주변에서 발견되었으며, 이 두 윈도우의 유전분산 설명력은 각각 0.51% 및 0.48%인 것으로 나타났다. DGAT1유전자는 유전체 선발에 상업적으로 이용되는 50k SNP chip에 포함되어있지 않기 때문에 직접적인 유전자의 효과가 명확하게 드러나지는 않지만 DGAT1 유전자에 인접한 단일염기다형성들간의 연관불평형에 의하여 주변 윈도우에서 가장 높은 유전분산 설명력을 보이는 것으로 사료된다.

정규 확률과정을 사용한 공조 시스템의 전력 소모량 예측에 관한 연구 (A Study on the Prediction of Power Consumption in the Air-Conditioning System by Using the Gaussian Process)

  • 이창용;송근수;김진호
    • 산업경영시스템학회지
    • /
    • 제39권1호
    • /
    • pp.64-72
    • /
    • 2016
  • In this paper, we utilize a Gaussian process to predict the power consumption in the air-conditioning system. As the power consumption in the air-conditioning system takes a form of a time-series and the prediction of the power consumption becomes very important from the perspective of the efficient energy management, it is worth to investigate the time-series model for the prediction of the power consumption. To this end, we apply the Gaussian process to predict the power consumption, in which the Gaussian process provides a prior probability to every possible function and higher probabilities are given to functions that are more likely consistent with the empirical data. We also discuss how to estimate the hyper-parameters, which are parameters in the covariance function of the Gaussian process model. We estimated the hyper-parameters with two different methods (marginal likelihood and leave-one-out cross validation) and obtained a model that pertinently describes the data and the results are more or less independent of the estimation method of hyper-parameters. We validated the prediction results by the error analysis of the mean relative error and the mean absolute error. The mean relative error analysis showed that about 3.4% of the predicted value came from the error, and the mean absolute error analysis confirmed that the error in within the standard deviation of the predicted value. We also adopt the non-parametric Wilcoxon's sign-rank test to assess the fitness of the proposed model and found that the null hypothesis of uniformity was accepted under the significance level of 5%. These results can be applied to a more elaborate control of the power consumption in the air-conditioning system.

Support Vector Machine 기법을 이용한 고객의 구매의도 예측 (Forecasting of Customer's Purchasing Intention Using Support Vector Machine)

  • 김진화;남기찬;이상종
    • 경영정보학연구
    • /
    • 제10권2호
    • /
    • pp.137-158
    • /
    • 2008
  • 기업 경쟁력 강화의 중요한 이슈인 대량 개별화(mass-customization)의 실행을 위하여 통합 고객관계 관리 프로세스로서의 CRM(customer relationship management)에 대한 관심과 활용에 대한 필요성은 점점 더 높아지고 있다. 특히, 기존 고객들의 구매 정보를 기반으로 고객의 구매 패턴을 파악하고 의도를 예측하는 것은 오늘날 실질적인 판매 전략을 수립하는 마케팅 분야에서 상당히 큰 비중을 차지하고 있다. 고객의 구매의도 예측에는 대량의 데이터로부터 과거에 인지하지 못했던 의미 있고, 근거 있는 정보를 추출하는 데이터마이닝(datamining)이 주로 사용되고 있다. 기존의 구매의도 예측에 사용된 데이터마이닝 기법들은 주로 신경망(neural networks)과 로지스틱 회귀분석(logistic regression analysis)이었는데, 예측 정확성 및 모형 구축의 어려움으로 인한 다양한 문제점들이 제기되고 있는 실정이다. 따라서, 본 논문에서는 기존의 기법들이 가지고 있는 단점들을 개선하기 위하여 신경망과 로지스틱 회귀분석 외에 연관규칙(association rule), 연관성 매트릭스(association matrix), 의사결정 나무(decision tree), 베이지안 망(bayesian network), SVM(support vector machine) 기법들을 추가로 제안하였다. 본 연구의 목적은 고객의 특정 상품에 대한 구매의도 예측을 위하여 새로운 알고리즘을 제시하기보다는 기존의 다양한 데이터마이닝 기법들을 적용시켜 봄으로써, 가장 우수한 예측성과를 나타내는 기법을 발견하는 것이다. 연구에 사용된 자료는 기존의 연구에서는 적용되지 않았던 편의점의 영수증 데이터이다. 예측 목표상품은 카테고리화 된 '우유'와 '냉동식품'이며, 제안된 기법들의 신뢰성을 위하여 전체 데이터를 10개의 training과 test 셋으로 중복되지 않게 구분함과 동시에 10번의 교차 검증(cross validation)을 실시하였다. 실험 결과 SVM이 영수증 데이터를 이용한 고객의 특정 상품에 대한 구매의도 예측에서 가장 우수한 성과를 나타내는 것을 확인하였다.