DOI QR코드

DOI QR Code

베이지안 네트워크를 이용한 다차원 범주형 분석

Multi-dimension Categorical Data with Bayesian Network

  • Kim, Yong-Chul (Department of Logistic and Statistical Information, Yongin University)
  • 투고 : 2018.03.15
  • 심사 : 2018.03.29
  • 발행 : 2018.04.30

초록

일반적으로 자료의 효과 연속형인 경우 분산분석과 이산형인 경우 분할표 카이제곱 검정을 통계적 분석방법으로 사용한다. 다차원의 자료에서는 계층적 구조의 분석이 요구되어지며 자료간의 인과관계를 나타내기 위해 통계적 선형모형을 채택하여 분석한다. 선형모형의 구조에서는 자료의 정규성이 요구되어지며 일부 자료에서는 비 선형모형을 채택할 수도 있다. 특히, 설문조사 자료 구조는 문항의 특성상 이산형 자료의 형태가 많아 모형의 조건에 만족하지 않는 경우가 종종 발생한다. 자료구조의 차원이 높아질수록 인과관계, 교호작용, 연관성분석 등에 다차원 범주형 자료 분석 방법을 사용한다. 본 논문에서는 확률분포의 계산을 이용한 베이지안 네트워크 모형이 범주형 자료 분석에서 분석절차를 줄이고 교호작용 및 인과관계를 분석할 수 있다는 것을 제시하였다.

In general, the methods of the analysis of variance(ANOVA) for the continuous data and the chi-square test for the discrete data are used for statistical analysis of the effect and the association. In multidimensional data, analysis of hierarchical structure is required and statistical linear model is adopted. The structure of the linear model requires the normality of the data. A multidimensional categorical data analysis methods are used for causal relations, interactions, and correlation analysis. In this paper, Bayesian network model using probability distribution is proposed to reduce analysis procedure and analyze interactions and causal relationships in categorical data analysis.

키워드

참고문헌

  1. A, Onisko, M. J. Druzdzel and H. Wasyluk, "Learning Bayesian network parameters from small data set: Application of Noisy-Or gates," Int. J of Approximate Reasoning, vol. 27, no. 2, pp. 165-182, 2001. https://doi.org/10.1016/S0888-613X(01)00039-1
  2. Cooper, Gregory F and Herskovits Edward, "A Bayesian Method for the Induction of Probabilistic Networks from Data," Machine Learning, vol. 9, pp. 309-347, 1992.
  3. Heckerman, David, Geiger, Dan and Chickering, David M., "Leraning Bayesian Networks: The Combination of Knowledge and Statistical Data," Machine Learning, vol. 20, 197-203, 1995.
  4. Johnson, R.A and Wichern, D.W., "Applied Multivariate Statistical Analysis", Prentice Hall, 1992.
  5. R. Kohavi and G. H. John, "Wrappers for feature subset selection," Artificial Intelligence, vol. 97, pp. 273-324, 1997. https://doi.org/10.1016/S0004-3702(97)00043-X
  6. S. Hwang, L. Lee, "A Score-Based bayesian network learning method by adopting Minimum Description Length principle", Proceeding of KIISE, vol. 33, no. 2, pp. 412-415, 2006.
  7. S. Jung, D. Lee, G. Lee, "Reducing Uncertainty of Bayesian Networks by Reducing Variances of Probability Distributions", Proceeding of KIISE, vol. 33, no. 2, pp. 238-243, 2006.
  8. S. lim, S. Cho, "Automatic Construction of Hierarchical Bayesian Networks for Topic Inference of Conversational Agent", KIISE, vol.33 no. 10, pp. 877-885, 2006.
  9. T.W. Anderson, "An Introduction to Multivariate Statistical Analysis", JohnWiley & Sons, 1971.
  10. Y. Sung,"Applied Multivariate Statistical Analysis", Tamjin Press, 1998.