DOI QR코드

DOI QR Code

정규 혼합분포를 이용한 준지도 학습

Semi-Supervised Learning by Gaussian Mixtures

  • 발행 : 2008.10.31

초록

혼합모형을 이용한 판별분석은 다중 분류문제를 해결하는데 유용한 방법으로서 준지도 학습으로 확장될 수 있다. 본 논문에서는 정규 혼합분포를 이용한 준지도 학습 방법에서 혼합 모형의 하위 구성요소 개수 선택 기준을 연구하고자 한다. 하위 구성요소 선택 기준으로서 베이지안 정보량을 사용하였고 모의실험을 통해 이 방법의 유용성을 규명하였다.

Discriminant analysis based on Gaussian mixture models, an useful tool for multi-class classifications, can be extended to semi-supervised learning. We consider a model selection problem for a Gaussian mixture model in semi-supervised learning. More specifically, we adopt Bayesian information criterion to determine the number of subclasses in the mixture model. Through simulations, we illustrate the usefulness of the criterion.

키워드

참고문헌

  1. Breiman, L., Fredman, J., Olshen, R. and Stone, C. (1984). Classification and Regression Trees, Wadsworth, Belmont
  2. Dempster, A. P., Laird, N. M. and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm, Jornal of the Royal Statistical Society, Series B, 39, 1-38
  3. Halbe, Z. and Aladjem, M. (2005). Model-based mixture discriminant analysis|an experimental study, Pattern Recognition, 38, 437-440 https://doi.org/10.1016/j.patcog.2004.08.010
  4. Hastie, T. and Tibshirani, R. (1996). Discriminant analysis by Gaussian Mixtures, Journal of the Royal Statististical Society, Serise B, 58, 158-176
  5. Nigam, K., McCallum, A. K., Thrun, S. and Mitchell, T. (2000). Text classification from labeled and unlabeled documents using EM, Machine Learning, 39, 103-134 https://doi.org/10.1023/A:1007692713085
  6. Zhu X. (2005). Semi-Supervised Learning Literature Survey, Technical Report 1530, Computer Sciences, University of Wisconsin-Madison