DOI QR코드

DOI QR Code

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data

근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교

  • Baek, Seung Hyun (Division of Business Administration, Hanyang University ERICA Campus)
  • 백승현 (한양대학교 에리카 캠퍼스, 경영학부)
  • Received : 2013.09.16
  • Accepted : 2013.12.05
  • Published : 2013.12.31

Abstract

본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Keywords

References

  1. Dunia R, Qin SJ, Edgar TF, Mcavoy TJ (1996), "Sensor fault identification and reconstruction using principal component analysis", Proc. of IFAC Congress'96, pp. 259-264, San Francisco, June 30-July 5
  2. Furtado P, Madeira H (1999), "Analysis of accuracy of data reduction techniques", First International Conference, DaWaK'99, Florence, Italy, Springer-Verlag, pp. 377-388
  3. Geldi P, Kowalski B (1986), "Partial Least Squares Regression: A Tutorial", Analytica Chemica Acta Vol. 185, pp. 1-17 https://doi.org/10.1016/0003-2670(86)80028-9
  4. Hines JW, Gribok AV, Attieh I, Uhrig RE (2000), "Regularization methods for inferential sensing in nuclear power plants", Fuzzy Systems and Soft Computing in Nuclear Engineering, Chapter 13, Ed. Da Ruan, Springer Verlag
  5. Hoskuldsson A (1988), "PLS Regression Methods", Journal of Chemometrics, Vol. 2, pp. 211-228 https://doi.org/10.1002/cem.1180020306
  6. Sanchez-Franco MJ, Roldan JL (2005), "Web acceptance and usage model: A comparison between goal-directed and experiential web users", Internet Research, Emerald Group Publishing Limited, Vol. 15, Issue 1, pp. 21-48
  7. Valle-Cervantes S, Li W, Qin SJ (1999), "Selection of the number of principal components: A new criterion with compression to existing methods", I&EC Research, Vol. 38, pp. 4389-4401
  8. Westerhuis JA, De Jong S, Smilde AK (2001), "Direct orthogonal signal correction", Chemomet rics and Intelligent Laboratary Systems, Vol. 56, pp. 13-25 https://doi.org/10.1016/S0169-7439(01)00102-2
  9. Wold H (1966), "Non-linear estimation by iterative least squares procedures", In: David, F. (Ed.), Research Papers in Statistics, Wiley, NY
  10. Wold H (1985), "Partial least squares", in Kotz, S., Johnson, N.L. (Eds), Encyclopedia of Statistical Sciences, Wiley, New York, NY, Vol. 6, pp. 581-91