Decision Tree Approach for Factor Analysis of Industrial Accidents

산업재해의 요인분석을 위한 의사결정나무

  • Leem, Young-Moon (Dept. of Industrial and Systems Engineering, Kangnung National University) ;
  • Hwang, Young-Seob (Dept. of Industrial and Systems Engineering, Kangnung National University)
  • Published : 2006.08.30

Abstract

의사결정나무 알고리즘은 데이터마이닝 기법중 하나인데 관심이 되는 데이터들에 대하여 분류 및 예측을 가능하게 해준다. 이 기법은 데이터 형태의 특성을 분석할 수 있고 산업재해 형태의 차이점을 찾아내는데 사용될 수 있다. 본 연구에서는 산업재해 데이터의 특성을 파악하고자 C4.5 알고리즘을 사용하였다. 본 연구에서 분석을 위하여 사용된 데이터는 강원도에서 발생한 2년 동안의 산업재해 관련 데이터로서 연구에 적용된 데이터의 수는 19,909개로 구성되어 있다. 본 연구의 목적을 위하여 한 개의 목표변수와 여덟 개의 독립변수가 산업재해 형태에 따라 세분화 되었다. 분석 후 데이터는 222개의 전체 나뭇가지와 151개의 줄기가지로 분류되었다. 또한 본 연구에서는 재해자들의 위험도 관리와 감소를 위하여 이익도표를 제공하였다.

Keywords

References

  1. Breiman, L. Friedman, J.H, Olshen, RA. and Stone, C.J. Classification and Regression Trees, Champman and Hall, New York. 1984
  2. Fayyard, UM., Piatetsky-Shapiro, G., Smyth, P., From Datamining in Knowledge Discovery. In: Fayyad, U.M., Piatetsky-Shapiro, G., Smyth, P., Uthurusamy, R (Eds.) , Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, Menlo Park, pp. 1 -24. 1996
  3. Ho, S.H., lee, S.H., Lee, J.E., Park, J.S., "Analysis on risk factors for cervical cancer usmg indication technique", Expert Systems with Applications, 27, 2004. pp. 97-105 https://doi.org/10.1016/j.eswa.2003.12.005
  4. Holder, L.B., Intermediate Decision Trees. Proceedings of the 14th International Conference on Artificial Intelligence, Montreal, Canada. Morgan Kaufmann, San Francisco, USA, 1995. pp. 1056-1062
  5. Kamber, M., Winstone, L., Gong, W., Cheng, S., Han, J,. Generalization and Decision Tree Induction: Efficient Classification in Data Mining. Proceedings of the International Workshop Issue of Data Engineering (RIDE' 97) Birmingham, UK. 1997, pp. 111 -120
  6. Kubat, M., Holte, RC., Matwin, S .. Machine Learning for the Detection of Oil Spills in Satellite Radar Images. Mach. Learn. 30(2-3), 1998, pp. 195- 215 https://doi.org/10.1023/A:1007452223027
  7. McQueen, RJ, Garner, S.R, Nevill-Manning, C.G., Witten, LH., Applying Machine Learning to Agricultural Data. Comput. Electron. Agric. 12 (4), 1995. pp. 275- 293 https://doi.org/10.1016/0168-1699(95)98601-9
  8. Mitchell, T.M., Machine Learning. McGraw Hill, New York. 1997
  9. Paul R Harper, David J. Winsleet Classification trees: A Possible Method for Maternity Risk Grouping, European Journal of Operational Research. 2004
  10. Quinlan, J.R, C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, USA. 1993
  11. SAS Inst. Inc., SAS/STAT User's Guide, Version 8, 1st ed. SAS Inst., Inc, Cary, NC, USA. 2002