Research on improving correctness of cardiac disorder data classifier by applying Best-First decision tree method

Best-First decision tree 기법을 적용한 심전도 데이터 분류기의 정확도 향상에 관한 연구

  • Received : 2011.04.19
  • Accepted : 2011.09.13
  • Published : 2011.12.31

Abstract

Cardiac disorder data are generally tested using the classifier and QRS-Complex and R-R interval which is used in this experiment are often extracted by ECG(Electrocardiogram) signals. The experimentation of ECG data with classifier is generally performed with SVM(Support Vector Machine) and MLP(Multilayer Perceptron) classifier, but this study experimented with Best-First Decision Tree(B-F Tree) derived from the Dicision Tree among Random Forest classifier algorithms to improve accuracy. To compare and analyze accuracy, experimentation of SVM, MLP, RBF(Radial Basic Function) Network and Decision Tree classifiers are performed and also compared the result of announced papers carried out under same interval and data. Comparing the accuracy of Random Forest classifier with above four ones, Random Forest is the best in accuracy. As though R-R interval was extracted using Band-pass filter in pre-processing of this experiment, in future, more filter study is needed to extract accurate interval.

심전도 질환 데이터는 일반적으로 분류기를 사용한 실험이 많다. 심전도 신호는 QRS-Complex와 R-R interval을 추출하는 경우가 많은데 본 실험에서는 R-R interval을 추출하여 실험하였다. 심전도 데이터의 분류기 실험은 일반적으로 SVM(Support Vector Machine)과 MLP(Multilayer Perceptron) 분류기로 수행되지만 본 실험은 정확도 향상을 위해 Random Forest 분류기 알고리즘 중 Decision Tree를 Best-First Decision Tree(B-F Tree)로 수정하여 실험하였다. 그리고 정확도 비교분석을 위해 SVM, MLP, RBF(Radial Basic Function) Network와 Decision Tree 분류기 실험을 같이 수행하였고, 동일한 데이터와 간격으로 실험한 타 논문의 결과와 비교해보았다. 수정한 Random Forest 분류기의 정확도를 다른 네 개의 분류기와 타 논문의 실험과 비교해보니 정확도 부분에서는 Random Forest가 가장 우수하였다. 본 실험의 전처리 과정은 대역통과 필터(Band-pass filter)를 사용하여 R-R interval을 추출하였는데 향후에는 정확한 간격을 추출하기 위한 필터의 연구가 사려된다.

Keywords

References

  1. K. S. Park, B. H. Cho, D. H. Lee, S. H. Song, J. S. Lee, Y. J. Chee, I. Y. Kim, and S. I. Kim, "Hierarchical Classification of ECG Beat Using Higher Order Statistics and Hermite Model", J Kor Soc Med Informatics, Vol.15, pp. 117-131, 2009. https://doi.org/10.4258/jksmi.2009.15.1.117
  2. Physiobank(MIT-BIH Arrhythmia Database): http://physionet.mit.edu/physiobank/database/mitdb/
  3. Korean Heart Rhythm Society : http://arrhythmia.circulation.or.kr/ilban/
  4. Korea University Arrhythmia Center : http://www.korea-heartrhythm.com/
  5. G. D. Clifford, F. Azuaje and P. E. McSharry, "Advanced Methods and Tools for ECG Data Analysis", pp.101-102, Artech-Hous e, Boston & London, 2006.
  6. NI Biomedical Startup Kit 3.0 : http://decibel.ni.com/content/docs/DOC-12646
  7. All About Circuits(Band-pass filter) : http://www.allaboutcircuits.com/vol_2/chpt_8/4.html
  8. L. Breiman, "Machine Learning", Kluwer Academic Publishers, Vol.45, p.5-32, Netherlands, 2001.
  9. P. N. Tan, M. Steinbach and V. Kumar, "Introduction to Data Mining", 1st Ed, p.283-285, Addison-Wesley, Massachusetts, 2006.
  10. H. Shi, "Best-first Decision Tree Learning", p.3-5, The University of Waikato, NewZealand, 2007.
  11. K. Tateno and L. Glass, "A Method for Detection of Atrial Fibrillation Using RR Intervals", Computers in Cardiology(IEEE), Vol.27, pp.391-394, 2000.
  12. M. G. Tsipouras, D. I. Fotiadis and D. Sideris, "An arrhythmia Classification system based on the RR-interval signal", Artificial Intelligence in Medicine, Vol.33, pp.237-250, 2005. https://doi.org/10.1016/j.artmed.2004.03.007