DOI QR코드

DOI QR Code

Research on the modified algorithm for improving accuracy of Random Forest classifier which identifies automatically arrhythmia

부정맥 증상을 자동으로 판별하는 Random Forest 분류기의 정확도 향상을 위한 수정 알고리즘에 대한 연구

  • Received : 2011.06.08
  • Accepted : 2011.09.20
  • Published : 2011.12.31

Abstract

ECG(Electrocardiogram), a field of Bio-signal, is generally experimented with classification algorithms most of which are SVM(Support Vector Machine), MLP(Multilayer Perceptron). But this study modified the Random Forest Algorithm along the basis of signal characteristics and comparatively analyzed the accuracies of modified algorithm with those of SVM and MLP to prove the ability of modified algorithm. The R-R interval extracted from ECG is used in this study and the results of established researches which experimented co-equal data are also comparatively analyzed. As a result, modified RF Classifier showed better consequences than SVM classifier, MLP classifier and other researches' results in accuracy category. The Band-pass filter is used to extract R-R interval in pre-processing stage. However, the Wavelet transform, median filter, and finite impulse response filter in addition to Band-pass filter are often used in experiment of ECG. After this study, selection of the filters efficiently deleting the baseline wandering in pre-processing stage and study of the methods correctly extracting the R-R interval are needed.

생체신호의 한 분야인 심전도는 분류알고리즘을 사용한 실험이 일반적이다. 심전도를 실험한 논문에서 사용된 분류알고리즘은 대부분 SVM(Support Vector Machine), MLP(Multilayer Perceptron) 이었으나, 본 실험은 Random Forest 분류기를 시도하였다. 실험방법은 Random Forest 알고리즘을 실험데이터의 신호의 특징에 기반하여 분석하도록 수정하였고, 분류기의 수정된 알고리즘 성능을 규명하기 위하여 SVM과 MLP 분류기와 정확도를 비교 분석하였다. 실험에서는 심전도 신호의 R-R interval을 추출하여 시행하였으며 또한 동일한 데이터를 사용한 타 논문의 결과와 본 실험의 결과를 비교 분석하였다. 결과는 수정된 Random Forest 분류기가 SVM, MLP 분류기, 그리고 타 실험의 결과보다 정확도 부분에서는 우수한 결과를 도출하였다. 본 실험의 전처리 과정에서는 대역통과필터를 사용하여 R-R interval을 추출하였다. 그러나 심전도 실험에서는 대역통과 필터 뿐 아니라, 웨이블릿 변환, 메디안 필터, 유한 임펄스 필터 등으로 실험하는 경우가 많다. 따라서 향후에는 전처리과정에서 기저선 잡음(baseline wandering)을 효율적으로 제거하는 필터의 선택이 필요하며, R-R interval을 정확하게 추출할 수 있는 방법에 대한 연구가 필요하다고 사려된다.

Keywords

References

  1. K. S. Park, B. H. Cho, D. H. Lee, S. H. Song, J. S. Lee, Y. J. Chee, I. Y. Kim, and S. I. Kim, "Hierarchical Classification of ECG Beat Using Higher Order Statistics and Hermite Model," J Kor Soc Med Informatics, Vol.15, pp.117-131, 2009.
  2. Korean Heart Rhythm Society : http://www.k-hrs.org/
  3. M. G. Tsipouras, D. I. Fotiadis and D. Sideris, "An arrhythmia Classification system based on the RR-interval signal," Artificial Intelligence in Madicine, Vol.33, pp.237-250, 2005. https://doi.org/10.1016/j.artmed.2004.03.007
  4. M. H. Song, J. Lee, S. F. Cho and K. J. Lee, "SVM Classifier for the Detection of Ventricular Fibrillation," The Institute of Electronics of Korea, Vol.42, pp.261-268, 2005.
  5. PhysioBank : http://physionet.mit.edu/physiobank/database/mitdb/
  6. NI Biomedical Startup Kit 3.0 : http://decibel.ni.com/content/docs/DOC-12646
  7. G. D. Clifford, F. Azuaje and P. E. McSharry, "Advanced Methods and Tools for ECG Data Analysis," Artech House, pp.101-102, 2006.
  8. All About Circuits : http://www.allaboutcircuits.com/vol_2/chpt_8/4.html
  9. L. Breiman, 'Machine Learning', Kluwer Academic Publishers in Netherlands, 2001.
  10. P. N. Tan, M. Steinbach and V. Kumar, 'Introduction to Data Mining', 1-st Addison-Wesley, 2006.
  11. H. Shi, "Best-first Decision Tree Learning," The University of Waikato in NewZealand, pp.3-5, 2007.
  12. K. Tateno and L. Glass, "A Method for Detection of Atrial Fibrillation Using RR Intervals," Computers in Cardiology(IEEE), Vol.27, pp.391-394, 2000.