Abstract
Feature ranking is useful to gain knowledge of data and identify relevant features. In this study, we proposed a use of feature ranking for classification of neuro-degeneration and vascular dementia in micro-Raman spectra of platelet. The entire region of the spectrum is divided into local region including several peaks, followed by Gaussian curve fitting method in the region to be modeled. Local minima select from the subregion and then remove the background based on the position by using interpolation method. After preprocessing steps, significant features were selected by feature ranking method to improve the classification accuracy and the computational complexity of classification system. PCA (principal component analysis) transform the selected features and the overall features that is used classification with the number of principal components. These were classified as MAP (maximum a posteriori) and it compared with classification result using overall features. In all experiments, the computational complexity of the classification system was remarkably reduced and the classification accuracy was partially increased. Particularly, the proposed method increased the classification accuracy in the experiment classifying the Parkinson's disease and normal with the average 1.7 %. From the result, it confirmed that proposed method could be efficiently used in the classification system of the neuro-degenerative disease and vascular dementia of platelet.
특징 순위 방법은 데이터에 대한 정보와 관련된 특징을 구별하는데 유용하게 사용된다. 본 논문에서는 혈소판으로부터 측정된 라만 스펙트럼에서 퇴행성 뇌신경질환과 혈관성 인지증의 분류에 특징 순위를 이용하는 방법을 제안하였다. 퇴행성 뇌신경 질환인 알츠하이머병(Alzheimer's disease)과 파킨슨병(Parkinson's disease) 그리고 혈관성 인지증(vascular dementia)을 유도한 실험용 쥐의 혈소판에서 측정한 스펙트럼은 가우시안 모델을 이용한 커브 피팅으로 노이즈를 제거하고 로컬 최저점에 선형 보간법(linear interpolation)으로 배경 잡음을 제거한다. 전처리 과정을 수행한 스펙트럼에서 분류정확도와 계산복잡도를 개선하기 위해 특징 순위 방법을 이용하여 주요 특징을 선택하였다. 선택된 특징들은 PCA(principal component analysis) 방법으로 변환하여 주성분의 수를 변화시키며 MAP(maximum a posteriori)으로 분류하고 전체 특징을 사용한 경우의 분류 결과와 비교하였다. 실험 결과에서 제안한 방법을 적용한 모든 실험에서 분류 시스템의 계산복잡도를 현저하게 감소시키고 분류정확도는 부분적으로 증가하였다. 특히 파킨슨병과 정상을 분류하는 실험에서 제안한 방법이 전체 특징을 사용한 경우보다 모든 주성분의 수에서 분류정확도가 높았으며 평균 1.7 %의 성능이 향상되었다. 이 결과에서 분류정확도와 계산복잡도의 개선을 고려하면 제안한 방법이 혈소판 라만 스펙트럼에서 퇴행성 뇌신경질환과 혈관성 인지증의 분류 시스템에 효율적으로 사용될 수 있음을 확인하였다.