kNN 알고리즘에서의 속성 가중치 자동계산 방법

an Automatic Calculation Method of Feature Weights in k Nearest Neighbor Algorithms

  • 이강일 (동국대학교 정보통신공학과) ;
  • 이창환 (동국대학교 정보통신공학과)
  • Lee, Kang-Il (Dept of Information and Communication Engineering, Dong-Guk University) ;
  • Lee, Chang-Hwan (Dept of Information and Communication Engineering, Dong-Guk University)
  • 발행 : 2005.05.13

초록

기억기반학습의 일종인 최근접 이웃(k nearest neighbor) 알고리즘은 과거의 데이터들 중에서 새로운 개체와 유사한 데이터들을 이용해서 새로운 개체의 목적 값을 예측하는 것이다. 이 경우 속성의 가중치를 계산하는 방식은 kNN의 성능을 결정하는 중요한 요소가 된다. 본 논문에서는 기존의 다른 이론들과 달리 정보이론에서 사용되는 엔트로피 개념을 이용해서 속성의 가중치를 이론적이고, 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목적속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN의 성능을 향상시킨다. 마지막으로 이러한 방식의 성능을 다수의 실험을 통해 비교하였다.

키워드