다양한 클러스터 결과에 의해 진화적 접근법을 사용하는 이종 클러스터링 앙상블 기법

Heterogeneous Clustering Ensemble Method using Evolutionary Approach with Different Cluster Results

  • 윤혜성 (이화여자대학교 컴퓨터학과) ;
  • 안선영 (이화여자대학교 컴퓨터학과) ;
  • 이상호 (이화여자대학교 컴퓨터학과) ;
  • 조성범 (서울대학교 의과대학 생명의료정보학연구실) ;
  • 김주한 (서울대학교 의과대학 생명의료정보학연구실)
  • Yoon Hye-Sung (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Ahn Sun-Young (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Lee Sang-Ho (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Cho Sung-Bum (Seoul National University Biomedical Informatics(SNUBI), Seoul National University College of Medicine) ;
  • Kim Ju-Han (Seoul National University Biomedical Informatics(SNUBI), Seoul National University College of Medicine)
  • 발행 : 2006.06.01

초록

데이터마이닝 기법의 클러스터링 알고리즘은 생물정보학에서 데이터 셋의 사전 정보를 고려하지 않고 중요한 유전적, 생물학적 상호작용을 찾기 위하여 적용되고 있다. 그러나 다양한 형식의 수많은 알고리즘들은 바이오데이터의 다양한 특성들과 실험의 가정 때문에 다른 클러스터링 결과들을 만들 수 있다. 본 논문에서는 바이오 데이터 셋의 특성에도 적합하면서 양질의 클러스터링 결과를 만들기 위한 새로운 방법을 제안한다. 이 방법은 여러 가지 클러스터링 알고리즘의 결과들을 유전자 알고리즘의 기본 개념인 진화적 환경에서 가장 적합한 형질을 선택하는 문제와 결합하였다. 그리고 실제 데이터 셋을 이용하여 우리의 제안하는 방법을 증명하고 실험 결과로 최적의 클러스터 결과를 보인다.

키워드