초록
최근 생명 정보학 기술의 발달로 마이크로 단위의 실험조작이 가능해짐에 따라 하나의 chip상에서 전체 genome의 expression pattern을 관찰할 수 있게 되었고, 동시에 수 만개의 유전자들 간치 상호작용도 연구 가능하게 되었다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 본 논문에서 제안한 유사성 척도 조합 방법으로 정보력 있는 유전자들을 추출한 후, 유사성 척도 조합 방법과 결합한 멀티퍼셉트론 신경망 분류기와 기존의 DT, NB, SVM 분류기를 이용하여 클래스 분류 시스템을 구축하고, 성능을 비교분석하였다. 피어슨 적률 상관 계수와 유클리디안 거리 계수 조합을 이용하여 선택된 200 유전사들을 멀티퍼셉트론 신경망 분류기로 분류한 결과 98.84%의 정확도를 보여 다른 분류기를 이용하여 실험을 수행한 경우보다 향상된 분류 성능을 보였다.
As development in technology of bioinformatics recently mates it possible to operate micro-level experiments, we can observe the expression pattern of total genome through on chip and analyze the interactions of thousands of genes at the same time. In this thesis, we used CDNA microarrays of 3840 genes obtained from neuronal differentiation experiment of cortical stem cells on white mouse with cancer. It analyzed and compared performance of each of the experiment result using existing DT, NB, SVM and multi-perceptron neural network classifier combined the similar scale combination method after constructing class classification model by extracting significant gene list with a similar scale combination method proposed in this paper through normalization. Result classifying in Multi-Perceptron neural network classifier for selected 200 genes using combination of PC(Pearson correlation coefficient) and ED(Euclidean distance coefficient) represented the accuracy of 98.84%, which show that it improve classification performance than case to experiment using other classifier.