확장 베이지안망을 적용한 고위험성 HRCT 영상 분류

Classification of Very High Concerns HRCT Images using Extended Bayesian Networks

  • 투고 : 2011.01.31
  • 심사 : 2012.03.06
  • 발행 : 2012.03.25

초록

최근 의료분야에서는 방대한 양의 정보를 효과적으로 처리하기 위하여 의사결정트리, 신경망, 베이지안망 등을 비롯한 각종 데이터마이닝 기법의 적용 방안을 연구하고 있다. 또한 환자의 기본적인 신상정보나 과거력, 가족력과 같은 정보 이외에도 MRI, HRCT 등의 영상정보를 추가적으로 수집하고 진단에 활용함으로써 질병진단의 정확도 향상을 도모하는 것이 일반적인 현황이다. 하지만 실제 상황에서는 결과에 영향을 미치는 다량의 변수가 존재하므로 특정 데이터마이닝 기법을 통하여 얻을 수 있는 정보가 상당히 제한적이라고 볼 수 있다. 그뿐만 아니라 촬영된 의료영상도 부수적으로 진단에 긍정적인 영향을 줄 수는 있지만, 주관적인 판단 비중이 높아 자동화된 시스템으로 처리하기가 난해한 문제이다. 이에 따라 현실의 복잡한 상황에서 상대적으로 대처가 유리하고 다변량 확률적인 모델을 기반으로 하는 베이지안망에서 K2나 TAN 등으로 탐색 알고리즘을 개선한 확장 모델이 제안되었다. 이 때, 적용되는 탐색 알고리즘의 종류에 따라 그 성능이 크게 좌우되는 확장 베이지안망의 특성상, 각 기법에 대한 성능과 적합성의 사실적인 평가가 요구된다. 따라서 본 논문에서는 확장 베이지안망에서 질병 진단에 대한 동일한 데이터를 이용하여 실험을 수행하였으며, K2, TAN과 같은 탐색 알고리즘에 변화를 주며 분류 정확도를 측정하였다. 실험에서는 10-fold 교차검증을 수행한 결과분석을 기반으로 성능을 비교평가하고, 발병 위험성이 높은 환자에 대한 HRCT 영상을 분류하여 고위험성의 데이터를 식별 가능하도록 하였다.

Recently the medical field to efficiently process the vast amounts of information to decision trees, neural networks, Bayesian Networks, including the application method of various data mining techniques are investigated. In addition, the basic personal information or patient history, family history, in addition to information such as MRI, HRCT images and additional information to collect and leverage in the diagnosis of disease, improved diagnostic accuracy is to promote a common status. But in real world situations that affect the results much because of the variable exists for a particular data mining techniques to obtain information through the enemy can be seen fairly limited. Medical images were taken as well as a minor can not give a positive impact on the diagnosis, but the proportion increased subjective judgments by the automated system is to deal with difficult issues. As a result of a complex reality, the situation is more advantageous to deal with the relative probability of the multivariate model based on Bayesian network, or TAN in the K2 search algorithm improves due to expansion model has been proposed. At this point, depending on the type of search algorithm applied significantly influenced the performance characteristics of the extended Bayesian network, the performance and suitability of each technique for evaluation of the facts is required. In this paper, we extend the Bayesian network for diagnosis of diseases using the same data were carried out, K2, TAN and changes in search algorithms such as classification accuracy was measured. In the 10-fold cross-validation experiment was performed to compare the performance evaluation based on the analysis and the onset of high-risk classification for patients with HRCT images could be possible to identify high-risk data.

키워드

참고문헌

  1. Stuart Moran, Yulan Hey, Kecheng Liu, "An Empirical Framework for Automatically Selecting the Best Bayesian Classifier", Proceedings of the World Congress on Engineering 2009 Vol I, WCE 2009, July 1-3, 2009.
  2. Carolina Ruiz, "Illustration of the K2 Algorithm for Learning Bayes Net Structures", Department of Computer Science, WPI, 2005.
  3. Evelina Lamma, Fabrizio Riguzzi, Sergio Storari, "Improving the K2 Algorithm Using Association Rule Parameters", Modern Information Processing: From Theory to Applications B, 2006.
  4. Jesse Davis, Vítor Santos Costa, Irene M. Ong, David Page and Inês Dutra, "Using Bayesian Classiers to Combine Rules", Department of Biostatistics and Medical Informatics, University of Madison-Wisconsin, 2004.
  5. Jesus Cerquides, "Tractable Bayesian Learning of Tree Augmented Naive Bayes Classifiers", Ramon Lopez de Mantaras, 2003.
  6. http://www.cs.waikato.ac.nz/-ml/weka/index.html
  7. 이우영, 송병호, 김갑기, 최조천, 이경효, 이연우, 사례 기반 추론을 이용한 적조 예측 시스템 구현, 대한전자공학회 2010년 하계종합학술대회, 2010.6
  8. 박선, 김경준, 이진석, 이성로, 신경망과 SVM을 이용한 적조 발생 예측, 전자공학논문지 제48권 제5호, 2011.9