Vision transformers for endoscopic pathological findings classification

내시경 병리소견 분류를 위한 비전 트랜스포머

  • Published : 2022.05.26

Abstract

The endoscopic pathological findings of gastrointestinal tract (GIT) are important in the early diagnosis of colorectal cancer. Deep learning based on convolutional nueral network (CNN) has been implemented to solve the subjective analysis problem and to increase the performance of early detection of pathological findings. However, the desired performance is yet to be achieved and CNNs are computationally complex. To solve these problems, in this paper, we propose a vision transformer based endoscopic pathological findings classification for the early detection of colorectal cancer. Publicly available endoscopic images with three pathological findings, including esophagitis, polyps, and ulcerative colitis, each with 1000 images were used. Using our approach, we have achieved a test accuracy of 98% in classifying the three pathological findings.

위장관의 내시경적 병리학적 소견은 대장암의 조기 진단에 중요하다. 최근 CNN 기반 딥 러닝의 활용은 주관적 분석의 정확도와 조기 진단의 성능을 높이는 결과를 보였으나, 계산 복잡도가 높고 임상에 즉시 활용하기에는 상대적으로 낮은 정확도로 사용에 제한적이다. 이러한 문제를 해결하기 위해 본 논문에서는 대장암의 조기 발견을 위한 비전 트랜스포머 기반 내시경 병리 소견 분류법을 제안한다. 식도염, 폴립, 궤양성 대장염을 포함한 병리학적 소견이 있는 내시경 이미지를 각각 1,000개씩 사용하였으며, 제안된 접근 방식을 사용하여 세 가지 병리학적 소견을 분류할 때 98%의 분류 정확도를 보였다.

Keywords