Abstract
This retrospective study aimed to evaluate the difference in measurement between conventional orthodontic analysis and artificial intelligence orthodontic analysis in pediatric and adolescent patients aged 7 - 15 with the mixed and permanent dentition. A total of 60 pediatric and adolescent patients (30 mixed dentition, 30 permanent dentition) who underwent lateral cephalometric radiograph for orthodontic diagnosis were randomly selected. Seventeen cephalometric landmarks were identified, and 22 measurements were calculated by 1 examiner, using both conventional analysis method and deep learning-based analysis method. Errors due to repeated measurements were assessed by Pearson's correlation coefficient. For the mixed dentition group and the permanent dentition group, respectively, a paired t-test was used to evaluate the difference between the 2 methods. The difference between the 2 methods for 8 measurements were statistically significant in mixed dentition group: APDI, SNA, SNB, Mandibular plane angle, LAFH (p < 0.001), Facial ratio (p = 0.001), U1 to SN (p = 0.012), and U1 to A-Pg (p = 0.021). In the permanent dentition group, 4 measurements showed a statistically significant difference between the 2 methods: ODI (p = 0.020), Wits appraisal (p = 0.025), Facial ratio (p = 0.026), and U1 to A-Pg (p = 0.001). Compared with the time-consuming conventional orthodontic analysis, the deep learning-based cephalometric system can be clinically acceptable in terms of reliability and validity. However, it is essential to understand the limitations of the deep learning-based programs for orthodontic analysis of pediatric and adolescent patients and use these programs with the proper assessment.
이 후향적 연구의 목적은 7 - 15세 사이의 혼합치열기와 영구치열기의 소아 및 청소년 환자에서 기존 교정 분석 방법과 인공 지능을 활용한 교정 분석 방법을 이용한 변수의 차이를 비교하여 평가하는 것이다. 교정 진단을 위해 측면 두부계측 방사선 사진을 촬영한 소아 환자 60명(혼합 치열기 30명, 영구치열기 30명)을 무작위로 선정하였다. V-ceph을 사용한 기존 분석 방법과 WebCeph를 사용한 딥 러닝 기반 분석 방법으로 1명의 검사자가 17개의 두부 측정 계측점을 식별하고, 22개의 측정 항목을 평가했다. 기존 분석 방법의 반복 측정으로 인한 오차는 Pearson의 상관 분석을 사용하여 평가하었다. 혼합치열군과 영구치열군에 대한 각각 두 방법의 차이는 paired t-test를 사용하여 평가하였다. 혼합치열군에서 두 분석 방법의 차이는 8개의 계측항목에서 통계적으로 유의하였다: APDI, SNA, SNB, Mandibular plane angle, LAFH (p < 0.001), Facial ratio (p = 0.001), U1 to SN (p = 0.012), and U1 to A-Pg (p = 0.021). 영구치열군에서는 두 분석 방법 간에 4개의 계측항목이 통계적으로 유의한 차이를 보였다: ODI (p = 0.020), Wits appraisal (p = 0.025), Facial ratio (p = 0.026), and U1 to A-Pg (p = 0.001). 많은 시간이 소요되는 기존의 교정 분석 방법과 비교하였을 때, 딥 러닝 기반 교정 분석 시스템은 측정의 신뢰성과 유효성 측면에서 임상적으로 허용될 수 있다. 하지만 소아 환자의 교정 분석을 위해 딥 러닝 기반 프로그램을 사용할 때에는 이러한 프로그램의 한계점을 인지하고 올바른 판단으로 사용하는 것이 중요하다.