• 제목/요약/키워드: Prediction accuracy

검색결과 3,732건 처리시간 0.035초

Development and Validation of 18F-FDG PET/CT-Based Multivariable Clinical Prediction Models for the Identification of Malignancy-Associated Hemophagocytic Lymphohistiocytosis

  • Xu Yang;Xia Lu;Jun Liu;Ying Kan;Wei Wang;Shuxin Zhang;Lei Liu;Jixia Li;Jigang Yang
    • Korean Journal of Radiology
    • /
    • 제23권4호
    • /
    • pp.466-478
    • /
    • 2022
  • Objective: 18F-fluorodeoxyglucose (FDG) PET/CT is often used for detecting malignancy in patients with newly diagnosed hemophagocytic lymphohistiocytosis (HLH), with acceptable sensitivity but relatively low specificity. The aim of this study was to improve the diagnostic ability of 18F-FDG PET/CT in identifying malignancy in patients with HLH by combining 18F-FDG PET/CT and clinical parameters. Materials and Methods: Ninety-seven patients (age ≥ 14 years) with secondary HLH were retrospectively reviewed and divided into the derivation (n = 71) and validation (n = 26) cohorts according to admission time. In the derivation cohort, 22 patients had malignancy-associated HLH (M-HLH) and 49 patients had non-malignancy-associated HLH (NM-HLH). Data on pretreatment 18F-FDG PET/CT and laboratory results were collected. The variables were analyzed using the Mann-Whitney U test or Pearson's chi-square test, and a nomogram for predicting M-HLH was constructed using multivariable binary logistic regression. The predictors were also ranked using decision-tree analysis. The nomogram and decision tree were validated in the validation cohort (10 patients with M-HLH and 16 patients with NM-HLH). Results: The ratio of the maximal standardized uptake value (SUVmax) of the lymph nodes to that of the mediastinum, the ratio of the SUVmax of bone lesions or bone marrow to that of the mediastinum, and age were selected for constructing the model. The nomogram showed good performance in predicting M-HLH in the validation cohort, with an area under the receiver operating characteristic curve of 0.875 (95% confidence interval, 0.686-0.971). At an appropriate cutoff value, the sensitivity and specificity for identifying M-HLH were 90% (9/10) and 68.8% (11/16), respectively. The decision tree integrating the same variables showed 70% (7/10) sensitivity and 93.8% (15/16) specificity for identifying M-HLH. In comparison, visual analysis of 18F-FDG PET/CT images demonstrated 100% (10/10) sensitivity and 12.5% (2/16) specificity. Conclusion: 18F-FDG PET/CT may be a practical technique for identifying M-HLH. The model constructed using 18F-FDG PET/CT features and age was able to detect malignancy with better accuracy than visual analysis of 18F-FDG PET/CT images.

Development and Validation of MRI-Based Radiomics Models for Diagnosing Juvenile Myoclonic Epilepsy

  • Kyung Min Kim;Heewon Hwang;Beomseok Sohn;Kisung Park;Kyunghwa Han;Sung Soo Ahn;Wonwoo Lee;Min Kyung Chu;Kyoung Heo;Seung-Koo Lee
    • Korean Journal of Radiology
    • /
    • 제23권12호
    • /
    • pp.1281-1289
    • /
    • 2022
  • Objective: Radiomic modeling using multiple regions of interest in MRI of the brain to diagnose juvenile myoclonic epilepsy (JME) has not yet been investigated. This study aimed to develop and validate radiomics prediction models to distinguish patients with JME from healthy controls (HCs), and to evaluate the feasibility of a radiomics approach using MRI for diagnosing JME. Materials and Methods: A total of 97 JME patients (25.6 ± 8.5 years; female, 45.5%) and 32 HCs (28.9 ± 11.4 years; female, 50.0%) were randomly split (7:3 ratio) into a training (n = 90) and a test set (n = 39) group. Radiomic features were extracted from 22 regions of interest in the brain using the T1-weighted MRI based on clinical evidence. Predictive models were trained using seven modeling methods, including a light gradient boosting machine, support vector classifier, random forest, logistic regression, extreme gradient boosting, gradient boosting machine, and decision tree, with radiomics features in the training set. The performance of the models was validated and compared to the test set. The model with the highest area under the receiver operating curve (AUROC) was chosen, and important features in the model were identified. Results: The seven tested radiomics models, including light gradient boosting machine, support vector classifier, random forest, logistic regression, extreme gradient boosting, gradient boosting machine, and decision tree, showed AUROC values of 0.817, 0.807, 0.783, 0.779, 0.767, 0.762, and 0.672, respectively. The light gradient boosting machine with the highest AUROC, albeit without statistically significant differences from the other models in pairwise comparisons, had accuracy, precision, recall, and F1 scores of 0.795, 0.818, 0.931, and 0.871, respectively. Radiomic features, including the putamen and ventral diencephalon, were ranked as the most important for suggesting JME. Conclusion: Radiomic models using MRI were able to differentiate JME from HCs.

차량 내 영상 센서 기반 고속도로 돌발상황 검지 정밀도 평가 (Precision Evaluation of Expressway Incident Detection Based on Dash Cam)

  • 남상기;정연식
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.114-123
    • /
    • 2023
  • 컴퓨터 비전(Computer Vision: CV) 기술 발전으로 폐쇄회로 TV(Closed-Circuit television: CCTV)와 같은 영상 센서로 돌발상황을 검지하고 있다. 그러나 현재 이러한 기술은 대부분 고정식 영상 센서를 기반으로 한다. 따라서 고정식 장비의 영상 범위가 닿지 않는 음영지역의 돌발상황 검지에는 한계가 존재해왔다. 최근 엣지 컴퓨팅(Edge-computing) 기술의 발전으로 이동식 영상정보의 실시간 분석이 가능해졌다. 본 연구는 차량 내 설치된 이동식 영상 센서(dashboard camera 혹은 dash cam)에 컴퓨터 비전 기술을 도입하여 고속도로에서 실시간으로 돌발상황 검지 가능성에 대해 평가하는 것이 목적이다. 이를 위해 한국도로공사 순찰차량에 장착된 dash cam에서 수집된 4,388건의 스틸 프레임 데이터 기반으로 학습데이터를 구축하였으며, YOLO(You Only Look Once) 알고리즘을 활용하여 분석하였다. 분석 결과 객체 모두 예측 정밀도가 70% 이상으로 나타났고, 교통사고는 약 85%의 정밀도를 보였다. 또한 mAP(mean Average Precision)의 경우 0.769로 나타났고, 객체별 AP(Average Precision)를 보면 교통사고가 0.904로 가장 높게 나타났고, 낙하물이 0.629로 가장 낮게 나타났다.

기계학습을 이용한 풀필먼트센터의 실시간 박스 추천에 관한 연구 (A Study on the Real-time Recommendation Box Recommendation of Fulfillment Center Using Machine Learning)

  • 차대욱;조희연;한지수;신광섭;민윤홍
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.149-163
    • /
    • 2023
  • 지속적인 이커머스 시장의 성장으로 풀필먼트센터가 처리해야 하는 주문량은 증가하였고, 다양한 고객 요구사항은 주문 처리의 복잡성을 높이고 있다. 이러한 추세와 함께 최근 인건비 증가로 인해 풀필먼트센터의 운영 효율성이 기업 경영 관점에서 더욱 중요해지고 있다. 본 연구는 풀필먼트센터의 출고 프로세스 중 포장 작업 영역에 적용 가능한 박스 추천을 중심으로 연구를 수행하였다. 박스 추천을 하기 위해 과거 실적 데이터를 기계학습 모형의 학습 데이터로 사용하였다. 상품 정보, 주문 정보, 포장 정보, 배송 정보 4가지 종류의 데이터를 전처리, 변수 가공 과정을 거쳐 기계학습 모델에 적용하였다. 입력 벡터로는 상품 규격 정보에 해당하는 width, length, height 3가지 특성을 사용하였으며, 상품의 실수 정보를 구간별 정수체계로 변환하는 변수 가공 과정을 통해 입력 벡터의 특성을 추출하였다. 기계학습 모형별 성능을 비교한 결과 GradientBoosting 모델을 적용하였을 경우 21개의 구간으로 상품 규격 정보를 정수로 변환하였을 때 95.2%로 가장 높은 정확도로 예측을 수행함을 확인하였다. 본 연구는 풀필먼트센터에서 잘못된 박스 선택으로 인해 발생하는 물류비용의 증가와 박스 포장 소요 시간의 비효율을 줄이기 위한 방안으로 기계학습 모형을 제시하며, 상품 규격 정보의 특성을 효과적으로 추출하기 위한 변수 가공 처리 방식을 제안한다.

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

근적외선 분광법에 의한 국내 축우용 TMR의 성분추정 (Prediction on the Quality of Total Mixed Ration for Dairy Cows by Near Infrared Reflectance Spectroscopy)

  • 기광석;김상범;이현준;양승학;이재식;김택림;김현섭;여준모;구재연;조종구
    • 한국초지조사료학회지
    • /
    • 제29권3호
    • /
    • pp.253-262
    • /
    • 2009
  • 본 연구의 목적은 축우용 TMR 사용이 점차 증가하고 있으나 TMR의 영양성분을 측정하고자 할 경우 실험실 분석에 의존하므로 많은 비용과 시간이 소요되어 농가 현장에서 활용하기가 어려움에 따라 NIRS(Near InfraRed Spectroscopy, 근적외선분광분석기)을 이용하여 TMR에 대한 신속하고 간편하게 사료가치를 평가하기 위한 검량선을 작성하기 위하여 실시하였다. 근적외선 분광분석법은 친환경 분석으로서 시약의 사용이 전혀 없고, 폐수 및 유해물질의 사용이 전혀 없어 작업자의 환경을 개선 할 수 있다. 또한 분석시간이 일반 분석법에 비해 10배 이상 빠르며, 누구나 간단한 교육을 통해서 표준분석 방법을 개발하여 적용할 수 있는 분석법이다. 그러나 NIR 성분분석기를 이용할 경우 많은 TMR 시료 샘플을 분석 비교하여 새로운 검량선을 만들어야 한다는 애로사항이 있다. 따라서 본 연구에서는 NIR 성분분석기를 이용하여 새로운 검량선을 만들고자 하였고 수집된 TMR 시료 253점에 대하여 부적합한 일부 시료를 제거하고 검량식 세트 160점과 검증 세트 40점으로 구별하여 일반성분분석과 각 성분에 대한 NIR Calibration curve를 만들어 비교하며 신뢰성 높은 새로운 검량선을 개발하였다. 개발된 NIR 검량선을 이용할 경우 TMR 성분분석시 신속하고 신뢰성 높은 성분분석 값을 얻을 수 있을 것으로 사료되나 보다 정확하고 정밀한 검량선을 얻기 위해서는 더 많은 시료의 수집 및 분석, TMR의 구성요소에 비율 등의 연구가 추가되어야 할 것으로 생각한다.

고해상도 위성영상을 이용한 낙동강 유역의 클로로필-a 농도 추정 (Estimation of Chlorophyll-a Concentrations in the Nakdong River Using High-Resolution Satellite Image)

  • 최은영;이재운;이재관
    • 대한원격탐사학회지
    • /
    • 제27권5호
    • /
    • pp.613-623
    • /
    • 2011
  • 본 연구에서는 Moderate Imaging Spectroradiometer(MODIS), Sea-viewing Wide Field-fo-view Sensor(SeaWiFS), Medium Resolution Imaging Spectrometer(MERIS) 등의 광역관측 위성영상을 이용한 해수나 연안수의 클로로필 농도 분석을 통해 가능성이 확인되었던 밴드 비를 이용한 비교적 간단한 추정 모델을 수체의 크기와 폭이 현저히 작고 탁도가 있는 하천에 대해 클로로필-a 농도값을 추정하고자 고해상도 위성영상에 Two-band 및 Three-band reflectance 모델을 적용하여 가능성을 파악하였다. 특히 RapidEye 영상을 이용하여 일반적으로 탁도가 있는 수체에 대해 Red와 NIR 영역을 활용하는 이들 모델에 Red-edge(RE) 밴드를 적용하였다. Red와 NIR을 이용한 Two-band Reflectance 모델은 계산식의 결정계수 $R^2$ 값이 0.38로 유의성 없는 결과를 나타내었다. 그러나 RapidEye의 Red-edge (RE) 파장 대를 이용한 Red-RE Two-band 모델과 Red-RE-NIR Three-band 모델을 이용한 계산식에 대해서는, 2차함수에 의한 Three-band 모델의 결과는 Red-RE Two-band 모델의 결과와 통계적인 값이 거의 유사하였고 Two-band와 3차함수에 의한 Three-band 모델 추정식은 각각 0.66, 0.73 의 $R^2$값을 나타내어 Red-edge 밴드의 적용 가능성을 보였고, 실측치와의 Root Mean Square Error (RMSE)는 24.8, 22.4 mg $m^{-3}$, Relative Percent Difference(RPD)는 각각 1.30, 1.29로 1.5 이하의 대략적인 추정(Approximate Prediction) 수준을 나타내었다. 고해상도 위성영상에 Red-RE-NIR Three-band 모델을 적용한 계산식을 이용해 대략적인 추정이지만 가장 유의한 수준의 클로로필-a 농도를 추정할 수 있었다. 영상에서 추정된 클로로필-a 분포를 비교하였을 때 3차함수에 의한 Three-band 모델 추정식이 Two-band 모델에 비해 낮은 값의 분포를 보였다. 향후 하천의 스펙트럼을 실측하여 파장별 부유물질, 유기물과의 상관성 및 클로로필 농도와의 간섭 정도를 시뮬레이션하여 보정식을 산출 적용한다면 탁도가 다소 높은 하천에서의 클로로필-a 농도 계산식의 정확도를 더욱 높일 수 있을 것으로 기대된다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

데이터마이닝 기법을 활용한 대학수학능력시험 영어영역 정답률 예측 및 주요 요인 분석 (Prediction of Correct Answer Rate and Identification of Significant Factors for CSAT English Test Based on Data Mining Techniques)

  • 박희진;장경애;이윤호;김우제;강필성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.509-520
    • /
    • 2015
  • 대학수학능력시험(수능)은 고등학교 3년간의 학업 성취도를 측정하는 대표적인 평가 도구로서 대한민국 대학 입시에 있어 매우 중요한 역할을 하는 시험이다. 응시생들의 학업 성취도를 효과적으로 평가하기 위해서는 수능의 난이도가 적절하게 조절되어야 하나 지금까지는 수능 난이도의 편차가 매우 크게 나타나 매 입시연도마다 여러 가지 문제점을 야기해왔다. 본 연구에서는 전문가의 판단에 의존한 기존 방식에서 벗어나 지금까지 시행된 모의고사 및 실제 시험을 통해 축적된 자료를 바탕으로 데이터마이닝 기법을 적용하여 영어영역 문제의 난이도를 예측하는 모델을 구축하고 난이도 예측에 영향을 미치는 요소를 판별하고자 한다. 이를 위해 각 문항의 특성을 판별할 수 있는 여러 지표와 함께 지문, 문제, 답안 등에 나타난 단어들의 특징을 토픽 모델링(topic modeling) 기법을 이용하여 정량화하고 이를 바탕으로 선형회귀분석 및 의사결정나무 기법을 이용하여 각 문항의 난이도를 예측하는 모델을 구축하였다. 구축된 예측 모델을 실제 문제에 적용한 결과 난이도의 상/하 구분에 대한 예측 정확도는 90% 수준으로 나타났으며, 실제 정답률 대비 오차 비율은 약 16% 이내인 것으로 나타났다. 또한 배점 및 문제 유형이 문제의 난이도에 큰 영향을 미치며 지문이 특정 주제에 관련된 경우에도 난이도에 영향을 미치는 것을 확인하였다. 본 연구에서 제시된 방법론을 이용하여 영어영역 각 문제들에 대한 기대 정답률의 범위를 추정할 수 있으며 이를 종합하여 영어영역 전체 문제에 대한 정답률 예측을 통해 적절한 난이도의 문제를 출제하는 데 기여할 수 있을 것으로 기대한다.