• 제목/요약/키워드: machine learning

검색결과 5,177건 처리시간 0.033초

XAI 기반의 임상의사결정시스템에 관한 연구 (A Study on XAI-based Clinical Decision Support System)

  • 안윤애;조한진
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.13-22
    • /
    • 2021
  • 임상의사결정시스템은 누적된 의료 데이터를 활용하여 머신러닝으로 학습된 AI 모델을 환자의 진단 및 진료 예측에 적용한다. 그러나 기존의 블랙박스 기반의 AI 응용은 시스템이 예측한 결과에 대해 타당한 이유를 제시하지 못하여 설명성이 부족한 한계점이 존재한다. 이와 같은 문제점을 보완하기 위해 이 논문에서는 임상의사결정시스템의 개발 단계에서 설명이 가능한 XAI를 적용하는 시스템 모델을 제안한다. 제안 모델은 기존의 AI모델에 설명성이 가능한 특정 XAI 기술을 추가로 적용시켜 블랙박스의 한계점을 보완할 수 있다. 제안 모델의 적용을 보이기 위해 LIME과 SHAP을 활용한 XAI 적용 사례를 제시한다. 테스트를 통해 데이터들이 모델의 예측 결과에 어떤 영향을 미치는지 다양한 관점에서 설명할 수 있다. 제안된 모델은 사용자에게 구체적인 이유를 제시함으로써 사용자의 신뢰를 높일 수 있는 장점을 가진다. 아울러 XAI의 적극적인 활용을 통해 기존 임상의사결정시스템의 한계를 극복하고 더 나은 진단 및 의사결정 지원을 가능하게 할 것으로 기대한다.

머신러닝을 활용한 행위 및 스크립트 유사도 기반 크립토재킹 탐지 프레임워크 (Behavior and Script Similarity-Based Cryptojacking Detection Framework Using Machine Learning)

  • 임은지;이은영;이일구
    • 정보보호학회논문지
    • /
    • 제31권6호
    • /
    • pp.1105-1114
    • /
    • 2021
  • 최근 급상승한 암호 화폐의 인기로 인해 암호 화폐 채굴 악성코드인 크립토재킹 위협이 증가하고 있다. 특히 웹 기반 크립토재킹은 피해자가 웹 사이트에 접속만 하여도 피해자의 PC 자원을 사용해 암호 화폐를 채굴할 수 있으며 간단하게 채굴 스크립트만 추가하면 되기 때문에 공격이 쉽고 성능 열화와 고장의 원인이 된다. 크립토재킹은 피해자가 피해 상황을 인지하기 어렵기 때문에 크립토재킹을 효율적으로 탐지하고 차단할 수 있는 연구가 필요하다. 본 연구에서는 크립토재킹의 대표적인 감염 증상과 스크립트를 지표로 활용하여 효과적으로 크립토재킹을 탐지하는 프레임워크를 제안하고 평가한다. 제안한 크립토재킹 탐지 프레임워크에서 행위 기반 동적 분석 기법으로 컴퓨터 성능 지표를 학습한 K-Nearest Neighbors(KNN) 모델을 활용했고, 스크립트 유사도 기반 정적 분석 기법은 악성 스크립트 단어 빈도수를 학습한 K-means 모델을 크립토재킹 탐지에 활용했다. 실험 결과에 따르면 KNN 모델은 99.6%의 정확도를 보였고, K-means 모델은 정상 군집의 실루엣 계수가 0.61인 것을 확인하였다.

Comparison of survival prediction models for pancreatic cancer: Cox model versus machine learning models

  • Kim, Hyunsuk;Park, Taesung;Jang, Jinyoung;Lee, Seungyeoun
    • Genomics & Informatics
    • /
    • 제20권2호
    • /
    • pp.23.1-23.9
    • /
    • 2022
  • A survival prediction model has recently been developed to evaluate the prognosis of resected nonmetastatic pancreatic ductal adenocarcinoma based on a Cox model using two nationwide databases: Surveillance, Epidemiology and End Results (SEER) and Korea Tumor Registry System-Biliary Pancreas (KOTUS-BP). In this study, we applied two machine learning methods-random survival forests (RSF) and support vector machines (SVM)-for survival analysis and compared their prediction performance using the SEER and KOTUS-BP datasets. Three schemes were used for model development and evaluation. First, we utilized data from SEER for model development and used data from KOTUS-BP for external evaluation. Second, these two datasets were swapped by taking data from KOTUS-BP for model development and data from SEER for external evaluation. Finally, we mixed these two datasets half and half and utilized the mixed datasets for model development and validation. We used 9,624 patients from SEER and 3,281 patients from KOTUS-BP to construct a prediction model with seven covariates: age, sex, histologic differentiation, adjuvant treatment, resection margin status, and the American Joint Committee on Cancer 8th edition T-stage and N-stage. Comparing the three schemes, the performance of the Cox model, RSF, and SVM was better when using the mixed datasets than when using the unmixed datasets. When using the mixed datasets, the C-index, 1-year, 2-year, and 3-year time-dependent areas under the curve for the Cox model were 0.644, 0.698, 0.680, and 0.687, respectively. The Cox model performed slightly better than RSF and SVM.

Machine learning based anti-cancer drug response prediction and search for predictor genes using cancer cell line gene expression

  • Qiu, Kexin;Lee, JoongHo;Kim, HanByeol;Yoon, Seokhyun;Kang, Keunsoo
    • Genomics & Informatics
    • /
    • 제19권1호
    • /
    • pp.10.1-10.7
    • /
    • 2021
  • Although many models have been proposed to accurately predict the response of drugs in cell lines recent years, understanding the genome related to drug response is also the key for completing oncology precision medicine. In this paper, based on the cancer cell line gene expression and the drug response data, we established a reliable and accurate drug response prediction model and found predictor genes for some drugs of interest. To this end, we first performed pre-selection of genes based on the Pearson correlation coefficient and then used ElasticNet regression model for drug response prediction and fine gene selection. To find more reliable set of predictor genes, we performed regression twice for each drug, one with IC50 and the other with area under the curve (AUC) (or activity area). For the 12 drugs we tested, the predictive performance in terms of Pearson correlation coefficient exceeded 0.6 and the highest one was 17-AAG for which Pearson correlation coefficient was 0.811 for IC50 and 0.81 for AUC. We identify common predictor genes for IC50 and AUC, with which the performance was similar to those with genes separately found for IC50 and AUC, but with much smaller number of predictor genes. By using only common predictor genes, the highest performance was AZD6244 (0.8016 for IC50, 0.7945 for AUC) with 321 predictor genes.

사물인터넷 기반 소관리 시스템의 분석 및 설계 (Analysis and Design of Cattle Management System based on IoT)

  • 조병호
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.125-130
    • /
    • 2021
  • 축산 스마트팜의 구현이 사물인터넷 기술이 발전함에 따라 더욱 효율적으로 이루어질 수 있게 되었다. IoT 기술을 이용한 소의 질병 및 발정을 판단하여 자동적으로 소의 관리자 스마트폰으로 그 판단 결과를 푸시메지시로 알려주면 유용한 축산관리 시스템 구축이 가능해진다. 소의 질병 및 발정시기를 판단하는 방식은 온도센서 및 3축가속도 센서를 이용하여 가축의 생체데이터를 수집하여 IoT 통신과 인터넷을 이용해서 서버로 데이터를 전송하고 이 데이터는 인공지능 머신러닝 학습에 의해 이루어진다. 본 논문에서는 이와 같은 사물인터넷 기반 소관리 시스템을 구축하기 위한 전체 시스템 구조를 보여준다. 또한 객체지향방법을 이용한 사용자 요구사항 분석과 플로우차트 및 화면 설계를 보여줌으로써 이 시스템 소프트웨어를 개발하기 위한 효율적인 분석 및 설계 방법을 제시한다.

Evaluating flexural strength of concrete with steel fibre by using machine learning techniques

  • Sharma, Nitisha;Thakur, Mohindra S.;Upadhya, Ankita;Sihag, Parveen
    • Composite Materials and Engineering
    • /
    • 제3권3호
    • /
    • pp.201-220
    • /
    • 2021
  • In this study, potential of three machine learning techniques i.e., M5P, Support vector machines and Gaussian processes were evaluated to find the best algorithm for the prediction of flexural strength of concrete mix with steel fibre. The study comprises the comparison of results obtained from above-said techniques for given dataset. The dataset consists of 124 observations from past research studies and this dataset is randomly divided into two subsets namely training and testing datasets with (70-30)% proportion by weight. Cement, fine aggregates, coarse aggregates, water, super plasticizer/ high-range water reducer, steel fibre, fibre length and curing days were taken as input parameters whereas flexural strength of the concrete mix was taken as the output parameter. Performance of the techniques was checked by statistic evaluation parameters. Results show that the Gaussian process technique works better than other techniques with its minimum error bandwidth. Statistical analysis shows that the Gaussian process predicts better results with higher coefficient of correlation value (0.9138) and minimum mean absolute error (1.2954) and Root mean square error value (1.9672). Sensitivity analysis proves that steel fibre is the significant parameter among other parameters to predict the flexural strength of concrete mix. According to the shape of the fibre, the mixed type performs better for this data than the hooked shape of the steel fibre, which has a higher CC of 0.9649, which shows that the shape of fibers do effect the flexural strength of the concrete. However, the intricacy of the mixed fibres needs further investigations. For future mixes, the most favorable range for the increase in flexural strength of concrete mix found to be (1-3)%.

Water consumption prediction based on machine learning methods and public data

  • Kesornsit, Witwisit;Sirisathitkul, Yaowarat
    • Advances in Computational Design
    • /
    • 제7권2호
    • /
    • pp.113-128
    • /
    • 2022
  • Water consumption is strongly affected by numerous factors, such as population, climatic, geographic, and socio-economic factors. Therefore, the implementation of a reliable predictive model of water consumption pattern is challenging task. This study investigates the performance of predictive models based on multi-layer perceptron (MLP), multiple linear regression (MLR), and support vector regression (SVR). To understand the significant factors affecting water consumption, the stepwise regression (SW) procedure is used in MLR to obtain suitable variables. Then, this study also implements three predictive models based on these significant variables (e.g., SWMLR, SWMLP, and SWSVR). Annual data of water consumption in Thailand during 2006 - 2015 were compiled and categorized by provinces and distributors. By comparing the predictive performance of models with all variables, the results demonstrate that the MLP models outperformed the MLR and SVR models. As compared to the models with selected variables, the predictive capability of SWMLP was superior to SWMLR and SWSVR. Therefore, the SWMLP still provided satisfactory results with the minimum number of explanatory variables which in turn reduced the computation time and other resources required while performing the predictive task. It can be concluded that the MLP exhibited the best result and can be utilized as a reliable water demand predictive model for both of all variables and selected variables cases. These findings support important implications and serve as a feasible water consumption predictive model and can be used for water resources management to produce sufficient tap water to meet the demand in each province of Thailand.

디스플레이형 자판기 사용자 분석을 위한 이중 단계 검출 및 분류 망 (2-Stage Detection and Classification Network for Kiosk User Analysis)

  • 서지원;김미경
    • 한국정보통신학회논문지
    • /
    • 제26권5호
    • /
    • pp.668-674
    • /
    • 2022
  • 시각 정보를 이용한 기계 학습 기술은 주변 상황 인지, 결함 감지, 보안 그리고 사용자 분석과 같이 산업, 서비스 분야에서 활용성이 높아졌다. 그 중 CCTV 영상 분석을 통한 사용자 분석은 시각 정보를 잘 활용하는 실용적인 부분이라고 할 수 있다. 또한 이러한 임베디드 환경에서의 실용성을 높이기 위한 신경 회로망 경량화에 대한 연구가 지속되고 있다. 본 논문에서는 디스플레이형 자판기인 키오스크에서 활용할 수 있는 사람 및 얼굴 검출과 사용자의 나이 및 성별 분류 시스템을 제안한다. 제안하는 모델은 MobileNet, YOLOv2, 생략 연결을 기반으로 설계되었으며, 검출과 분류 망을 개별적으로 학습한 뒤 결합한 2-stage 구조를 띈다. 또한 주의 집중 기법을 사용하여 시스템의 성능을 향상시키고자 하였다. 제안하는 시스템에 대한 구동과 성능 평가는 소형 그래픽 처리 유닛인 Nvidia Jetson Nano에서 진행하였다.

낙동강 조간대 연약지반의 지역별 점성토층 두께 추정 모델 개발에 관한 연구 (A Study on the Development of Model for Estimating the Thickness of Clay Layer of Soft Ground in the Nakdong River Estuary)

  • 안성인;류동우
    • 터널과지하공간
    • /
    • 제32권6호
    • /
    • pp.586-597
    • /
    • 2022
  • 본 연구에서는 국내 주요 연약지반으로 알려진 낙동강 조간대 지역의 압밀침하 취약성 평가에 활용할 상부 점성토층의 위치별 두께 정보를 추정할 수 있는 모델을 개발하였다. 두께정보 추정을 위하여 기계학습 알고리즘인 RF (Random Forest), SVR (Support Vector Regression), GPR (Gaussian Process Regression)과 지구통계기법인 정규크리깅(Ordinary Kriging)을 이용한 4가지 공간추정 모델을 개발하고 상호 비교하였다. 모델 개발을 위하여 수집한 연구지역의 시추공 자료 4,712개 중 상부점성토층이 존재하는 2,948개의 시추공 자료를 사용하였으며, 개발된 모델들의 성능을 정량적으로 평가하기 위하여 피어슨(Pearson) 상관계수와 오차제곱평균(mean squared error)을 사용하였다. 또한, 정성적 평가를 위하여 연구지역 전역에 상부점성토층의 두께를 추정하여 점성토층의 지역별 분포 특성을 상호 비교하였다.

LYGBO 단결정의 열형광 전자포획준위 인자 (Thermoluminescence Kinetics of LYGBO Crystal)

  • 김성환
    • 한국방사선학회논문지
    • /
    • 제17권1호
    • /
    • pp.17-23
    • /
    • 2023
  • 본 연구에서는 중성자 반응단면적이 높은 Li, Gd 및 B을 모체로 구성된 중성자 검출용 Li6Y0.5Gd0.5(BO3)3 (LY0.5G0.5BO) 섬광체의 전자포획준위에 대하여 조사하였다. LY0.5G0.5BO 섬광 단결정에 대하여 열형광곡선을 측정하고 이를 피크형상법, 초기상승법 및 기계학습 알고리즘을 이용하여 분석하여 전자포획준위의 물리적인 인자를 평가하였다. LYGBO 섬광 단결정의 열형광곡선은 단일 피크로 이루어져 있으며, 이 피크를 분석한 결과 전자포획준위의 활성화에너지, 발광차수 및 주파수인자는 각각 0.61 eV, 1.1 및 1.7×107 s-1이었다. 아울러 기계학습을 이용한 섬광체의 열형광 해석의 가능성을 확인하였다.