• 제목/요약/키워드: Random Forest Regression

검색결과 268건 처리시간 0.029초

Application and evaluation of machine-learning model for fire accelerant classification from GC-MS data of fire residue

  • Park, Chihyun;Park, Wooyong;Jeon, Sookyung;Lee, Sumin;Lee, Joon-Bae
    • 분석과학
    • /
    • 제34권5호
    • /
    • pp.231-239
    • /
    • 2021
  • Detection of fire accelerants from fire residues is critical to determine whether the case was arson or accidental fire. However, to develop a standardized model for determining the presence or absence of fire accelerants was not easy because of high temperature which cause disappearance or combustion of components of fire accelerants. In this study, logistic regression, random forest, and support vector machine models were trained and evaluated from a total of 728 GC-MS analysis data obtained from actual fire residues. Mean classification accuracies of the three models were 63 %, 81 %, and 84 %, respectively, and in particular, mean AU-PR values of the three models were evaluated as 0.68, 0.86, and 0.86, respectively, showing fine performances of random forest and support vector machine models.

영역-점 회귀 크리깅 기반 다중센서 위성영상의 공간-분광 융합: 고해상도 적색 경계 및 단파 적외선 밴드 생성 실험 (Spatio-spectral Fusion of Multi-sensor Satellite Images Based on Area-to-point Regression Kriging: An Experiment on the Generation of High Spatial Resolution Red-edge and Short-wave Infrared Bands)

  • 박소연;강솔아;박노욱
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.523-533
    • /
    • 2022
  • 이 논문에서는 상호보완적인 공간 및 분광해상도를 가진 다중센서 위성영상을 이용하여 공간해상도와 분광해상도를 향상시키기 위해 영역-점 회귀 크리깅(area-to-point regression kriging, ATPRK) 기반의 2단계 spatio-spectral fusion method (2SSFM)을 제안하였다. 2SSFM은 ATPRK와 random forest 회귀 모형을 결합하여 다중센서 위성영상에서 높은 공간해상도를 갖는 분광 밴드를 예측한다. 첫 번째 단계에서는 다중센서 위성영상 사이의 공간해상도 차이를 감소시키기 위해 ATPRK 기반 공간 상세화를 수행한다. 두 번째 단계에서는 다중센서 위성영상 사이의 분광 밴드의 관계성을 정량화하기 위해 random forest를 이용한 회귀 모델링을 적용하였다. 2SSFM의 예측 성능은 적색 경계와 단파 적외선 밴드를 생성하는 사례 연구를 통해 평가하였다. 사례 연구에서 2SSFM은 실제 분광 밴드와 유사한 분광패턴을 보이면서 공간해상도가 향상된 적색 경계와 단파 적외선 밴드를 생성할 수 있었으며, 2SSFM가 고해상도 위성영상에서 제공하지 않은 분광 밴드 생성에 유용함을 확인할 수 있었다. 따라서 2SSFM을 통해 실제로 획득 불가능하지만 환경 모니터링에 효과적인 분광 밴드를 예측함으로써 다양한 분광 지수를 생성할 수 있을 것으로 기대된다.

Ensemble Deep Learning Model using Random Forest for Patient Shock Detection

  • Minsu Jeong;Namhwa Lee;Byuk Sung Ko;Inwhee Joe
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권4호
    • /
    • pp.1080-1099
    • /
    • 2023
  • Digital healthcare combined with telemedicine services in the form of convergence with digital technology and AI is developing rapidly. Digital healthcare research is being conducted on many conditions including shock. However, the causes of shock are diverse, and the treatment is very complicated, requiring a high level of medical knowledge. In this paper, we propose a shock detection method based on the correlation between shock and data extracted from hemodynamic monitoring equipment. From the various parameters expressed by this equipment, four parameters closely related to patient shock were used as the input data for a machine learning model in order to detect the shock. Using the four parameters as input data, that is, feature values, a random forest-based ensemble machine learning model was constructed. The value of the mean arterial pressure was used as the correct answer value, the so called label value, to detect the patient's shock state. The performance was then compared with the decision tree and logistic regression model using a confusion matrix. The average accuracy of the random forest model was 92.80%, which shows superior performance compared to other models. We look forward to our work playing a role in helping medical staff by making recommendations for the diagnosis and treatment of complex and difficult cases of shock.

머신러닝 기반 고용량 I-131의 용량 예측 모델에 관한 연구 (A Study on Predictive Modeling of I-131 Radioactivity Based on Machine Learning)

  • 유연욱;이충운;김정수
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제46권2호
    • /
    • pp.131-139
    • /
    • 2023
  • High-dose I-131 used for the treatment of thyroid cancer causes localized exposure among radiology technologists handling it. There is a delay between the calibration date and when the dose of I-131 is administered to a patient. Therefore, it is necessary to directly measure the radioactivity of the administered dose using a dose calibrator. In this study, we attempted to apply machine learning modeling to measured external dose rates from shielded I-131 in order to predict their radioactivity. External dose rates were measured at 1 m, 0.3 m, and 0.1 m distances from a shielded container with the I-131, with a total of 868 sets of measurements taken. For the modeling process, we utilized the hold-out method to partition the data with a 7:3 ratio (609 for the training set:259 for the test set). For the machine learning algorithms, we chose linear regression, decision tree, random forest and XGBoost. To evaluate the models, we calculated root mean square error (RMSE), mean square error (MSE), and mean absolute error (MAE) to evaluate accuracy and R2 to evaluate explanatory power. Evaluation results are as follows. Linear regression (RMSE 268.15, MSE 71901.87, MAE 231.68, R2 0.92), decision tree (RMSE 108.89, MSE 11856.92, MAE 19.24, R2 0.99), random forest (RMSE 8.89, MSE 79.10, MAE 6.55, R2 0.99), XGBoost (RMSE 10.21, MSE 104.22, MAE 7.68, R2 0.99). The random forest model achieved the highest predictive ability. Improving the model's performance in the future is expected to contribute to lowering exposure among radiology technologists.

정수장 전염소 공정제어를 위한 침전지 잔류염소농도 예측 머신러닝 모형 (Machine learning model for residual chlorine prediction in sediment basin to control pre-chlorination in water treatment plant)

  • 김주환;이경혁;김수전;김경훈
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1283-1293
    • /
    • 2022
  • 본 연구는 정수장의 수처리 공정에서 계측되고 있는 수량 및 수질데이터의 활용과 수처리 공정제어의 지능화를 위한 것으로 정수장에서 전염소 공정이 수반되는 처리공정에서 침전지 유출수 잔류염소농도 안정화를 위하여 이를 추정할 수 있는 모형을 구축하고자 하였다. 정수장 침전지 유출수의 잔류염소농도를 예측하기 위하여 중회귀모형과 인공지능 알고리즘 중 다층퍼셉트론 신경망, 랜덤포레스트 및 장단기기억(Long Short Term Memory; LSTM) 모형을 활용하였고 그 결과를 비교, 평가하였다. 모형의 입력변수로는 전염소 공정이 도입된 정수장에서의 잔류염소농도, 수온, 탁도, pH, 전기전도도, 유량, 알칼리도 등이 사용되었고 전염소에 따른 침전지의 안정적 운영을 위해 요구되는 침전지 잔류염소농도를 출력변수로 구성하였다. 적용 결과에서는 랜덤포레스트 모형이 가장 양호한 결과를 보여 주었으며 다음으로 LSTM, 다층퍼셈트론 신경망 순으로 나타났다. 수학적 모형인 중회귀모형은 적합도 측면에서 가장 낮은 결과를 보여 주었는데, 이는 수량과 수질데이터의 수치적인 규모나 차원의 차이뿐만 아니라 계절별 수질특성에 따라 염소소비 특성이 매우 다양하게 반응하기 때문으로 판단된다. 따라서 정수장 수처리 공정에서 인공지능 알고리즘의 적용을 위해서는 랜덤포레스트와 같이 의사결정 트리구조의 도입과 적용이 타당한 것으로 나타났다. 본 연구에서 분석된 결과를 근거로 전염소 공정이 도입된 정수장 수처리 공정에서 염소주입량을 실시간으로 예측 가능하게 함으로써 침전지 유출수에서 잔류염소농도를 일정하게 유지하는데 기여할 수 있을 것으로 기대된다.

Hand-crafted 특징 및 머신 러닝 기반의 은하 이미지 분류 기법 개발 (Development of Galaxy Image Classification Based on Hand-crafted Features and Machine Learning)

  • 오윤주;정희철
    • 대한임베디드공학회논문지
    • /
    • 제16권1호
    • /
    • pp.17-27
    • /
    • 2021
  • In this paper, we develop a galaxy image classification method based on hand-crafted features and machine learning techniques. Additionally, we provide an empirical analysis to reveal which combination of the techniques is effective for galaxy image classification. To achieve this, we developed a framework which consists of four modules such as preprocessing, feature extraction, feature post-processing, and classification. Finally, we found that the best technique for galaxy image classification is a method to use a median filter, ORB vector features and a voting classifier based on RBF SVM, random forest and logistic regression. The final method is efficient so we believe that it is applicable to embedded environments.

인턴십 지원자를 위한 기계학습기반 취업예측 모델 개발 (Development of the Machine Learning-based Employment Prediction Model for Internship Applicants)

  • 김현수;김선호;김도현
    • 반도체디스플레이기술학회지
    • /
    • 제21권2호
    • /
    • pp.138-143
    • /
    • 2022
  • The employment prediction model proposed in this paper uses 16 independent variables, including self-introductions of M University students who applied for IPP and work-study internship, and 3 dependent variable data such as large companies, mid-sized companies, and unemployment. The employment prediction model for large companies was developed using Random Forest and Word2Vec with the result of F1_Weighted 82.4%. The employment prediction model for medium-sized companies and above was developed using Logistic Regression and Word2Vec with the result of F1_Weighted 73.24%. These two models can be actively used in predicting employment in large and medium-sized companies for M University students in the future.

An Exploratory Study on the Usage Patterns of Software-based Design Tools in Designers' Ideation and Collaboration Activities

  • Kim, Dongwook;Kim, Sungbum
    • International Journal of Contents
    • /
    • 제17권4호
    • /
    • pp.16-34
    • /
    • 2021
  • The purpose of this study was to explore how designers use software-based design tools for ideation and collaboration (for two cases: with designers and with developers). We conducted logistic regression analysis and random forest analysis. Software-based design tools are more popular among product designers and affiliated with design organizations with 51 to 100 members. We identify the features that influence designers to use design tools for the ideation and collaboration, and how these usage patterns are interrelated. Interrelated usage pattern is a key consideration for location of the menu and convenience of use. The results imply that reinforcement of the design tool features per designer profile is required and that design management should be consistent with the field of design and the nature of the organization.

해양환경 예측정보를 활용한 인공지능 분석 기반의 최적 안전항로 연구 (Research on optimal safety ship-route based on artificial intelligence analysis using marine environment prediction)

  • 엄대용;이방희
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 춘계학술대회
    • /
    • pp.100-103
    • /
    • 2023
  • 최근 스마트선박 개발에 발맞춰 정확하고 세밀한 실시간 해양환경 예측정보의 요구가 확대되고 선박에 직접 지원하기 위한 환경이 확보됨에 따라 최적항로 분야에서도 다양한 해양환경을 고려한 정보 생산 및 평가 연구가 필요하다. 스마트선박에서 해양환경의 위험도 및 에너지 소비의 불확실성을 줄이면서 최적항로를 산출할 수 있는 알고리즘은 2단계로 구분하여 개발하였다. 1단계는 해양환경정보들과 선박자동식별시스템(AIS)내에 선박의 위치·상태정보를 결합해 프로파일을 생성하였다. 2단계는 구성한 프로파일 결과를 이용하여 해양환경 에너지맵을 정의할 수 있는 모델을 개발하였고, 약 60만개의 데이터를 반영할 수 있도록 인공지능 머신러닝 기법 중 Random Forest를 적용하여 회귀식을 생성하였다. Random Forest 회귀 모델의 결정계수(R2)는 0.89 를 보였다. 생성한 모델에 2021년 6월 1일~3일의 해양환경 예측정보를 이용하여 Dijikstra 최단경로 알고리즘을 적용해 최적 안전항로를 산출하고 맵에 표출했다. Random Forest 회귀 모델로 산출된 항로는 유선적이고 해양환경 예측정보의 상태를 감안하며 항로를 도출하는 결과를 보였다. 본 연구의 실시간 해양환경 예측정보 기반의 항로 산출 개념은 선박의 이동 경향성을 반영한 현실적이면서 안전한 항로 산출이 가능하고, 향후 경제성, 안전성, 친환경성 평가 모델로 범위로 확대할 수 있을 것으로 기대된다.

  • PDF

Comparison of machine learning algorithms for regression and classification of ultimate load-carrying capacity of steel frames

  • Kim, Seung-Eock;Vu, Quang-Viet;Papazafeiropoulos, George;Kong, Zhengyi;Truong, Viet-Hung
    • Steel and Composite Structures
    • /
    • 제37권2호
    • /
    • pp.193-209
    • /
    • 2020
  • In this paper, the efficiency of five Machine Learning (ML) methods consisting of Deep Learning (DL), Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT), and Gradient Tree Booting (GTB) for regression and classification of the Ultimate Load Factor (ULF) of nonlinear inelastic steel frames is compared. For this purpose, a two-story, a six-story, and a twenty-story space frame are considered. An advanced nonlinear inelastic analysis is carried out for the steel frames to generate datasets for the training of the considered ML methods. In each dataset, the input variables are the geometric features of W-sections and the output variable is the ULF of the frame. The comparison between the five ML methods is made in terms of the mean-squared-error (MSE) for the regression models and the accuracy for the classification models, respectively. Moreover, the ULF distribution curve is calculated for each frame and the strength failure probability is estimated. It is found that the GTB method has the best efficiency in both regression and classification of ULF regardless of the number of training samples and the space frames considered.