• 제목/요약/키워드: LGBM

검색결과 29건 처리시간 0.025초

타이타늄 압연재의 기계학습 기반 극저온/상온 변형거동 예측 (Prediction of Cryogenic- and Room-Temperature Deformation Behavior of Rolled Titanium using Machine Learning)

  • 천세호;유진영;이성호;이민수;전태성;이태경
    • 소성∙가공
    • /
    • 제32권2호
    • /
    • pp.74-80
    • /
    • 2023
  • A deformation behavior of commercially pure titanium (CP-Ti) is highly dependent on material and processing parameters, such as deformation temperature, deformation direction, and strain rate. This study aims to predict the multivariable and nonlinear tensile behavior of CP-Ti using machine learning based on three algorithms: artificial neural network (ANN), light gradient boosting machine (LGBM), and long short-term memory (LSTM). The predictivity for tensile behaviors at the cryogenic temperature was lower than those in the room temperature due to the larger data scattering in the train dataset used in the machine learning. Although LGBM showed the lowest value of root mean squared error, it was not the best strategy owing to the overfitting and step-function morphology different from the actual data. LSTM performed the best as it effectively learned the continuous characteristics of a flow curve as well as it spent the reduced time for machine learning, even without sufficient database and hyperparameter tuning.

머신러닝을 활용한 청년 구직자의 강소기업 선호 예측모형 개발 및 요인별 상대적 중요도 분석 (Developing a Predictive Model of Young Job Seekers' Preference for Hidden Champions Using Machine Learning and Analyzing the Relative Importance of Preference Factors)

  • 조윤주;김진수;배환석;양성병;윤상혁
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권4호
    • /
    • pp.229-245
    • /
    • 2023
  • Purpose This study aims to understand the inclinations of young job seekers towards "hidden champions" - small but competitive companies that are emerging as potential solutions to the growing disparity between youth-targeted job vacancies and job seekers. We utilize machine learning techniques to discern the appeal of these hidden champions. Design/methodology/approach We examined the characteristics of small and medium-sized enterprises using data sourced from the Ministry of Employment and Labor and Youth Worknet. By comparing the efficacy of five machine learning classification models (i.e., Logistic Regression, Random Forest Classifier, Gradient Boosting Classifier, LGBM Classifier, and XGB Classifier), we discovered that the predictive model utilizing the LGBM Classifier yielded the most consistent performance. Findings Our analysis of the relative significance of preference determinants revealed that industry type, geographical location, and employee count are pivotal factors influencing preference. Drawing from these insights, we propose targeted strategic interventions for policymakers, hidden champions, and young job seekers.

Numerical data-driven machine learning model to predict the strength reduction of fire damaged RC columns

  • HyunKyoung Kim;Hyo-Gyoung Kwak;Ju-Young Hwang
    • Computers and Concrete
    • /
    • 제32권6호
    • /
    • pp.625-637
    • /
    • 2023
  • The application of ML approaches in determining the resisting capacity of fire damaged RC columns is introduced in this paper, on the basis of analysis data driven ML modeling. Considering the characteristics of the structural behavior of fire damaged RC columns, the representative five approaches of Kernel SVM, ANN, RF, XGB and LGBM are adopted and applied. Additional partial monotonic constraints are adopted in modelling, to ensure the monotone decrease of resisting capacity in RC column with fire exposure time. Furthermore, additional suggestions are also added to mitigate the heterogeneous composition of the training data. Since the use of ML approaches will significantly reduce the computation time in determining the resisting capacity of fire damaged RC columns, which requires many complex solution procedures from the heat transfer analysis to the rigorous nonlinear analyses and their repetition with time, the introduced ML approach can more effectively be used in large complex structures with many RC members. Because of the very small amount of experimental data, the training data are analytically determined from a heat transfer analysis and a subsequent nonlinear finite element (FE) analysis, and their accuracy was previously verified through a correlation study between the numerical results and experimental data. The results obtained from the application of ML approaches show that the resisting capacity of fire damaged RC columns can effectively be predicted by ML approaches.

A Multi-step Time Series Forecasting Model for Mid-to-Long Term Agricultural Price Prediction

  • Jonghyun, Park;Yeong-Woo, Lim;Do Hyun, Lim;Yunsung, Choi;Hyunchul, Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.201-207
    • /
    • 2023
  • 본 논문에서는 Multi-Step Time Series의 세 가지 전략을 비교 분석하기 위해 LGBM, MLP, LSTM, GRU를 사용하여 농산물 중장기 가격 예측에 대한 최적의 모형을 제안한다. 제안 모형은 다각도로 전략을 선택하여 모델과 전략간 최적의 조합을 찾도록 설계되었다. 기존 농산물 가격 예측 연구에서는 전통 계량경제 모델인 ARIMA를 비롯하여 LSTM 계열 모델이 주로 사용된 반면 Multi-Step Time Series 관련 농산물 가격 예측 연구는 매우 제한적이다. 본 연구에서는 농산물 가격의 변동성 정도에 따라 두 개의 기간으로 나누어 실험을 진행하였으며, Direct, Hybrid, Multiple Outputs 등 세 전략의 중장기 가격 예측 결과 Hybrid 접근법이 상대적으로 우수한 성능을 보였다.본 연구 결과는 중장기 일별 가격 예측을 고도화할 수 있는 효과적인 대안을 제시한다는 측면에서 학술적, 실무적 의의를 갖는다.

A Design and Implement of Efficient Agricultural Product Price Prediction Model

  • Im, Jung-Ju;Kim, Tae-Wan;Lim, Ji-Seoup;Kim, Jun-Ho;Yoo, Tae-Yong;Lee, Won Joo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.29-36
    • /
    • 2022
  • 본 논문에서는 DACON에서 제공하는 데이터셋을 기반으로 한 효과적인 농산물 가격 예측 모델을 제안한다. 이 모델은 XGBoost와 CatBoost 이며 Gradient Boosting 계열의 알고리즘으로써 기존의 Logistic Regression과 Random Forest보다 평균정확도 및 수행시간이 우수하다. 이러한 장점들을 기반으로 농산물의 이전 가격들을 기반으로 1주, 2주, 4주뒤 가격을 예측하는 머신러닝 모델을 설계한다. XGBoost 모델은 회귀 방식의 모델링인 XGBoost Regressor 라이브러리를 사용하여 하이퍼 파라미터를 조정함으로써 가장 우수한 성능을 도출할 수 있다. CatBoost 모델은 CatBoost Regressor를 사용하여 모델을 구현한다. 구현한 모델은 DACON에서 제공하는 API를 이용하여 검증하고, 모델 별 성능평가를 실시한다. XGBoost는 자체적인 과적합 규제를 진행하기 때문에 적은 데이터셋에도 불구하고 우수한 성능을 도출하지만, 학습시간, 예측시간 등 시간적인 성능 면에서는 LGBM보다 성능이 낮다는 것을 알 수 있었다.

스마트폰 센서를 통한 우울증 탐지 및 위급상황 탐지 모델 연구 (Research on depression and emergency detection model using smartphone sensors)

  • 손민근;이강표;박재용;최민
    • 스마트미디어저널
    • /
    • 제12권3호
    • /
    • pp.9-18
    • /
    • 2023
  • 코로나19의 심화로 인해 고강도 사회적 거리두기가 장기화되고 많은 사회적 문제를 나았다. 특히 비대면 체계로 인해 물리적, 심리적 고립이 발생하였고 많은 피해가 발생하였다. 코로나로 인한 여러 사회적 문제들은 코로나19로 피해를 입은 모든 사람들에게 심한 스트레스로 작용하여 결국엔 우울증 등의 정신건강을 위협하는 요소로 작용되었다. 정신질환을 겪는 사람들은 늘어나는 반면 실제로 정신건강 서비스 이용률은 저조한 상황이기 때문에 정신건강 문제를 겪고 있는 사람들을 위한 시스템 구축이 필요한 상황이다. 이에 본 연구에서는 우울증 대상자와 일반인 대상자로부터 스마트폰을 이용한 센서 정보를 바탕으로 우울증 탐지 및 위급상황 탐지모델을 구축하였다. 우울증 탐지와 위급상황 탐지를 위해 VAE, DAGMM, ECOD, COPOD, LGBM 알고리즘을 이용하였다. 연구 결과로 우울증 탐지 모델은 F1 score 0.93, 위급상황 탐지 모델은 F1 score 0.99의 성능의 모델을 구축하였다.

Comparison of Stock Price Prediction Using Time Series and Non-Time Series Data

  • Min-Seob Song;Junghye Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.67-75
    • /
    • 2023
  • 주가 예측은 금융시장에서 중요하게 다뤄지고 있는 주제이지만 영향을 미칠 수 있는 다수의 요소들로 인해 어려운 주제로 고려되고 있다. 본 논문에서는 시계열 예측 모델 (LSTM, GRU)과 데이터의 시간적 의존성을 고려하지 않는 비 시계열 예측 모델 (RF, SVR, KNN, LGBM)을 주가 예측에 적용하여 성능을 비교하고 분석하였다. 또한 주가 데이터와 기술적 분석 보조지표, 재무제표 지표, 매수매도 지표, 공매도, 외국인 지표 등 다양한 데이터를 조합 및 활용하여 최적의 예측 요소를 찾아내고 업종별로 주가 예측에 영향을 미치는 주요 요소들을 분석했다. 하이퍼파라미터 최적화 과정을 통해 알고리즘별 예측 성능을 향상 시키는 과정도 진행하여 성능에 영향을 주는 요인을 분석하였다. 변수 선택과 하이퍼 파라미터 최적화 과정을 거친 결과, 시계열 예측 알고리즘인 GRU, 그리고 LSTM+GRU의 예측 정확도가 가장 높은 것으로 나타났다.

머신러닝 기반의 유튜브 먹방 콘텐츠 인기 예측 모델 (A Machine Learning-based Popularity Prediction Model for YouTube Mukbang Content)

  • 서범근;이한준
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.49-55
    • /
    • 2023
  • 본 연구에서는 유튜브 먹방 콘텐츠의 인기를 예측하는 모형을 제안하고 사후 분석을 통하여 먹방 콘텐츠의 인기에 영향을 주는 요인들을 식별하였다. 이를 위해 API와 Pretty Scale을 활용하여 구독자수 상위 먹방 채널들로부터 22,223개 콘텐츠의 정보를 수집하고 Random Forest, XGBoost 및 LGBM 등의 머신러닝 알고리즘을 기반으로 조회수와 좋아요수 예측모델을 구축하였다. SHAP 분석 결과 조회수 예측 모형에서는 구독자수가 예측에 가장 큰 영향을 미치는 반면, 좋아요수 예측 모형에서는 크리에이터의 매력도가 중요변수로 도출되는 등 콘텐츠 조회와 좋아요 반응에 대한 선행요인이 다름을 확인할 수 있었다. 본 연구는 대량의 온라인 콘텐츠를 분석하여 실증 분석을 진행하였다는 점에서 학술적 의의가 있으며 먹방 크리에이터들에게 시청자들의 콘텐츠 소비 경향을 알려주고 상품성 높은 콘텐츠 제작의 가이드를 제공한다는 점에서 실무적인 의의를 지닌다.

농림위성을 위한 기계학습을 활용한 복사전달모델기반 대기보정 모사 알고리즘 개발 및 검증: 식생 지역을 위주로 (Machine Learning-Based Atmospheric Correction Based on Radiative Transfer Modeling Using Sentinel-2 MSI Data and ItsValidation Focusing on Forest)

  • 강유진;김예진;임정호;임중빈
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.891-907
    • /
    • 2023
  • Compact Advanced Satellite 500-4 (CAS500-4) is scheduled to be launched to collect high spatial resolution data focusing on vegetation applications. To achieve this goal, accurate surface reflectance retrieval through atmospheric correction is crucial. Therefore, a machine learning-based atmospheric correction algorithm was developed to simulate atmospheric correction from a radiative transfer model using Sentinel-2 data that have similarspectral characteristics as CAS500-4. The algorithm was then evaluated mainly for forest areas. Utilizing the atmospheric correction parameters extracted from Sentinel-2 and GEOKOMPSAT-2A (GK-2A), the atmospheric correction algorithm was developed based on Random Forest and Light Gradient Boosting Machine (LGBM). Between the two machine learning techniques, LGBM performed better when considering both accuracy and efficiency. Except for one station, the results had a correlation coefficient of more than 0.91 and well-reflected temporal variations of the Normalized Difference Vegetation Index (i.e., vegetation phenology). GK-2A provides Aerosol Optical Depth (AOD) and water vapor, which are essential parameters for atmospheric correction, but additional processing should be required in the future to mitigate the problem caused by their many missing values. This study provided the basis for the atmospheric correction of CAS500-4 by developing a machine learning-based atmospheric correction simulation algorithm.

다종 위성자료와 기계학습을 이용한 고해상도 표층 염분 추정 (Estimation of High Resolution Sea Surface Salinity Using Multi Satellite Data and Machine Learning)

  • 성태준;심성문;장은나;임정호
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.747-763
    • /
    • 2022
  • 해양 염분은 전 지구 규모에서 해수 순환에 영향을 미칠 뿐만 아니라, 연·근해 지역 저염분수가 어족자원 및 수산업에 피해를 줄 수 있는 등 해양 식생환경의 변화를 줄 수 있다. 해수의 표면 특성인 sea surface salinity (SSS)에 따라 마이크로웨이브 영역의 방사율이 달라지며, 이를 통해 Soil Moisture Active Passive (SMAP) 등 위성 센서를 활용한 SSS 산출물이 제공되고 있다. 하지만 마이크로파 위성 센서 기반의 SSS 산출물은 낮은 시공간해상도로 자료를 생산하며, 연안지역과 고위도 지역에서 정확도가 낮다. 이러한 이유로 연·근해 지역 SSS의 상세한 시공간적 변화를 관측하기에는 적합하지 않다. 본 연구에서는 Jang et al. (2022)에서 제시한 기계학습 기반의 개선된 SMAP SSS (SMAP SSS (Jang))를 참조자료로 활용하여, 정지궤도해색센서(Geostationary Ocean Color Imager, GOCI) 영상으로부터 고해상도 SSS를 추정하는 Light Gradient Boosting Machine (LGBM) 기반의 모델을 개발하였다. 3가지 입력변수 조합을 테스트하였고, Multi-scale Ultra-high Resolution Sea Surface Temperature (SST) 자료가 추가된 scheme 3가 가장 높은 정확도를 보였다(R2 = 0.60, RMSE = 0.91 psu). 이를 바탕으로 본 연구영역에서 SST가 SSS 모의에 효과적인 환경변수로 작용함을 보였다. 본 연구에서 제시한 LGBM 기반의 GOCI SSS는 SMAP SSS (Jang)와 비슷한 시공간적 패턴을 보였지만, 더 높은 공간해상도를 바탕으로 SSS의 보다 상세한 공간적 분포와 더불어 SMAP SSS (Jang)에서 산출하지 않는 연안 지역의 정보까지 모의하였다. 또한, 중국 남방지역에 대홍수가 발생하였던 2020년 8월을 대상으로 양자강 유출수(Changjiang Diluted Water)의 거동을 분석한 결과, GOCI SSS는 한국 해양수산연구원의 보도자료와 비교하여 일관성 있는 시공간적 변화를 보였다. 본 연구의 결과로 연안 지역의 저염수 뿐 아니라, 원해 지역에서 광학위성 신호를 활용한 고해상도 SSS 산출의 가능성을 제시하였다.