• 제목/요약/키워드: ensemble method

검색결과 511건 처리시간 0.039초

데이터마이닝을 활용한 HR제도들의 상대적 중요도 평가: 제조업을 중심으로 (Analysis of Relative Importance of HR practice Using Data Mining Method: Focus on Manufacturing Companies)

  • 노진수;백승현;전상길
    • 한국시뮬레이션학회논문지
    • /
    • 제22권3호
    • /
    • pp.55-69
    • /
    • 2013
  • 기업의 전략은 환경 변화에 따라 변화하며 전략의 변화에 따라 최적화된 인적자원관리 제도를 도입 및 실행해야 경영성과 극대화를 달성할 수 있다. 그러나 실질적으로 기업의 자원 및 시간은 한정되어 있기 때문에 활동들 간의 상대적 중요도를 고려하여 우선순위에 따라 단계적으로 추진해야한다. 본 연구는 "CART 앙상블" 분석을 통해 제조업에서의 보편적 관점 및 기업규모 및 전략유형에 따른 상황적 관점에 따라 HR제도 중에서 기업성과를 가장 잘 설명할 수 있는 제도를 찾고 분석결과를 통하여 고성과를 위해 우선적으로 도입해야 할 HR제도의 우선순위를 탐색하였다. 분석결과 보편적 관점에서 기업은 최우선적으로 전략과 인사부서의 통합정도를 높이는데 힘써야 하며, 경영 의사결정 참여도를 높이는 것과 업무속도/방법에 대한 자율재량을 높이는 것이 중요한 것으로 나타났다. 상황적 관점에서도 공통적으로 전략과 인사부서의 통합정도를 높이는 것이 중요하게 나타났으나 그 외의 사항들은 다양한 양상으로 나타났다. 본 연구는 기업의 다양한 상황에 따른 HR제도 우선순위를 파악하는데 주요한 결과를 제시하였다.

차량가속도데이터를 이용한 머신러닝 기반의 궤도품질지수(TQI) 예측 (Prediction of Track Quality Index (TQI) Using Vehicle Acceleration Data based on Machine Learning)

  • 최찬용;김현기;김영철;김상수
    • 한국지반신소재학회논문집
    • /
    • 제19권1호
    • /
    • pp.45-53
    • /
    • 2020
  • 철도분야에서도 계측자료를 바탕으로 머신러닝 기법을 이용하여 예측 분석하는 시도가 점차적으로 증가하고 있는 실정이다. 이 논문에서는 열차의 차상가속도 데이터를 기반으로 궤도의 품질을 결정하는 지표 중에 하나인 궤도품질지수를 머신러닝 기법을 활용하여 예측하였다. 머신러닝 기법으로 활용하고 있는 대표적인 3개의 모델로 궤도품질지수를 예측하여 가장 정확도가 높은 모델은 XGBoost으로 데이터셋에서 85% 이상의 예측정확도를 보였다. 또한 윤축과 대차의 z축의 진동가속도가 고저 궤도품질지수의 기여도가 높은 것으로 나타났으며, 이는 기존 연구결과와도 잘 일치하였다. 이러한 결과를 볼 때 단일 알고리즘인 서포터 벡터머신보다는 앙상블 알고리즘을 적용한 랜덤포레스트와 XGBoost이 정확도가 높은 것으로 판단된다. 따라서 머신러닝 기법에서 적용모델에 따라 정확도가 달라질 수 있기 때문에 차량진동가속도를 이용한 궤도품질지수를 예측하기 위해서는 앙상블 알고리즘을 가지는 모델을 적용하는 것이 적절할 것으로 판단된다.

신용카드 대손회원 예측을 위한 SVM 모형 (Credit Card Bad Debt Prediction Model based on Support Vector Machine)

  • 김진우;지원철
    • 한국IT서비스학회지
    • /
    • 제11권4호
    • /
    • pp.233-250
    • /
    • 2012
  • In this paper, credit card delinquency means the possibility of occurring bad debt within the certain near future from the normal accounts that have no debt and the problem is to predict, on the monthly basis, the occurrence of delinquency 3 months in advance. This prediction is typical binary classification problem but suffers from the issue of data imbalance that means the instances of target class is very few. For the effective prediction of bad debt occurrence, Support Vector Machine (SVM) with kernel trick is adopted using credit card usage and payment patterns as its inputs. SVM is widely accepted in the data mining society because of its prediction accuracy and no fear of overfitting. However, it is known that SVM has the limitation in its ability to processing the large-scale data. To resolve the difficulties in applying SVM to bad debt occurrence prediction, two stage clustering is suggested as an effective data reduction method and ensembles of SVM models are also adopted to mitigate the difficulty due to data imbalance intrinsic to the target problem of this paper. In the experiments with the real world data from one of the major domestic credit card companies, the suggested approach reveals the superior prediction accuracy to the traditional data mining approaches that use neural networks, decision trees or logistics regressions. SVM ensemble model learned from T2 training set shows the best prediction results among the alternatives considered and it is noteworthy that the performance of neural networks with T2 is better than that of SVM with T1. These results prove that the suggested approach is very effective for both SVM training and the classification problem of data imbalance.

Efficient Osteoporosis Prediction Using A Pair of Ensemble Models

  • Choi, Se-Heon;Hwang, Dong-Hwan;Kim, Do-Hyeon;Bak, So-Hyeon;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.45-52
    • /
    • 2021
  • 본 논문에서는 컴퓨터 단층촬영(CT) 이미지를 이용한 합성곱 신경망(CNN)을 기반의 골감소증 및 골다공증 예측 모델을 제안한다. 기존의 CNN은 단일 CT 이미지에서 예측에 중요한 지역정보를 활용하지 못하다는 문제가 있다. 본 논문에서 이를 해결하고자 CT 이미지를 정규화하여 질감 정보가 다른 두 개의 이미지로 변환하고, 해당 이미지를 활용한 한 쌍의 신경망 네트워크를 제안한다. 동일한 구조를 가진 네트워크 각각의 신경망은 질감 정보가 다른 이미지를 입력으로 사용하고 비유사성 손실함수를 통해 다른 정보를 학습한다. 최종적으로 제안 모델은 중요한 지역정보를 포함한 단일 CT 이미지의 다양한 특징 정보를 학습하며, 이를 앙상블하여 골감소증 및 골다공증 예측 정확도를 높인다. 실험 결과를 통해 제안 모델의 정확도 77.11%를 확인할 수 있으며 Grad-CAM을 이용하여 모델이 바라보는 특징을 확인할 수 있다.

OBDII 데이터 기반의 실시간 연료 소비량 예측 모델 연구 (A Modeling of Realtime Fuel Comsumption Prediction Using OBDII Data)

  • 양희은;김도현;최호섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권2호
    • /
    • pp.57-64
    • /
    • 2021
  • 자율주행차 시대가 도래하면서 ECU (Electronic Control Unit)는 점차 고도화되고 있고, 이에 따라 차량에서 정확한 데이터를 추출하고 분석하려는 연구가 다양하게 시도되어 왔다. 그러나 ECU는 차량 제조사별로 상이한 프로토콜을 가지고 있어 상용 단말기로는 정확한 데이터 추출과 분석이 어렵다. 본 연구에서는 정확한 차량 데이터를 추출하기 위하여 전용 펌웨어를 개발하여 차량의 2019년 1월부터 2월의 실제 주행데이터 53,580건의 데이터를 추출하였으며, 20회가 넘는 실제 도로 주행을 통해서 데이터의 정확도를 검증하였다. 이러한 데이터를 바탕으로 실시간 연료 소비량 예측 모델의 정확도를 높이기 위하여 스태킹 앙상블 기법을 이용하였다. 본 연구에서는 베이스 모델로 Ridge, Lasso, XGBoost, LightGBM이 사용되고 메타 모델은 Ridge가 사용되었으며, 예측 성능은 MAE 0.011, RMSE 0.017로 최적의 결과를 보였다.

XGboost 기반의 WiFi 신호를 이용한 실내 측위 기법 (Indoor positioning method using WiFi signal based on XGboost)

  • 황치곤;윤창표;김대진
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.70-75
    • /
    • 2022
  • 위치를 정확하게 측정하는 것은 다양한 서비스를 제공하는 데 필요하다. 실내 측위를 위한 데이터는 스마트 폰의 앱을 통해 WiFi 장치로부터 RSSI 값을 측정한다. 이렇게 측정된 데이터는 기계학습의 원시 데이터가 된다. 특징 데이터는 측정된 RSSI 값이고, 레이블은 측정한 위치에 대한 공간의 이름으로 한다. 이를 위한 기계학습 기법은 분류에 효율적인 기법을 적용하여 WiFi 신호만으로 정확한 위치를 예측하는 기법을 연구하고자 한다. 앙상블은 하나의 모델보다 다양한 모델을 통하여 더 정확한 예측값을 구하는 기법으로, bagging과 boosting이 있다. 이 중 Boosting은 샘플링한 데이터를 바탕으로 모델링한 결과를 통해 모델의 가중치를 조정하는 기법으로, 다양한 알고리즘이 있다. 본 연구는 위 기법 중 XGboost를 이용하고, 다른 앙상블 기법과 이용한 수행결과를 바탕으로 성능을 평가한다.

충남 부여군 문화재의 산사태 민감성 평가 (Assessing the Landslide Susceptibility of Cultural Heritages of Buyeo-gun, Chungcheongnam-do)

  • 김준우;김호걸
    • 한국환경복원기술학회지
    • /
    • 제25권5호
    • /
    • pp.1-13
    • /
    • 2022
  • The damages caused by landslides are increasing worldwide due to climate change. In Korea, damages from landslides occur frequently, making it necessary to develop the effective response strategies. In particular, there is a lack of countermeasures against landslides in cultural heritage areas. The purpose of this study was to spatially analyze the relationship between Buyeo-gun's cultural heritage and landslide susceptible areas in Buyeo-gun, Chungcheongnam-do, which has a long history. Nine spatial distribution models were used to evaluate the landslide susceptibility, and the ensemble method was applied to reduce the uncertainty of individual model. There were 17 cultural heritages belonging to the landslide susceptible area. As a result of calculating the area ratio of the landslide susceptible area for cultural heritages, the cultural heritages with 100% of the area included in the landslide susceptible area were "Standing statue of Maae in Hongsan Sangcheon-ri" and "Statue of King Seonjo." More than 35% of "Jeungsanseong", "Garimseong", and "Standing stone statue of Maitreya Bodhisattva in Daejosa Temple" belonged to landslide susceptible areas. In order to effectively prevent landslide damage, the application of landslide prevention measures should be prioritized according to the proportion belonging to the landslide susceptible area. Since it is very difficult to restore cultural properties once destroyed, preventive measures are required before landslide damage occurs. The approach and results of this study provide basic data and guidelines for disaster response plans to prevent landslides in Buyeo-gun.

텍스트와 음성의 앙상블을 통한 다중 감정인식 모델 (Multi-Emotion Recognition Model with Text and Speech Ensemble)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제11권8호
    • /
    • pp.65-72
    • /
    • 2022
  • COVID-19로 인해 대면으로 이루어지던 상담 방식이 비대면으로 진행되면서 비대면 상담의 중요성이 높아지고 있다. 비대면 상담은 온라인으로 언제 어디서든 상담할 수 있고, COVID-19에 안전하다는 장점이 있다. 그러나 비언어적 표현의 소통이 어려워 내담자의 마음을 이해하기 어렵다. 이에 비대면 상담 시 내담자의 마음을 잘 알기 위해서는 텍스트와 음성을 정확하게 분석하여 감정을 인식하는 것이 중요하다. 따라서 본 논문에서는 텍스트 데이터는 자음을 분리한 후 FastText를 사용하여 벡터화하고, 음성 데이터는 Log Mel Spectrogram과 MFCC를 사용하여 각각 특징을 추출하여 벡터화한다. 벡터화된 데이터를 LSTM 모델을 활용하여 5가지 감정을 인식하는 다중 감정인식 모델을 제안한다. 다중 감정인식은 RMSE을 활용하여 계산한다. 실험 결과 텍스트와 음성 데이터를 각각 사용한 모델보다 제안한 모델의 RMSE가 0.2174로 가장 낮은 오차를 확인하였다.

기후변화에 따른 강수 특성 변화 분석을 위한 대규모 기후 앙상블 모의자료 적용 (Application of the Large-scale Climate Ensemble Simulations to Analysis on Changes of Precipitation Trend Caused by Global Climate Change)

  • 김영규;손민우
    • 대기
    • /
    • 제32권1호
    • /
    • pp.1-15
    • /
    • 2022
  • Recently, Japan's Meteorological Research Institute presented the d4PDF database (Database for Policy Decision-Making for Future Climate Change, d4PDF) through large-scale climate ensemble simulations to overcome uncertainty arising from variability when the general circulation model represents extreme-scale precipitation. In this study, the change of precipitation characteristics between the historical and future climate conditions in the Yongdam-dam basin was analyzed using the d4PDF data. The result shows that annual mean precipitation and seasonal mean precipitation increased by more than 10% in future climate conditions. This study also performed an analysis on the change of the return period rainfall. The annual maximum daily rainfall was extracted for each climatic condition, and the rainfall with each return period was estimated. In this process, we represent the extreme-scale rainfall corresponding to a very long return period without any statistical model and method as the d4PDF provides rainfall data during 3,000 years for historical climate conditions and during 5,400 years for future climate conditions. The rainfall with a 50-year return period under future climate conditions exceeded the rainfall with a 100-year return period under historical climate conditions. Consequently, in future climate conditions, the magnitude of rainfall increased at the same return period and, the return period decreased at the same magnitude of rainfall. In this study, by using the d4PDF data, it was possible to analyze the change in extreme magnitude of rainfall.

ESP 기법을 이용한 수문학적 가뭄전망의 활용성 평가 (Applicability Assessment of Hydrological Drought Outlook Using ESP Method)

  • 손경환;배덕효
    • 한국수자원학회논문집
    • /
    • 제48권7호
    • /
    • pp.581-593
    • /
    • 2015
  • 본 연구에서는 ESP (Ensemble Streamflow Prediction)기법을 활용한 가뭄전망 체계를 구축하고 가뭄예보에 있어 활용성을 평가하였다. 과거 관측 수문기상 및 지형정보를 이용하여 우리나라 전역에 지면모델(Land Surface Model, LSM)을 구축하고 유출량(Historical Runoff, HR)을 생산하였다. 또한, 모의기간 동안 과거 30개 기상자료와 초기 토양수분량을 이용하여 선행시간별(1, 2, 3개월) 전망된 유출량(Predicted Runoff, PR)을 생산하였다. 평가결과 여름 및 가을철 보다 봄철 및 겨울철에 정확도가 높았으며, 1개월 전망 이후로는 정확도가 낮게 나타났다. 가뭄지수는 국내 가뭄해석에 있어 검증된 표준유출지수(Standardized Runoff Index, SRI)를 활용하였으며, PR_SRI을 산정 및 평가하였다. 1, 2개월 전망에서는 과거 HR이 고려되어 ESP HR에 비해 정확도가 크게 개선됨을 알 수 있었다. 선행시간별 상관계수는 평균 0.71, 0.48, 0.00, 평균제곱근오차는 0.46, 0.76, 1.01로 나타났으며, 건조기에 정확도가 높게 나타나 1, 2개월 전망까지는 ESP를 활용한 국내 가뭄예보의 활용성이 높다고 판단된다.