• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.031초

머신러닝을 이용한 철광석 가격 예측에 대한 연구 (Forecasting of Iron Ore Prices using Machine Learning)

  • 이우창;김양석;김정민;이충권
    • 한국산업정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.57-72
    • /
    • 2020
  • 철광석의 가격은 여러 국가와 기업들의 수요와 공급에 따라서 높은 변동성이 지속되고 있다. 이러한 비즈니스 환경에서 철광석의 가격을 예측하는 것은 중요해졌다. 본 연구는 머신러닝 기법을 이용하여 철광석이 거래되는 시점으로부터 한 달 전에 철광석 거래가격을 미리 예측하는 모형을 개발하고자 하였다. 예측 모형은 시계열 데이터를 활용한 예측 방법론으로 많이 활용되고 있는 시차분포 모형과 다층신경망 (Multi-layer perceptron), 순환신경망 (Recurrent neural network), 그리고 장단기 기억 네트워크 (Long short-term memory)와 같은 딥 러닝(Deep Learning) 모형을 사용하였다. 측정지표를 통해 개별 모형을 비교한 결과에 따르면, LSTM 모형이 예측 오차가 가장 낮은 것으로 나타났다. 또한, 앙상블 기법을 적용한 모형들을 비교한 결과, 시차분포와 LSTM의 앙상블 모형이 예측오차가 가장 낮은 것으로 나타났다.

Efficient Osteoporosis Prediction Using A Pair of Ensemble Models

  • Choi, Se-Heon;Hwang, Dong-Hwan;Kim, Do-Hyeon;Bak, So-Hyeon;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권12호
    • /
    • pp.45-52
    • /
    • 2021
  • 본 논문에서는 컴퓨터 단층촬영(CT) 이미지를 이용한 합성곱 신경망(CNN)을 기반의 골감소증 및 골다공증 예측 모델을 제안한다. 기존의 CNN은 단일 CT 이미지에서 예측에 중요한 지역정보를 활용하지 못하다는 문제가 있다. 본 논문에서 이를 해결하고자 CT 이미지를 정규화하여 질감 정보가 다른 두 개의 이미지로 변환하고, 해당 이미지를 활용한 한 쌍의 신경망 네트워크를 제안한다. 동일한 구조를 가진 네트워크 각각의 신경망은 질감 정보가 다른 이미지를 입력으로 사용하고 비유사성 손실함수를 통해 다른 정보를 학습한다. 최종적으로 제안 모델은 중요한 지역정보를 포함한 단일 CT 이미지의 다양한 특징 정보를 학습하며, 이를 앙상블하여 골감소증 및 골다공증 예측 정확도를 높인다. 실험 결과를 통해 제안 모델의 정확도 77.11%를 확인할 수 있으며 Grad-CAM을 이용하여 모델이 바라보는 특징을 확인할 수 있다.

협업필터링과 스태킹 모형을 이용한 상품추천시스템 개발 (Development of Product Recommender System using Collaborative Filtering and Stacking Model)

  • 박성종;김영민;안재준
    • 융합정보논문지
    • /
    • 제9권6호
    • /
    • pp.83-90
    • /
    • 2019
  • 사람들은 자신의 더 나은 선택을 위하여 끊임없이 노력한다. 이러한 이유로 추천시스템이 개발되었으며, 1990년대 초반부터 계속해서 발전하고 있다. 그 중, 협업필터링 기법은 추천시스템 분야에서 우수한 성능을 보였으며, 기계학습이 등장하면서 기계학습을 이용한 추천시스템에 관한 연구가 활발히 진행되었다. 본 연구는 앙상블 방법 중에서 스태킹 모형을 사용하여 추천시스템을 구축하며, 실제 고객의 상품 구매 데이터를 활용하여 협업필터링과 기계학습 기반 스태킹 모형으로 추천시스템을 개발하였다. 제시한 모형의 추천 성능은 기존의 협업필터링과 기계학습 기반 추천시스템과 비교하여 모형의 우수성을 확인하며, 연구결과는 스태킹 모형을 이용한 추천시스템 모형의 추천 성능이 개선됨을 확인하였다. 향후 본 연구에서 제안한 모형은 개인이나 기업이 더 나은 선택을 하여 상품을 추천할 때 도움을 줄 것으로 기대한다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

OBDII 데이터 기반의 실시간 연료 소비량 예측 모델 연구 (A Modeling of Realtime Fuel Comsumption Prediction Using OBDII Data)

  • 양희은;김도현;최호섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권2호
    • /
    • pp.57-64
    • /
    • 2021
  • 자율주행차 시대가 도래하면서 ECU (Electronic Control Unit)는 점차 고도화되고 있고, 이에 따라 차량에서 정확한 데이터를 추출하고 분석하려는 연구가 다양하게 시도되어 왔다. 그러나 ECU는 차량 제조사별로 상이한 프로토콜을 가지고 있어 상용 단말기로는 정확한 데이터 추출과 분석이 어렵다. 본 연구에서는 정확한 차량 데이터를 추출하기 위하여 전용 펌웨어를 개발하여 차량의 2019년 1월부터 2월의 실제 주행데이터 53,580건의 데이터를 추출하였으며, 20회가 넘는 실제 도로 주행을 통해서 데이터의 정확도를 검증하였다. 이러한 데이터를 바탕으로 실시간 연료 소비량 예측 모델의 정확도를 높이기 위하여 스태킹 앙상블 기법을 이용하였다. 본 연구에서는 베이스 모델로 Ridge, Lasso, XGBoost, LightGBM이 사용되고 메타 모델은 Ridge가 사용되었으며, 예측 성능은 MAE 0.011, RMSE 0.017로 최적의 결과를 보였다.

통합적인 인공 신경망 모델을 이용한 발틱운임지수 예측 (Predicting the Baltic Dry Bulk Freight Index Using an Ensemble Neural Network Model)

  • 소막
    • 무역학회지
    • /
    • 제48권2호
    • /
    • pp.27-43
    • /
    • 2023
  • 해양 산업은 글로벌 경제 성장에 매우 중요한 역할을 하고 있다. 특히 벌크운임지수인 BDI는 글로벌 상품 가격과 매우 밀접한 상관 관계를 지니고 있기 때문에 BDI 예측 연구의 중요성이 증가하고 있다. 본연구에서는 글로벌 시장 상황 불안정성으로 인한 정확한 BDI 예측 어려움을 해결하고자 머신러닝 전략을 도입하였다. CNN과 LSTM의 이점을 결합한 예측 모델을 설정하였고, 모델 적합도를 위해 27년간의 일일 BDI 데이터를 수집하였다. 연구 결과, CNN을 통해 추출된 BDI 특징을 기반으로 LSTM이 BDI를 R2 값 94.7%로 정확하게 예측할 수 있었다. 본 연구는 해운 경제지표 연구 분야에서 새로운 머신 러닝 통합 접근법을 적용했을 뿐만 아니라 해운 관련기관과 금융 투자 분야의 위험 관리 의사결정에 대한 시사점을 제공한다는 점에서 그 의의가 있다.

Application of a Distribution Rainfall-Runoff Model on the Nakdong River Basin

  • 김광섭;순밍동
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.976-976
    • /
    • 2012
  • The applicability of a distributed rainfall-runoff model for large river basin flood forecasts is analyzed by applying the model to the Nakdong River basin. The spatially explicit hydrologic model was constructed and calibrated by the several storm events. The assimilation of the large scale Nakdong River basin were conducted by calibrating the sub-basin channel outflow, dam discharge in the basin rainfall-runoff model. The applicability of automatic and semi-automatic calibration methods was analyzed for real time calibrations. Further an ensemble distributed rainfall runoff model has been developed to measure the runoff hydrograph generated for any temporally-spatially varied rainfall events, also the runoff of basin can be forecast at any location as well. The results of distributed rainfall-runoff model are very useful for flood managements on the large scale basins. That offer facile, realistic management method for the avoiding the potential flooding impacts and provide a reference for the construct and developing of flood control facilities.

  • PDF

A multi-dimensional crime spatial pattern analysis and prediction model based on classification

  • Hajela, Gaurav;Chawla, Meenu;Rasool, Akhtar
    • ETRI Journal
    • /
    • 제43권2호
    • /
    • pp.272-287
    • /
    • 2021
  • This article presents a multi-dimensional spatial pattern analysis of crime events in San Francisco. Our analysis includes the impact of spatial resolution on hotspot identification, temporal effects in crime spatial patterns, and relationships between various crime categories. In this work, crime prediction is viewed as a classification problem. When predictions for a particular category are made, a binary classification-based model is framed, and when all categories are considered for analysis, a multiclass model is formulated. The proposed crime-prediction model (HotBlock) utilizes spatiotemporal analysis for predicting crime in a fixed spatial region over a period of time. It is robust under variation of model parameters. HotBlock's results are compared with baseline real-world crime datasets. It is found that the proposed model outperforms the standard DeepCrime model in most cases.

융선 기울기의 변화량을 이용한 앙상블 지문분류 시스템 (An Ensemble Fingerprint Classification System Using Changes of Gradient of Ridge)

  • 윤경배;박창희
    • 한국지능시스템학회논문지
    • /
    • 제13권5호
    • /
    • pp.545-551
    • /
    • 2003
  • 본 논문은 전통적인 지문분류 모델인 헨리식 분류방법으로는 적용이 어려운 현대의 자동화된 지문인식 시스템에서 대용량 데이터베이스 운용시 정합속도를 향상시키기 위한 융선 기울기의 변화량을 이용한 앙상블 지문분류 알고리즘을 적용한다. 기존의 분류체계인 헨리분류체계는 중심점과 삼각점을 모두 획득하는 회전낙인의 경우에 사용 가능한 분류방법이나 현대의 자동화된 지문인식 시스템에서는 입력센서의 크기 및 입력방법의 문제로 인하여, 헨리식 분류방법을 적용할 수 없다. 본 논문에서 제안하는 앙상블 지문분류 시스템 알고리즘은 융선 기울기의 변화량을 이용하여 삼각점을 획득하지 못한 영상에서도 기존의 헨리식 분류체계에 의해 분류된 5개의 문양을 분류할 수 있다. 이와 같은 방법으로 지문분류론 수행한 후 정합을 실행하면 정합 대상이 되는 데이터의 양이 줄어들게 되어 인식 시스템의 정합속도를 향상시킬 수 있다.

모바일 사용자의 잠재 관심 추론을 위한 앙상블 기법 (An Ensemble Method for Latent Interest Reasoning of Mobile Users)

  • 최예림;박종헌;신동완
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.706-712
    • /
    • 2015
  • 최근 모바일 서비스에서 콘텐트를 요약 정보가 담긴 리스트 형태로 제공하는 경우가 증가하고 있다. 이에 따라 사용자가 콘텐트에 관심이 있어도 별점이나 클릭과 같은 명시적 혹은 암묵적 관심을 표현하지 않고 요약 정보를 통해 콘텐트를 소비하는 잠재 관심 표현이 대다수를 차지하게 되었다. 따라서 사용자의 관심을 파악하기 위해서는 잠재 관심 콘텐트의 추론이 필수적이다. 본 연구에서는 사용자의 모바일 상의 콘텐트 소비 로그 패턴을 분석하여 잠재 관심 콘텐트를 추론하는 기법을 제안한다. 특히, 실제 서비스에 적용 시 잘못된 관심 추론은 치명적일 수 있다는 점에서 추론의 정밀도를 극대화시키기 위해 서로 다른 특성을 반영한 다수의 분류기가 모두 동의한 경우에 잠재 관심 콘텐트로 추론하는 만장일치 앙상블 방식을 도입한다. 자체 제작한 어플리케이션으로부터 콘텐트 소비 로그를 수집하였으며 이를 이용하여 제안 방법론의 우수한 성능을 확인하였다. 이러한 잠재 관심 아이템의 정확한 도출은 사용자의 관심에 기초한 추천 시스템과 같은 개인화 서비스의 질 향상에 기여할 것이다.