• Title/Summary/Keyword: HyperParameter

Search Result 113, Processing Time 0.027 seconds

기계학습기법을 이용한 부산-울산-경남 지역의 증발수요 가뭄지수 예측 (Evaporative demand drought index forecasting in Busan-Ulsan-Gyeongnam region using machine learning methods)

  • 이옥정;원정은;서지유;김상단
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.617-628
    • /
    • 2021
  • 가뭄은 심각한 사회적 경제적 손실을 초래하는 주요 자연재해이다. 지역 가뭄 예측은 가뭄 대비에 중요한 정보를 제공할 수 있다. 본 연구에서는 한반도 동남부 부산-울산-경남 지역에서 1981년부터 2020년까지 10개 관측소의 과거 가뭄지수 및 기상 관측자료를 사용하여 가뭄을 예측하는 새로운 기계학습모델을 제안한다. 베이지안 최적화기법을 이용하여 하이퍼 파라미터가 튜닝된 Random Forest, XGBoost, Light GBM 모델을 구축하여 1개월 뒤의 6개월 시간 척도의 증발 수요 가뭄지수를 예측하였다. 단일 지점별 모델과 지역 모델을 각각 구성하여 모델 성능을 비교하였다. 또한 지역 모델을 기반으로 개별 지점의 자료에 대해 미세조정된 모델을 구성하여 모델 성능을 높일 가능성을 살펴보았다.

주가 예측 모델에서의 분할 예측을 통한 성능향상 탐구 (Exploring performance improvement through split prediction in stock price prediction model)

  • 여태건우;유도희;남정원;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.503-509
    • /
    • 2022
  • 본 논문의 연구 취지는 예측하고자 하는 다음 날과 이전 날의 시가 사이 변동률을 예측값으로 두고 시가를 예측하는 기존 논문들과는 다르게 예측하고자 하는 다음날의 주가 순위를 일정한 간격으로 분할하여 생성된 각 구간마다의 시가 변동률을 예측값으로 하는 모델을 통하여 최종적인 다음날의 시가 변동률을 예측하는 새로운 시계열 데이터 예측 방식을 제안하고자 한다. 예측값의 세분화 정도와 입력 데이터의 종류에 따른 모델의 성능 변화를 분석했으며 연구 결과 예측값의 세분화 정도에 따른 모델의 예측값과 실제값의 차이가 예측값의 세분화 개수가 3일 때 큰 폭으로 감소한다는 사실도 도출해 낼 수 있었다.

시계열 분해 및 데이터 증강 기법 활용 건화물운임지수 예측 (Forecasting Baltic Dry Index by Implementing Time-Series Decomposition and Data Augmentation Techniques)

  • 한민수;유성진
    • 품질경영학회지
    • /
    • 제50권4호
    • /
    • pp.701-716
    • /
    • 2022
  • Purpose: This study aims to predict the dry cargo transportation market economy. The subject of this study is the BDI (Baltic Dry Index) time-series, an index representing the dry cargo transport market. Methods: In order to increase the accuracy of the BDI time-series, we have pre-processed the original time-series via time-series decomposition and data augmentation techniques and have used them for ANN learning. The ANN algorithms used are Multi-Layer Perceptron (MLP), Recurrent Neural Network (RNN), and Long Short-Term Memory (LSTM) to compare and analyze the case of learning and predicting by applying time-series decomposition and data augmentation techniques. The forecast period aims to make short-term predictions at the time of t+1. The period to be studied is from '22. 01. 07 to '22. 08. 26. Results: Only for the case of the MAPE (Mean Absolute Percentage Error) indicator, all ANN models used in the research has resulted in higher accuracy (1.422% on average) in multivariate prediction. Although it is not a remarkable improvement in prediction accuracy compared to uni-variate prediction results, it can be said that the improvement in ANN prediction performance has been achieved by utilizing time-series decomposition and data augmentation techniques that were significant and targeted throughout this study. Conclusion: Nevertheless, due to the nature of ANN, additional performance improvements can be expected according to the adjustment of the hyper-parameter. Therefore, it is necessary to try various applications of multiple learning algorithms and ANN optimization techniques. Such an approach would help solve problems with a small number of available data, such as the rapidly changing business environment or the current shipping market.

AI기반 하천 부유쓰레기 모니터링 기술 연구 (A Study of AI-based Monitoring Techniques for Land-based Debris in Stream)

  • 이경수;윤해인;원종화;정상화
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.137-137
    • /
    • 2023
  • 해양쓰레기는 해안의 심미적 가치 저하뿐만 아니라 생태계 파괴, 유령 어업에 따른 수산업 피해 등의 사회적·환경적 문제를 발생시키며, 그중 70% 이상은 육상 기인으로 플라스틱 및 기타 쓰레기가 주를 이루는 해외와 달리 국내의 경우 다량의 초목류를 포함하고 있다. 다양한 부유쓰레기에 대한 기존의 해양쓰레기량 추정의 한계와 하천·하구 쓰레기 수거의 효율화를 위해 해양으로 유입되는 부유쓰레기 방지를 위한 실효성 있는 대책 수립이 필요한 실정이다. 본 연구는 해양 유입 전 하천의 차단시설에 차집된 부유쓰레기의 수거 효율화 및 지속가능한 해양쓰레기 데이터 구축을 위해 AI기반의 기술을 통해 부유쓰레기 성상 분석 기법(Object Detection)과 차집량 분석 기법(Semantic Segmentation)을 활용하였다. 실제와 유사한 데이터 수집을 위해 다양한 하천 환경(정수조, 소하천, 급경사수로)에 대해 탁도(녹조, 유사), 광량, 쓰레기형상, 초목류 함량, 날씨(소하천), 유속(급경사수로) 등의 실험조건에 대하여 해양쓰레기 분류 기준 및 통계를 바탕으로 부유쓰레기 종류 선정하여 학습을 위한 데이터를 수집하였다. 학습 목적에 따라 구분하여 라벨링(Bounding box, Polygon)을 수행하고, 각 분석 기법별 전이학습을 통해 Phase 1(정수조), Phase 2(소하천), Phase 3(급경사수로) 순서로 모델을 고도화하였다. 성상 분석을 위해 YOLO v4를 활용하여 Train, Test DataSet(9:1)을 구성하고 학습 및 평가는 Iteration마다의 mAP, loss 값을 통해 비교하였으며, 학습 Phase에 따라 모델 고도화로 Test Set의 mAP 값이 성상별로 높아짐을 확인하였으며, 차집량 분석을 위해 Unet을 활용하여 Train, Test, Validation DataSet(8.5:1:0.5)을 구성하고 epoch별 IoU(intersection over Union), F1-score, loss 값을 비교하여 정성적, 정량적 평가 모두 Phase 3에서 가장 높은 성능을 확인하였다. 향후 하천 환경에서의 다양한 영양인자별 분석을 통해 주요 영향인자 도출 및 Hyper Parameter 최적화를 통한 모델 고도화로 인해 활용성이 높아질 것으로 판단된다.

  • PDF

뉴로모픽 환경에서 QoS를 고려한 최적의 SNN 모델 파라미터 생성 기법 (QoS-Aware Optimal SNN Model Parameter Generation Method in Neuromorphic Environment)

  • 김서연;김봉재;정진만
    • 스마트미디어저널
    • /
    • 제12권4호
    • /
    • pp.19-26
    • /
    • 2023
  • 뉴로모픽 아키텍처 기반 하드웨어를 이용한 IoT 엣지 서비스는 단말 장치에서 지능형 처리를 수행할 수 있기 때문에 자율형 IoT 응용 지원에 적합하다. 그러나 IoT 개발자가 뉴로모픽 하드웨어에서 사용되는 SNN을 이해하기에는 어려움이 있다. 본 논문에서는 뉴로모픽 하드웨어의 제약조건을 고려하며 사용자의 요구 성능을 만족하는 SNN 모델 생성 기법을 제안한다. 제안 기법은 프로파일링된 데이터에서 최적의 SNN 모델 파라미터를 찾도록 전처리된 데이터로 사전 학습한 모델을 활용한다. 전체 탐색 기법과 비교 결과, 두 기법 모두 사용자 요구사항을 모두 만족하였지만, 제안 기법이 수행 시간 측면에서 더 좋은 성능을 보였다. 또한, 신규 하드웨어의 제약조건을 명확히 알지 못하더라도 새로운 하드웨어의 프로파일링된 데이터를 활용할 수 있으므로 높은 확장성을 제공할 수 있다.

AutoFe-Sel: A Meta-learning based methodology for Recommending Feature Subset Selection Algorithms

  • Irfan Khan;Xianchao Zhang;Ramesh Kumar Ayyasam;Rahman Ali
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권7호
    • /
    • pp.1773-1793
    • /
    • 2023
  • Automated machine learning, often referred to as "AutoML," is the process of automating the time-consuming and iterative procedures that are associated with the building of machine learning models. There have been significant contributions in this area across a number of different stages of accomplishing a data-mining task, including model selection, hyper-parameter optimization, and preprocessing method selection. Among them, preprocessing method selection is a relatively new and fast growing research area. The current work is focused on the recommendation of preprocessing methods, i.e., feature subset selection (FSS) algorithms. One limitation in the existing studies regarding FSS algorithm recommendation is the use of a single learner for meta-modeling, which restricts its capabilities in the metamodeling. Moreover, the meta-modeling in the existing studies is typically based on a single group of data characterization measures (DCMs). Nonetheless, there are a number of complementary DCM groups, and their combination will allow them to leverage their diversity, resulting in improved meta-modeling. This study aims to address these limitations by proposing an architecture for preprocess method selection that uses ensemble learning for meta-modeling, namely AutoFE-Sel. To evaluate the proposed method, we performed an extensive experimental evaluation involving 8 FSS algorithms, 3 groups of DCMs, and 125 datasets. Results show that the proposed method achieves better performance compared to three baseline methods. The proposed architecture can also be easily extended to other preprocessing method selections, e.g., noise-filter selection and imbalance handling method selection.

머신러닝 애플리케이션 구현 비용 평가를 위한 확장형 기능 포인트 모델 (An Extended Function Point Model for Estimating the Implementing Cost of Machine Learning Applications )

  • 임석진
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.475-481
    • /
    • 2023
  • 머신러닝과 같은 소프트웨어가 일상생활에 매우 큰 영향력을 발휘하고 있는 상황에서, 소프트웨어의 개발비용을 평가하는 비용 모델의 중요성이 지속적으로 증가하고 있다. 비용 모델로서 LOC(Line of Code)와 M/M(Man-Month) 모델은 소프트웨어의 양적인 요소들을 측정하는 비용모델이다. 이와는 달리, FP(Function Point)는 소프트웨어의 기능적 특징들을 평가하는 비용모델로서 소프트웨어의 질적인 요소를 평가한다는 점에서 효과적이다. 그러나 FP는 머신러닝 소프트웨어의 주요한 요소들을 평가하지 않기 때문에 머신러닝 소프트웨어를 평가하는데 한계를 가진다. 본 논문은 확장형 FP(Extended Function Point, ExFP)를 제안한다. 확장형 FP는 머신러닝의 주요 특징인 하이퍼 파라미터와 그것의 최적화에 대한 복잡도를 반영하여 소프트웨어의 기능적 요소를 평가하도록 확장하였기 때문에 머신러닝과 같은 최신 소프트웨어에의 비용 평가에 적합하다. 머신러닝 소프트웨어의 특징을 반영한 평가를 통해 제안된 확장형 FP의 효용성을 보였다.

A vibration-based approach for detecting arch dam damage using RBF neural networks and Jaya algorithms

  • Ali Zar;Zahoor Hussain;Muhammad Akbar;Bassam A. Tayeh;Zhibin Lin
    • Smart Structures and Systems
    • /
    • 제32권5호
    • /
    • pp.319-338
    • /
    • 2023
  • The study presents a new hybrid data-driven method by combining radial basis functions neural networks (RBF-NN) with the Jaya algorithm (JA) to provide effective structural health monitoring of arch dams. The novelty of this approach lies in that only one user-defined parameter is required and thus can increase its effectiveness and efficiency, as compared to other machine learning techniques that often require processing a large amount of training and testing model parameters and hyper-parameters, with high time-consuming. This approach seeks rapid damage detection in arch dams under dynamic conditions, to prevent potential disasters, by utilizing the RBF-NNN to seamlessly integrate the dynamic elastic modulus (DEM) and modal parameters (such as natural frequency and mode shape) as damage indicators. To determine the dynamic characteristics of the arch dam, the JA sequentially optimizes an objective function rooted in vibration-based data sets. Two case studies of hyperbolic concrete arch dams were carefully designed using finite element simulation to demonstrate the effectiveness of the RBF-NN model, in conjunction with the Jaya algorithm. The testing results demonstrated that the proposed methods could exhibit significant computational time-savings, while effectively detecting damage in arch dam structures with complex nonlinearities. Furthermore, despite training data contaminated with a high level of noise, the RBF-NN and JA fusion remained the robustness, with high accuracy.

구글 버텍스 AI을 이용한 치과 X선 영상진단 유용성 평가 (Preliminary Test of Google Vertex Artificial Intelligence in Root Dental X-ray Imaging Diagnosis)

  • 정현자
    • 한국방사선학회논문지
    • /
    • 제18권3호
    • /
    • pp.267-273
    • /
    • 2024
  • 본 연구에서는 코딩없이 인공지능 학습 모델을 개발할 수 있는 클라우드 기반의 버텍스 AI 플렛폼을 이용하여 비전문가인 일반인들이 손쉽게 인공지능 학습 모델을 개발하였고 임상적 적용가능성을 확인하였다. 학습용 데이터는 캐글 사이트에 공개된 총9개 치과 질환, 2,999장 치근병 X선 영상을 사용하였고, 무작위로 학습, 검증 및 테스트 데이터 이미지를 분류하였다. 버텍스 AI의 기본 학습모델 워크플로우에서 학습 파이프라인을 사용하여 하이퍼 파라미터 조정작업을 통해 영상분류, 멀티레이블 학습을 수행하였다. Auto ML을 수행한 결과 AUC가 0.967, 정밀도는 95.6%, 재현율은 95.2%로 나타났으며, 학습된 인공지능 모델이 임상적 진단에 충분한 의미가 있음을 확인하였다.

쉴드 TBM 기계 데이터 및 머신러닝 기법을 이용한 암석의 일축압축강도 예측 (Prediction of Uniaxial Compressive Strength of Rock using Shield TBM Machine Data and Machine Learning Technique)

  • 김태환;고태영;박양수;김택곤;이대혁
    • 터널과지하공간
    • /
    • 제30권3호
    • /
    • pp.214-225
    • /
    • 2020
  • 쉴드 TBM(Tunnel Boring Machine) 터널 굴착 시 암반의 상태는 굴진 성능을 결정하는 중요한 요소 중 하나이다. 암석 강도는 지반조사 시 실내시험을 통해 얻을 수 있으나, 전체 TBM 굴진 구간에 대해 모두 알 수 없다. TBM 굴진 시 최적 Operation Parameter를 적용하기 위해서는 굴진 속도에 영향을 미치는 암석 강도를 파악하는 것이 매우 중요하다. 이에 본 연구에서는 TBM 굴착 중 생성되는 기계 데이터와 머신러닝(Machine Learning) 기법을 활용하여 암석 강도를 예측하고자 한다. 암석 강도를 예측하기 위해 여러 머신러닝 기법을 사용하여 비교하였고, 가장 예측 성능이 좋은 스태킹 모델을 최종 모델로 선택하였다. 암반 구간 Slurry 쉴드 TBM 굴진 사례에서 지반조사 및 시공 중 조사한 암석 강도와 강도를 획득한 위치에서의 TBM 굴착 데이터를 사용하였다. TBM 굴착 데이터는 Training과 Test용으로 8:2로 분할하였으며, 변수 선택(feature selection), 표준화(scaling), 이상치(outlier) 제거 등 전처리 과정을 수행하였다. 하이퍼파라미터 튜닝까지 마친 후, 스태킹 모델에 대해 평균 제곱근 오차(Root Mean Square Error, RMSE)와 결정 계수(R2)로 모델을 평가한 결과 각각 5.556과 0.943로 나타났으며, TBM 굴착 데이터로 암석 강도를 예측하는 모델로 유용할 것으로 판단된다.