• 제목/요약/키워드: Tree algorithm

검색결과 1,726건 처리시간 0.032초

Datamining 기법을 활용한 단기 항만 물동량 예측 (Forecasting the Daily Container Volumes Using Data Mining with CART Approach)

  • 하준수;임채환;조광휘;하헌구
    • 한국항만경제학회지
    • /
    • 제37권3호
    • /
    • pp.1-17
    • /
    • 2021
  • 본 연구에서는 항만의 단기 물동량을 예측하기 위해 ARIMA 모형과 CART 모형을 활용한 단기 수요예측 모형을 제시하였다. 제시한 모형은 2단계로 구성된다. 1단계에서는 시계열 예측치와 주요 교역국의 주당 근로일수를 변수로 사용하여 CART 모형을 추정하고 주별 물동량 예측을 진행한다. 2단계에서는 1단계에서 도출한 예측치와 요일 정보, 주요국 공휴일 정보, 주요국 행사 기간 정보를 설명변수로 활용하여 최종적인 일별 물동량 예측 모형을 추정한다. 제시한 수요예측 모형을 활용하여 2020년 10월 1일부터 12월 31일까지 92일의 부산항 물동량을 예측한 결과 제시한 모형의 평균 정확도가 기존 시계열 모형보다 '22.5%' 높은 것으로 나타났다. 제시 모형은 일별 물동량의 추세뿐만 아니라 물동량이 급등락하는 지점에서도 높은 정확도를 보였으며 시계열 예측 모형을 사용했을 때 비해 총 166,504(TEU)의 오차를 줄일 수 있는 것으로 나타났다. 항만의 효율적인 운영을 위해 필수적인 단기 물동량 예측에 적합한 예측 모형을 제시한 본 연구는 충분한 활용 가치가 있을 것으로 판단된다.

데이터 확장 기법에서 손실값을 대치하는 확률 추정 방법 (Probability Estimation Method for Imputing Missing Values in Data Expansion Technique)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.91-97
    • /
    • 2021
  • 본 논문은 불완전한 데이터를 처리하기 위해 본래 규칙개선 문제를 위해 고안되었던 데이터 확장 기법을 사용한다. 이 기법은 사건마다 중요도를 의미하는 가중치를 가질 수 있으며 각 변수를 확률값으로 나타낼 수 있는 특징이 있다. 본 논문에서의 핵심 문제가 손실값과 가장 근사한 확률을 구하여 손실값을 확률로 대치하는 것이므로, 3가지 다른 알고리즘으로 손실값에 대한 확률을 구한 후 이 데이터 구조의 형식으로 저장한다. 그리고 각각의 확률 구조에 대한 평가를 위해 SVM 분류 알고리즘으로 각각의 정보 영역을 분류하는 학습을 한 후, 본래의 정보와 비교하여 얼마나 서로 일치하느냐를 측정한다. 손실값의 대치 확률을 위한 3가지 알고리즘들은 같은 데이터 구조를 사용하고 있으나 접근 방법에서는 서로 다른 특징을 가지고 있어 적용 분야에 따라 다양한 용도로 이용될 수 있기를 기대한다.

머신러닝 기반 고춧가루 원산지 판별기법 (Detection of Red Pepper Powders Origin based on Machine Learning)

  • 유성민;박민서
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.355-360
    • /
    • 2022
  • 최근 국내산 고추의 생산 비용 상승과 수입산 고추의 도입으로 고춧가루 원산지 허위표기 등의 피해사례가 속출하고 있다. 이에 따라 원산지를 신속하고 정확하게 판별하는 문제가 대두되었다. 기존의 고춧가루 원산지 판별법의 경우 무기 및 유기성분을 실험적으로 대조 및 분석하여 비용과 시간이 많이 든다는 한계가 있다. 이를 보완하기 위해, 본 연구는 머신러닝을 도입하여 국내산, 수입산 고춧가루 분류를 제안한다. 고춧가루에 포함된 53가지 성분에 대하여 머신러닝 모델을 설계하고 검증하였다. 본 연구를 통해 어떠한 성분이 원산지 판별 시 중요하게 활용되는지 파악 할 수 있었다. 추후 고춧가루뿐만 아니라 다양한 식품으로 확장하여 원산지 판별에 드는 비용을 보다 줄일 수 있을 것으로 기대된다.

무인 항공기를 위한 실시간 경로 재계획 기법: RRT*와 LOSPO를 활용한 환경 변화 고려 (Real-time Path Replanning for Unmanned Aerial Vehicles: Considering Environmental Changes using RRT* and LOSPO)

  • 안정우;우지원;김현섭;박상윤;남경래
    • 한국항행학회논문지
    • /
    • 제27권4호
    • /
    • pp.365-373
    • /
    • 2023
  • 무인 항공기는 다양한 분야에서 널리 활용되고 있으며, 실시간 경로 재계획은 이들 기기의 안전성과 효율성을 향상하는 핵심 요소이다. 본 논문에서는 RRT*와 LOSPO를 기반으로 한 실시간 경로 재계획 기법을 제안한다. 제안된 기법은 먼저 RRT* 알고리즘을 활용하여 초기 경로를 생성하고, LOSPO를 이용하여 경로를 최적화한다. 또한 최적화된 경로를 궤적으로 변경하여 실제 시간과 항공기의 동적한계를 고려할 수 있다. 이 과정에서 환경 변화와 충돌 위험을 실시간으로 감지하고, 필요한 경우 경로를 재계획함으로써 안전한 운행을 유지한다. 이 방법은 시뮬레이션을 통한 실험을 통해 검증되었다. 본 논문의 결과는 무인 항공기의 실시간 경로 재계획에 관한 연구에 중요한 기여할 것으로 기대한다. 또한 이 기법을 다양한 상황에 적용함으로써 무인 항공기의 안전성과 효율성을 향상시킬 수 있다.

머신러닝 기법을 활용한 낙동강 하구 염분농도 예측 (Nakdong River Estuary Salinity Prediction Using Machine Learning Methods)

  • 이호준;조민규;천세진;한정규
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.31-38
    • /
    • 2022
  • 하천의 염분 변화를 신속히 예측하는 것은 염분 침투로 인한 농업, 생태계의 피해를 예측하고 재해 방지 대책을 수립하기 위해서 중요한 작업이다. 머신러닝 기법은 물리 기반 수리 모델에 비해 계산량이 훨씬 적기 때문에, 비교적 짧은 시간에 염분농도를 예측 가능하여 물리 기반 수리 모델의 보완 기법으로 연구되고 있다. 해외에서는 머신러닝 기법 기반 염분 예측 연구들이 활발히 연구되고 있으나, 대한민국의 공공데이터에 머신러닝 기법을 적용한 연구는 충분치 않다. 낙동강 하구의 환경 정보에 관한 공공데이터와 함께, 본 연구는 여러 종류의 머신러닝 기법의 염분농도에 대한 예측 성능을 측정하였다. 실험 결과에서, 결정 트리 기반의 LightGBM 알고리즘은 평균 RMSE 0.37의 예측 정확도와 타 알고리즘 대비 2-20배 빠른 학습 속도를 보여주었다. 따라서 국내 하천의 염분농도 예측에도 머신러닝 기법을 적용할 수 있다고 판단된다.

Machine-assisted Semi-Simulation Model (MSSM): Predicting Galactic Baryonic Properties from Their Dark Matter Using A Machine Trained on Hydrodynamic Simulations

  • Jo, Yongseok;Kim, Ji-hoon
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.55.3-55.3
    • /
    • 2019
  • We present a pipeline to estimate baryonic properties of a galaxy inside a dark matter (DM) halo in DM-only simulations using a machine trained on high-resolution hydrodynamic simulations. As an example, we use the IllustrisTNG hydrodynamic simulation of a (75 h-1 Mpc)3 volume to train our machine to predict e.g., stellar mass and star formation rate in a galaxy-sized halo based purely on its DM content. An extremely randomized tree (ERT) algorithm is used together with multiple novel improvements we introduce here such as a refined error function in machine training and two-stage learning. Aided by these improvements, our model demonstrates a significantly increased accuracy in predicting baryonic properties compared to prior attempts --- in other words, the machine better mimics IllustrisTNG's galaxy-halo correlation. By applying our machine to the MultiDark-Planck DM-only simulation of a large (1 h-1 Gpc)3 volume, we then validate the pipeline that rapidly generates a galaxy catalogue from a DM halo catalogue using the correlations the machine found in IllustrisTNG. We also compare our galaxy catalogue with the ones produced by popular semi-analytic models (SAMs). Our so-called machine-assisted semi-simulation model (MSSM) is shown to be largely compatible with SAMs, and may become a promising method to transplant the baryon physics of galaxy-scale hydrodynamic calculations onto a larger-volume DM-only run. We discuss the benefits that machine-based approaches like this entail, as well as suggestions to raise the scientific potential of such approaches.

  • PDF

Framework for improving the prediction rate with respect to outdoor thermal comfort using machine learning

  • Jeong, Jaemin;Jeong, Jaewook;Lee, Minsu;Lee, Jaehyun
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.119-127
    • /
    • 2022
  • Most of the construction works are conducted outdoors, so the construction workers are affected by weather conditions such as temperature, humidity, and wind velocity which can be evaluated the thermal comfort as environmental factors. In our previous researches, it was found that construction accidents are usually occurred in the discomfort ranges. The safety management, therefore, should be planned in consideration of the thermal comfort and measured by a specialized simulation tool. However, it is very complex, time-consuming, and difficult to model. To address this issue, this study is aimed to develop a framework of a prediction model for improving the prediction accuracy about outdoor thermal comfort considering environmental factors using machine learning algorithms with hyperparameter tuning. This study is done in four steps: i) Establishment of database, ii) Selection of variables to develop prediction model, iii) Development of prediction model; iv) Conducting of hyperparameter tuning. The tree type algorithm is used to develop the prediction model. The results of this study are as follows. First, considering three variables related to environmental factor, the prediction accuracy was 85.74%. Second, the prediction accuracy was 86.55% when considering four environmental factors. Third, after conducting hyperparameter tuning, the prediction accuracy was increased up to 87.28%. This study has several contributions. First, using this prediction model, the thermal comfort can be calculated easily and quickly. Second, using this prediction model, the safety management can be utilized to manage the construction accident considering weather conditions.

  • PDF

지역 단위 가뭄단계 판단규칙 개발에 관한 연구 (A preliminary study on the determination of drought stages at the local level)

  • 이종소;전다은;윤현철;감종훈;이상은
    • 한국수자원학회논문집
    • /
    • 제56권12호
    • /
    • pp.929-937
    • /
    • 2023
  • 본 연구는 2022-2023 광주・전남지역 가뭄 사례를 바탕으로 지역 단위에서 가뭄의 심각성을 토대로 가뭄단계를 판단하는 규칙을 개발하기 위해 실시되었다. 전국의 시・군 단위로 발표되는 8가지 가뭄지표 중에서 농업용수(논) 가뭄단계, 생・공용수 가뭄단계, SPI-12, 농업용 저수지 저수율, 예년 대비 가정용수 사용량 변화율, 예년 대비 비가정용수 사용량 변화율 등의 6가지 지표는 담당자・전문가들의 인식과 통계적 상관성을 확인할 수 있었다. 또한 이 가뭄지표를 의사결정트리 알고리즘에 적용하여 가뭄의 심각성을 판단하기 위한 규칙을 도출하였는데, 선행연구에서 제안한 기존의 방법과 유사한 결과를 제시하나, 광주・전남지역 가뭄에서 확인된 시・공간적인 패턴을 설명하는데 있어서 상당한 비교우위를 보였다.

머신러닝 기법을 활용한 철골 모멘트 골조의 화재 취약도 분석 (Fire Fragility Analysis of Steel Moment Frame using Machine Learning Algorithms)

  • 박성월;김은주
    • 한국전산구조공학회논문집
    • /
    • 제37권1호
    • /
    • pp.57-65
    • /
    • 2024
  • 내화 구조물에서는 환기 계수, 재료 탄성 계수, 항복 강도, 열팽창 계수, 외력 및 화재 위치에서 불확실성이 관찰된다. 환기 불확실성은 화재 온도에 영향을 미치고, 이는 다시 구조물 온도에 영향을 미친다. 이러한 온도는 재료 특성과 함께 불확실한 구조적 응답으로 이어지고 있다. 화재 시 구조적 비선형 거동으로 인해 몬테카를로 시뮬레이션을 사용하여 화재 취약성을 계산하는데, 이는 시간이 많이 소요된다. 따라서 머신러닝 알고리즘을 활용해 화재 취약성 분석을 예측함으로써 효율성을 높이고 정확성을 확보하려는 연구가 진행되고 있다. 이 연구에서는 화재 크기, 위치, 구조 재료 특성의 불확실성을 고려하여 철골 모멘트 골조 건물의 화재 취약성을 예측했다. 화재 시 비선형 구조 거동 결과를 기반으로 한 취약성 곡선은 로그 정규 분포를 따른다. 마지막으로 제안한 방법이 화재 취약성을 정확하고 효율적으로 예측할 수 있음을 보여주었다.

Protecting Accounting Information Systems using Machine Learning Based Intrusion Detection

  • Biswajit Panja
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.111-118
    • /
    • 2024
  • In general network-based intrusion detection system is designed to detect malicious behavior directed at a network or its resources. The key goal of this paper is to look at network data and identify whether it is normal traffic data or anomaly traffic data specifically for accounting information systems. In today's world, there are a variety of principles for detecting various forms of network-based intrusion. In this paper, we are using supervised machine learning techniques. Classification models are used to train and validate data. Using these algorithms we are training the system using a training dataset then we use this trained system to detect intrusion from the testing dataset. In our proposed method, we will detect whether the network data is normal or an anomaly. Using this method we can avoid unauthorized activity on the network and systems under that network. The Decision Tree and K-Nearest Neighbor are applied to the proposed model to classify abnormal to normal behaviors of network traffic data. In addition to that, Logistic Regression Classifier and Support Vector Classification algorithms are used in our model to support proposed concepts. Furthermore, a feature selection method is used to collect valuable information from the dataset to enhance the efficiency of the proposed approach. Random Forest machine learning algorithm is used, which assists the system to identify crucial aspects and focus on them rather than all the features them. The experimental findings revealed that the suggested method for network intrusion detection has a neglected false alarm rate, with the accuracy of the result expected to be between 95% and 100%. As a result of the high precision rate, this concept can be used to detect network data intrusion and prevent vulnerabilities on the network.