• 제목/요약/키워드: Long-Short Term Memory Network

검색결과 319건 처리시간 0.028초

장단기 기억 신경망을 활용한 선박교통 해양사고 패턴 분석 및 예측 (Analysis and Prediction Methods of Marine Accident Patterns related to Vessel Traffic using Long Short-Term Memory Networks)

  • 장다운;김주성
    • 해양환경안전학회지
    • /
    • 제28권5호
    • /
    • pp.780-790
    • /
    • 2022
  • 해양사고 예방을 위해서는 사고의 원인과 결과에 대한 분석 및 진단뿐만 아니라, 사고의 발생 패턴과 변화 추이를 예측함으로써 정량적 위험도를 제시할 필요성이 있다. 선박교통과 관련된 해양사고 예측은 선박의 충돌위험도 분석 및 항해 경로 탐색 등 선박교통의 흐름에 관한 연구가 주로 수행되었으며, 해양사고의 발생 패턴에 대한 분석은 전통적인 통계 분석에 따라 제시되었다. 본 연구에서는 해양사고 통계 자료 중 선박교통관련 사고의 월별, 시간대별 발생 현황 데이터를 활용하여 해양사고 발생 예측 모델을 제시하고자 한다. 국내 해양사고 발생 현황 중 월별, 시간대별 데이터 집계가 가능한 1998년부터 2021년까지의 통계자료 중 선박교통 관련 데이터를 분류하여 정형 시계열 데이터로 변환하였으며, 대표적인 인공지능 모델인 순환 신경망 기반 장단기 기억 신경망을 통하여 예측 모델을 구축하였다. 검증데이터를 통하여 모델의 성능을 검증한 결과 RMSE는 초기 신경망 모델에서 월별 52.5471, 시간대별 126.5893으로 나타났으며, 관측값으로 신경망 모델을 업데이트한 결과 RMSE는 월별 31.3680, 시간대별 36.3967로 개선되었다. 본 연구에서 제안한 신경망 모델을 기반으로 다양한 해양사고의 특징 데이터를 학습하여 해양사고 발생 패턴을 예측할 수 있을 것이다. 향후 해양사고 발생 위험의 정량적 제시와 지역기반의 위험지도 개발 등에 관한 추가 연구가 필요하다.

합성곱 순환 신경망 구조를 이용한 지진 이벤트 분류 기법 (Earthquake events classification using convolutional recurrent neural network)

  • 구본화;김관태;장수;고한석
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.592-599
    • /
    • 2020
  • 본 논문은 다양한 지진 이벤트 분류를 위해 지진 데이터의 정적인 특성과 동적인 특성을 동시에 반영할 수 있는 합성곱 순환 신경망(Convolutional Recurrent Neural Net, CRNN) 구조를 제안한다. 중규모 지진뿐만 아니라 미소 지진, 인공 지진을 포함한 지진 이벤트 분류 문제를 해결하려면 효과적인 특징 추출 및 분류 방법이 필요하다. 본 논문에서는 먼저 주의 기반 합성곱 레이어를 통해 지진 데이터의 정적 특성을 추출 하게 된다. 추출된 특징은 다중 입력 단일 출력 장단기메모리(Long Short-Term Memory, LSTM) 네트워크 구조에 순차적으로 입력되어 다양한 지진 이벤트 분류를 위한 동적 특성을 추출하게 되며 완전 연결 레이어와 소프트맥스 함수를 통해 지진 이벤트 분류를 수행한다. 국내외 지진을 이용한 모의 실험 결과 제안된 모델은 다양한 지진 이벤트 분류에 효과적인 모습을 보여 주었다.

순환 신경망 모델을 이용한 소형어선의 운동응답 예측 연구 (Study on the Prediction of Motion Response of Fishing Vessels using Recurrent Neural Networks)

  • 서장훈;박동우;남동
    • 해양환경안전학회지
    • /
    • 제29권5호
    • /
    • pp.505-511
    • /
    • 2023
  • 본 논문에서는 소형어선의 운동 응답을 예측하기 위해 딥러닝 모델을 구축하였다. 크기가 다른 두 소형어선을 대상으로 유체동역학 성능을 평가하여 데이터세트를 확보하였다. 딥러닝 모델은 순환 신경망 기법의 하나인 장단기 메모리 기법(LSTM, Long Short-Term Memory)을 사용하였다. 딥러닝 모델의 입력 데이터는 6 자유도 운동 및 파고의 시계열 데이터를 사용하였으며, 출력 라벨로는 6 자유도 운동의 시계열 데이터로 선정하였다. 최적 LSTM 모델 구축을 위해 hyperparameter 및 입력창 길이의 영향을 평가하였다. 구축된 LSTM 모델을 통해 입사파 방향에 따른 시계열 운동 응답을 예측하였다. 예측된 시계열 운동 응답은 해석 결과와 전반적으로 잘 일치함을 확인할 수 있었다. 시계열의 길이가 길어짐에 따라서 예측값과 해석 결과의 차이가 발생하는데, 이는 장기 데이터에 따른 훈련 영향도가 감소 됨에 따라 나타난 것으로 확인할 수 있다. 전체 예측 데이터의 오차는 약 85% 이상의 데이터가 10% 이내의 오차를 보였으며, 소형어선의 시계열 운동 응답을 잘 예측함을 확인하였다. 구축된 LSTM 모델은 소형어선의 모니터링 및 경보 시스템에 활용될 수 있을 것으로 기대한다.

Self-Supervised Long-Short Term Memory Network for Solving Complex Job Shop Scheduling Problem

  • Shao, Xiaorui;Kim, Chang Soo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권8호
    • /
    • pp.2993-3010
    • /
    • 2021
  • The job shop scheduling problem (JSSP) plays a critical role in smart manufacturing, an effective JSSP scheduler could save time cost and increase productivity. Conventional methods are very time-consumption and cannot deal with complicated JSSP instances as it uses one optimal algorithm to solve JSSP. This paper proposes an effective scheduler based on deep learning technology named self-supervised long-short term memory (SS-LSTM) to handle complex JSSP accurately. First, using the optimal method to generate sufficient training samples in small-scale JSSP. SS-LSTM is then applied to extract rich feature representations from generated training samples and decide the next action. In the proposed SS-LSTM, two channels are employed to reflect the full production statues. Specifically, the detailed-level channel records 18 detailed product information while the system-level channel reflects the type of whole system states identified by the k-means algorithm. Moreover, adopting a self-supervised mechanism with LSTM autoencoder to keep high feature extraction capacity simultaneously ensuring the reliable feature representative ability. The authors implemented, trained, and compared the proposed method with the other leading learning-based methods on some complicated JSSP instances. The experimental results have confirmed the effectiveness and priority of the proposed method for solving complex JSSP instances in terms of make-span.

Time Series Classification of Cryptocurrency Price Trend Based on a Recurrent LSTM Neural Network

  • Kwon, Do-Hyung;Kim, Ju-Bong;Heo, Ju-Sung;Kim, Chan-Myung;Han, Youn-Hee
    • Journal of Information Processing Systems
    • /
    • 제15권3호
    • /
    • pp.694-706
    • /
    • 2019
  • In this study, we applied the long short-term memory (LSTM) model to classify the cryptocurrency price time series. We collected historic cryptocurrency price time series data and preprocessed them in order to make them clean for use as train and target data. After such preprocessing, the price time series data were systematically encoded into the three-dimensional price tensor representing the past price changes of cryptocurrencies. We also presented our LSTM model structure as well as how to use such price tensor as input data of the LSTM model. In particular, a grid search-based k-fold cross-validation technique was applied to find the most suitable LSTM model parameters. Lastly, through the comparison of the f1-score values, our study showed that the LSTM model outperforms the gradient boosting model, a general machine learning model known to have relatively good prediction performance, for the time series classification of the cryptocurrency price trend. With the LSTM model, we got a performance improvement of about 7% compared to using the GB model.

Human Activity Recognition with LSTM Using the Egocentric Coordinate System Key Points

  • Wesonga, Sheilla;Park, Jang-Sik
    • 한국산업융합학회 논문집
    • /
    • 제24권6_1호
    • /
    • pp.693-698
    • /
    • 2021
  • As technology advances, there is increasing need for research in different fields where this technology is applied. On of the most researched topic in computer vision is Human activity recognition (HAR), which has widely been implemented in various fields which include healthcare, video surveillance and education. We therefore present in this paper a human activity recognition system based on scale and rotation while employing the Kinect depth sensors to obtain the human skeleton joints. In contrast to previous approaches that use joint angles, in this paper we propose that each limb has an angle with the X, Y, Z axes which we employ as feature vectors. The use of the joint angles makes our system scale invariant. We further calculate the body relative direction in the egocentric coordinates in order to provide the rotation invariance. For the system parameters, we employ 8 limbs with their corresponding angles each having the X, Y, Z axes from the coordinate system as feature vectors. The extracted features are finally trained and tested with the Long short term memory (LSTM) Network which gives us an average accuracy of 98.3%.

Predicting the lateral displacement of tall buildings using an LSTM-based deep learning approach

  • Bubryur Kim;K.R. Sri Preethaa;Zengshun Chen;Yuvaraj Natarajan;Gitanjali Wadhwa;Hong Min Lee
    • Wind and Structures
    • /
    • 제36권6호
    • /
    • pp.379-392
    • /
    • 2023
  • Structural health monitoring is used to ensure the well-being of civil structures by detecting damage and estimating deterioration. Wind flow applies external loads to high-rise buildings, with the horizontal force component of the wind causing structural displacements in high-rise buildings. This study proposes a deep learning-based predictive model for measuring lateral displacement response in high-rise buildings. The proposed long short-term memory model functions as a sequence generator to generate displacements on building floors depending on the displacement statistics collected on the top floor. The model was trained with wind-induced displacement data for the top floor of a high-rise building as input. The outcomes demonstrate that the model can forecast wind-induced displacement on the remaining floors of a building. Further, displacement was predicted for each floor of the high-rise buildings at wind flow angles of 0° and 45°. The proposed model accurately predicted a high-rise building model's story drift and lateral displacement. The outcomes of this proposed work are anticipated to serve as a guide for assessing the overall lateral displacement of high-rise buildings.

Enhancing the radar-based mean areal precipitation forecasts to improve urban flood predictions and uncertainty quantification

  • Nguyen, Duc Hai;Kwon, Hyun-Han;Yoon, Seong-Sim;Bae, Deg-Hyo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.123-123
    • /
    • 2020
  • The present study is aimed to correcting radar-based mean areal precipitation forecasts to improve urban flood predictions and uncertainty analysis of water levels contributed at each stage in the process. For this reason, a long short-term memory (LSTM) network is used to reproduce three-hour mean areal precipitation (MAP) forecasts from the quantitative precipitation forecasts (QPFs) of the McGill Algorithm for Precipitation nowcasting by Lagrangian Extrapolation (MAPLE). The Gangnam urban catchment located in Seoul, South Korea, was selected as a case study for the purpose. A database was established based on 24 heavy rainfall events, 22 grid points from the MAPLE system and the observed MAP values estimated from five ground rain gauges of KMA Automatic Weather System. The corrected MAP forecasts were input into the developed coupled 1D/2D model to predict water levels and relevant inundation areas. The results indicate the viability of the proposed framework for generating three-hour MAP forecasts and urban flooding predictions. For the analysis uncertainty contributions of the source related to the process, the Bayesian Markov Chain Monte Carlo (MCMC) using delayed rejection and adaptive metropolis algorithm is applied. For this purpose, the uncertainty contributions of the stages such as QPE input, QPF MAP source LSTM-corrected source, and MAP input and the coupled model is discussed.

  • PDF

Assessment of maximum liquefaction distance using soft computing approaches

  • Kishan Kumar;Pijush Samui;Shiva S. Choudhary
    • Geomechanics and Engineering
    • /
    • 제37권4호
    • /
    • pp.395-418
    • /
    • 2024
  • The epicentral region of earthquakes is typically where liquefaction-related damage takes place. To determine the maximum distance, such as maximum epicentral distance (Re), maximum fault distance (Rf), or maximum hypocentral distance (Rh), at which an earthquake can inflict damage, given its magnitude, this study, using a recently updated global liquefaction database, multiple ML models are built to predict the limiting distances (Re, Rf, or Rh) required for an earthquake of a given magnitude to cause damage. Four machine learning models LSTM (Long Short-Term Memory), BiLSTM (Bidirectional Long Short-Term Memory), CNN (Convolutional Neural Network), and XGB (Extreme Gradient Boosting) are developed using the Python programming language. All four proposed ML models performed better than empirical models for limiting distance assessment. Among these models, the XGB model outperformed all the models. In order to determine how well the suggested models can predict limiting distances, a number of statistical parameters have been studied. To compare the accuracy of the proposed models, rank analysis, error matrix, and Taylor diagram have been developed. The ML models proposed in this paper are more robust than other current models and may be used to assess the minimal energy of a liquefaction disaster caused by an earthquake or to estimate the maximum distance of a liquefied site provided an earthquake in rapid disaster mapping.

LSTM 순환 신경망을 이용한 재료의 단축하중 하에서의 응력-변형률 곡선 예측 연구 (Prediction of the Stress-Strain Curve of Materials under Uniaxial Compression by Using LSTM Recurrent Neural Network)

  • 변훈;송재준
    • 터널과지하공간
    • /
    • 제28권3호
    • /
    • pp.277-291
    • /
    • 2018
  • 이 논문에서는 재료의 단축하중 하에서의 응력-변형률 곡선을 예측하기 위하여 순환 신경망의 일종인 LSTM(Long Short-Term Memory) 알고리즘을 사용하였다. 석고와 규사를 혼합해 만든 재료에 일축압축시험을 수행하여 얻은 응력-변형률 데이터를 이용하였으며, 낮은 응력 구간의 초반 데이터를 활용해서 파괴 전까지의 거동을 예측하였다. 앞부분의 데이터를 활용하여 단계적으로 뒤쪽 구간의 값을 예측하는 LSTM 순환 신경망의 구조상 큰 응력에 대응하는 변형률을 예측할 경우에는 앞쪽 구간의 오차가 누적되어 실측값과 차이가 늘어났으나 전반적으로 높은 정확도로 응력-변형률 곡선을 예측하였다. 예측에 사용한 초기 데이터의 길이가 늘어나는 경우 정확도는 조금 증가했다. 그러나 접선을 이용한 단순 예측과의 성능 차이는 초기 데이터의 길이가 작은 경우에 두드러졌으며, 적은양의 데이터로도 응력-변형률 곡선 전체 구간의 예측을 가능하게 한다는 점으로부터 신경망 모델의 필요성을 확인하였다.