• 제목/요약/키워드: LSTM/GRU learning model

검색결과 49건 처리시간 0.024초

GRU 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템 (A Fuzzy-AHP-based Movie Recommendation System using the GRU Language Model)

  • 오재택;이상용
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.319-325
    • /
    • 2021
  • 무선 기술의 고도화 및 이동통신 기술의 인프라가 빠르게 성장함에 따라 AI 기반 플랫폼을 적용한 시스템이 사용자의 주목을 받고 있다. 특히 사용자의 취향이나 관심사 등을 이해하고, 선호하는 아이템을 추천해주는 시스템은 고도화된 전자상거래 맞춤형 서비스 및 스마트 홈 등에 적용되고 있다. 그러나 이러한 추천 시스템은 다양한 사용자들의 취향이나 관심사 등에 대한 선호도를 실시간으로 반영하기 어렵다는 문제가 있다. 본 연구에서는 이러한 문제를 해소하기 위해 GRU(Gated Recurrent Unit) 언어 모델을 이용한 Fuzzy-AHP 기반 영화 추천 시스템을 제안하였다. 본 시스템에서는 사용자의 취향이나 관심사를 실시간으로 반영하기 위해 Fuzzy-AHP를 적용하였다. 또한 대중들의 관심사 및 해당 영화의 내용을 분석하여 사용자가 선호하는 요인과 유사한 영화를 추천하기 위해 GRU 언어 모델 기반의 모델을 적용하였다. 본 추천 시스템의 성능을 검증하기 위해 학습 모듈에서 사용된 스크래핑 데이터를 이용하여 학습 모델의 적합성을 측정하였으며, LSTM(Long Short-Term Memory) 언어 모델과 Epoch 당 학습 시간을 비교하여 학습 수행 속도를 측정하였다. 그 결과 본 연구의 학습 모델의 평균 교차 검증 지수가 94.8%로 적합하다는 것을 알 수 있었으며, 학습 수행 속도가 LSTM 언어 모델보다 우수함을 확인할 수 있었다.

전력 부하 분석을 통한 절삭 공정 이상탐지 (Anomaly Detection of Machining Process based on Power Load Analysis)

  • 육준홍;배성문
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.173-180
    • /
    • 2023
  • Smart factory companies are installing various sensors in production facilities and collecting field data. However, there are relatively few companies that actively utilize collected data, academic research using field data is actively underway. This study seeks to develop a model that detects anomalies in the process by analyzing spindle power data from a company that processes shafts used in automobile throttle valves. Since the data collected during machining processing is time series data, the model was developed through unsupervised learning by applying the Holt Winters technique and various deep learning algorithms such as RNN, LSTM, GRU, BiRNN, BiLSTM, and BiGRU. To evaluate each model, the difference between predicted and actual values was compared using MSE and RMSE. The BiLSTM model showed the optimal results based on RMSE. In order to diagnose abnormalities in the developed model, the critical point was set using statistical techniques in consultation with experts in the field and verified. By collecting and preprocessing real-world data and developing a model, this study serves as a case study of utilizing time-series data in small and medium-sized enterprises.

딥러닝 모형을 이용한 팔당대교 지점에서의 유량 예측 (Flow rate prediction at Paldang Bridge using deep learning models)

  • 성연정;박기두;정영훈
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.565-575
    • /
    • 2022
  • 최근의 수자원공학 분야는 4차산업혁명과 더불어 비약적으로 발전된 딥러닝 기술을 활용한 시계열 수위 및 유량의 예측에 대한 관심이 높아지고 있다. 또한 시계열 자료의 예측이 가능한 LSTM 모형과 GRU 모형을 활용하여 수위 및 유량 예측을 수행하고 있지만 시간 변동성이 매우 큰 하천에서의 유량 예측 정확도는 수위 예측 정확도에 비해 낮게 예측되는 경향이 있다. 본 연구에서는 유량변동이 크고 하구에서의 조석의 영향이 거의 없는 한강의 팔당대교 관측소를 선택하였다. 또한, LSTM 모형과 GRU 모형의 입력 및 예측 자료로 활용될 유량변동이 큰 시계열 자료를 선택하였고 총 자료의 길이는 비교적 짧은 2년 7개월의 수위 자료 및 유량 자료를 수집하였다. 시간변동성이 큰 시계열 수위를 2개의 모형에서 학습할 경우, 2개의 모형 모두에서 예측되는 수위 결과는 관측 수위와 비교하여 적정한 정확도가 확보되었으나 변동성이 큰 유량 자료를 2개의 모형에서 직접 학습시킬 경우, 예측되는 유량 자료의 정확도는 악화되었다. 따라서, 본 연구에서는 급변하는 유량을 정확히 예측하기 위하여 2개 모형으로 예측된 수위 자료를 수위-유량관계곡선의 입력자료로 활용하여 유량의 예측 정확도를 크게 향상시킬 수 있었다. 마지막으로 본 연구성과는 수문자료의 별도 가공없이 관측 길이가 상대적으로 충분히 길지 않고 유출량이 급변하는 도시하천에서의 홍수예경보 자료로 충분히 활용할 수 있을 것으로 기대된다.

LSTM 기반의 sequence-to-sequence 모델을 이용한 한글 자동 띄어쓰기 (LSTM based sequence-to-sequence Model for Korean Automatic Word-spacing)

  • 이태석;강승식
    • 스마트미디어저널
    • /
    • 제7권4호
    • /
    • pp.17-23
    • /
    • 2018
  • 자동 띄어쓰기 특성을 효과적으로 처리할 수 있는 LSTM(Long Short-Term Memory Neural Networks) 기반의 RNN 모델을 제시하고 적용한 결과를 분석하였다. 문장이 길거나 일부 노이즈가 포함된 경우에 신경망 학습이 쉽지 않은 문제를 해결하기 위하여 입력 데이터 형식과 디코딩 데이터 형식을 정의하고, 신경망 학습에서 드롭아웃, 양방향 다층 LSTM 셀, 계층 정규화 기법, 주목 기법(attention mechanism)을 적용하여 성능을 향상시키는 방법을 제안하였다. 학습 데이터로는 세종 말뭉치 자료를 사용하였으며, 학습 데이터가 부분적으로 불완전한 띄어쓰기가 포함되어 있었음에도 불구하고, 대량의 학습 데이터를 통해 한글 띄어쓰기에 대한 패턴이 의미 있게 학습되었다. 이것은 신경망에서 드롭아웃 기법을 통해 학습 모델의 오버피팅이 되지 않도록 함으로써 노이즈에 강한 모델을 만들었기 때문이다. 실험결과로 LSTM sequence-to-sequence 모델이 재현율과 정확도를 함께 고려한 평가 점수인 F1 값이 0.94로 규칙 기반 방식과 딥러닝 GRU-CRF보다 더 높은 성능을 보였다.

데이터 예측을 위한 텐서플로우 기반 기계학습 알고리즘 비교 연구 (A Comparative Study of Machine Learning Algorithms Based on Tensorflow for Data Prediction)

  • ;장성봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권3호
    • /
    • pp.71-80
    • /
    • 2021
  • 기계학습에서 정확한 데이터 예측을 위해서는 적절한 인공신경망 알고리즘을 선택해야 한다. 이러한 알고리즘에는 심층 신경망 (DNN), 반복 신경망 (RNN), 장단기 기억 (LSTM) 네트워크 및 게이트 반복 단위 (GRU) 신경망등을 들 수 있다. 개발자가 실험을 위해, 하나를 선택해야 하는 경우, 각 알고리즘의 성능에 대한 충분한 정보가 없었기 때문에, 직관에 의존할 수 밖에 없었다. 본 연구에서는 이러한 어려움을 완화하기 위해 실험을 통해 예측 오류(RMSE)와 처리 시간을 비교 평가 하였다. 각 알고리즘은 텐서플로우를 이용하여 구현하였으며, 세금 데이터를 사용하여 학습을 수행 하였다. 학습 된 모델을 사용하여, 세금 예측을 수행 하였으며, 실제값과의 비교를 통해 정확도를 측정 하였다. 또한, 활성화 함수와 다양한 최적화 함수들이 알고리즘에 미치는 영향을 비교 분석 하였다. 실험 결과, GRU 및 LSTM 알고리즘의 경우, RMSE(Root Mean Sqaure Error)는 0.12이고 R2값은 각각 0.78 및 0.75로 다른 알고리즘에 비해 더 낳은 성능을 보여 주었다. 기본 심층 신경망(DNN)의 경우, 처리 시간은 가장 낮지만 예측 오류는 0.163로 성능은 가장 낮게 측정 되었다. 최적화 알고리즘의 경우, 아담(Adam)이 오류 측면에서 최고의 성능을, 처리 시간 측면에서 최악의 성능을 보여 주었다. 본 연구의 연구결과는 데이터 예측을 위한 알고리즘 선택시, 개발자들에게 유용한 정보로 사용될 것으로 예상된다.

다중 입력 딥러닝을 이용한 서리 발생 추정 (Estimation of Frost Occurrence using Multi-Input Deep Learning)

  • 김용석;허지나;김응섭;심교문;조세라;강민구
    • 한국농림기상학회지
    • /
    • 제26권1호
    • /
    • pp.53-62
    • /
    • 2024
  • 본 연구에서는 딥러닝을 이용한 모형을 이용해서 우리나라 지역에 대한 서리 발생 예측 모형을 구축하였다. 딥러닝 모형의 학습 데이터로 다양한 기상인자들(최저기온, 풍속, 상대습도, 구름량, 강수량)을 사용하였으며, 기상인자들에 대한 통계적 분석 결과, 서리가 발생한 날과 서리가 발생하지 않은 날에 대해 각 요소별로 유의한 차이가 있는 것을 볼 수 있었다. 단일 딥러닝 모형 3가지와 다중 입력 딥러닝 모형 3가지를 이용하여 서리발생을 추정한 결과, 평균적으로 MLP가 가장 정확도가 낮았으며, LSTM, GRU 순으로 정확도가 높게 나타났고, 다중 입력 딥러닝 모형의 경우 3가지 모형이 거의 비슷한 결과가 나타났지만 그 중 평균적으로 GRU와 MLP를 이용한 모형이 가장 정확도가 높았다. 또한, 단일 딥러닝이 다중 입력 딥러닝에 비해 샘플에 따라 정확도 편차도 더 컸다. 이에 따라 결과적으로 단일 딥러닝 기반의 서리발생 예측 모형보다 다중 입력 딥러닝 기반의 서리발생 예측 모형이 안정성과 정확도와 재현율 측면에서 다소 우수한 것을 확인할 수 있었다.

디지털 FIR 필터와 Deep Learning을 이용한 ECG 신호 예측 및 경과시간 (Predicton and Elapsed time of ECG Signal Using Digital FIR Filter and Deep Learning)

  • 윤의중
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.563-568
    • /
    • 2023
  • 심전도(electrocardiogram, ECG)는 심박동의 속도와 규칙성, 심실의 크기와 위치, 심장 손상 여부를 측정하는 데 사용되며, 모든 심장질환의 원인을 찾아낼 수 있다. ECG-KIT를 이용하여 획득한 ECG 신호는 ECG 신호에 잡음을 포함하기 때문에 딥러닝에 적용하기 위해서는 ECG 신호에서 잡음을 제거해야만 한다. 본 논문에서는, ECG 신호에 포함된 잡음은 Digital FIR 해밍 창함수를 이용한 저역통과 필터를 사용하여 제거하였다. LSTM의 딥러닝 모델을 사용하여 3가지 활성화 함수인 sigmoid(), ReLU(), tanh() 에 대한 성능 평가를 비교했을 때, 오차가 가장 작은 활성화 함수는 tanh() 함수 임을 확인하였고, batch size가 작은 경우가 큰 경우보다 시간이 많이 소요되었다. 또한 GRU 모델의 성능 평가의 결과가 LSTM 모델보다 우수한 것을 확인하였다.

한글 음소 단위 딥러닝 모형을 이용한 감성분석 (Sentiment Analysis Using Deep Learning Model based on Phoneme-level Korean)

  • 이재준;권순범;안성만
    • 한국IT서비스학회지
    • /
    • 제17권1호
    • /
    • pp.79-89
    • /
    • 2018
  • Sentiment analysis is a technique of text mining that extracts feelings of the person who wrote the sentence like movie review. The preliminary researches of sentiment analysis identify sentiments by using the dictionary which contains negative and positive words collected in advance. As researches on deep learning are actively carried out, sentiment analysis using deep learning model with morpheme or word unit has been done. However, this model has disadvantages in that the word dictionary varies according to the domain and the number of morphemes or words gets relatively larger than that of phonemes. Therefore, the size of the dictionary becomes large and the complexity of the model increases accordingly. We construct a sentiment analysis model using recurrent neural network by dividing input data into phoneme-level which is smaller than morpheme-level. To verify the performance, we use 30,000 movie reviews from the Korean biggest portal, Naver. Morpheme-level sentiment analysis model is also implemented and compared. As a result, the phoneme-level sentiment analysis model is superior to that of the morpheme-level, and in particular, the phoneme-level model using LSTM performs better than that of using GRU model. It is expected that Korean text processing based on a phoneme-level model can be applied to various text mining and language models.

A Comparative study on smoothing techniques for performance improvement of LSTM learning model

  • Tae-Jin, Park;Gab-Sig, Sim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.17-26
    • /
    • 2023
  • 본 연구논문에서는 LSTM 기반의 학습 모델 적용과 그 효용성을 높일 수 있도록 몇 가지 평활 기법을 비교, 적용하고자 한다. 적용된 평활 기법은 Savitky-Golay, 지수 평활법, 가중치 이동 평균 등이다. 본 연구를 통해 비트코인 데이터에 LSTM모델 적용 시 보여준 결과 값보다 전처리 과정에서 적용된 Savitky-Golay 필터가 적용된 LSTM 알고리즘이 예측 성능에 유의미한 좋은 결과를 보였다. 예측 성능 결과를 확인하기 위해 비트코인 가격 예측에 따른 복잡 요인을 제거하는데 사용된 LSTM의 경우와 Savitzky-Golay LSTM 모델에 따른 학습 손실율과 검증 손실율을 비교하고 그 신뢰성을 높일 수 있도록 20회 평균값으로 실험하였다. 그 결과 (3.0556, 0.00005), (1.4659, 0.00002)의 값을 얻을 수 있었다. 결과적으로는 비트코인과 같은 암호화폐가 주식보다 더한 변동성을 가지는 만큼 데이터 전처리 과정에서 평활 기법(Savitzky-Golay)을 적용하여 잡음(Noise)을 제거하였으며, 전처리 후의 데이터는 LSTM 신경망 학습을 통해서 비트코인 예측률을 높이는데 가장 유의미한 결과를 얻을 수 있었다.

The roles of differencing and dimension reduction in machine learning forecasting of employment level using the FRED big data

  • Choi, Ji-Eun;Shin, Dong Wan
    • Communications for Statistical Applications and Methods
    • /
    • 제26권5호
    • /
    • pp.497-506
    • /
    • 2019
  • Forecasting the U.S. employment level is made using machine learning methods of the artificial neural network: deep neural network, long short term memory (LSTM), gated recurrent unit (GRU). We consider the big data of the federal reserve economic data among which 105 important macroeconomic variables chosen by McCracken and Ng (Journal of Business and Economic Statistics, 34, 574-589, 2016) are considered as predictors. We investigate the influence of the two statistical issues of the dimension reduction and time series differencing on the machine learning forecast. An out-of-sample forecast comparison shows that (LSTM, GRU) with differencing performs better than the autoregressive model and the dimension reduction improves long-term forecasts and some short-term forecasts.