• 제목/요약/키워드: Recurrent neural networks

검색결과 289건 처리시간 0.029초

수문모형과 기계학습을 연계한 실시간 하천홍수 예측 (Linkage of Hydrological Model and Machine Learning for Real-time Prediction of River Flood)

  • 이재영;김현일;한건연
    • 대한토목학회논문집
    • /
    • 제40권3호
    • /
    • pp.303-314
    • /
    • 2020
  • 수자원분야에서 이용되는 강우에 따른 유역의 수문학적 시스템, 도시지역 및 하천에 대한 수리학적 시스템은 비선형성이 강하고 많은 변수들을 포함하고 있다. 이러한 특성을 가진 시계열 자료에서 기계학습을 통한 예측은 예측시점 이전의 자료 특성을 반영하지 못하는 등 기본적인 신경망으로는 부족한 상황이 발생하기도 한다. 본 연구에서 적용할 강우-유출량과 같이 비선형성이 강하고 시간종속성이 높은 복잡한 시계열 자료를 예측하기 위해 신경망의 학습능력을 극대화한 순환형 동적 신경망(Recurrent Dynamic Neural Network)의 한 종류인 동시에, 시간 지연 신경망(Time-Delay Neural Network)의 특성을 가진 비선형 자기회귀(NARX, Nonlinear Autoregressive Exogenous Model) 인공신경망을 사용하였다. 이를 태화강 지방하천 구간에 적용하여 NARX 인공신경망의 시간 지연 매개변수를 10분에서 120분까지 조정하며 모의한 결과에 대해 여러 통계지표를 이용해 정량적으로 평가하였다. 그 결과 지연시간이 증가할수록 효율계수(NSE)가 0.530에서 0.988으로 증가하고, 평균제곱근편차(RMSE)가 379.9 ㎥/s에서 16.1 ㎥/s로 감소하는 등 정교한 예측이 가능함을 확인하였다.

숫자 기호화를 통한 신경기계번역 성능 향상 (Symbolizing Numbers to Improve Neural Machine Translation)

  • 강청웅;노영헌;김지수;최희열
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1161-1167
    • /
    • 2018
  • 기계 학습의 발전은 인간만이 할 수 있었던 섬세한 작업들을 기계가 할 수 있도록 이끌었고, 이에 따라 많은 기업체들은 기계 학습 기반의 번역기를 출시하였다. 현재 상용화된 번역기들은 우수한 성능을 보이지만 숫자 번역에서 문제가 발생하는 것을 발견했다. 번역기들은번역할문장에 큰숫자가 있을경우종종숫자를잘못번역하며, 같은문장에서숫자만바꿔번역할 때문장의구조를 완전히바꾸어 번역하기도 한다. 이러한 문제점은오번역의 가능성을 높이기 때문에해결해야 될 사안으로여겨진다. 본 논문에서는 Bidirectional RNN (Recurrent Neural Network), LSTM (Long Short Term Memory networks), Attention mechanism을 적용한 Neural Machine Translation 모델을 사용하여 데이터 클렌징, 사전 크기 변경을 통한 모델 최적화를 진행 하였고, 최적화된 모델에 숫자 기호화 알고리즘을 적용하여 상기 문제점을 해결하는 번역 시스템을 구현하였다. 본논문은 데이터 클렌징 방법과 사전 크기 변경, 그리고 숫자 기호화 알고리즘에 대해 서술하였으며, BLEU score (Bilingual Evaluation Understudy score) 를 이용하여 각 모델의 성능을 비교하였다.

LSTM 언어모델 기반 한국어 문장 생성 (LSTM Language Model Based Korean Sentence Generation)

  • 김양훈;황용근;강태관;정교민
    • 한국통신학회논문지
    • /
    • 제41권5호
    • /
    • pp.592-601
    • /
    • 2016
  • 순환신경망은 순차적이거나 길이가 가변적인 데이터에 적합한 딥러닝 모델이다. LSTM은 순환신경망에서 나타나는 기울기 소멸문제를 해결함으로써 시퀀스 구성 요소간의 장기의존성을 유지 할 수 있다. 본 논문에서는 LSTM에 기반한 언어모델을 구성하여, 불완전한 한국어 문장이 입력으로 주어졌을 때 뒤 이어 나올 단어들을 예측하여 완전한 문장을 생성할 수 있는 방법을 제안한다. 제안된 방법을 평가하기 위해 여러 한국어 말뭉치를 이용하여 모델을 학습한 다음, 한국어 문장의 불완전한 부분을 생성하는 실험을 진행하였다. 실험 결과, 제시된 언어모델이 자연스러운 한국어 문장을 생성해 낼 수 있음을 확인하였다. 또한 문장 최소 단위를 어절로 설정한 모델이 다른 모델보다 문장 생성에서 더 우수한 결과를 보임을 밝혔다.

인공지능 기반 전력량예측 기법의 비교 (Comparison of Power Consumption Prediction Scheme Based on Artificial Intelligence)

  • 이동구;선영규;김수현;심이삭;황유민;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.161-167
    • /
    • 2019
  • 최근 안정적인 전력수급과 급증하는 전력수요를 예측하는 수요예측 기술에 대한 관심과 실시간 전력측정을 가능하게 하는 스마트 미터기의 보급의 증대로 인해 수요예측 기법에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 실제 측정된 가정의 전력 사용량 데이터를 학습하여 예측결과를 출력하는 딥 러닝 예측모델 실험을 진행한다. 그리고 본 연구에서는 데이터 전처리 기법으로써 이동평균법을 도입하였다. 실제로 측정된 데이터를 학습한 모델의 예측량과 실제 전력 측정량을 비교한다. 이 예측량을 통해서 전력공급 예비율을 낮춰 사용되지 않고 낭비되는 예비전력을 줄일 수 있는 가능성을 제시한다. 또한 본 논문에서는 같은 데이터, 같은 실험 파라미터를 토대로 세 종류의 기법: 다층퍼셉트론(Multi Layer Perceptron, MLP), 순환신경망(Recurrent Neural Network, RNN), Long Short Term Memory(LSTM)에 대해 실험을 진행하여 성능을 평가한다. 성능평가는 MSE(Mean Squared Error), MAE(Mean Absolute Error)의 기준으로 성능평가를 진행했다.

청각장애인을 위한 사운드 이벤트 검출 기반 홈 모니터링 시스템 (Home monitoring system based on sound event detection for the hard-of-hearing)

  • 김지연;신승수;김형국
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.427-432
    • /
    • 2019
  • 본 논문에서는 청각장애인을 위해 양방향 게이트 순환 신경망을 이용한 사운드 이벤트 검출 기반의 홈 모니터링 시스템을 제안한다. 제안된 시스템에서는 우선적으로 효과적인 사운드 이벤트 검출을 위해 패킷손실 은닉을 이용하여 무선 센서 네트워크로 인해 손실된 신호를 복원하고, 멀티채널 상호 상관관계 계수를 이용하여 신뢰할 수 있는 채널을 선택한다. 선택된 채널의 사운드는 이벤트 검출을 위해 두 개의 오디오 채널을 사용하는 양방향 게이트 순환신경망에 적용된다. 검출된 사운드 이벤트는 텍스트로 변환되며, 이와 함께 하모닉/퍼커시브 음원 분리 방식을 통해 햅틱 신호로 변환되어 청각장애인에게 제공된다. 실험결과는 제안한 사운드 검출기반의 성능이 기존 방식보다 더 우수하다는 것과 음원 분리 방식을 통해 사운드를 세밀한 햅틱 신호로 표현할 수 있음을 보인다.

가속도 예측 기반 새로운 선박 이동 경로 예측 방법 (A New Vessel Path Prediction Method Based on Anticipation of Acceleration of Vessel)

  • 김종희;정찬호;강도근;이창진
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1176-1179
    • /
    • 2020
  • 선박의 이동 경로를 예측하는 기존의 방법들은 일반적으로 위도와 경도를 직접 예측한다. 하지만, 위도와 경도를 직접 예측할 경우, 예측 모델이 출력 가능한 범위가 상당히 넓어서 예측 오차가 매우 크게 발생할 수 있다. 또한, 순환 신경망 모델 기반의 예측에서는 이전 예측 위치도 다음 위치를 예측하기 위해 사용되기 때문에 오차가 누적되는 현상도 쉽게 발생할 수 있다. 이에 따라, 제안하는 방법에서는 위도와 경도를 직접 예측하지 않고, 선박의 가속도를 예측하여, 향후 속도와 방향을 결정하고, 그 결과로 위도와 경도가 예측되는 방법을 제안한다. 실험 결과에서는 같은 순환 신경망 모델을 사용했을 때, 제안하는 방법이 기존의 직접적으로 위도와 경도를 예측하는 방법에 비해 더 적은 오차를 발생시킴을 보인다.

Malware Detection Using Deep Recurrent Neural Networks with no Random Initialization

  • Amir Namavar Jahromi;Sattar Hashemi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.177-189
    • /
    • 2023
  • Malware detection is an increasingly important operational focus in cyber security, particularly given the fast pace of such threats (e.g., new malware variants introduced every day). There has been great interest in exploring the use of machine learning techniques in automating and enhancing the effectiveness of malware detection and analysis. In this paper, we present a deep recurrent neural network solution as a stacked Long Short-Term Memory (LSTM) with a pre-training as a regularization method to avoid random network initialization. In our proposal, we use global and short dependencies of the inputs. With pre-training, we avoid random initialization and are able to improve the accuracy and robustness of malware threat hunting. The proposed method speeds up the convergence (in comparison to stacked LSTM) by reducing the length of malware OpCode or bytecode sequences. Hence, the complexity of our final method is reduced. This leads to better accuracy, higher Mattews Correlation Coefficients (MCC), and Area Under the Curve (AUC) in comparison to a standard LSTM with similar detection time. Our proposed method can be applied in real-time malware threat hunting, particularly for safety critical systems such as eHealth or Internet of Military of Things where poor convergence of the model could lead to catastrophic consequences. We evaluate the effectiveness of our proposed method on Windows, Ransomware, Internet of Things (IoT), and Android malware datasets using both static and dynamic analysis. For the IoT malware detection, we also present a comparative summary of the performance on an IoT-specific dataset of our proposed method and the standard stacked LSTM method. More specifically, of our proposed method achieves an accuracy of 99.1% in detecting IoT malware samples, with AUC of 0.985, and MCC of 0.95; thus, outperforming standard LSTM based methods in these key metrics.

정수장에서의 에너지 관리를 위한 AI 기반 복합센서 적용 연구 (AI based complex sensor application study for energy management in WTP)

  • 홍성택;안상병;김국;성민석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.322-323
    • /
    • 2022
  • 정수장의 최적화 운영을 위하여 가장 필요한 것은 수용가에서 사용되는 수돗물의 패턴과 양을 정확하게 예측하여 필요한 만큼의 수돗물을 펌프를 이용하여 배수지로 전달하여 저장하고, 필요한 유량이 최소의 전기에너지를 이용하여 적기에 공급되어야 한다. 정수장의 수량 예측 중 에너지 최적화 운영의 관점에서 필요한 단기 수요예측은 시계열 분석, 회귀분석 및 신경망 알고리즘을 이용하여 계절별, 주요 기간별, 지역 특성별 등을 고려하여 이루어져 왔으며, 본 논문에서는 순환적 신경회로망의 일종인 LSTM(Long Short-Term Memory), GRU(Gated Recurrent Units) 등의 AI 기반 복합센서 적용성 분석을 통한 에너지 관리 방안에 대하여 분석하였다.

  • PDF

군집 별 표준곡선 매개변수를 이용한 치밀오일 생산성 예측 순환신경망 모델 (Recurrent Neural Network Model for Predicting Tight Oil Productivity Using Type Curve Parameters for Each Cluster)

  • 한동권;김민수;권순일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.297-299
    • /
    • 2021
  • 치밀오일 미래 생산성 예측은 잔류오일 회수량 및 저류층 거동 분석을 위해 중요한 작업이다. 일반적으로 석유공학적 관점에서 감퇴곡선법을 이용하여 생산성 예측이 이루어지는데, 최근에는 데이터기반의 머신러닝 기법을 이용한 연구도 수행되고 있다. 본 연구에서는 딥러닝 기반 순환신경망과 LSTM, GRU 알고리즘을 이용하여 미래 생산량 예측을 위한 효과적인 모델을 제안하고자 한다. 입력변수로는 치밀오일 생산 시 산출되는 오일, 가스, 물과 이와 더불어 다양한 군집분석을 통해 산출된 표준곡선이 주요 매개변수이고, 출력변수는 월별 오일 생산량이다. 기존의 경험적 모델인 감퇴곡선법과 순환신경망 모델들을 비교하였으며, 모델의 예측성능을 향상시키기 위해 하이퍼파라미터 튜닝을 통해 최적 모델을 도출하였다.

  • PDF

Application of Informer for time-series NO2 prediction

  • Hye Yeon Sin;Minchul Kang;Joonsung Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.11-18
    • /
    • 2023
  • 본 논문에서는 딥러닝 시계열 예측 모형을 평가한다. 최근 연구에 따르면 이 모형은 ARIMA와 같은 기존 예측 모형보다 성능이 우수하다고 결론짓는다. 그 중 히든 레이어에 이전 정보를 저장하는 순환 신경망이 이를 위한 예측 모형 중 하나이다. 네트워크의 그래디언트 소실 문제를 해결하기 위해 LSTM은 데이터 흐름의 반대 방향으로 숨겨진 레이어가 추가되는 BI-LSTM과 함께 순환 신경망 내부의 작은 메모리로 사용된다. 본 논문은 서울의 2018년 1월 1일부터 2022년도 1월 1일까지의 NO2 자료에 대해 Informer의 성능을 LSTM, BI-LSTM, Transformer와 비교하였다. 이에 실제 값과 예측값 사이의 평균 제곱근 오차와 평균 절대 오차를 구하였다. 그 결과 Test 데이터(2021.09.01.~2022.01.01.)에 대해 Informer는 다른 방법에 비해 가장 높은 예측 정확도 (가장 낮은 예측 오차: 평균 제곱근 오차: 0.0167, 평균 절대 오차: 0.0138)를 보여 타 방법에 비해 그 우수성을 입증하였다. Informer는 당초 취지와 부합되게 다른 방법들이 갖고 있는 장기 시계열 예측에 있어서의 문제점을 개선하는 결과를 나타내고 있다.