• Title/Summary/Keyword: 순환 신경망

Search Result 314, Processing Time 0.028 seconds

Attention/LIME method to analyze decision process of RNN (Attention과 LIME기법을 활용한 순환신경망의 의사결정 요인 분석)

  • Yoon, Joo-Sung;Park, Jong-Cheol;Ha, Jong-Su;An, Jin-Hyeon;Kim, Hyeon-Cheol
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.253-256
    • /
    • 2017
  • 딥러닝으로 만들어진 모델의 내부는 black box와 같은 특성을 가져 동작 규칙을 알기 어렵다. 최근 기계학습의 발전으로 인공지능이 전보다 더 복잡한 문제를 해결할 수 있으나 위와 같은 이유로, 모델이 내린 판단의 근거를 알기 어렵다. 그러므로 딥러닝의 동작 규칙을 사람이 이해할 수 있는 형식으로 나타내려는 노력이 필요하다. 본 연구에서는 Attention과 LIME 기법을 활용하여 IMDB 데이터를 감성 분석한 순환신경망의 의사결정 요인을 분석하였다. 각 기법을 활용했을 때의 장단점과 실제 구현에 있어 등장하는 문제에 대해 알아보고자 한다.

  • PDF

Emotion Recognition using Various Combinations of Audio Features and Textual Information (음성특징의 다양한 조합과 문장 정보를 이용한 감정인식)

  • Seo, Seunghyun;Lee, Bowon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.137-139
    • /
    • 2019
  • 본 논문은 다양한 음성 특징과 텍스트를 이용한 멀티 모드 순환신경망 네트워크를 사용하여 음성을 통한 범주형(categorical) 분류 방법과 Arousal-Valence(AV) 도메인에서의 분류방법을 통해 감정인식 결과를 제시한다. 본 연구에서는 음성 특징으로는 MFCC, Energy, Velocity, Acceleration, Prosody 및 Mel Spectrogram 등의 다양한 특징들의 조합을 이용하였고 이에 해당하는 텍스트 정보를 순환신경망 기반 네트워크를 통해 융합하여 범주형 분류 방법과 과 AV 도메인에서의 분류 방법을 이용해 감정을 이산적으로 분류하였다. 실험 결과, 음성 특징의 조합으로 MFCC Energy, Velocity, Acceleration 각 13 차원과 35 차원의 Prosody 의 조합을 사용하였을 때 범주형 분류 방법에서는 75%로 다른 특징 조합들 보다 높은 결과를 보였고 AV 도메인 에서도 같은 음성 특징의 조합이 Arousal 55.3%, Valence 53.1%로 각각 가장 높은 결과를 보였다.

  • PDF

Photovoltaic Prediction System based on Recurrent Neural Network (순환신경망 기반 태양광 발전량 예측 시스템)

  • Jung, Seolryung;Park, Kyoungwook;Koh, Jingwang;Lee, Sungkeun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.849-852
    • /
    • 2021
  • 화석연료의 빈번한 사용으로 인한 지구온난화 문제가 심각해지면서 화석연료를 대체할 수 있는 신재생 에너지가 떠오르고 있다. 그중에서도 에너지원이 청정하고 무제한으로 사용할 수 있다는 장점을 가진 태양광 발전소가 주목을 받고 있다. 하지만 기후에 따라 영향을 많이 받는 특징 때문에 안정적인 전력 생산을 위해서는 태양광 발전량 예측이 매우 중요해지고 있다. 본 논문에서는 시계열 데이터에 특화된 순환신경망 기법인 RNN과 LSTM 모델을 이용하여 태양광 발전량을 예측하고 각 모델의 하이퍼 파라미터를 다르게 주어 비교 분석하였다. 그 결과 LSTM 모델이 RNN 모델보다 높은 예측력을 보였고, 손실 값이 0.1보다 낮은 높은 정확도를 보였다.

Mobility Prediction for Paging with RL (강화학습 기반 Paging 의 이동성 예측)

  • Chun, Sungjin;Kim, Bokken;Choo, Hyunseung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.633-636
    • /
    • 2021
  • 4G 에서 5G 로 기술이 발전하며 무선 통신에 필요한 자원이 급격히 증가하고 있다. 증가된 자원을 효율적으로 관리하는 것은 필수적이며 이를 위해 paging cost 감소 연구들이 진행되고 있다. 순환신경망을 응용한 paging cost 감소 연구에서는 연속 예측으로 인해 예측 정확도 감소 문제가 발생한다. 본 논문에서는 강화학습 기반 이동성 예측 기법을 제안하고 기존 순환신경망 응용 기법에서 발생하는 정확도 감소 문제를 극복한다.

Prediction of Particulate Matter AQI using Recurrent Neural Networks (순환 신경망을 이용한 미세먼지 AQI 지수 예측)

  • Jung, Yong-jin;Lee, Jong-sung;Oh, Chang-heon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.543-545
    • /
    • 2019
  • The AQI index has been developed and used to guide the action of particulate matter. Information on the AQI index can be easily provided to the general public, and various services are provided based on the AQI index. As services are provided, accurate AQI index prediction is needed. In this paper, we design the classification model using the circular neural network to predict the AQI index of particulate matter. For the evaluation of the designed model, compare the AQI index of the actual particulate matter with the predicted value.

  • PDF

Joint Model for Dependency Parser and Semantic Role Labeling using Recurrent Neural Network Parallelism (순환 신경망 병렬화를 사용한 의존 구문 분석 및 의미역 결정 통합 모델)

  • Park, Seong Sik;Kim, Hark Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.276-279
    • /
    • 2019
  • 의존 구문 분석은 문장을 구성하는 성분들 간의 의존 관계를 분석하고 문장의 구조적 정보를 얻기 위한 기술이다. 의미역 결정은 문장에서 서술어에 해당하는 어절을 찾고 해당 서술어의 논항들을 찾는 자연어 처리의 한 분야이다. 두 기술은 서로 밀접한 상관관계가 존재하며 기존 연구들은 이 상관관계를 이용하기 위해 의존 구문 분석의 결과를 의미역 결정의 자질로써 사용한다. 그러나 이런 방법은 의미역 결정 모델의 오류가 의존 구문 분석에 역전파 되지 않으므로 두 기술의 상관관계를 효과적으로 사용한다고 보기 어렵다. 본 논문은 포인터 네트워크 기반의 의존 구문 분석 모델과 병렬화 순환 신경망 기반의 의미역 결정 모델을 멀티 태스크 방식으로 학습시키는 통합 모델을 제안한다. 제안 모델은 의존 구문 분석 및 의미역 결정 말뭉치인 UProbBank를 실험에 사용하여 의존 구문 분석에서 UAS 0.9327, 의미역 결정에서 PIC F1 0.9952, AIC F1 0.7312의 성능 보였다.

  • PDF

Text-based Password Guessing Research Trend using Recurrent Neural Networks (순환 신경망을 사용한 텍스트 기반 패스워드 예측 연구 동향)

  • Lim, Se-Jin;Kim, Hyun-Ji;Kang, Yea-Jun;Kim, Won-Woong;Oh, Yu-Jin;Seo, Hwa-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.473-474
    • /
    • 2022
  • 텍스트를 기반으로 하는 패스워드는 다방면에서 가장 많이 사용되고 있는 인증 수단이다. 하지만 이러한 패스워드는 사용자의 기억에 의존하기 때문에 사람들은 일반적으로 기억하기 쉽게 '!iloveY0u'와 같은 암호를 사용한다. 이로 인해 사용자들의 패스워드 간에 규칙성이 생기게 되어 HashCat과 같은 크래킹 도구에 의해 해킹될 수 있다. 딥러닝을 통한 패스워드 예측의 경우, 일반적인 패스워드 크래킹 도구와 달리 패스워드 구조 및 속성에 대한 사전 지식 및 전문적 지식 없이도 패턴을 추출하고 학습할 수 있어 활발히 연구되고 있다. 본 논문에서는 딥러닝 모델 중에서도 순환 신경망을 사용하여 텍스트 기반의 패스워드를 예측하는 연구의 동향에 대해 알아본다.

Knowledge Embedding Method for Implementing a Generative Question-Answering Chat System (생성 기반 질의응답 채팅 시스템 구현을 위한 지식 임베딩 방법)

  • Kim, Sihyung;Lee, Hyeon-gu;Kim, Harksoo
    • Journal of KIISE
    • /
    • v.45 no.2
    • /
    • pp.134-140
    • /
    • 2018
  • A chat system is a computer program that understands user's miscellaneous utterances and generates appropriate responses. Sometimes a chat system needs to answer users' simple information-seeking questions. However, previous generative chat systems do not consider how to embed knowledge entities (i.e., subjects and objects in triple knowledge), essential elements for question-answering. The previous chat models have a disadvantage that they generate same responses although knowledge entities in users' utterances are changed. To alleviate this problem, we propose a knowledge entity embedding method for improving question-answering accuracies of a generative chat system. The proposed method uses a Siamese recurrent neural network for embedding knowledge entities and their synonyms. For experiments, we implemented a sequence-to-sequence model in which subjects and predicates are encoded and objects are decoded. The proposed embedding method showed 12.48% higher accuracies than the conventional embedding method based on a convolutional neural network.

A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge (시계열 자료의 예측을 위한 자료 기반 신경망 모델에 관한 연구: 한강대교 수위예측 적용)

  • Yoo, Hyungju;Lee, Seung Oh;Choi, Seohye;Park, Moonhyung
    • Journal of Korean Society of Disaster and Security
    • /
    • v.12 no.2
    • /
    • pp.73-82
    • /
    • 2019
  • Recently, as the occurrence frequency of sudden floods due to climate change increased, the flood damage on riverside social infrastructures was extended so that there has been a threat of overflow. Therefore, a rapid prediction of potential flooding in riverside social infrastructure is necessary for administrators. However, most current flood forecasting models including hydraulic model have limitations which are the high accuracy of numerical results but longer simulation time. To alleviate such limitation, data driven models using artificial neural network have been widely used. However, there is a limitation that the existing models can not consider the time-series parameters. In this study the water surface elevation of the Hangang River bridge was predicted using the NARX model considering the time-series parameter. And the results of the ANN and RNN models are compared with the NARX model to determine the suitability of NARX model. Using the 10-year hydrological data from 2009 to 2018, 70% of the hydrological data were used for learning and 15% was used for testing and evaluation respectively. As a result of predicting the water surface elevation after 3 hours from the Hangang River bridge in 2018, the ANN, RNN and NARX models for RMSE were 0.20 m, 0.11 m, and 0.09 m, respectively, and 0.12 m, 0.06 m, and 0.05 m for MAE, and 1.56 m, 0.55 m and 0.10 m for peak errors respectively. By analyzing the error of the prediction results considering the time-series parameters, the NARX model is most suitable for predicting water surface elevation. This is because the NARX model can learn the trend of the time series data and also can derive the accurate prediction value even in the high water surface elevation prediction by using the hyperbolic tangent and Rectified Linear Unit function as an activation function. However, the NARX model has a limit to generate a vanishing gradient as the sequence length becomes longer. In the future, the accuracy of the water surface elevation prediction will be examined by using the LSTM model.