• Title/Summary/Keyword: 순환 신경망

Search Result 314, Processing Time 0.029 seconds

Hybrid Document Summarization using a TextRank Algorithm and an Attentive Recurrent Neural Networks (TextRank 알고리즘과 주의 집중 순환 신경망을 이용한 하이브리드 문서 요약)

  • Jeong, Seok-won;Lee, Hyeon-gu;Kim, Harksoo
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.47-50
    • /
    • 2017
  • 문서 요약은 입력 문서가 가진 주제를 유지하면서 크기가 축약된 새로운 문서를 생성하는 것이다. 문서 요약의 방법론은 크게 추출 요약과 추상 요약으로 구분된다. 추출 요약의 경우 결과가 문서 전체를 충분히 대표하지 못하거나 문장들 간의 호응이 떨어지는 문제점이 있다. 최근에는 순환 신경망 구조의 모델을 이용한 추상 요약이 활발히 연구되고 있으나, 이러한 방법은 입력이 길어지는 경우 정보가 누락된다는 문제점을 가지고 있다. 본 논문에서는 이러한 단점들을 해소하기 위해 추출 요약으로 입력 문서의 중요한 일부 문장들을 선별하고 이를 추상 요약의 입력으로 사용했을 때의 성능 변화를 관찰한다. 추출 요약을 통해 원문 대비 30%까지 문서를 요약한 후 요약을 생성했을 때, ROUGE-1 0.2802, ROUGE-2 0.1294, ROUGE-L 0.3254의 성능을 보였다.

  • PDF

Modeling Orientation-Selectivity using Recurrent Neural Networks without Attractors (끌개를 가지지 않는 순환 신경망을 이용한 방위 선택성 모델링)

  • Kim, Hoon-Hee;Ku, Bon-Woong;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.226-229
    • /
    • 2008
  • 방위 선택성(orientation selectivity)은 일차 시각 피질에 존재하는 심플 셀(simple cell)의 중요한 특성이다. 이 특성이 어떻게 구현되는가는 아직까지 정확하게 알려지지 않았다. 대표적인 기존 심플 셀의 이론 모델은 시각 자극의 인자마다 대응되는 끌개(attractor)를 가지는 순환 신경망(recurrent neural networks) 모델이 있다. 하지만 자극을 결정하는 인자의 범위는 무한대이므로 끌개 또한 무한대여야 한다는 문제점을 가지고 있다. 본 연구에서는 끌개를 가지지 않는 순환 신경망 모델을 이용하여 심플 셀의 특성을 보임으로서 기존 Recurrent 모델의 문제점을 해결하고 새로운 연구 방향을 제시하고자 한다.

  • PDF

A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning (심층강화학습에 은닉 상태 정보 활용을 통한 학습 성능 개선에 대한 고찰)

  • Choi, Yohan;Seok, Yeong-Jun;Kim, Ju-Bong;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.528-530
    • /
    • 2022
  • 심층강화학습에 완전 연결 신경망과 합성곱 신경망은 잘 활용되는 것에 반해 순환 신경망은 잘 활용되지 않는다. 이는 강화학습이 마르코프 속성을 전제로 하기 때문이다. 지금까지의 강화학습은 환경이 마르코프 속성을 만족하도록 사전 작업이 필요했다, 본 논문에서는 마르코프 속성을 따르지 않는 환경에서 이러한 사전 작업 없이도 순환 신경망의 은닉 상태를 통해 마르코프 속성을 학습함으로써 학습 성능을 개선할 수 있다는 것을 소개한다.

Earthquake events classification using convolutional recurrent neural network (합성곱 순환 신경망 구조를 이용한 지진 이벤트 분류 기법)

  • Ku, Bonhwa;Kim, Gwantae;Jang, Su;Ko, Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.39 no.6
    • /
    • pp.592-599
    • /
    • 2020
  • This paper proposes a Convolutional Recurrent Neural Net (CRNN) structure that can simultaneously reflect both static and dynamic characteristics of seismic waveforms for various earthquake events classification. Addressing various earthquake events, including not only micro-earthquakes and artificial-earthquakes but also macro-earthquakes, requires both effective feature extraction and a classifier that can discriminate seismic waveform under noisy environment. First, we extract the static characteristics of seismic waveform through an attention-based convolution layer. Then, the extracted feature-map is sequentially injected as input to a multi-input single-output Long Short-Term Memory (LSTM) network structure to extract the dynamic characteristic for various seismic event classifications. Subsequently, we perform earthquake events classification through two fully connected layers and softmax function. Representative experimental results using domestic and foreign earthquake database show that the proposed model provides an effective structure for various earthquake events classification.

Prediction of the Stress-Strain Curve of Materials under Uniaxial Compression by Using LSTM Recurrent Neural Network (LSTM 순환 신경망을 이용한 재료의 단축하중 하에서의 응력-변형률 곡선 예측 연구)

  • Byun, Hoon;Song, Jae-Joon
    • Tunnel and Underground Space
    • /
    • v.28 no.3
    • /
    • pp.277-291
    • /
    • 2018
  • LSTM (Long Short-Term Memory) algorithm which is a kind of recurrent neural network was used to establish a model to predict the stress-strain curve of an material under uniaxial compression. The model was established from the stress-strain data from uniaxial compression tests of silica-gypsum specimens. After training the model, it can predict the behavior of the material up to the failure state by using an early stage of stress-strain curve whose stress is very low. Because the LSTM neural network predict a value by using the previous state of data and proceed forward step by step, a higher error was found at the prediction of higher stress state due to the accumulation of error. However, this model generally predict the stress-strain curve with high accuracy. The accuracy of both LSTM and tangential prediction models increased with increased length of input data, while a difference in performance between them decreased as the amount of input data increased. LSTM model showed relatively superior performance to the tangential prediction when only few input data was given, which enhanced the necessity for application of the model.

Polyphonic sound event detection using multi-channel audio features and gated recurrent neural networks (다채널 오디오 특징값 및 게이트형 순환 신경망을 사용한 다성 사운드 이벤트 검출)

  • Ko, Sang-Sun;Cho, Hye-Seung;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.36 no.4
    • /
    • pp.267-272
    • /
    • 2017
  • In this paper, we propose an effective method of applying multichannel-audio feature values to GRNNs (Gated Recurrent Neural Networks) in polyphonic sound event detection. Real life sounds are often overlapped with each other, so that it is difficult to distinguish them by using a mono-channel audio features. In the proposed method, we tried to improve the performance of polyphonic sound event detection by using multi-channel audio features. In addition, we also tried to improve the performance of polyphonic sound event detection by applying a gated recurrent neural network which is simpler than LSTM (Long Short Term Memory), which shows the highest performance among the current recurrent neural networks. The experimental results show that the proposed method achieves better sound event detection performance than other existing methods.

Mobile Gesture Recognition using Hierarchical Recurrent Neural Network with Bidirectional Long Short-Term Memory (BLSTM 구조의 계층적 순환 신경망을 이용한 모바일 제스처인식)

  • Lee, Myeong-Chun;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.321-323
    • /
    • 2012
  • 스마트폰 사용의 보편화와 센서기술의 발달로 이를 응용하는 다양한 연구가 진행되고 있다. 특히 가속도, GPS, 조도, 방향센서 등의 센서들이 스마트폰에 부착되어 출시되고 있어서, 이를 이용한 상황인지, 행동인식 등의 관련 연구들이 활발하다. 하지만 다양한 클래스를 분류하면서 높은 인식률을 유지하는 것은 어려운 문제이다. 본 논문에서는 인식률 향상을 위해 계층적 구조의 순환 신경망을 이용하여 제스처를 인식한다. 스마트폰의 가속도 센서를 이용하여 사용자의 제스처 데이터를 수집하고 BLSTM(Bidirectional Long Short-Term Memory) 구조의 순환신경망을 계층적으로 사용하여, 20가지 사용자의 제스처와 비제스처를 분류한다. 약 24,850개의 시퀀스 데이터를 사용하여 실험한 결과, 기존 BLSTM은 평균 89.17%의 인식률을 기록한 반면 계층적 BLSTM은 평균 91.11%의 인식률을 나타내었다.

Application Assessment of water level prediction using Artificial Neural Network in Geum river basin (인공신경망을 이용한 금강 유역 하천 수위예측 적용성 평가)

  • Yu, Wansikl;Kim, Sunmin;Kim, Yeonsu;Hwang, Euiho;Jung, Kwansue
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.424-424
    • /
    • 2018
  • 인공신경망(Artificial Neural Network; ANN)은 뇌에 존재하는 생물학적 신경세포와 이들의 신호처리 과정을 수학적으로 묘사하여 뇌가 나타내는 지능적 형태의 반응을 구현한 것이다. 인공신경망은 학습(training)을 통해 입력과 출력으로 구성되는 하나의 시스템을 병렬적이고 비선형적으로 구축할 수 있으며, 유연한 모델링 특성으로 인하여 시스템 예측, 패턴인식, 분류 및 공정제어 등의 다양한 분야에서 활용되고 있다. 인공신경망에 대한 최초의 이론은 Muculloch and Pitts(1943)가 제안한 Perceptron에서 시작 되었으며, 기본적인 학습기법인 오차역전파 기법(back-propagation Algorithm) 이 1980년대에 들어 수학적으로 정립된 이후 여러 분야에서 활용되기 시작하였다). 본 연구에서는 하도추적, 구체적으로는 상류단의 복수의 수위관측을 이용하여 하류단의 수위를 예측하기 위하여 인공신경망 모델을 구성하였다. 대상하도는 금강유역의 용담댐과 대청댐 사이의 본류이며, 상류단 입력자료로써 본류에 있는 수통, 호탄 관측소 관측수위와 지류인 송천 관측소 관측수위를 고려하였다. 출력 값으로는 하류단의 옥천 관측소 수위를 3시간 및 6시간의 선행시간으로 예측하도록 인공신경망 모형을 구성하였다. 인공신경망의 학습(testing), 시험(testing), 검증(validation)을 위해 2000년부터 2012년까지 13년간의 시수위자료를 이용하여 학습을 진행하였으며, 2013년부터 2014년의 2년간의 수위자료를 이용한 시험을 통해 최적의 모형을 선정하였다. 또한 선정된 최적의 모형을 이용하여 2015년부터 2016년까지의 수위예측을 수행하였다.

  • PDF

Predicting Movie Evaluation using Deep LSTM (순환 신경망(LSTM) 이용한 영화 평점 예측)

  • Kang, Kyeongpil;Choo, Jaegul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.591-594
    • /
    • 2016
  • 소비자의 선호도 및 여론을 정량적인 방법으로 분석하기 위해 비정형 데이터의 분석은 필수적인 요소가 되고 있다. 하지만 비정형 데이터는 언어의 구조 및 모호성 등으로 인해 분석하기 어려운 형태이다. 따라서 본 연구는 최근 각광받고 있는 인공신경망, 특히 그 중에서도 순환 신경망의 한 모델인 Deep LSTM을 이용하여 비정형 데이터를 분석하고 이를 활용하여 어순 및 어감 등의 언어의 구조적 문제에도 효과적인 정략적 모델을 설계하여 학습하고 이를 기존의 인공신경망 모델과 비교 분석하고자 한다.

Multi-channel EEG classification method according to music tempo stimuli using 3D convolutional bidirectional gated recurrent neural network (3차원 합성곱 양방향 게이트 순환 신경망을 이용한 음악 템포 자극에 따른 다채널 뇌파 분류 방식)

  • Kim, Min-Soo;Lee, Gi Yong;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.40 no.3
    • /
    • pp.228-233
    • /
    • 2021
  • In this paper, we propose a method to extract and classify features of multi-channel ElectroEncephalo Graphy (EEG) that change according to various musical tempo stimuli. In the proposed method, a 3D convolutional bidirectional gated recurrent neural network extracts spatio-temporal and long time-dependent features from the 3D EEG input representation transformed through the preprocessing. The experimental results show that the proposed tempo stimuli classification method is superior to the existing method and the possibility of constructing a music-based brain-computer interface.