• 제목/요약/키워드: Long Short Term Memory (LSTM)

검색결과 495건 처리시간 0.035초

양방향 LSTM기반 시계열 특허 동향 예측 연구 (A patent application filing forecasting method based on the bidirectional LSTM)

  • 최승완;김광수;곽수영
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.545-552
    • /
    • 2022
  • 특정 분야의 특허출원수는 기술의 수명주기 및 산업의 활성화 정도와 밀접한 관계를 가지고 있다. 따라서 사전에 사업을 준비하는 기업들과 미래 유망 기술을 초기 단계에서 선발하여 투자하고자 하는 정부 기관들은 미래의 특허 출원수 예측에 대해 큰 관심을 가지고 있다. 본 논문에서는 시계열 데이터에 적합한 RNN의 기법 중 하나인 양방향 LSTM 기법을 이용하여 기존 예측 방법들보다 정확도를 높이는 방법을 제안한다. 5개 분야의 대한민국 특허 출원 데이터에 대해서 제안된 방법은 기존에 사용되던 확산 모델 중 하나인 Bass 모델과 비교하여 평균 절대 백분율 오차(MAPE)의 값이 약 16퍼센트 향상된 결과를 보여준다.

LSTM을 이용한 상수관망 내 실시간 유량 및 수질 데이터 예측 (Estimation of real-time data in water distribution systems using LSTM)

  • 조은영;최선홍;장동우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.463-463
    • /
    • 2023
  • 국내 수도관 보급률이 증가하면서 기존 노후화된 수도관들과 추가로 노후화된 수도관들이 증가하고 있다. 경과년수가 오래된 시설이 증가하는 것은 잠재적인 사고발생 위험을 증가시킨다. 실제 노후화된 상수도 시설물로 인해 단수, 누수, 수질오염, 지반함몰 발생이 증가하는 추세이다. 이러한 현상들은 시민들의 생활과 안전, 경제활동에 직접적인 영향을 끼치기 때문에 이에 대한 대책 마련이 시급한 상태이다. 본 연구에서는 AI를 기반으로 상수도관의 노후도 및 위험도를 예측하는 모델을 설계하고자 하였다. 대상지역을 인천광역시 서구로 선정하여 유량과 수질의 실시간 계측데이터를 수집하였다. 딥러닝 기법 중 하나인 LSTM(Long Short-Term Memory)을 이용하여 데이터를 예측하였고, 결정계수(R2)와 RMSE(Root Mean Square Error)로 학습데이터와 검증데이터의 비율을 정하여 예측도를 평가하였다. 유량과 수질 데이터 중 80%는 학습데이터로 20%는 검증 데이터로 분리하였고, LSTM의 셀과레이어 수를 해석에 적합한 범위로 설정한 결과, 실제값과 예측값이 높은 상관성을 보이는 것으로 나타났다. 예측된 유량 및 수질의 결과는 상수도 관리에 중요한 정보를 제공하며, 사고 위험도 평가와 관 노후화에 따른 대응력을 향상시키는 데 도움이 될 것으로 판단된다.

  • PDF

강우유출 분석을 위한 수문 모형과 딥러닝 기법의 비교 분석 (Comparison of hydrologic models and deep learning techniques for rainfall-runoff analysis)

  • 김진혁;김초롱;김충수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.295-295
    • /
    • 2021
  • 수자원 관리 및 계획 수립에 있어 강우 유출 분석은 가장 중요하며, 기본적인 분석이다. 기존의 강우 유출 분석은 일반적으로 수문 모형을 이용한다. 강우 유출 분석은 강수와 증발산 과정, 즉 물순환에 있어 복잡한 상호 작용을 고려해야한다. 본 연구에서는 기존의 수문 모형과 데이터간의 관계를 포착할 수 있는 딥러닝 기법을 이용한 강우 유출분석 수행하였다. 우리나라의 유역 중, 비교적 풍부한 수문데이터를 보유하고 있는 IHP (International Hydrological Program)의 청미천 유역을 연구대상지역으로 연구를 수행하였다. 수문 모형으로는 SWAT (Soil and Water Assessment Tool)을 이용하였으며, 딥러닝 기법은 시계열 분석에 있어 주로 사용되는 RNN(Recurrent Neural Network) 중 LSTM (Long Short-Term Memory) 네트워크를 이용하였다. 분석결과 수문 모형의 성능 지표인 상관계수와 NSE (Nash-Sutcliffe Efficiency)는 LSTM 네트워크에서 더 높은 성능을 확인 할 수 있었다. 일반적으로 LSTM 네트워크는 보정 기간이 길수록 더욱 좋은 성능을 나타낸다. 즉, 과거 수문데이터가 충분히 확보된 유역에서 LSTM 네트워크와 같은 데이터 기반 모델은 다양한 지형 및 기상데이터를 필요하는 수문 모델보다 유용할 것이라 사료된다.

  • PDF

수신된 전파신호의 자동 변조 인식을 위한 딥러닝 방법론 (A deep learning method for the automatic modulation recognition of received radio signals)

  • 김한진;김혁진;제준호;김경섭
    • 한국정보통신학회논문지
    • /
    • 제23권10호
    • /
    • pp.1275-1281
    • /
    • 2019
  • 무선 신호의 자동 변조 인식은 지능형 수신기의 주요한 작업으로 다양한 민간 및 군대 응용분야가 있다. 본 논문에서는 딥 뉴럴 네트워크 모델을 기반한 무선통신에서 전파신호의 변조 방식을 식별하는 방법을 제안한다. 순차적인 데이터에 대해 장기적인 패턴을 잡아내는데 용이한 LSTM 모델을 통과하여 얻은 연속적인 신호의 특징값을 딥 뉴럴 네트워크의 입력 데이터로 사용하여 신호의 변조 패턴을 분류한다. 변조된 신호의 진폭 및 위상, 동상(In-phase) 반송파, 직각 위상(Quadrature-phase) 반송파의 값을 LSTM 모델의 입력 데이터로 사용하여 분류한다. 제안된 학습 방법의 성능을 검증하기 위해, 다양한 신호 대 잡음비로 10 가지 유형의 변조 신호를 포함하는 대형 데이터 세트를 사용하여 학습하고 테스트한다. 본 논문의 변조 인식 프로그램은 신호의 사전 정보가 없는 환경에서 변조방식을 예측하는데 적용될 수 있다.

LSTM 기반의 sequence-to-sequence 모델을 이용한 한글 자동 띄어쓰기 (LSTM based sequence-to-sequence Model for Korean Automatic Word-spacing)

  • 이태석;강승식
    • 스마트미디어저널
    • /
    • 제7권4호
    • /
    • pp.17-23
    • /
    • 2018
  • 자동 띄어쓰기 특성을 효과적으로 처리할 수 있는 LSTM(Long Short-Term Memory Neural Networks) 기반의 RNN 모델을 제시하고 적용한 결과를 분석하였다. 문장이 길거나 일부 노이즈가 포함된 경우에 신경망 학습이 쉽지 않은 문제를 해결하기 위하여 입력 데이터 형식과 디코딩 데이터 형식을 정의하고, 신경망 학습에서 드롭아웃, 양방향 다층 LSTM 셀, 계층 정규화 기법, 주목 기법(attention mechanism)을 적용하여 성능을 향상시키는 방법을 제안하였다. 학습 데이터로는 세종 말뭉치 자료를 사용하였으며, 학습 데이터가 부분적으로 불완전한 띄어쓰기가 포함되어 있었음에도 불구하고, 대량의 학습 데이터를 통해 한글 띄어쓰기에 대한 패턴이 의미 있게 학습되었다. 이것은 신경망에서 드롭아웃 기법을 통해 학습 모델의 오버피팅이 되지 않도록 함으로써 노이즈에 강한 모델을 만들었기 때문이다. 실험결과로 LSTM sequence-to-sequence 모델이 재현율과 정확도를 함께 고려한 평가 점수인 F1 값이 0.94로 규칙 기반 방식과 딥러닝 GRU-CRF보다 더 높은 성능을 보였다.

Video Representation via Fusion of Static and Motion Features Applied to Human Activity Recognition

  • Arif, Sheeraz;Wang, Jing;Fei, Zesong;Hussain, Fida
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권7호
    • /
    • pp.3599-3619
    • /
    • 2019
  • In human activity recognition system both static and motion information play crucial role for efficient and competitive results. Most of the existing methods are insufficient to extract video features and unable to investigate the level of contribution of both (Static and Motion) components. Our work highlights this problem and proposes Static-Motion fused features descriptor (SMFD), which intelligently leverages both static and motion features in the form of descriptor. First, static features are learned by two-stream 3D convolutional neural network. Second, trajectories are extracted by tracking key points and only those trajectories have been selected which are located in central region of the original video frame in order to to reduce irrelevant background trajectories as well computational complexity. Then, shape and motion descriptors are obtained along with key points by using SIFT flow. Next, cholesky transformation is introduced to fuse static and motion feature vectors to guarantee the equal contribution of all descriptors. Finally, Long Short-Term Memory (LSTM) network is utilized to discover long-term temporal dependencies and final prediction. To confirm the effectiveness of the proposed approach, extensive experiments have been conducted on three well-known datasets i.e. UCF101, HMDB51 and YouTube. Findings shows that the resulting recognition system is on par with state-of-the-art methods.

다변수 Bidirectional RNN을 이용한 표층수온 결측 데이터 보간 (Imputation of Missing SST Observation Data Using Multivariate Bidirectional RNN)

  • 신용탁;김동훈;김현재;임채욱;우승범
    • 한국해안·해양공학회논문집
    • /
    • 제34권4호
    • /
    • pp.109-118
    • /
    • 2022
  • 정점 표층 수온 관측 데이터 중 결측 구간의 데이터를 양방향 순환신경망(Bidirectional Recurrent Neural Network, BiRNN) 기법을 이용하여 보간하였다. 인공지능 기법 중 시계열 데이터에 일반적으로 활용되는 Recurrent Neural Networks(RNNs)은 결측 추정 위치까지의 시간 흐름 방향 또는 역방향으로만 추정하기 때문에 장기 결측 구간에는 추정 성능이 떨어진다. 반면, 본 연구에서는 결측 구간 전후의 양방향으로 추정을 하여 장기 결측 데이터에 대해서도 추정 성능을 높일 수 있다. 또한 관측점 주위의 가용한 모든 데이터(수온, 기온, 바람장, 기압, 습도)를 사용함으로써, 이들 상관관계로부터 보간 데이터를 함께 추정하도록 하여 보간 성능을 더욱 높이고자 하였다. 성능 검증을 위하여 통계 기반 모델인 Multivariate Imputation by Chained Equations(MICE)와 기계학습 기반의 Random Forest 모델, 그리고 Long Short-Term Memory(LSTM)을 이용한 RNN 모델과 비교하였다. 7일간의 장기 결측에 대한 보간에 대해서 BiRNN/통계 모델들의 평균 정확도가 각각 70.8%/61.2%이며 평균 오차가 각각 0.28도/0.44도로 BiRNN 모델이 다른 모델보다 좋은 성능을 보인다. 결측 패턴을 나타내는 temporal decay factor를 적용함으로써 BiRNN 기법이 결측 구간이 길어질수록 보간 성능이 기존 방법보다 우수한 것으로 판단된다.

한국어 의존 구문 분석을 위한 개선된 Deep Biaffine Attention (Improved Deep Biaffine Attention for Korean Dependency Parsing)

  • 오동석;우종성;이병우;김경선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.608-610
    • /
    • 2018
  • 한국어 의존 구문 분석(Dependency Parsing)은 문장 어절의 중심어(head)와 수식어(modifier)의 의존관계를 표현하는 자연어 분석 방법이다. 최근에는 이러한 의존 관계를 표현하기 위해 주의 집중 메커니즘(Attention Mechanism)과 LSTM(Long Short Term Memory)을 결합한 모델들이 높은 성능을 보이고 있다. 본 논문에서는 개선된 Biaffine Attention 의존 구문 분석 모델을 제안한다. 제안된 모델은 기존의 Biaffine Attention에서 의존성과 의존 관계를 결정하는 방법을 개선하였고, 한국어 의존 구문 분석을 위한 입력 열의 형태소 표상을 확장함으로써 기존의 모델보다 UAS(Unlabeled Attachment Score)가 0.15%p 더 높은 성능을 보였다.

  • PDF

장단기 기억 신경망과 공간적 순환 신경망을 이용한 배경차분 (Background subtraction using LSTM and spatial recurrent neural network)

  • 추성권;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.13-16
    • /
    • 2016
  • 본 논문에서는 순환 신경망을 이용하여 동영상에서의 배경과 전경을 구분하는 알고리즘을 제안한다. 순환 신경망은 일련의 순차적인 입력에 대해서 내부의 루프(loop)를 통해 이전 입력에 의한 정보를 지속할 수 있도록 구성되는 신경망을 말한다. 순환 신경망의 여러 구조들 가운데, 우리는 장기적인 관계에도 반응할 수 있도록 장단기 기억 신경망(Long short-term memory networks, LSTM)을 사용했다. 그리고 동영상에서의 시간적인 연결 뿐 아니라 공간적인 연관성도 배경과 전경을 판단하는 것에 영향을 미치기 때문에, 공간적 순환 신경망을 적용하여 내부 신경망(hidden layer)들의 정보가 공간적으로 전달될 수 있도록 신경망을 구성하였다. 제안하는 알고리즘은 기본적인 배경차분 동영상에 대해 기존 알고리즘들과 비교할만한 결과를 보인다.

  • PDF

Neural Model for Named Entity Recognition Considering Aligned Representation

  • Sun, Hongyang;Kim, Taewhan
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.613-616
    • /
    • 2018
  • Sequence tagging is an important task in Natural Language Processing (NLP), in which the Named Entity Recognition (NER) is the key issue. So far the most widely adopted model for NER in NLP is that of combining the neural network of bidirectional long short-term memory (BiLSTM) and the statistical sequence prediction method of Conditional Random Field (CRF). In this work, we improve the prediction accuracy of the BiLSTM by supporting an aligned word representation mechanism. We have performed experiments on multilingual (English, Spanish and Dutch) datasets and confirmed that our proposed model outperformed the existing state-of-the-art models.