• 제목/요약/키워드: long-term memory

검색결과 782건 처리시간 0.035초

딥러닝의 모형과 응용사례 (Deep Learning Architectures and Applications)

  • 안성만
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.127-142
    • /
    • 2016
  • 딥러닝은 인공신경망(neural network)이라는 인공지능분야의 모형이 발전된 형태로서, 계층구조로 이루어진 인공신경망의 내부계층(hidden layer)이 여러 단계로 이루어진 구조이다. 딥러닝에서의 주요 모형은 합성곱신경망(convolutional neural network), 순환신경망(recurrent neural network), 그리고 심층신뢰신경망(deep belief network)의 세가지라고 할 수 있다. 그 중에서 현재 흥미로운 연구가 많이 발표되어서 관심이 집중되고 있는 모형은 지도학습(supervised learning)모형인 처음 두 개의 모형이다. 따라서 본 논문에서는 지도학습모형의 가중치를 최적화하는 기본적인 방법인 오류역전파 알고리즘을 살펴본 뒤에 합성곱신경망과 순환신경망의 구조와 응용사례 등을 살펴보고자 한다. 본문에서 다루지 않은 모형인 심층신뢰신경망은 아직까지는 합성곱신경망 이나 순환신경망보다는 상대적으로 주목을 덜 받고 있다. 그러나 심층신뢰신경망은 CNN이나 RNN과는 달리 비지도학습(unsupervised learning)모형이며, 사람이나 동물은 관찰을 통해서 스스로 학습한다는 점에서 궁극적으로는 비지도학습모형이 더 많이 연구되어야 할 주제가 될 것이다.

치매 환자를 위한 딥러닝 기반 이상 행동 탐지 시스템 (Deep Learning-based Abnormal Behavior Detection System for Dementia Patients)

  • 김국진;이승진;김성중;김재근;신동일;신동규
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.133-144
    • /
    • 2020
  • 고령화로 인해 증가하는 노인 비율만큼이나 치매를 앓는 노인 수 또한 빠르게 늘고 있는데 이는 사회적, 경제적 부담을 발생시킨다. 특히, 간병인의 근무 시간 손실 및 간호 부담으로 인한 의료 비용 증가와 같은 간접비용을 포함하는 치매 관리 비용은 수년에 걸쳐 기하급수적으로 증가하고 있다. 이러한 비용을 줄이기 위해 치매 환자를 돌보기 위한 관리 시스템 도입이 시급하다. 따라서 본 연구는 항상 치매 환자를 돌볼 수 없는 환경이나 독거노인을 관리하기 위한 센서 기반 이상 행동 탐지 시스템을 제안한다. 기존 연구들은 단지 행동을 인지하거나 정상 행동 여부를 평가하는 정도였고 센서로부터 받은 데이터가 아닌 이미지를 처리하여 행동을 인지한 연구도 있었다. 본 연구에서는 실데이터 수집에 한계가 있음을 인지하여 비지도 학습 모델인 오토인코더와 지도 학습 모델인 장·단기 기억 모형을 동시에 사용했다. 비지도 학습 모델인 오토인코더는 정상 행동 데이터를 학습하여 정상적인 행동에 대한 패턴을 학습시켰고 장·단기 기억 모형은 센서로 인지 가능한 행동을 학습시켜 분류를 좀 더 세분화했다. 테스트 결과 각각의 모델은 약 96%, 98% 이상의 정확도를 도출하였고 오토인코더의 이상치가 3% 이상을 갖는 경우 장·단기 기억 모형을 통과하도록 설계했다. 이 시스템을 통해 혼자 사는 노인이나 치매 환자를 효율적으로 관리할 수 있으며 돌보기 위한 비용 또한 절감할 수 있을 것으로 전망된다.

기술 용어에 대한 한국어 정의 문장 자동 생성을 위한 순환 신경망 모델 활용 연구 (Research on the Utilization of Recurrent Neural Networks for Automatic Generation of Korean Definitional Sentences of Technical Terms)

  • 최가람;김한국;김광훈;김유일;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.99-120
    • /
    • 2017
  • 본 논문에서는 지속적으로 커져가는 산업 시장에 대해 관련 연구자들이 이를 효율적으로 분석할 수 있는 반자동 지원 체제개발을 위한 기술 용어와 기술 개념에 대한 정의문 및 설명문을 자동으로 생성하는 한국어 문장 생성 모델을 제시한다. 한국어 정의 문장 생성을 위하여 딥러닝 기술 중 데이터의 전/후 관계를 포함한 시퀀스 레이블링이 가능한 LSTM을 활용한다. LSTM을 근간으로 한 두 가지 모델은 기술명을 입력할 시 그에 대한 정의문 및 설명문을 생성한다. 다양하게 수집된 대규모 학습 말뭉치를 이용해 실험한 결과, 본 논문에서 구현한 2가지 모델 중 CNN 음절 임베딩을 활용한 어절 단위 LSTM 모델이 용어에 대한 정의문 및 설명문을 생성하는데 더 나은 결과를 도출시킨다는 사실을 확인하였다. 본 논문의 연구 결과를 바탕으로 동일한 주제를 다루는 문장 집합을 생성할 수 있는 확장 모델을 개발할 수 있으며 더 나아가서는 기술에 대한 문헌을 자동으로 작성하는 인공지능 모델을 구현할 수 있으리라 사료된다.

Beyond Clot Dissolution; Role of Tissue Plasminogen Activator in Central Nervous System

  • Kim, Ji-Woon;Lee, Soon-Young;Joo, So-Hyun;Song, Mi-Ryoung;Shin, Chan-Young
    • Biomolecules & Therapeutics
    • /
    • 제15권1호
    • /
    • pp.16-26
    • /
    • 2007
  • Tissue plasminogen activator (tPA) is a serine protease catalyzing the proteolytic conversion of plasminogen into plasmin, which is involved in thrombolysis. During last two decades, the role of tPA in brain physiology and pathology has been extensively investigated. tPA is expressed in brain regions such as cortex, hippocampus, amygdala and cerebellum, and major neural cell types such as neuron, astrocyte, microglia and endothelial cells express tPA in basal status. After strong neural stimulation such as seizure, tPA behaves as an immediate early gene increasing the expression level within an hour. Neural activity and/or postsynaptic stimulation increased the release of tPA from axonal terminal and presumably from dendritic compartment. Neuronal tPA regulates plastic changes in neuronal function and structure mediating key neurologic processes such as visual cortex plasticity, seizure spreading, cerebellar motor learning, long term potentiation and addictive or withdrawal behavior after morphine discontinuance. In addition to these physiological roles, tPA mediates excitotoxicity leading to the neurodegeneration in several pathological conditions including ischemic stroke. Increasing amount of evidence also suggest the role of tPA in neurodegenerative diseases such as Alzheimer's disease and multiple sclerosis even though beneficial effects was also reported in case of Alzheimer's disease based on the observation of tPA-induced degradation of $A{\beta}$ aggregates. Target proteins of tPA action include extracellular matrix protein laminin, proteoglycans and NMDA receptor. In addition, several receptors (or binding partners) for tPA has been reported such as low-density lipoprotein receptor-related protein (LRP) and annexin II, even though intracellular signaling mechanism underlying tPA action is not clear yet. Interestingly, the action of tPA comprises both proteolytic and non-proteolytic mechanism. In case of microglial activation, tPA showed non-proteolytic cytokine-like function. The search for exact target proteins and receptor molecules for tPA along with the identification of the mechanism regulating tPA expression and release in the nervous system will enable us to better understand several key neurological processes like teaming and memory as well as to obtain therapeutic tools against neurodegenerative diseases.

Sequence-to-sequence 학습을 이용한 한국어 약어 생성 (Korean Abbreviation Generation using Sequence to Sequence Learning)

  • 최수정;박성배;김권양
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권3호
    • /
    • pp.183-187
    • /
    • 2017
  • 스마트폰 사용자들은 텍스트를 쉽게 읽고 빠르게 입력하기를 원한다. 이런 흐름에 따라 사용자들은 채팅 용어에서부터 전문 분야, 뉴스 기사에 이르기까지 여러 단어로 이루어진 어휘를 축약한 약어를 많이 사용한다. 그러므로 약어를 모아 데이터를 구축한다면 정보 검색과 추천 시스템 등에 유용하게 사용될 수 있다. 하지만 약어는 새로운 콘텐츠가 등장할 때마다 계속해서 생겨나기 때문에 수동으로 모으는 일은 쉽지 않으므로, 약어를 자동으로 생성하는 방법이 필요하다. 기존 연구들은 약어를 자동으로 생성하기 위해 규칙 기반 방법을 사용하였으나, 불규칙한 약어들은 생성할 수 없다는 한계점이 있다. 또한 규칙에 의해 생성된 후보 약어들 중에서 올바른 약어를 결정해야하는 문제도 발생한다. 따라서 본 논문에서는 이런 한계점을 극복하기 위해 시퀀스 투 시퀀스 학습 방법을 사용하여 약어를 자동으로 생성한다. 시퀀스투 시퀀스 학습 방법은 심층 신경망으로 기존의 규칙 기반 방법으로 생성할 수 없던 불규칙한 약어들을 생성할 수 있다. 게다가 후보 약어들 중 올바른 약어를 결정할 문제가 발생하지 않기 때문에 자동으로 약어를 생성하는 문제에 적합하다. 본 논문에서는 제안한 방법을 평가한 결과, 기존의 연구에서 생성할 수 없던 불규칙적인 약어를 생성하여 제안한 모델이 효과적임을 증명하였다.

The Ability of L2 LSTM Language Models to Learn the Filler-Gap Dependency

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.27-40
    • /
    • 2020
  • 본 논문은 장단기기억신경망(LSTM)이 영어를 배우면서 학습한 암묵적 통사 관계인 필러-갭 의존 관계를 조사하여 영어 문장 학습량과 한국인 영어 학습자(L2ers)의 문장 처리 패턴 간의 상관관계를 규명한다. 이를 위해, 먼저 장단기기억신경망 언어모델(LSTM LM)을 구축하였다. 이 모델은 L2ers가 영어 학습 과정에서 잠재적으로 배울 수 있는 L2 코퍼스의 영어 문장들로 심층학습을 하였다. 다음으로, 이 언어 모델을 이용하여 필러-갭 의존 관계 구조를 위반한 영어 문장을 대상으로 의문사 상호작용 효과(wh-licensing interaction effect) 즉, 정보 이론의 정보량인 놀라움(surprisal)의 정도를 계산하여 문장 처리 양상을 조사하였다. 또한 L2ers 언어모델과 상응하는 원어민 언어모델을 비교 분석함으로써, 두 언어모델이 문장 처리에서 필러-갭 의존 관계에 내재된 추상적 구문 구조를 추적할 수 있음을 보여주었을 뿐만 아니라, 또한 선형 혼합효과 회귀모델을 사용하여 본 논문의 중심 연구 주제인 의존 관계 처리에 있어서 원어민 언어모델과 L2ers 언어모델간 통계적으로 유의미한 차이가 존재함을 규명하였다.

이 러닝의 질적 우수성에 대한 재고(再考)무엇이 질을 결정하는가? (Reconsidering of critical factors for high quality e-Learning)

  • 조은순
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.36-50
    • /
    • 2005
  • 지난 수년 동안 우리나라에서 이 러닝은 특히 기업을 중심으로 빠른 시간에 확산이 되었으며, 양적으로 팽창한 만큼 질적인 부분에 대한 의구심이 팽배한 것이 사실이다. 기존의 오프라인 교육에 비하여 이 러닝의 질적 수준을 분석하는 이유는 그 동안 급속도로 발전된 이 러닝이 학습자들에게 훌륭한 학습경험을 주지 못하였고, 생각보다 결과가 저조하였으며, 무엇보다 투자된 비용에 비해 효과성이 저조하였다는 지적이 많기 때문이다 . 그동안 이 러닝에서의 많은 경험은 오랜 세월동안 익숙해왔던 오프라인수업을 중심으로 구성되어왔으며, 이 러닝에 종사하는 많은 전문가들도 대부분 오프라인에서의 교수-학습에 대한 경험을 바탕으로 이 러닝의 체제를 이해하여 왔다. Dublin&Cross (2003)에 의하면 과연 얼마나 많은 사람들이 이 러닝에 대한 공통된 개념을 가지고 있으며, 학습자들이 단지 문제없이 이 러닝에 접속하여 끝까지 기술적인 문제없이 도달하는데서 끝나지 않고 얼마나 효과적이고 효율적으로 이 러닝이 의도한 학습과정에 흡수되는 가를 분석해 낼 수 있는가에 따라 이 러닝의 성공여부가 달려 있다고 한다. 본 논문은 이 러닝의 확산속도에 맞추어 질적 향상이 쉽게 이루어지지 않는 이 러닝의 현상을 분석해보고 이 러닝의 질적 발전을 위하여 고려하여야 하는 요소들은 무엇이 있으며 이들이 어떻게 조화를 이루어야 이 러닝이 질적으로 우수성을 가질 수 있는지에 대한 방안을 제시해 보고자 한다.

  • PDF

이 러닝의 질적 향상 방안에 대한 연구 (A Study on e-Learning Quality Improvement)

  • 조은순
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.316-324
    • /
    • 2005
  • 우리나라의 이 러닝은 그동안 양적으로 팽창한 만큼 질적인 부분에 대한 의구심이 팽배해지고 있는 것이 사실이다. 현재 시점에서 이 러닝의 질적 수준을 분석해야 하는 이유는 그 동안 급속도로 발전된 이 러닝이 학습자들에게 훌륭한 학습경험을 주지 못하였고, 생각보다 결과가 저조하였으며, 무엇보다 투자된 비용에 비해 효과성이 저조하였다는 지적이 많기 때문이다. 지난 몇 년 동안 이 러닝에서의 학습경험은 오랜 세월 익숙해왔던 오프라인수업을 중심으로 구성되어 왔으며, 이 러닝에 종사하는 많은 전문가들도 대부분 오프라인에서의 교수-학습에 대한 경험을 바탕으로 이 러닝의 체제를 이해하여 왔다. Dublin&Cross에 의하면 과연 얼마나 많은 사람들이 이 러닝에 대한 공통된 개념을 가지고 있으며, 학습자들이 단지 문제없이 이 러닝에 접속하여 끝까지 기술적인 문제없이 도달하는데서 끝나지 않고 얼마나 효과적이고 효율적으로 이 러닝이 의도한 학습과정에 흡수되는 가를 분석해 낼 수 있는가에 따라 이 러닝의 성공여부가 달려 있다고 한다 [12]. 본 논문은 이 러닝의 확산속도에 맞추어 질적 향상이 쉽게 이루어지지 않는 이 러닝의 현상을 심층 분석해보고 이 러닝의 질적 향상을 위하여 고려해야 하는 요소들은 무엇이 있으며 이들이 어떻게 조화를 이루어야 이 러닝이 질적으로 우수성을 가질 수 있는지에 대한 방안을 제시해 보고자 한다.

  • PDF

CNN-LSTM 딥러닝 기반 캠퍼스 전력 예측 모델 최적화 단계 제시 (Proposal of a Step-by-Step Optimized Campus Power Forecast Model using CNN-LSTM Deep Learning)

  • 김예인;이세은;권용성
    • 한국산학기술학회논문지
    • /
    • 제21권10호
    • /
    • pp.8-15
    • /
    • 2020
  • 딥러닝을 사용한 예측 방법은 동일한 예측 모델과 파라미터를 사용한다 하더라도 데이터셋의 특성에 따라 결과가 일정하지 않다. 예를 들면, 데이터셋 A에 최적화된 예측 모델 X를 다른 특성을 가진 데이터셋 B에 적용하면 데이터셋 A와 같이 좋은 예측 결과를 기대하기 어렵다. 따라서 높은 정확도를 갖는 예측 모델을 구현하기 위해서는 데이터셋의 성격을 고려하여 예측 모델을 최적화하는 것이 필요하다. 본 논문에서는 하루 대학 캠퍼스 전력사용량을 1시간 단위로 예측하기 위해 데이터셋의 특성이 고려된 예측 모델이 도출되는 일련의 방법을 단계적으로 제시한다. 데이터 전처리 과정을 시작으로, 이상치 제거와 데이터셋 분류 과정 그리고 합성곱 신경망과 장기-단기 기억 신경망이 결합된 알고리즘(CNN-LSTM: Convolutional Neural Networks-Long Short-Term Memory Networks) 기반 하이퍼파라미터 튜닝 과정을 소개한다. 본 논문에서 제안하는 예측 모델은, 각 시간별 24개 포인트에서 2%의 평균 절대비율 오차(MAPE: Mean Absolute Percentage Error)를 보인다. 단순히 예측 알고리즘만을 적용한 모델과는 달리, 단계적 방법을 통해 최적화된 예측 모델을 사용하여 단일 전력 입력 변수만을 사용해서 높은 예측 정확도를 도출한다. 이 예측 모델은 모바일 에너지관리시스템(Energy Management System: EMS) 어플리케이션에 적용되어 관리자나 소비자에게 최적의 전력사용 방안을 제시할 수 있으며 전력 사용 효율 개선에 크게 기여할 것으로 기대된다.

메콩강 유출모의를 위한 물리적 및 데이터 기반 모형의 비교·분석 (Comparison of physics-based and data-driven models for streamflow simulation of the Mekong river)

  • 이기하;정성호;이대업
    • 한국수자원학회논문집
    • /
    • 제51권6호
    • /
    • pp.503-514
    • /
    • 2018
  • 최근 기후변화 및 유역개발로 인하여 메콩강 유역의 수문환경이 급격히 변화하고 있으며, 메콩강을 공유하는 국가의 수재해 예방 및 지속가능한 수자원개발을 위해서는 메콩강 주요지점에서의 유량 정보의 분석 및 예측이 요구된다. 본 연구에서는 물리적 기반의 수문모형인 SWAT과 데이터기반 딥러닝 알고리즘인 LSTM을 이용하여 메콩강 하류 Kratie 지점의 유출모의를 수행하고, 유출모의 정확도 및 두 가지 방법론의 장 단점을 비교 분석한다. SWAT 모형의 구축을 위해 범용 입력자료(지형: HydroSHED, 토지이용: GLCF-MODIS, 토양: FAO-Soil map, 강우: APHRODITE 등)을 이용하였으며 warming-up 및 매개변수 보정 후 2003~2007년 일유량 모의를 수행하였다. LSTM을 이용한 유출모의의 경우, 딥러닝 오픈소스 라이브러리인 TensorFlow를 활용하여 Kratie 지점기준 메콩강 상류 10개 수위관측소의 두 기간(2000~2002, 2008~2014) 일수위 정보만을 이용하여 심층신경망을 학습하고, SWAT 모형과 마찬가지로 2003~2007년을 대상으로 Kratie 지점에 대한 일수위 모의 후 수위-유량관계곡선식을 이용하여 유출량으로 환산하였다. 두 모형의 모의성능 비교 검토를 위하여 모의기간에 대해 NSE (Nash-Sutcliffe Efficiency)을 산정한 결과, SWAT은 0.9, LSTM은 보다 높은 0.99의 정확도를 나타내는 것으로 분석되었다. 메콩강과 같은 대유역의 특정 지점에 대한 수문시계열 자료의 모의를 위해서는 다양한 입력자료를 요구하는 물리적 수문모형 대신 선행 시계열자료의 변동성을 기억 학습하여 이를 예측에 반영하는 LSTM 기법 등 데이터기반의 심층신경망 모형의 적용이 가능할 것으로 판단된다.