• 제목/요약/키워드: Sequential neural networks

검색결과 54건 처리시간 0.023초

메모리 요소를 활용한 신경망 연구 동향 (A Survey on Neural Networks Using Memory Component)

  • 이지환;박진욱;김재형;김재인;노홍찬;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권8호
    • /
    • pp.307-324
    • /
    • 2018
  • 최근 순환 신경 망(Recurrent Neural Networks)은 시간에 대한 의존성을 고려한 구조를 통해 순차 데이터(Sequential data)의 예측 문제 해결에서 각광받고 있다. 하지만 순차 데이터의 시간 스텝이 늘어남에 따라 발생하는 그라디언트 소실(Gradients vanishing)이 문제로 대두되었다. 이를 해결하기 위해 장단기 기억 모델(Long Short-Term Memory)이 제안되었지만, 많은 데이터를 저장하고 장기간 보존하는 데에 한계가 있다. 따라서 순환 신경망과 메모리 요소(Memory component)를 활용한 학습 모델인 메모리-증대 신경망(Memory-Augmented Neural Networks)에 대한 연구가 최근 활발히 진행되고 있다. 본 논문에서는 딥 러닝(Deep Learning) 분야의 화두로 떠오른 메모리-증대 신경망 주요 모델들의 구조와 특징을 열거하고, 이를 활용한 최신 기법들과 향후 연구 방향을 제시한다.

계열연상능력에 미치는 히스테리시스 특성에 대한 해석 (Analysis of the effects of the hysteretic property on the performance of sequential associative neural nets)

  • 김응수;이상욱
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.448-459
    • /
    • 2012
  • 신경회로망의 동작과 정보처리 능력 등에 관하여 살펴보고자 할 때, 신경회로망의 구성 요소를 어떻게 모델화 할 것인가는 중요한 문제이다. 소자의 응답특성이 바뀜에 따른 특성의 변화, 결합강도 및 적응규칙이 바뀜으로써 회로망 전체의 다이나믹스가 바뀌는 모습, 소자 상호간의 결합 형태에 따른 정보처리 능력의 변화 등과 같은 신경회로망이 가진 다양한 정보처리 능력을 밝히는 것은 병렬 정보처리의 메카니즘을 이해하는 문제와도 일맥상통하고 있다. 따라서 이러한 문제들에 대하여 신경회로망의 정보처리 능력을 해석적으로 평가하는 것은 병렬분산 정보처리의 본질을 밝힌다는 측면에서 중요하게 여겨진다. 따라서 본 논문에서는 신경회로망을 구성하는 구성요소의 변화, 그 가운데에서도 특히 소자의 히스테리시스 특성이 신경망의 계열연상능력에 미치는 영향에 대한 이론적 해석결과에 대하여 기술한다.

인공 신경망의 Catastrophic forgetting 현상 극복을 위한 순차적 반복 학습에 대한 연구 (A study on sequential iterative learning for overcoming catastrophic forgetting phenomenon of artificial neural network)

  • 최동빈;박용범
    • Journal of Platform Technology
    • /
    • 제6권4호
    • /
    • pp.34-40
    • /
    • 2018
  • 현재 인공신경망은 단일 작업에 대해선 뛰어난 성능을 보이나, 다른 종류의 작업을 학습하면 이전 학습 내용을 잊어버리는 단점이 있다. 이를 catastrophic forgetting이라고 한다. 인공신경망의 활용도를 높이긴 위해선 이 현상을 극복해야 한다. catastrophic forgetting을 극복하기 위한 여러 노력이 있다. 하지만 많은 노력이 있었음에도 완벽하게 catastrophic forgetting을 극복하지는 못하였다. 본 논문에서는 여러 노력 중 elastic weight consolidation(EWC)에 사용되는 핵심 개념을 이용하여, 순차적 반복학습을 제시한다. 인공신경망 학습에 많이 쓰이는 MNIST를 확장한 EMNIST 데이터 셋을 이용하여 catastrophic forgetting 현상을 재현하고 이를 순차적 반복학습을 통해 극복하는 실험을 진행하였으며, 그 결과 모든 작업에 대해서 학습이 가능하였다.

Minimization of differential column shortening and sequential analysis of RC 3D-frames using ANN

  • Njomo, Wilfried W.;Ozay, Giray
    • Structural Engineering and Mechanics
    • /
    • 제51권6호
    • /
    • pp.989-1003
    • /
    • 2014
  • In the preliminary design stage of an RC 3D-frame, repeated sequential analyses to determine optimal members' sizes and the investigation of the parameters required to minimize the differential column shortening are computational effort consuming, especially when considering various types of loads such as dead load, temperature action, time dependent effects, construction and live loads. Because the desired accuracy at this stage does not justify such luxury, two backpropagation feedforward artificial neural networks have been proposed in order to approximate this information. Instead of using a commercial software package, many references providing advanced principles have been considered to code a program and generate these neural networks. The first one predicts the typical amount of time between two phases, needed to achieve the minimum maximorum differential column shortening. The other network aims to prognosticate sequential analysis results from those of the simultaneous analysis. After the training stages, testing procedures have been carried out in order to ensure the generalization ability of these respective systems. Numerical cases are studied in order to find out how good these ANN match with the sequential finite element analysis. Comparison reveals an acceptable fit, enabling these systems to be safely used in the preliminary design stage.

Bayesian Analysis for Neural Network Models

  • Chung, Younshik;Jung, Jinhyouk;Kim, Chansoo
    • Communications for Statistical Applications and Methods
    • /
    • 제9권1호
    • /
    • pp.155-166
    • /
    • 2002
  • Neural networks have been studied as a popular tool for classification and they are very flexible. Also, they are used for many applications of pattern classification and pattern recognition. This paper focuses on Bayesian approach to feed-forward neural networks with single hidden layer of units with logistic activation. In this model, we are interested in deciding the number of nodes of neural network model with p input units, one hidden layer with m hidden nodes and one output unit in Bayesian setup for fixed m. Here, we use the latent variable into the prior of the coefficient regression, and we introduce the 'sequential step' which is based on the idea of the data augmentation by Tanner and Wong(1787). The MCMC method(Gibbs sampler and Metropolish algorithm) can be used to overcome the complicated Bayesian computation. Finally, a proposed method is applied to a simulated data.

백본 네트워크에 따른 사람 속성 검출 모델의 성능 변화 분석 (Analyzing DNN Model Performance Depending on Backbone Network )

  • 박천수
    • 반도체디스플레이기술학회지
    • /
    • 제22권2호
    • /
    • pp.128-132
    • /
    • 2023
  • Recently, with the development of deep learning technology, research on pedestrian attribute recognition technology using deep neural networks has been actively conducted. Existing pedestrian attribute recognition techniques can be obtained in such a way as global-based, regional-area-based, visual attention-based, sequential prediction-based, and newly designed loss function-based, depending on how pedestrian attributes are detected. It is known that the performance of these pedestrian attribute recognition technologies varies greatly depending on the type of backbone network that constitutes the deep neural networks model. Therefore, in this paper, several backbone networks are applied to the baseline pedestrian attribute recognition model and the performance changes of the model are analyzed. In this paper, the analysis is conducted using Resnet34, Resnet50, Resnet101, Swin-tiny, and Swinv2-tiny, which are representative backbone networks used in the fields of image classification, object detection, etc. Furthermore, this paper analyzes the change in time complexity when inferencing each backbone network using a CPU and a GPU.

  • PDF

연관규칙과 퍼지 인공신경망에 기반한 하이브리드 데이터마이닝 메커니즘에 관한 연구 (A Study on the Hybrid Data Mining Mechanism Based on Association Rules and Fuzzy Neural Networks)

  • 김진성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.884-888
    • /
    • 2003
  • In this paper, we introduce the hybrid data mining mechanism based in association rule and fuzzy neural networks (FNN). Most of data mining mechanisms are depended in the association rule extraction algorithm. However, the basic association rule-based data mining has not the learning ability. In addition, sequential patterns of association rules could not represent the complicate fuzzy logic. To resolve these problems, we suggest the hybrid mechanism using association rule-based data mining, and fuzzy neural networks. Our hybrid data mining mechanism was consisted of four phases. First, we used general association rule mining mechanism to develop the initial rule-base. Then, in the second phase, we used the fuzzy neural networks to learn the past historical patterns embedded in the database. Third, fuzzy rule extraction algorithm was used to extract the implicit knowledge from the FNN. Fourth, we combine the association knowledge base and fuzzy rules. Our proposed hybrid data mining mechanism can reflect both association rule-based logical inference and complicate fuzzy logic.

  • PDF

신경회로망과 유한요소법을 이용한 편측식 선형유도전동기의 최적설계에 관한 연구 (Optimum Design of Single-Sided Linear Induction Motor Using the Neural Networks and Finite Element Method)

  • 임달호;박승찬;박두진;장석명;이철직
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1993년도 하계학술대회 논문집 B
    • /
    • pp.1004-1006
    • /
    • 1993
  • A new method for the optimal design of a single-sided linear induction motor(SLIM) is presented. The method utilizes the neural networks and finite element method for optimizing the design parameters of SLIM. The finite element analysis is used to produce a variety of neural networks training data and the neural networks is used for optimizing the design parameters by sequential unconstrained minimization technique(SUMT). As a result, it is known that the novel method is very efficient and accurate as an optimization technique.

  • PDF

신경회로망을 사용한 물고기 로봇의 빠른 방향 전환 궤적 설계 (Design of C-shape Sharp Turn Trajectory using Neural Networks for Fish Robot)

  • 박희문;박진현
    • 한국정보통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.510-518
    • /
    • 2014
  • 본 연구에서는 유체 속에서의 로봇의 방향전환 메커니즘의 성능을 개선하고 최적화하기 위하여 물 속 자연환경에 최적화되어 있는 물고기의 CST(CST:C-shape sharp turn) 패턴을 모방하여 물고기 로봇의 꼬리 관절 궤적을 신경회로망(neural network)을 사용하여 제안하였다. 물고기의 CST 패턴을 모방하기 위해 CST 패턴을 순차적으로 기록한 정보를 수치적으로 변환하여 좌표 데이터를 생성하고 함수화하였다. 함수화된 모션 함수를 물고기 로봇의 상대 관절각으로 변환하였으나, 구해진 상대 관절 궤적은 잉어의 순차적 기록에 의해 구해진 각도이므로 분해능이 떨어져 실제 물고기 로봇의 제어에 적용하기 어렵다. 그러므로 상대 관절 궤적을 일반화 기능이 뛰어난 신경회로망을 사용하여 보간하고 물고기 로봇에 적용하였다. 모의실험을 통하여 신경회로망을 이용한 상대 관절 궤적 함수가 고차의 다항식 궤적 함수에 비하여 물고기 로봇의 CST 모션에 더 좋은 성능을 나타냄을 확인하였다.

사운덱스 알고리즘을 적용한 신경망라 뉴로-처지 기법의 호스트 이상 탐지 (Host Anomaly Detection of Neural Networks and Neural-fuzzy Techniques with Soundex Algorithm)

  • 차병래;김형종;박봉구;조혁현
    • 정보보호학회논문지
    • /
    • 제15권2호
    • /
    • pp.13-22
    • /
    • 2005
  • 본 논문에서는 시스템 호출을 이용하여 이상 침입 탐지 시스템의 성능을 향상시키기 위해, 특징 선택과 가변 길이 데이터를 고정 길이 학습 패턴으로 변환 생성하는 문제를 해결하기 위한 사운덱스 알고리즘을 적용한 신경망 학습을 통하여 이상 침입 탐지의 연구를 하고자 한다. 즉, 가변 길이의 순차적인 시스템 호출 데이터를 사운덱스 알고리즘에 의한 고정 길이의 행위 패턴을 생성하여 역전파 알고리즘과 퍼지 멤버쉽 함수에 의해 신경망 학습을 수행하였다. 역전파 신경망과 뉴로-퍼지 기법을 UNM의 Sendmail Data Set을 이용하여 시스템 호출의 이상침입 탐지에 적용하여 시간과 공간 복잡도 그리고 MDL 측면에서 성능을 검증하였다.