• 제목/요약/키워드: Layer-by-layer learning

검색결과 642건 처리시간 0.031초

저주파 필터 특성을 갖는 다층 구조 신경망을 이용한 시계열 데이터 예측 (Time Series Prediction Using a Multi-layer Neural Network with Low Pass Filter Characteristics)

  • Min-Ho Lee
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제21권1호
    • /
    • pp.66-70
    • /
    • 1997
  • In this paper a new learning algorithm for curvature smoothing and improved generalization for multi-layer neural networks is proposed. To enhance the generalization ability a constraint term of hidden neuron activations is added to the conventional output error, which gives the curvature smoothing characteristics to multi-layer neural networks. When the total cost consisted of the output error and hidden error is minimized by gradient-descent methods, the additional descent term gives not only the Hebbian learning but also the synaptic weight decay. Therefore it incorporates error back-propagation, Hebbian, and weight decay, and additional computational requirements to the standard error back-propagation is negligible. From the computer simulation of the time series prediction with Santafe competition data it is shown that the proposed learning algorithm gives much better generalization performance.

  • PDF

다층 퍼셉트론의 층별 학습 가속을 위한 중간층 오차 함수 (A New Hidden Error Function for Training of Multilayer Perceptrons)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제5권6호
    • /
    • pp.57-64
    • /
    • 2005
  • 다층 퍼셉트론의 학습을 빠르게 하기 위한 방법으로 층별 학습이 제안되었었다. 이 방법에서는 각 층별로 오차함수가 주어지고, 이렇게 층별로 주어진 오차함수를 최적화 방법을 사용하여 감소시키도록 학습이 이루어진다. 이 경우 중간층 오차함수가 학습의 성능에 큰 영향을 미치는 데, 이 논문에서는 층별 학습의 성능을 개선하기 위한 중간층 오차함수를 제안한다. 이 중간층 오차함수는 출력층 오차함수에서 중간층 가중치의 학습에 관계된 성분을 유도하는 형태로 제안된다. 제안한 방법은 필기체 숫자 인식과 고립단어인식 문제의 시뮬레이션으로 효용성을 확인하였다.

  • PDF

문장 독립 화자 인증을 위한 세그멘트 단위 혼합 계층 심층신경망 (Segment unit shuffling layer in deep neural networks for text-independent speaker verification)

  • 허정우;심혜진;김주호;유하진
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.148-154
    • /
    • 2021
  • 문장 독립 화자 인증 연구에서는 일반화 성능 향상을 위해 문장 정보와 독립적인 화자 특징을 추출하는 것이 필수적이다. 그렇지만 심층 신경망은 학습 데이터에 의존적이므로, 동일한 시계열 정보를 반복 학습할 경우, 화자 정보를 학습하는 대신 문장 정보에 과적합 될 수 있다. 본 논문에서는 이러한 과적합을 방지하기 위해 시간 축으로 입력층 혹은 은닉층을 분할 및 무작위 재배열하여 시계열 정보의 순서를 뒤섞는 세그멘트 단위 혼합 계층을 제안한다. 세그멘트 단위 혼합 계층은 입력층 뿐만 아니라 은닉층에도 적용이 가능하므로, 입력층에서의 일반화 기법에 비해 효과적이라 알려진 은닉층에서의 일반화 기법으로 활용이 가능하며, 기존의 데이터 증강 방법과 동시에 적용할 수도 있다. 뿐만아니라, 세그멘트의 단위 크기를 조절하여 혼합의 정도를 조절할 수도 있다. 본 논문에서는 제안한 방법을 적용하여 문장 독립 화자 인증 성능이 개선됨을 확인하였다.

다층 신경회로망을 이용한 유연성 로보트팔의 위치제어 (Position Control of a One-Link Flexible Arm Using Multi-Layer Neural Network)

  • 김병섭;심귀보;이홍기;전홍태
    • 전자공학회논문지B
    • /
    • 제29B권1호
    • /
    • pp.58-66
    • /
    • 1992
  • This paper proposes a neuro-controller for position control of one-link flexible robot arm. Basically the controller consists of a multi-layer neural network and a conventional PD controller. Two controller are parallelly connected. Neural network is traind by the conventional error back propagation learning rules. During learning period, the weights of neural network are adjusted to minimize the position error between the desired hub angle and the actual one. Finally the effectiveness of the proposed approach will be demonstrated by computer simulation.

  • PDF

신경회로망을 이용한 직류전동기의 센서리스 속도제어 (Sensorless Speed Control of Direct Current Motor by Neural Network)

  • 강성주;오세진;김종수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제28권1호
    • /
    • pp.90-97
    • /
    • 2004
  • DC motor requires a rotor speed sensor for accurate speed control. The speed sensors such as resolvers and encoders are used as speed detectors. but they increase cost and size of the motor and restrict the industrial drive applications. So in these days. many Papers have reported on the sensorless operation or DC motor(3)-(5). This paper Presents a new sensorless strategy using neural networks(6)-(8). Neural network structure has three layers which are input layer. hidden layer and output layer. The optimal neural network structure was tracked down by trial and error and it was found that 4-16-1 neural network has given suitable results for the instantaneous rotor speed. Also. learning method is very important in neural network. Supervised learning methods(8) are typically used to train the neural network for learning the input/output pattern presented. The back-propagation technique adjusts the neural network weights during training. The rotor speed is gained by weights and four inputs to the neural network. The experimental results were found satisfactory in both the independency on machine parameters and the insensitivity to the load condition.

생성적 적대 신경망을 이용한 함정전투체계 획득 영상의 초고해상도 영상 복원 연구 (A Study on Super Resolution Image Reconstruction for Acquired Images from Naval Combat System using Generative Adversarial Networks)

  • 김동영
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1197-1205
    • /
    • 2018
  • 본 논문에서는 함정전투체계의 EOTS나 IRST에서 획득한 영상을 초고해상도 영상으로 복원한다. 저해상도에서 초고해상도의 영상을 생성하는 생성 모델과 이를 판별하는 판별 모델로 구성된 생성적 적대 신경망을 이용하고, 다양한 학습 파라미터의 변화를 통한 최적의 값을 제안한다. 실험에 사용되는 학습 파라미터는 crop size와 sub-pixel layer depth, 학습 이미지 종류로 구성되며, 평가는 일반적인 영상 품질 평가 지표에 추가적으로 특징점 추출 알고리즘을 함께 사용하였다. 그 결과, Crop size가 클수록, Sub-pixel layer depth가 깊을수록, 고해상도의 학습이미지를 사용할수록 더 좋은 품질의 영상을 생성한다.

Hybrid Neural Networks for Pattern Recognition

  • Kim, Kwang-Baek
    • Journal of information and communication convergence engineering
    • /
    • 제9권6호
    • /
    • pp.637-640
    • /
    • 2011
  • The hybrid neural networks have characteristics such as fast learning times, generality, and simplicity, and are mainly used to classify learning data and to model non-linear systems. The middle layer of a hybrid neural network clusters the learning vectors by grouping homogenous vectors in the same cluster. In the clustering procedure, the homogeneity between learning vectors is represented as the distance between the vectors. Therefore, if the distances between a learning vector and all vectors in a cluster are smaller than a given constant radius, the learning vector is added to the cluster. However, the usage of a constant radius in clustering is the primary source of errors and therefore decreases the recognition success rate. To improve the recognition success rate, we proposed the enhanced hybrid network that organizes the middle layer effectively by using the enhanced ART1 network adjusting the vigilance parameter dynamically according to the similarity between patterns. The results of experiments on a large number of calling card images showed that the proposed algorithm greatly improves the character extraction and recognition compared with conventional recognition algorithms.

분산 딥러닝에서 통신 오버헤드를 줄이기 위해 레이어를 오버래핑하는 하이브리드 올-리듀스 기법 (Hybrid All-Reduce Strategy with Layer Overlapping for Reducing Communication Overhead in Distributed Deep Learning)

  • 김대현;여상호;오상윤
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권7호
    • /
    • pp.191-198
    • /
    • 2021
  • 분산 딥러닝은 각 노드에서 지역적으로 업데이트한 지역 파라미터를 동기화는 과정이 요구된다. 본 연구에서는 분산 딥러닝의 효과적인 파라미터 동기화 과정을 위해, 레이어 별 특성을 고려한 allreduce 통신과 연산 오버래핑(overlapping) 기법을 제안한다. 상위 레이어의 파라미터 동기화는 하위 레이어의 다음 전파과정 이전까지 통신/계산(학습) 시간을 오버랩하여 진행할 수 있다. 또한 이미지 분류를 위한 일반적인 딥러닝 모델의 상위 레이어는 convolution 레이어, 하위 레이어는 fully-connected 레이어로 구성되어 있다. Convolution 레이어는 fully-connected 레이어 대비적은 수의 파라미터를 가지고 있고 상위에 레이어가 위치하므로 네트워크 오버랩 허용시간이 짧고, 이를 고려하여 네트워크 지연시간을 단축할 수 있는 butterfly all-reduce를 사용하는 것이 효과적이다. 반면 오버랩 허용시간이 보다 긴 경우, 네트워크 대역폭을 고려한 ring all-reduce를 사용한다. 본 논문의 제안 방법의 효과를 검증하기 위해 제안 방법을 PyTorch 플랫폼에 적용하여 이를 기반으로 실험 환경을 구성하여 배치크기에 대한 성능 평가를 진행하였다. 실험을 통해 제안 기법의 학습시간은 기존 PyTorch 방식 대비 최고 33% 단축된 모습을 확인하였다.

양액재배를 위한 배양액관리 지원시스템의 개발 - II. 신경회로망에 의한 전기전도도(EC)의 추정 (Development of a Supporting System for Nutrient Solution Management in Hydroponics - II. Estimation of Electrical Conductivity(EC) using Neural Networks)

  • 손정익;김문기;남상운
    • 생물환경조절학회지
    • /
    • 제1권2호
    • /
    • pp.162-168
    • /
    • 1992
  • As the automation of nutrient solution management proceeds in the field of hydroponics, effective supporting systems to manage the nutrient solution by computer become needed. This study was attempt to predict the EC of nutrient solution using the neural networks. The multilayer perceptron consisting of 3 layers with the back propagation learning algorithm was selected for EC prediction, of which nine variables in the input layer were the concentrations of each ion and one variable in the output layer the EC of nutrient solution. The meq unit in ion concentration was selected fir input variable in the input layer. After the 10,000 learning sweeps with 108 sample data, the comparison of predicted and measured ECs for 72 test data showed good agreements with the correlation coefficient of 0.998. In addition, the predicted ECs by neural network showed relatively equal or closer to the measured ones than those by current complicated models.

  • PDF

퍼지논리와 다층 신경망을 이용한 로보트 매니퓰레이터의 위치제어 (Position Control of the Robot Manipulator Using Fuzzy Logic and Multi-layer neural Network)

  • 김종수;이홍기;전홍태
    • 전자공학회논문지B
    • /
    • 제28B권11호
    • /
    • pp.934-940
    • /
    • 1991
  • The multi-layer neural network that has broadly been utilized in designing the controller of robot manipulator possesses the desirable characteristics of learning capacity, by which the uncertain variation of the dynamic parameters of robot can be handled adaptively, and parallel distributed processing that makes it possible to control on real-time. However the error back propagation algorithm that has been utilized popularly in the learning of the multi-layer neural network has the problem of its slow convergencs speed. In this paper, an approach to improve the convergence speed is proposed using fuzzy logic that can effectively handle the uncertain and fuzzy informations by linguistic level. The effectiveness of the proposed algorithm is demonstrated by computer simulation of PUMA 560 robot manipulator.

  • PDF