DOI QR코드

DOI QR Code

망 분리를 이용한 딥러닝 학습시간 단축에 대한 연구

A Study on Reducing Learning Time of Deep-Learning using Network Separation

  • Lee, Hee-Yeol (Dept. Electronic Engineering, Hanbat National University) ;
  • Lee, Seung-Ho (Dept. Electronic Engineering, Hanbat National University)
  • 투고 : 2021.05.17
  • 심사 : 2021.06.01
  • 발행 : 2021.06.30

초록

본 논문에서는 딥러닝 구조를 분할을 이용한 개별 학습을 수행하여 학습시간을 단축하는 알고리즘을 제안한다. 제안하는 알고리즘은 망 분류 기점 설정 과정, 특징 벡터 추출 과정, 특징 노이즈 제거 과정, 클래스 분류 과정 등의 4가지 과정으로 구성된다. 첫 번째로 망 분류 기점 설정 과정에서는 효과적인 특징 벡터 추출을 위한 망 구조의 분할 기점을 설정한다. 두 번째로 특징 벡터 추출 과정에서는 기존에 학습한 가중치를 사용하여 추가 학습 없이 특징 벡터를 추출한다. 세 번째로 특징 노이즈 제거 과정에서는 추출된 특징 벡터를 입력받아 각 클래스의 출력값을 학습하여 데이터의 노이즈를 제거한다. 네 번째로 클래스 분류 과정에서는 노이즈가 제거된 특징 벡터를 입력받아 다층 퍼셉트론 구조에 입력하고 이를 출력하고 학습한다. 제안된 알고리즘의 성능을 평가하기 위하여 Extended Yale B 얼굴 데이터베이스를 사용하여 실험 하였다. 실험 결과, 1회 학습에 소요되는 시간의 경우 제안하는 알고리즘이 기존 알고리즘 기준 40.7% 단축하였다. 또한 목표 인식률까지 학습 횟수가 기존 알고리즘과 비교하여 단축하였다. 실험결과를 통해 1회 학습시간과 전체 학습시간을 감소시켜 기존의 알고리즘보다 향상됨을 확인하였다.

In this paper, we propose an algorithm that shortens the learning time by performing individual learning using partitioning the deep learning structure. The proposed algorithm consists of four processes: network classification origin setting process, feature vector extraction process, feature noise removal process, and class classification process. First, in the process of setting the network classification starting point, the division starting point of the network structure for effective feature vector extraction is set. Second, in the feature vector extraction process, feature vectors are extracted without additional learning using the weights previously learned. Third, in the feature noise removal process, the extracted feature vector is received and the output value of each class is learned to remove noise from the data. Fourth, in the class classification process, the noise-removed feature vector is input to the multi-layer perceptron structure, and the result is output and learned. To evaluate the performance of the proposed algorithm, we experimented with the Extended Yale B face database. As a result of the experiment, in the case of the time required for one-time learning, the proposed algorithm reduced 40.7% based on the existing algorithm. In addition, the number of learning up to the target recognition rate was shortened compared with the existing algorithm. Through the experimental results, it was confirmed that the one-time learning time and the total learning time were reduced and improved over the existing algorithm.

키워드

참고문헌

  1. LeCun, Yann, et al. "Handwritten digit recognition with a back-propagation network.," Advances in neural information processing systems. 1990. DOI: 10.5555/109230.109279
  2. LeCun, Yann, et al. "Learning algorithms for classification: A comparison on handwritten digit recognition," Neural networks: the statistical mechanics perspective, pp.261-276, 2015.
  3. H. K. Jeon, K. Y. Lee, C. Y. Kim, "An Implementation of a Convolutional Accelerator based on a GPGPU for a Deep Learning," j.inst. Korean.electr.electron.eng, vol.20, no.3, pp.303-306, 2016. DOI: 10.7471/ikeee.2016.20.3.303
  4. J. W. Bang, Y. J. Jeong, "A Real-Time Hardware Design of CNN for Vehicle Detection," j.inst. Korean.electr.electron.eng, vol.20, no.4, pp.351-360, 2016. DOI: 10.7471/ikeee.2016.20.4.351
  5. H. Y. Lee, S. H. Lee, "A Study On Memory Optimization for Applying Deep Learning to PC," j.inst.Korean.electr.electron.eng, vol.21, no.2, pp. 136-141, 2017. DOI: 10.7471/ikeee.2017.21.2.136
  6. Simonyan, Karen, Andrew Zisserman, "Very deep convolutional networks for large-scale image recognition," arXiv preprint arXiv:1409.1556 2014.
  7. LeCun, Yann, Yoshua Bengio, Geoffrey Hinton, "Deep learning," nature vol.521, pp.436-444, 2015. https://doi.org/10.1038/nature14539