DOI QR코드

DOI QR Code

딥러닝을 PC에 적용하기 위한 메모리 최적화에 관한 연구

A Study On Memory Optimization for Applying Deep Learning to PC

  • Lee, Hee-Yeol (Dept. Electronics Engineering, Hanbat National University) ;
  • Lee, Seung-Ho (Dept. Electronics&Control Engineering, Hanbat National University)
  • 투고 : 2017.06.12
  • 심사 : 2017.06.27
  • 발행 : 2017.06.30

초록

본 논문에서는 딥러닝을 PC에 적용하기 위한 메모리 최적화에 관한 알고리즘을 제안한다. 제안된 알고리즘은 일반 PC에서 기존의 딥러닝 구조에서 요구되는 연산처리 과정과 데이터 량을 감소시켜 메모리 및 연산처리 시간을 최소화한다. 본 논문에서 제안하는 알고리즘은 분별력이 있는 랜덤 필터를 이용한 컨볼루션 층 구성 과정, PCA를 이용한 데이터 축소 과정, SVM을 사용한 CNN 구조 생성 등의 3과정으로 이루어진다. 분별력이 있는 랜덤 필터를 이용한 컨볼루션 층 구성 과정에서는 학습과정이 필요치 않아서 전체적인 딥러닝의 학습시간을 단축시킨다. PCA를 이용한 데이터 축소 과정에서는 메모리량과 연산처리량을 감소시킨다. SVM을 사용한 CNN 구조 생성에서는 필요로 하는 메모리량과 연산 처리량의 감소 효과를 극대화 시킨다. 제안된 알고리즘의 성능을 평가하기 위하여 예일 대학교의 Extended Yale B 얼굴 데이터베이스를 사용하여 실험한 결과, 본 논문에서 제안하는 알고리즘이 기존의 CNN 알고리즘과 비교하여 비슷한 성능의 인식률을 보이면서 연산 소요시간과 메모리 점유율에 있어 우수함이 확인되었다. 본 논문에서 제안한 알고리즘을 바탕으로 하여 일반 PC에서도 많은 데이터와 연산처리를 가진 딥러닝 알고리즘을 구현할 수 있으리라 기대된다.

In this paper, we propose an algorithm for memory optimization to apply deep learning to PC. The proposed algorithm minimizes the memory and computation processing time by reducing the amount of computation processing and data required in the conventional deep learning structure in a general PC. The algorithm proposed in this paper consists of three steps: a convolution layer configuration process using a random filter with discriminating power, a data reduction process using PCA, and a CNN structure creation using SVM. The learning process is not necessary in the convolution layer construction process using the discriminating random filter, thereby shortening the learning time of the overall deep learning. PCA reduces the amount of memory and computation throughput. The creation of the CNN structure using SVM maximizes the effect of reducing the amount of memory and computational throughput required. In order to evaluate the performance of the proposed algorithm, we experimented with Yale University's Extended Yale B face database. The results show that the algorithm proposed in this paper has a similar performance recognition rate compared with the existing CNN algorithm. And it was confirmed to be excellent. Based on the algorithm proposed in this paper, it is expected that a deep learning algorithm with many data and computation processes can be implemented in a general PC.

키워드

참고문헌

  1. J. W. Bang, Y. J. Jeong, "A Real-Time Hardware Design of CNN for Vehicle Detection,"j.inst.Kore an.electr .electron.eng, vol.20, no.4, pp. 351-360, Dec. 2016. DOI:10.7471/ikeee.2016.20.4.351
  2. H. K. Jeon, K. Y. Lee, C. Y. Kim, "An Implementation of a Convolutional Accelerator based on a GPGPU for a Deep Learning," j.inst.Korean.electr.electron.eng, vol.20, no.3, pp. 303-306, Sep. 2016. DOI:10.7471/ikeee.2016.20.3.303
  3. K. H. Lee, C. Y. Ki, "Thread Distribution Method of GP-GPU for Accelerating Parallel Algorithms," j.inst.Korean.electr.electron.eng, vol.21, no.1, pp. 92-95, Mar. 2017.
  4. Kevin Jarrett, Koray Kavukcuoglu, Marc'Aurelio Ranzato, Yann LeCun, "What is the best multi-stage architecture for object recognition?," Computer Vision, 2009 IEEE 12th International Conference on, IEEE, 2009. DOI:10.1109/ICCV.2009.5459469
  5. David Cox, Nicolas Pinto, "Beyond simple features: A large-scale feature search approach to unconstrained face recognition," Automatic Face & Gesture Recognition and Workshops (FG 2011), 2011 IEEE International Conference on, IEEE, 2011. DOI:10.1109/FG.2011.5771385
  6. Andrew Saxe, Pang W. Koh, Zhenghao Chen, Maneesh Bhand, Bipin Suresh, Andrew Y. Ng, "On Random Weights and Unsupervised Feature Learning," Proceedings of the 28th International Conference on Machine Learning (ICML-11) , 2011, pp.1089-1096.
  7. Guodong Guo, S. Z. Li, Kapluk Chan, "Face recognition by support vector machines," Automatic Face and Gesture Recognition, 2000. Proceedings. Fourth IEEE International Conference on. IEEE, 2000. DOI:10.1109/AFGR.2000.840634