DOI QR코드

DOI QR Code

A Study on Rotating Object Classification using Deep Neural Networks

깊은신경망을 이용한 회전객체 분류 연구

  • 이용규 (연세대학교 컴퓨터과학과) ;
  • 이일병 (연세대학교 컴퓨터과학과)
  • Received : 2015.06.15
  • Accepted : 2015.09.16
  • Published : 2015.10.25

Abstract

This paper is a study to improve the classification efficiency of rotating objects by using deep neural networks to which a deep learning algorithm was applied. For the classification experiment of rotating objects, COIL-20 is used as data and total 3 types of classifiers are compared and analyzed. 3 types of classifiers used in the study include PCA classifier to derive a feature value while reducing the dimension of data by using Principal Component Analysis and classify by using euclidean distance, MLP classifier of the way of reducing the error energy by using error back-propagation algorithm and finally, deep learning applied DBN classifier of the way of increasing the probability of observing learning data through pre-training and reducing the error energy through fine-tuning. In order to identify the structure-specific error rate of the deep neural networks, the experiment is carried out while changing the number of hidden layers and number of hidden neurons. The classifier using DBN showed the lowest error rate. Its structure of deep neural networks with 2 hidden layers showed a high recognition rate by moving parameters to a location helpful for recognition.

본 논문은 딥러닝 알고리즘을 적용한 깊은신경망을 이용하여 회전 객체의 분류 효율성을 높이기 위한 연구이다. 회전객체의 분류 실험을 위하여 데이터는 COIL-20을 사용하며 객체의 2/3영역을 학습시키고 1/3영역을 유추하여 분류한다. 연구에 이용된 3가지 분류기는 주성분 분석법을 이용해 데이터의 차원을 축소하면서 특징값을 추출하고 유클리디안 거리를 이용하여 분류하는 PCA분류기와 오류역전파 알고리즘을 이용하여 오류 에너지를 줄여가는 방식의 MLP분류기, 마지막으로 pre-training을 통하여 학습데이터의 관찰될 확률을 높여주고 fine-tuning으로 오류에너지를 줄여가는 방식의 딥러닝을 적용한 DBN분류기이다. 깊은신경망의 구조별 오류율을 확인하기 위하여 은닉층의 개수와 은닉뉴런의 개수를 변경해가며 실험하고 실제로 가장 낮은 오류율을 나타내는 구조를 기술한다. 가장 낮은 오류율을 보였던 분류기는 DBN을 이용한 분류기이다. 은닉층을 2개 갖는 깊은신경망의 구조로 매개 변수들을 인식에 도움이 되는 곳으로 이동 시켜 높은 인식률을 보여줬다.

Keywords

References

  1. Hye-Young Park and Kwan-Yong Lee ,Pattern recognition and Machine learning, EHAN, 2011.
  2. Il-Seok Oh, Pattern recognition. KYOBO. 2008.
  3. Bengio, Yoshua, "Learning Deep Architectures for AI," Foundations and Trends in Machine Learning 2, 2009.
  4. J. Schmidhuber, "Deep Learning in Neural Networks: An Overview," 2014.
  5. Geoffrey Hinton, "A Practical Guide to Training Restricted Boltzmann Machines," UTML TR 2010-003, University of Toronto, 2010.
  6. Min-Kyu Park, "Training Restricted Boltzmann Machines using MCMC-based Particle filter," University of Seoul, 2013.
  7. Hinton, Geoffrey E., "Training products of experts by minimizing contrastive divergence," Neural computation 14.8, 1771-1800. 2002.
  8. Sameer A.Nene, Shree K.Nayar, Hiroshi Murase, "Columbia Object Image Library (COIL-20)," No. CUCS-005-96. 1996.