DOI QR코드

DOI QR Code

로봇 비전의 영상 인식 AI를 위한 전이학습 정량 평가

Quantitative evaluation of transfer learning for image recognition AI of robot vision

  • 투고 : 2024.03.19
  • 심사 : 2024.05.10
  • 발행 : 2024.05.31

초록

본 연구에서는 로봇 비전용 영상 인식을 비롯한 다양한 AI 분야에서 널리 활용되는 전이학습에 대한 정량적 평가를 제시하였다. 전이학습을 적용한 연구 결과에 대한 정량적, 정성적 분석은 제시되나, 전이학습 자체에 대해서는 논의되지 않는다. 따라서 본 연구에서는 전이학습 자체에 대한 정량적 평가를 숫자 손글씨 데이터베이스인 MNIST를 기반으로 제안한다. 기준 네트워크를 대상으로 전이학습 동결층의 깊이 및 전이학습 데이터와 사전 학습 데이터의 비율에 따른 정확도 변화를 추적하였다. 이를 통해 첫번째 레이어까지 동결할 때 전이학습 데이터의 비율이 3% 이상일 경우, 90% 이상의 정확도를 안정적으로 유지할 수 있음이 확인되었다. 본 연구의 전이학습 정량 평가 방법은 향후 네트워크 구조와 데이터의 종류에 따라 최적화된 전이학습을 구현하는데 활용 가능하며, 다양한 환경에서 로봇 비전 및 이미지 분석 AI의 활용 범위를 확대할 것이다.

This study suggests a quantitative evaluation of transfer learning, which is widely used in various AI fields, including image recognition for robot vision. Quantitative and qualitative analyses of results applying transfer learning are presented, but transfer learning itself is not discussed. Therefore, this study proposes a quantitative evaluation of transfer learning itself based on MNIST, a handwritten digit database. For the reference network, the change in recognition accuracy according to the depth of the transfer learning frozen layer and the ratio of transfer learning data and pre-training data is tracked. It is observed that when freezing up to the first layer and the ratio of transfer learning data is more than 3%, the recognition accuracy of more than 90% can be stably maintained. The transfer learning quantitative evaluation method of this study can be used to implement transfer learning optimized according to the network structure and type of data in the future, and will expand the scope of the use of robot vision and image analysis AI in various environments.

키워드

참고문헌

  1. D. Kragic and H. I. Christensen, "Advances in robot vision," Rob. Auton. Syst., vol. 52, no. 1, pp. 1-3, Jul. 2005, doi: 10.1016/J.ROBOT.2005.03.007.
  2. N. Telagam, A. Thotakuri Assistant Professor, Tk. Assistant Professor, and M. Vucha Professor, "Survey on Robot Vision: Techniques, Tools and Methodologies," Int. J. Appl. Eng. Res., vol. 12, pp. 6887-6896, 2017, Accessed: Apr. 01, 2024. [Online]. Available: http://www.ripublication.com
  3. W. Liang et al., "Advances, challenges and opportunities in creating data for trustworthy AI," Nat. Mach. Intell. 2022 48, vol. 4, no. 8, pp. 669-677, Aug. 2022, doi: 10.1038/s42256-022-00516-1.
  4. S. Tayebi Arasteh et al., "Collaborative training of medical artificial intelligence models with non-uniform labels," Sci. Reports 2023 131, vol. 13, no. 1, pp. 1-9, Apr. 2023, doi: 10.1038/s41598-023-33303-y.
  5. X. Zhou, T. Bai, Y. Gao, and Y. Han, "Vision-Based Robot Navigation through Combining Unsupervised Learning and Hierarchical Reinforcement Learning," Sensors 2019, Vol. 19, Page 1576, vol. 19, no. 7, p. 1576, Apr. 2019, doi: 10.3390/S19071576.
  6. C. Kim, S. Yoon, M. Han, and M. Park, "Transfer Learning-based Generated Synthetic Images Identification Model,," J. Converg. Cult. Technol., vol. 10, no. 2, pp. 465-470, 2024, doi: http://dx.doi.org/10.17703/JCCT.2024.10.2.465.
  7. N. Kwak and D. Kim, "Study On Masked Face Detection And Recognition using transfer learning," Int. J. Adv. Cult. Technol., vol. 10, no. 1, pp. 294-301, 2022.
  8. "MNIST in CSV."https://www.kaggle.com/dataset/oddrationale/mnist-in-csv (accessed Dec. 24, 2023).
  9. "TMNIST (Typeface MNIST)."https://www.kaggle.com/datasets/nimishmagre/tmnist-typeface-mnist (accessed Dec. 24, 2023).