Performance Analysis of Human Facial Age Classification Method Based on Vision Transformer

Vision Transformer 기반 얼굴 연령 분류 기법의 성능 분석

  • Junhwi Park (Dept. of AI.Robotics Engineering, Korea National University of Transportation) ;
  • Namjung Kim (Dept. of Software, Korea National University of Transportation) ;
  • Changjoon Park (Dept. of IT.Energy Convergence, Korea National University of Transportation) ;
  • Jaehyun Lee (Dept. of Computer Engineering, Korea National University of Transportation) ;
  • Jeonghwan Gwak (Dept. of Software, Korea National University of Transportation)
  • 박준휘 (국립한국교통대학교 AI로봇공학과) ;
  • 김남중 (국립한국교통대학교 소프트웨어학과) ;
  • 박창준 (국립한국교통대학교 교통에너지융합학과) ;
  • 이재현 (국립한국교통대학교 컴퓨터공학과) ;
  • 곽정환 (국립한국교통대학교 소프트웨어학과)
  • Published : 2024.01.17

Abstract

얼굴 연령 분류 기법은 신원 확인 시스템 고도화, 유동 인구 통계 자동화 시스템 구축, 연령 제한 콘텐츠 관리 시스템 고도화 등 다양한 분야에 적용할 수 있는 확장 가능성을 가진다. 넓은 확장 가능성을 가지는 만큼 적용된 시스템의 안정성을 위해서는 얼굴 연령 분류 기법의 높은 정확도는 필수적이다. 따라서, 본 논문에서는 Vision Transformer(ViT) 기반 분류 알고리즘의 얼굴 연령 분류 성능을 비교 분석한다. ViT 기반분류 알고리즘으로는 최근 널리 사용되고 있는 ViT, Swin Transformer(ST), Neighborhood Attention Transformer(NAT) 세 가지로 선정하였으며, ViT의 얼굴 연령 분류 정확도 65.19%의 성능을 확인하였다.

Keywords

Acknowledgement

This work was supported by the Institute of Information & Communications Technology Planning & Evaluation (IITP) grant funded by the Korean government (MSIT) (No. 2014-3-00077).

References

  1. A. Dosovitskiy, L. Beyer, A. Kolesnikov, D. Weissenborn, X. Zhai, T. Unterthiner, M. Dehghani, M. Minderer, G. Heigold, S. Gelly, J. Uszkoreit and N. Houlsby, "An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale," International Conference on Learning Representations (ICLR), 2021. DOI : 10.48550/arXiv.2010.11929
  2. Z. Liu, Y. Lin, Y. Cao, H. Hu, Y. Wei, Z. Zhang, S. Lin and B. Guo, "Swin Transformer: Hierarchical Vision Transformer Using Shifted Windows," Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), pp. 10012-10022, October 2021, DOI : 10.48550/arXiv.2103.14030
  3. A. Hassani, S. Walton, J. Li, S. Li and H. Shi, "Neighborhood Attention Transformer," Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp. 6185-6194, June 2023 DOI :10.48550/arXiv.2204.07143
  4. https://www.kaggle.com/datasets/frabbisw/facial-age/data