초록
현재 심층 신경망 이론 및 응용 연구의 빠른 개발로 얼굴 인식의 효과가 향상되고 있다. 그러나 심층 신경망 계산의 복잡성과 탐지 환경의 복잡성으로 인해 얼굴을 빠르고 정확하게 감지하는 방법이 주요 문제가 된다. 이 논문은 FDDB, LFW 및 FaceScrub 공개 데이터 세트를 훈련 표본을 사용하는 단순한 MTCNN 모델을 기반으로 둔다. MTCNN 모델을 분류하고 소개하면서 학습 훈련 속도를 높이고 성능을 향상하는 방법을 모색합니다. 본 논문에서는 다이내믹 이미지 피라미드 기술을 이용하여 기존 이미지 Pyramid 기술을 대체하여 샘플을 분할하고 MTCNN 모델의 OHEM을 훈련에서 제거하여 훈련 속도를 향상시켰다.
With the rapid development of deep neural network theory and application research, the effect of face detection has been improved. However, due to the complexity of deep neural network calculation and the high complexity of the detection environment, how to detect face quickly and accurately becomes the main problem. This paper is based on the relatively simple model of the MTCNN model, using FDDB (Face Detection Dataset and Benchmark Homepage), LFW (Field Label Face) and FaceScrub public datasets as training samples. At the same time of sorting out and introducing MTCNN(Multi-Task Cascaded Convolutional Neural Network) model, it explores how to improve training speed and Increase performance at the same time. In this paper, the dynamic image pyramid technology is used to replace the traditional image pyramid technology to segment samples, and OHEM (the online hard example mine) function in MTCNN model is deleted in training, so as to improve the training speed.