• 제목/요약/키워드: MTCNN

검색결과 8건 처리시간 0.031초

복잡한 환경에서 MTCNN 모델 기반 얼굴 검출 알고리즘 개선 연구 (Research and Optimization of Face Detection Algorithm Based on MTCNN Model in Complex Environment)

  • 부옥매;김민영;장종욱
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.50-56
    • /
    • 2020
  • 현재 심층 신경망 이론 및 응용 연구의 빠른 개발로 얼굴 인식의 효과가 향상되고 있다. 그러나 심층 신경망 계산의 복잡성과 탐지 환경의 복잡성으로 인해 얼굴을 빠르고 정확하게 감지하는 방법이 주요 문제가 된다. 이 논문은 FDDB, LFW 및 FaceScrub 공개 데이터 세트를 훈련 표본을 사용하는 단순한 MTCNN 모델을 기반으로 둔다. MTCNN 모델을 분류하고 소개하면서 학습 훈련 속도를 높이고 성능을 향상하는 방법을 모색합니다. 본 논문에서는 다이내믹 이미지 피라미드 기술을 이용하여 기존 이미지 Pyramid 기술을 대체하여 샘플을 분할하고 MTCNN 모델의 OHEM을 훈련에서 제거하여 훈련 속도를 향상시켰다.

딥러닝을 이용한 열영상 기반 마스크 검출 시스템 설계 (Design of Face with Mask Detection System in Thermal Images Using Deep Learning)

  • 김용중;최병상;이기섭;정경권
    • 융합보안논문지
    • /
    • 제22권2호
    • /
    • pp.21-26
    • /
    • 2022
  • 마스크 착용은 COVID-19 감염을 예방하기 위한 효과적인 방안이다. 적외선 열화상 기반의 온도 측정과 신원 인식 시스템이 기업에서 널리 사용되고 있는 상황에서 마스크 감지를 위한 연구는 필수적이다. 최근 비전분야에 소개된 MTCNN은 객체 인스턴스 세분화를위한 개념적으로 간단하고 유연하며 일반적인 프레임 워크를 제시한다. 본 논문에서는 열적외선 카메라로부터 획득한 열감지영상에서 발열체인 인스턴스에 대해 발열부위의 세그멘테이션을 생성하는 동시에 이미지 내의 오브젝트 발열부분을 효율적으로 탐색하는 알고리즘을 제안한다. MTCNN(Multi-task Cascaded Convolutional Networks) 기법은 바운딩 박스 인식을 위해 기존 브랜치와 병렬로 객체 마스크를 예측하기 위한 브랜치를 추가한 알고리즘이다. MTCNN은 다른 작업으로 일반화하기 용이하다. 본 논문에서는 MTCNN기반 적외선 열영상 검출알고리즘을 제안하여 RGB영상에서 구별할 수 없는 마스크 착용 여부를 탐지하였다.

MTCNN을 활용한 군중 속 특징 추출 (Extracting Feature in the Crowd using MTCNN)

  • 박진우;김민주;김시현;장동환;이성진;문상호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.380-382
    • /
    • 2021
  • 2020년에 경찰청에서 조사한 자료에 따르면 38,496건 중에 미해결 사건이 161건으로, 미해결 원인 중 가장 높은 성인실종자의 경우는 대부분 단순 가출로 평가된다. CCTV를 통해 영상을 통해 찾는 경우에도 수많은 사람이 지나가는 상황에 인물들의 얼굴을 일일이 확인하고 진술의 특징들로만 인물을 찾아내야 하기 때문에 긴 시간이 걸리고 정확도가 낮아 수사에 많은 시간이 소요되는 것이 확인되었다. 본 논문은 MTCNN을 활용하여 CCTV 속 인물 추출에 대한 연구를 진행하였다. MTCNN으로 학습된 얼굴들과 입고 있는 옷의 특징을 동시에 분석을 시작하여 겹쳐지는 경우의 인물들만 추출하여 관계자에게 확인이 가능하도록 한다. 향후 실종자의 특징들을 좁혀 정확도를 높이기 위해 더 다양한 특징 검출 학습을 목표로 한다.

  • PDF

High-Quality Coarse-to-Fine Fruit Detector for Harvesting Robot in Open Environment

  • Zhang, Li;Ren, YanZhao;Tao, Sha;Jia, Jingdun;Gao, Wanlin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.421-441
    • /
    • 2021
  • Fruit detection in orchards is one of the most crucial tasks for designing the visual system of an automated harvesting robot. It is the first and foremost tool employed for tasks such as sorting, grading, harvesting, disease control, and yield estimation, etc. Efficient visual systems are crucial for designing an automated robot. However, conventional fruit detection methods always a trade-off with accuracy, real-time response, and extensibility. Therefore, an improved method is proposed based on coarse-to-fine multitask cascaded convolutional networks (MTCNN) with three aspects to enable the practical application. First, the architecture of Fruit-MTCNN was improved to increase its power to discriminate between objects and their backgrounds. Then, with a few manual labels and operations, synthetic images and labels were generated to increase the diversity and the number of image samples. Further, through the online hard example mining (OHEM) strategy during training, the detector retrained hard examples. Finally, the improved detector was tested for its performance that proved superior in predicted accuracy and retaining good performances on portability with the low time cost. Based on performance, it was concluded that the detector could be applied practically in the actual orchard environment.

딥러닝을 이용한 마스크 착용 여부 검사 시스템 (Mask Wearing Detection System using Deep Learning)

  • 남충현;남은정;장경식
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.44-49
    • /
    • 2021
  • 최근 COVID-19로 인해 마스크 착용 여부 자동 검사 시스템에 신경망 기술들을 적용하는 연구가 활발히 진행되고 있다. 신경망 적용 방식에 있어서 1단계 검출 방식 또는 2단계 검출 방식을 사용하며, 데이터를 충분히 확보할 수 없는 경우 사전 학습된 신경망에 대해 가중치 미세 조절 기법을 적용하여 학습한다. 본 논문에서는 얼굴 인식부와 마스크 검출부로 구성되는 2단계 검출 방식을 적용하였으며, 얼굴 인식부에는 MTCNN 모델, 마스크 검출부에는 ResNet 모델을 사용하였다. 마스크 검출부는 다양한 실 상황에서의 인식률과 추론 속도 향상을 위하여 5개의 ResNet모델을 적용하여 실험하였다. 학습 데이터는 웹 크롤러를 이용하여 수집한 17,219개의 정지 영상을 이용하였으며, 1,913개의 정지 영상과 1분 동영상 2개에 대해 각각 추론을 실시하였다. 실험 결과 정지 영상인 경우 96.39%, 동영상인 경우 92.98%의 높은 정확도를 보였고, 동영상 추론 속도는 10.78fps임을 확인하였다.

360 카메라를 이용한 디지털 트윈 강의실 (Digital Twin Classroom using 360 Camera)

  • 유현태;김진호;김유성;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.232-234
    • /
    • 2021
  • 본 논문에서는 딥러닝 얼굴 인식을 이용하여 실시간 360 공간 Classroom 과 실시간을 기반으로 한 가상 360 공간 Classroom 을 제안한다. MTCNN 을 이용한 얼굴 검출 및 Inception Resnet V1 모델을 이용한 딥러닝 기법을 통해 얼굴인식을 진행하고 HSV 색공간 기반의 화자 판별, 아바타 Rendering, 출석 체크 등을 진행한다. 이후 시각화를 위해 제작한 Web UI/UX 를 통해 사용자에게 현실과 가상 공간을 넘나드는 Twin Classroom 을 제공한다. 따라서 사용자는 새로운 화상 교육 플랫폼에서 보다 개선되고 생동감 있는 Classroom 에서 교육을 받을 수 있다.

  • PDF

Parallel Multi-task Cascade Convolution Neural Network Optimization Algorithm for Real-time Dynamic Face Recognition

  • Jiang, Bin;Ren, Qiang;Dai, Fei;Zhou, Tian;Gui, Guan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4117-4135
    • /
    • 2020
  • Due to the angle of view, illumination and scene diversity, real-time dynamic face detection and recognition is no small difficulty in those unrestricted environments. In this study, we used the intrinsic correlation between detection and calibration, using a multi-task cascaded convolutional neural network(MTCNN) to improve the efficiency of face recognition, and the output of each core network is mapped in parallel to a compact Euclidean space, where distance represents the similarity of facial features, so that the target face can be identified as quickly as possible, without waiting for all network iteration calculations to complete the recognition results. And after the angle of the target face and the illumination change, the correlation between the recognition results can be well obtained. In the actual application scenario, we use a multi-camera real-time monitoring system to perform face matching and recognition using successive frames acquired from different angles. The effectiveness of the method was verified by several real-time monitoring experiments, and good results were obtained.

얼굴 영역 추출 시 여유값의 설정에 따른 개성 인식 모델 정확도 성능 분석 (Performance Analysis for Accuracy of Personality Recognition Models based on Setting of Margin Values at Face Region Extraction)

  • 구욱;한규원;김봉재
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.141-147
    • /
    • 2024
  • 최근 개인의 성향을 반영한 맞춤형 서비스가 각광 받고 있다. 이와 관련하여 개인의 개성을 인식하고 활용하고자 하는 연구가 지속적으로 이루어지고 있다. 각 개인의 개성을 인식하고 평가하는 방법은 다수가 있지만, OCEAN 모델이 대표적으로 사용된다. OCEAN 모델로 각 개인의 개성을 인식할 때 언어적, 준언어적, 비언어적 정보를 이용하는 멀티 모달리티 기반 인공지능 모델이 사용될 수 있다. 본 논문에서는 비언어적 정보인 사용자의 표정을 기반으로 OCEAN을 인식하는 인공지능 모델에서 영상 데이터에서 얼굴 영역을 추출할 때 지정하는 얼굴 영역 여유값(Margin)에 따른 개성 인식 모델 정확도 성능을 분석한다. 실험에서는 2D Patch Partition, R2plus1D, 3D Patch Partition, 그리고 Video Swin Transformer에 기반한 개성 인식 모델을 사용하였다. 얼굴 영역 추출 시 여유값을 60으로 사용했을 때 1-MAE 성능이 0.9118로 가장 우수하였다. 따라서 개성 인식 모델의 성능을 최적화하기 위해서는 적절한 여유값을 설정해야 함을 확인하였다.