• 제목/요약/키워드: Face Landmark Detection

검색결과 13건 처리시간 0.026초

Multi-Task FaceBoxes: A Lightweight Face Detector Based on Channel Attention and Context Information

  • Qi, Shuaihui;Yang, Jungang;Song, Xiaofeng;Jiang, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4080-4097
    • /
    • 2020
  • In recent years, convolutional neural network (CNN) has become the primary method for face detection. But its shortcomings are obvious, such as expensive calculation, heavy model, etc. This makes CNN difficult to use on the mobile devices which have limited computing and storage capabilities. Therefore, the design of lightweight CNN for face detection is becoming more and more important with the popularity of smartphones and mobile Internet. Based on the CPU real-time face detector FaceBoxes, we propose a multi-task lightweight face detector, which has low computing cost and higher detection precision. First, to improve the detection capability, the squeeze and excitation modules are used to extract attention between channels. Then, the textual and semantic information are extracted by shallow networks and deep networks respectively to get rich features. Finally, the landmark detection module is used to improve the detection performance for small faces and provide landmark data for face alignment. Experiments on AFW, FDDB, PASCAL, and WIDER FACE datasets show that our algorithm has achieved significant improvement in the mean average precision. Especially, on the WIDER FACE hard validation set, our algorithm outperforms the mean average precision of FaceBoxes by 7.2%. For VGA-resolution images, the running speed of our algorithm can reach 23FPS on a CPU device.

Transposed Convolutional Layer 기반 Stacked Hourglass Network를 이용한 얼굴 특징점 검출에 관한 연구 (Facial Landmark Detection by Stacked Hourglass Network with Transposed Convolutional Layer)

  • 구정수;강호철
    • 한국멀티미디어학회논문지
    • /
    • 제24권8호
    • /
    • pp.1020-1025
    • /
    • 2021
  • Facial alignment is very important task for human life. And facial landmark detection is one of the instrumental methods in face alignment. We introduce the stacked hourglass networks with transposed convolutional layers for facial landmark detection. our method substitutes nearest neighbor upsampling for transposed convolutional layer. Our method returns better accuracy in facial landmark detection compared to stacked hourglass networks with nearest neighbor upsampling.

얼굴 특징점 검출을 위한 적분 회귀 네트워크 (Integral Regression Network for Facial Landmark Detection)

  • 김도엽;장주용
    • 방송공학회논문지
    • /
    • 제24권4호
    • /
    • pp.564-572
    • /
    • 2019
  • 최근 딥러닝 기술의 발전과 함께 얼굴 특징점 검출 방법의 성능은 크게 향상되었다. 대표적인 얼굴 특징점 검출 방법인 히트맵 회귀 방법은 효율적이고 강력한 방법으로 널리 사용되고 있으나, 단일 네트워크를 통해 특징점 좌표를 즉시 얻을 수 없으며, 히트맵으로부터 특징점 좌표를 결정하는 과정에서 정확도가 손실된다는 단점이 존재한다. 이러한 문제점들을 해결하기 위해 본 논문에서는 기존의 히트맵 회귀 방법에 적분 회귀 방법을 결합할 것을 제안한다. 여러 가지 데이터셋을 사용한 실험을 통해 제안하는 적분 회귀 네트워크가 얼굴 특징점 검출 성능을 크게 향상시킨다는 것을 보인다.

각 분할 스핀 영상을 사용한 3차원 얼굴 특징점 검출 방법 (Robust 3D Facial Landmark Detection Using Angular Partitioned Spin Images)

  • 김동현;최강선
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.199-207
    • /
    • 2013
  • 스핀 영상은 3차원 표면의 특징을 효과적으로 표현하기 때문에 3차원 얼굴에서 특징점을 검출하는데 많이 이용된다. 하지만 기존의 스핀 영상은 표면의 법선 벡터 방향에 따라 매우 다른 스핀 영상이 만들어지는 단점이 있다. 또한 해당 영역 내에 존재하는 모든 점을 2차원으로 변환하여 고려하기 때문에 3차원 표면 특징이 모호해질 수 있다. 본 논문에서는 검색 영역을 분할한 스핀 영상을 이용하는 3차원 얼굴 특징점 검출 방법을 제안하였다. 기준점으로부터 떨어진 각도에 따라 검색범위를 분할하여 분할된 영역 내 점들에 대해 스핀 영상을 구성하여 방향에 따른 특징 추출을 극대화했다. 법선 벡터 평탄화를 이용하여 표면 법선 벡터 방향에 대한 잡음 민감성을 줄여 정확한 형태의 스핀 영상을 얻도록 했다. 실험을 통해 제안한 방법으로 찾은 특징점과 실측 특징점과의 거리차를 비교하여 기존방법에 비해 약 34% 향상된 정확도를 얻음을 확인했다.

가중치 합산 기반 안면인식 특징점 저장 알고리즘 연구 (Study on Weight Summation Storage Algorithm of Facial Recognition Landmark)

  • 조성욱;유영균;곽광진;박정민
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.163-170
    • /
    • 2022
  • 본 논문은 실생활 속 정제되지 않은 입력으로 인해 안면의 특징점을 추출하여 객체 인식 모델의 이상적인 성능과 속도를 보증해주지 못하는 문제점을 가중치 합산을 통한 저장 알고리즘을 통해 개선하는 방법을 소개한다. 많은 안면인식 프로세스들은 이상적인 상황에서의 정확도를 보장해주지만, 실생활에서 발생할 수 있는 수많은 방해요인에 대해서는 대처하지 못한다는 문제점이 주목받고 있으며 이는 곧 보안과 밀접하게 관련된 안면인식 프로세스에서 심각한 문제를 발생할 수도 있다. 본 논문에서는 사람의 고유한 특징점은 사진의 구도 등의 여러 변수가 있어도 결국 평균적인 하나의 형태를 띤다는 점을 이용하여 입력으로 추출된 특징점을 여러 방해 요인에 과적합 되어있지 않은 소수의 특징점과 비교를 통해 실시간으로 빠르게, 그리고 정확하게 안면인식을 할수 있는 방법을 가중치 합산방식을 통하여 제시한다.

Caffe를 이용한 얼굴 인식 파이프라인 모델 구현 (Implementation of Face Recognition Pipeline Model using Caffe)

  • 박진환;김창복
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.430-437
    • /
    • 2020
  • 제안 모델은 얼굴 검출과 랜드마크 및 얼굴 인식 알고리즘을 이용하여 인공신경망으로 학습을 통해 얼굴 예측률과 인식률을 향상하는 모델을 구현하였다. 제안 모델은 특정 인물의 얼굴 영상에서 랜드마킹을 한 후, 기존에 학습된 Caffe 모델을 이용하여 얼굴검출과 임베딩 벡터 128D를 추출하였다. 학습은 기계학습 알고리즘인 SVM (support vector machine)과 DNN (deep neural network)을 구축하여 학습하였다. 얼굴인식은 학습된 모델을 이용하여 학습된 인물 중 다른 얼굴 영상으로 테스트하였다. 실험 결과, SVM 보다는 DNN으로 학습한 결과가 우수한 예측률과 인식률을 보였다. DNN의 중간층을 증가하게 되면 예측률은 높아지나 인식률이 감소하는 현상이 발생하였다. 이것은 인식하고자 하는 대상이 적음으로써 발생하는 과적합으로 판단된다. 제안 모델은 명확한 얼굴 영상을 추가하여 학습한 결과, 높은 예측률과 인식률의 결과를 얻을 수 있음을 확인할 수 있었다. 본 연구는 좀 더 많은 얼굴 영상 데이터를 이용함으로써 보다 효과적인 딥러닝 구축을 통해 보다 향상된 인식률과 예측률을 얻을 수 있을 것이다.

국부적 요소 모델을 이용한 얼굴 특징점 추출 (Face Landmark Detection Using Local Component Model)

  • 김대환;전승선;오두식;조성원;김재민;김상훈;정선태
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.143-146
    • /
    • 2007
  • 객체의 특징점을 추출할 때, 일반적으로 모델 기반 접근을 사용한다. 본 논문에서는 이러한 모델 기반 특징점 추출 알고리즘으로 PCA를 근간으로 하는 Active Appearance Model을 이용하는데, 기존의 AAM 알고리즘은 모든 특징점을 하나의 군집으로 기준하여 PCA를 수행하지만 본 논문에서는 이것을 각 주요 부위별 학습 모델로 분리하여 수행한다. 그리고 이러한 모델에서 특징점을 찾을 때, 발산하는 문제에 빠지지 않기 위한 방법을 제시한다. 제시한 방법의 모델을 이용하여 실험 할 경우의 결과와 이를 통한 개별 모델의 특성에 대하여 파악한 결과를 제시한다.

  • PDF

Triangle Method for Fast Face Detection on the Wild

  • Malikovich, Karimov Madjit;Akhmatovich, Tashev Komil;ugli, Islomov Shahboz Zokir;Nizomovich, Mavlonov Obid
    • Journal of Multimedia Information System
    • /
    • 제5권1호
    • /
    • pp.15-20
    • /
    • 2018
  • There are a lot of problems in the face detection area. One of them is detecting faces by facial features and reducing number of the false negatives and positions. This paper is directed to solve this problem by the proposed triangle method. Also, this paper explans cascades, Haar-like features, AdaBoost, HOG. We propose a scheme using 12-net, 24-net, 48-net to scan images and improve efficiency. Using triangle method for frontal pose, B and B1 methods for other poses in neural networks are proposed.

증강현실 기법을 이용한 초음파 미용기의 조사 위치 표시 (Display of Irradiation Location of Ultrasonic Beauty Device Using AR Scheme)

  • 강문호
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.25-31
    • /
    • 2020
  • 본 연구에서는 휴대용 초음파 피부 미용기 사용시 집속 초음파의 조사 위치를 증강현실 (Augmented Reality: AR) 기법을 통해 사용자에게 보여주어 안전하게 셀프시술을 하도록 하는 안드로이드 앱을 개발하고 시험을 통해 유용성을 보인다. 사용자가 초음파 미용기로 얼굴 부위를 시술하는 동안에 스마트폰 카메라를 통해 사용자의 얼굴과 얼굴위의 초음파 조사 위치를 실시간 검지한 후, 얼굴 영상위에 조사 위치를 표시하여 사용자에게 보여줌으로서, 초음파가 동일한 부위에 과도하게 중복되어 조사되지 않도록 한다. 이를 위해 ML-Kit를 이용하여 사용자 얼굴의 랜드마크(landmark)들을 실시간 검지하고 얼굴형상 기준 모델과 비교하여 얼굴의 회전과 이동 등의 자세를 추정한다. 미용기의 초음파 조사부위에 LED를 장착하고 조사 중에 작동시킨 후, LED의 불빛의 위치를 탐색하여 스마트폰 화면상의 초음파 조사 위치를 알아내고, 추정된 자세정보를 토대로 얼굴 영상위에 조사 위치를 정합시켜 표시한다. 앱에서 수행되는 각 작업들을 스레드와 타이머를 통해 구현하여 전체 작업이 75ms 이내에서 실행된다. 시험 결과, 120개의 초음파 조사 위치를 정합하고 표시하는 데 걸린 시간은 25ms 이하이고, 얼굴이 크게 회전하지 않는 경우 표시 정확도는 20mm 이내 임을 알 수 있다.

방향성 프로파일을 적용한 능동형태 모델 (Active Shape Model with Directional Profile)

  • 김정엽
    • 한국멀티미디어학회논문지
    • /
    • 제20권11호
    • /
    • pp.1720-1728
    • /
    • 2017
  • Active shape model is widely used in the field of image processing especially on arbitrary meaningful shape extraction from single gray level image. Cootes et. al. showed efficient detection of variable shape from image by using covariance and mean shape from learning. There are two stages of learning and testing. Hahn applied enhanced shape alignment method rather than using Cootes's rotation and scale scheme. Hahn did not modified the profile itself. In this paper, the method using directional one dimensional profile is proposed to enhance Cootes's one dimensional profile and the shape alignment algorithm of Hahn is combined. The performance of the proposed method was superior to Cootes's and Hahn's. Average landmark estimation error for each image was 27.72 pixels and 39.46 for Cootes's and 33.73 for Hahn's each.