• 제목/요약/키워드: Multiple Distance Face Image

검색결과 11건 처리시간 0.022초

줌 카메라를 통해 획득된 거리별 얼굴 영상을 이용한 원거리 얼굴 인식 기술 (The Long Distance Face Recognition using Multiple Distance Face Images Acquired from a Zoom Camera)

  • 문해민;반성범
    • 정보보호학회논문지
    • /
    • 제24권6호
    • /
    • pp.1139-1145
    • /
    • 2014
  • 지능형 서비스를 제공하는 로봇에서 특정 사람을 인지하거나 구별하는 인식 기술은 매우 중요하다. 기존 단일 거리 얼굴 영상을 학습으로 사용한 얼굴 인식 알고리즘은 원거리로 갈수록 얼굴 인식률이 떨어지는 문제점이 있다. 실제 거리별 얼굴 영상을 이용한 방법은 얼굴 인식률은 향상되지만, 사용자 협조가 요구되는 단점이 있다. 본 논문에서는 줌카메라를 통해 거리별 얼굴 영상을 획득하여 학습으로 사용하는 LDA 기반 원거리 얼굴 인식을 제안한다. 제안하는 방법은 기존 단일거리 얼굴 영상을 학습으로 이용한 방법에 비해 7.8% 향상된 성능을 보였고, 거리별 얼굴 영상을 학습으로 이용한 방법과 비교했을 때 8.0% 저하된 성능을 보였다. 그러나 거리별 얼굴 영상을 취득하기 위해 추가적인 시간과 사용자 협조가 요구되지 않는 장점이 있다.

거리별 얼굴영상 자동 생성 방법을 이용한 원거리 얼굴인식 시스템 (Long Distance Face Recognition System using the Automatic Face Image Creation by Distance)

  • 문해민;반성범
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.137-145
    • /
    • 2014
  • 본 논문에서는 지능형 영상 감시시스템을 위한 LDA기반 원거리 얼굴인식 알고리즘을 제안한다. 기존 단일 거리 얼굴영상을 학습으로 사용한 얼굴인식 알고리즘은 원거리로 갈수록 얼굴인식률이 떨어지는 문제점이 있다. 실제 거리별 얼굴영상을 사용한 방법은 얼굴인식률은 향상되지만 사용자가 직접 움직이며 학습용 거리별 얼굴영상을 취득해야하는 문제점이 있다. 그러므로 본 논문에서는 단일 거리에서 취득한 얼굴영상을 이용해 거리별 얼굴영상을 자동으로 생성하여 학습으로 사용하는 방법을 제안한다. 제안하는 방법은 기존 얼굴인식 방법과 동일한 수준의 사용자 협조에서 거리별 사용자 등록영상을 생성할 수 있는 장점이 있다. 실험결과, 제안한 알고리즘은 기존 단일 거리 학습영상 기반 알고리즘에 비해 근거리에서 평균 16.3%, 원거리에서 평균 18.0% 향상된 얼굴인식 성능을 나타냈고, 실제 거리별 얼굴영상을 사용한 방법보다 근거리에서 평균 4.3%감소했지만, 원거리에서는 동일한 얼굴인식 성능을 나타냈다.

영상 정규화 및 얼굴인식 알고리즘에 따른 거리별 얼굴인식 성능 분석 (Performance Analysis of Face Recognition by Distance according to Image Normalization and Face Recognition Algorithm)

  • 문해민;반성범
    • 정보보호학회논문지
    • /
    • 제23권4호
    • /
    • pp.737-742
    • /
    • 2013
  • 최근 감시시스템은 휴먼인식 기술을 활용하여 스스로 판단하고 대처할 수 있는 지능형으로 발전하고 있다. 기존 얼굴인식 기술은 근거리에서 인식성능이 우수하지만 원거리로 갈수록 인식률이 떨어진다. 본 논문에서는 원거리 휴먼인식을 위해 거리별 얼굴영상을 학습으로 사용한 얼굴인식에서 보간법 및 얼굴인식 알고리즘에 따른 얼굴인식률의 성능을 분석한다. 영상 정규화에는 최근접 이웃, 양선형, 양3차회선, Lanczos3 보간법을 사용하고, 얼굴인식 알고리즘은 PCA와 LDA를 사용한다. 실험결과, 영상 정규화로 양선형 보간법과 얼굴인식 알고리즘으로 LDA를 사용했을 때 우수한 성능을 나타냄을 확인하였다.

3D Face Recognition using Local Depth Information

  • 이영학;심재창;이태홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.818-825
    • /
    • 2002
  • 얼굴의 깊이 정보는 얼굴 인식에서 가장 중요한 요소이다. 3차원 얼굴 영상은 깊이 정보를 잘 나타내므로 얼굴의 깊이 값을 비교하는데 아주 유용하다. 얼굴 전체에 대한 처리는 많은 계산량과 데이터 량을 포함해야 하는 문제점이 있다. 따라서 본 논문에서는 얼굴의 국부적인 영역들에 대한 3차원 깊이 값을 이용하여 인식하였다. 3D 레이저 스캐너로 입력된 3차원 얼굴 영상으로부터 어떤 깊이에 있는 등고선 영역을 추출한 후, 이를 영역별로 취하면 국부적인 얼굴 깊이에 대한 특징을 잘 반영하게 된다. 얼굴의 가장 중심인 코를 기준점으로 깊이 영역에 대한 등고선 영역을 추출하며, 얼굴의 깊이를 고려한 국부적 깊이 정보를 다중 특징 벡터를 이용하여 얼굴을 인식한다. 다중 특징 벡터는 벡터 수가 적으면서 얼굴의 지역적 깊이 특성을 잘 나타내므로 간단한 방법으로 높은 인식률을 얻을 수 있었다.

Deep Learning based Human Recognition using Integration of GAN and Spatial Domain Techniques

  • Sharath, S;Rangaraju, HG
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.127-136
    • /
    • 2021
  • Real-time human recognition is a challenging task, as the images are captured in an unconstrained environment with different poses, makeups, and styles. This limitation is addressed by generating several facial images with poses, makeup, and styles with a single reference image of a person using Generative Adversarial Networks (GAN). In this paper, we propose deep learning-based human recognition using integration of GAN and Spatial Domain Techniques. A novel concept of human recognition based on face depiction approach by generating several dissimilar face images from single reference face image using Domain Transfer Generative Adversarial Networks (DT-GAN) combined with feature extraction techniques such as Local Binary Pattern (LBP) and Histogram is deliberated. The Euclidean Distance (ED) is used in the matching section for comparison of features to test the performance of the method. A database of millions of people with a single reference face image per person, instead of multiple reference face images, is created and saved on the centralized server, which helps to reduce memory load on the centralized server. It is noticed that the recognition accuracy is 100% for smaller size datasets and a little less accuracy for larger size datasets and also, results are compared with present methods to show the superiority of proposed method.

모바일 로봇을 위한 저해상도 영상에서의 원거리 얼굴 검출 (Detection of Faces Located at a Long Range with Low-resolution Input Images for Mobile Robots)

  • 김도형;윤우한;조영조;이재연
    • 로봇학회논문지
    • /
    • 제4권4호
    • /
    • pp.257-264
    • /
    • 2009
  • This paper proposes a novel face detection method that finds tiny faces located at a long range even with low-resolution input images captured by a mobile robot. The proposed approach can locate extremely small-sized face regions of $12{\times}12$ pixels. We solve a tiny face detection problem by organizing a system that consists of multiple detectors including a mean-shift color tracker, short- and long-rage face detectors, and an omega shape detector. The proposed method adopts the long-range face detector that is well trained enough to detect tiny faces at a long range, and limiting its operation to only within a search region that is automatically determined by the mean-shift color tracker and the omega shape detector. By focusing on limiting the face search region as much as possible, the proposed method can accurately detect tiny faces at a long distance even with a low-resolution image, and decrease false positives sharply. According to the experimental results on realistic databases, the performance of the proposed approach is at a sufficiently practical level for various robot applications such as face recognition of non-cooperative users, human-following, and gesture recognition for long-range interaction.

  • PDF

A Novel Cross Channel Self-Attention based Approach for Facial Attribute Editing

  • Xu, Meng;Jin, Rize;Lu, Liangfu;Chung, Tae-Sun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2115-2127
    • /
    • 2021
  • Although significant progress has been made in synthesizing visually realistic face images by Generative Adversarial Networks (GANs), there still lacks effective approaches to provide fine-grained control over the generation process for semantic facial attribute editing. In this work, we propose a novel cross channel self-attention based generative adversarial network (CCA-GAN), which weights the importance of multiple channels of features and archives pixel-level feature alignment and conversion, to reduce the impact on irrelevant attributes while editing the target attributes. Evaluation results show that CCA-GAN outperforms state-of-the-art models on the CelebA dataset, reducing Fréchet Inception Distance (FID) and Kernel Inception Distance (KID) by 15~28% and 25~100%, respectively. Furthermore, visualization of generated samples confirms the effect of disentanglement of the proposed model.

Real time tracking of multiple humans for mobile robot application

  • Park, Joon-Hyuk;Park, Byung-Soo;Lee, Seok;Park, Sung-Kee;Kim, Munsang
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.100.3-100
    • /
    • 2002
  • This paper presents the method for detection and tracking of multiple humans robustly in mobile platform. The perception of human is performed in real time through the processing of images acquired from a moving stereo vision system. We performed multi-cue integration such as human shape, skin color and depth information to detect and track each human in moving background scene. Human shape is measured by edge-based template matching on distance transformed image. Improving robustness for human detection, we apply the human face skin color in HSV color space. And we could increase the accuracy and the robustness in both detection and tracking by applying random sampling stochastic estimati...

  • PDF

Adaptive Background Modeling Considering Stationary Object and Object Detection Technique based on Multiple Gaussian Distribution

  • Jeong, Jongmyeon;Choi, Jiyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권11호
    • /
    • pp.51-57
    • /
    • 2018
  • In this paper, we studied about the extraction of the parameter and implementation of speechreading system to recognize the Korean 8 vowel. Face features are detected by amplifying, reducing the image value and making a comparison between the image value which is represented for various value in various color space. The eyes position, the nose position, the inner boundary of lip, the outer boundary of upper lip and the outer line of the tooth is found to the feature and using the analysis the area of inner lip, the hight and width of inner lip, the outer line length of the tooth rate about a inner mouth area and the distance between the nose and outer boundary of upper lip are used for the parameter. 2400 data are gathered and analyzed. Based on this analysis, the neural net is constructed and the recognition experiments are performed. In the experiment, 5 normal persons were sampled. The observational error between samples was corrected using normalization method. The experiment show very encouraging result about the usefulness of the parameter.

PERSONAL SPACE-BASED MODELING OF RELATIONSHIPS BETWEEN PEOPLE FOR NEW HUMAN-COMPUTER INTERACTION

  • Amaoka, Toshitaka;Laga, Hamid;Saito, Suguru;Nakajima, Masayuki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.746-750
    • /
    • 2009
  • In this paper we focus on the Personal Space (PS) as a nonverbal communication concept to build a new Human Computer Interaction. The analysis of people positions with respect to their PS gives an idea on the nature of their relationship. We propose to analyze and model the PS using Computer Vision (CV), and visualize it using Computer Graphics. For this purpose, we define the PS based on four parameters: distance between people, their face orientations, age, and gender. We automatically estimate the first two parameters from image sequences using CV technology, while the two other parameters are set manually. Finally, we calculate the two-dimensional relationship of multiple persons and visualize it as 3D contours in real-time. Our method can sense and visualize invisible and unconscious PS distributions and convey the spatial relationship of users by an intuitive visual representation. The results of this paper can be used to Human Computer Interaction in public spaces.

  • PDF