• Title/Summary/Keyword: eye recognition

Search Result 297, Processing Time 0.031 seconds

운전자 피로 감지를 위한 얼굴 동작 인식 (Facial Behavior Recognition for Driver's Fatigue Detection)

  • 박호식;배철수
    • 한국통신학회논문지
    • /
    • 제35권9C호
    • /
    • pp.756-760
    • /
    • 2010
  • 본 논문에서는 운전자 피로 감지를 위한 얼굴 동작을 효과적으로 인식하는 방법을 제안하고자 한다. 얼굴 동작은 얼굴 표정, 얼굴 자세, 시선, 주름 같은 얼굴 특징으로 나타난다. 그러나 얼굴 특징으로 하나의 동작 상태를 뚜렷이 구분한다는 것은 대단히 어려운 문제이다. 왜냐하면 사람의 동작은 복합적이며 그 동작을 표현하는 얼굴은 충분한 정보를 제공하기에는 모호성을 갖기 때문이다. 제안된 얼굴 동작 인식 시스템은 먼저 적외선 카메라로 눈 검출, 머리 방향 추정, 머리 움직임 추정, 얼굴 추적과 주름 검출과 같은 얼굴 특징 등을 감지하고 획득한 특징을 FACS의 AU로 나타낸다. 획득한 AU를 근간으로 동적 베이지안 네트워크를 통하여 각 상태가 일어날 확률을 추론한다.

다중 얼굴 특징 추적을 이용한 복지형 인터페이스 (Welfare Interface using Multiple Facial Features Tracking)

  • 주진선;신윤희;김은이
    • 대한전자공학회논문지SP
    • /
    • 제45권1호
    • /
    • pp.75-83
    • /
    • 2008
  • 본 논문에서는 얼굴의 다중 특징을 이용하여 마우스의 다양한 동작을 효율적으로 구현할 수 있는 복지형 인터페이스를 제안한다. 제안된 시스템은 5개의 모듈로 구성 된다 : 얼굴의 검출(Face detection), 눈의 검출(eye detection), 입의 검출(mouth detection), 얼굴특징 추적(lariat feature tracking), 마우스의 제어(mouse control). 첫 단계에서는 피부색 모델과 연결 성분 분석을 이용하여 얼굴 영역을 검출한다. 그 후 얼굴영역으로부터 정확히 눈을 검출하기 위하여 신경망 기반의 텍스처 분류기를 사용하여 얼굴 영역에서 눈 영역과 비 눈 영역을 구분한다. 일단 눈 영역이 검출되면 눈의 위치에 기반 하여 에지 검출기(edge detector)를 이용하여 입 영역을 찾는다. 눈 영역과 입 영역을 찾으면 각각 mean shift 알고리즘과 template matching을 사용하여 정확하게 추적되고, 그 결과에 기반 하여 마우스의 움직임 또는 클릭의 기능이 수행된다. 제안된 시스템의 효율성을 검증하기 위하여 제안된 인터페이스 시스템을 다양한 응용분야에 적용 하였다. 장애인과 비장애인으로 나누어 제안된 시스템을 실험한 결과 모두에게 실시간으로 보다 편리하고 친숙한 인터페이스로 활용 될 수 있다는 것이 증명 되었다.

뇌파, 시선추적 및 인공지능 기술에 기반한 디지털 도서관 인터페이스 연구: 암묵적 적합성 피드백 활용을 중심으로 (Digital Library Interface Research Based on EEG, Eye-Tracking, and Artificial Intelligence Technologies: Focusing on the Utilization of Implicit Relevance Feedback)

  • 김현희;김용호
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.261-282
    • /
    • 2024
  • 본 연구는 디지털 도서관의 콘텐츠를 탐색하는 동안 이용자의 암묵적 적합성 피드백을 활용하여 적합성을 판단하기 위해 뇌파 기반 및 시선추적 기반 방법들을 제안하고 평가해 보았다. 이를 위해서 32명을 대상으로 하여 동영상, 이미지, 텍스트 데이터를 활용하여 뇌파/시선추적 실험들을 수행하였다. 제안된 방법들의 유용성을 평가하기 위해서, 딥러닝 기반의 인공지능 방법들을 경쟁 기준으로 사용하였다. 평가 결과, 주제에 적합한 동영상과 이미지(얼굴/감정)를 선택하는 데에는 뇌파 컴포넌트 기반 방법들(av_P600, f_P3b)이 높은 분류 정확도를 나타냈고, 이미지(객체)와 텍스트(신문 기사)를 선택하는 데에는 인공지능 기반 방법 즉, 객체 인식 기반 방법과 자연언어 처리 방법이 각각 높은 분류 정확도를 나타냈다. 끝으로, 뇌파, 시선추적 및 인공지능 기술에 기반한 디지털 도서관 인터페이스를 구현하기 위한 지침 즉, 암묵적 적합성 피드백에 기반한 시스템 모형을 제안하고, 분류 정확도를 향상시키기 위해서 미디어별로 적합한 뇌파 기반, 시선추적 기반 및 인공지능 기반 방법들을 제시하였다.

스마트폰 환경의 인증 성능 최적화를 위한 다중 생체인식 융합 기법 연구 (Authentication Performance Optimization for Smart-phone based Multimodal Biometrics)

  • 문현준;이민형;정강훈
    • 디지털융복합연구
    • /
    • 제13권6호
    • /
    • pp.151-156
    • /
    • 2015
  • 본 논문에서는 스마트폰 환경의 얼굴 검출, 인식 및 화자 인증 기반 다중생체인식 개인인증 시스템을 제안한다. 제안된 시스템은 Modified Census Transform과 gabor filter 및 k-means 클러스터 분석 알고리즘을 통해 얼굴의 주요 특징을 추출하여 얼굴인식을 위한 데이터 전처리를 수행한다. 이후 Linear Discriminant Analysis기반 본인 인증을 수행하고(얼굴인식), Mel Frequency Cepstral Coefficient기반 실시간성 검증(화자인증)을 수행한다. 화자인증에 사용하는 음성 정보는 실시간으로 변화하므로 본 논문에서는 Dynamic Time Warping을 통해 이를 해결한다. 제안된 다중생체인식 시스템은 얼굴 및 음성 특징 정보를 융합 및 스마트폰 환경에 최적화하여 실시간 얼굴검출, 인식과 화자인증 과정을 수행하며 단일 생체인식에 비해 약간 낮은 95.1%의 인식률을 보이지만 1.8%의 False Acceptance Ratio를 통해 객관적인 실시간 생체인식 성능을 입증하여 보다 신뢰할 수 있는 시스템을 완성한다.

얼굴의 기하학적 특징정보 기반의 얼굴 특징자 분류 및 해석 시스템 (Face classification and analysis based on geometrical feature of face)

  • 정광민;김정훈
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1495-1504
    • /
    • 2012
  • 본 논문에서는 얼굴의 기하학적 특징정보를 기반으로 하여 얼굴의 특징자인 눈썹, 눈, 입, 턱선의 분류 및 해석 알고리즘을 제안하였다. 먼저, 얼굴 특징정보의 분류와 해석을 하기위한 전처리 과정으로 얼굴 특징자들의 눈, 코, 입, 눈썹, 턱선을 추출하기위해 얼굴 특징자 추출 알고리즘을 적용하여 얼굴 특징자들을 추출하게 된다. 추출한 얼굴 특징자들의 형태 정보와 모양정보 및 특징자들 간의 거리비율을 검출하여 이를 평가함수화 하고, 3가지의 눈 타입, 9가지의 입 타입, 12가지의 눈썹 타입 그리고 4가지의 턱선 타입의 분류를 하게 된다. 이렇게 분류된 얼굴 특징자들을 이용하여 얼굴을 해석하게 된다. 얼굴해석 알고리즘은 각각의 특징자들에 대한 고유의 특징자들의 내부구간의 화소분포 정보와 기울기 정보를 가지고 있다. 따라서 특징자들 간의 정보를 이용하여 얼굴을 해석할 수 있었다.

도로명판 및 교통표지판 인지에 미치는 시기능의 영향 (Impact of Visual Performance on Recognition of Road and Traffic Sign)

  • 추병선
    • 대한교통학회지
    • /
    • 제29권1호
    • /
    • pp.47-55
    • /
    • 2011
  • 본 연구의 목적은 서로 다른 시력조건하에서 도로명판과 도로표지판에 대한 판독거리와 판독시 안구의 움직임 (응시시간, 응시수)에 대한 측정을 수행하였다. 실험은 실제 도로상황과 유사한 환경을 가진 폐쇄순환도로에서 피실험자가 실제 차량을 운전하면서 실시되었으며, 실험을 위하여 규격에 맞게 제작되어진 도로명판과, 도로 양옆에 위치해 있는 실제 교통표지판 (도로명판, 속도제한 표지판)을 이용하였다. 시력조건은 안경렌즈를 이용하여, 시력이 1.2인 조건과 1.0 그리고 0.8의 조건을 구현하였으며, 각 실험자가 3가지의 시력 조건에 대해 실험을 수행하였다. 시력조건이 1.2 인 경우와 0.8인경우의 판독거리는 유의한 수준의 차이를 보였으며, 응시시간과 응시수는 표지판의 크기가 작은 경우에 시력조건별 차이를 보였다. 본 연구의 결과는 운전에 있어서 시력 교정의 중요성을 보여주었으며, 운전면허 기준시력을 넘는다고 해도 시력의 정도에 따라 판독거리, 그리고 판독시 안구운동의 효율성에서 차이를 보일 수 있다.

시각과 시촉각에 의한 운동 측면에서 본 공간과 시간의 관계성 연구 - 연경당 외부공간을 중심으로 - (A Study on the Relationship of Space and Time in Visual Tactility)

  • 육옥수
    • 건축역사연구
    • /
    • 제20권1호
    • /
    • pp.77-93
    • /
    • 2011
  • Across the culture of Western Europe, dichotomy based on the visual sense has evolved. They believed eyes and ears requiring a distance related in recognition, are more developed than any other human senses in human body. Dominant position, as a condition to using a perspective, the eye has been just concentrated in the development of optical sight. But developed a variety of modern media, highlighting the importance of the other perception, it makes dichotomy to the expansion of perception over the single function of visuality. Recently, Guille Deleuze and Merleau-Ponty try to recover the sense of tactility segregated in skin from body keeping eyes for distance. By the result, the activity can be happened by being connected to the body rather than to eye in the space between the subject and object. From the phase of recognition where the human body tries to identify the object in the space considering a time, it will be changed for the subject to the phase of structure vice versa. Visual tactility is to eliminate the distance between subject and object. If the visual tactility is to erase the distance different from the visual in dichotomy, it will be occurred to having a tension and makes new relationship to work trying to move the subjective point of view in object. Like this evidence in analysis of architecture, it can be easy to find the Korean architecture rather than western architecture in terms of emphasizing the time and space. The fact, architecture of Lee Dynasty had been preserved and consisted basic form and style over the centuries makes us assume that visual tactility was considered as well as the visual sense. This study will be intensive in terms of visual and tactile inherent in the subject and how it is being connected to the movement in the space and time.

다중 해상도 가버 특징 벡터를 이용한 강인한 눈 검출 (Robust Eye Localization using Multi-Scale Gabor Feature Vectors)

  • 김상훈;정수환;조성원;정선태
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.25-36
    • /
    • 2008
  • 눈 검출은 눈 동공의 정 중앙의 위치를 찾아내는 작업을 의미하며, 얼굴 인식 및 관련된 응용 분야 등에서 필요한 작업이다. 현재까지 보고된 대부분의 눈 검출 방법의 경우 성공적인 적용을 위해서는 여전히 정확도 및 검출 속도의 개선을 필요로 한다. 본 논문에서는 큰 계산량의 부담이 없는 다중 해상도 가버 특징 벡터를 이용한 강인한 눈 검출 방법을 제안한다. 가버 특징 벡터를 사용한 눈 검출은 EBGM 등에서 이미 이용되고 있다. 그런데, RBGM 등에서 사용한 눈 검출 방법은 초기값에 민감하고 조명, 자세 등에 강인하지 못하여, 만족할 만한 검출률을 얻기 위해서는 광범위한 탐색 범위가 필요하다. 이는 계산량의 상당한 증가를 초래한다. 본 논문에서 제안한 눈 검출 방법은 다중 해상도 접근 방법을 활용한다. 먼저, 원래 해상도 얼굴 이미지를 다운샘플링하여 얻은 저해상도 얼굴 이미지에서, 초기 추정 눈 위치에서의 가버 특징 벡터와 해당 해상도의 눈에 대한 가버 특징 벡터 모델과의 가버젯 유사도를 이용하여 눈 위치를 검출한다. 이후 검출된 눈 위치를 업스케일링하여 상위 해상도의 얼굴 이미지에서의 눈 위치 초기값으로 취하고 앞 단계에서처럼 가버젯 유사도를 이용하여 눈을 검출한다. 이 과정을 반복하여 최종적으로 원래 해상도 얼굴 이미지에서의 눈 위치를 확정한다. 또한, 본 논문에서는 제안된 다중 해상도 접근 방법이 조명에 대해서도 보다 강인하도록 하는 데 효과적인 조명 정규화 기법을 제안하고, 이를 다중 해상도 접근 방법의 전처리 단계에 추가적으로 적용함으로써 눈 검출 성공률을 더욱 개선하였다. 실험을 통해, 본 논문에서 제안한 다중스케일 가버 특징 벡터 기반 눈 검출 방법은 계산량을 크게 증가 시키지 않으면서 기존 연구들에서 보고된 다른 눈 검출 방법에 비해 정확도가 개선된 검출 방법이며, 자세 및 조명 변화에 대해서도 강인하다는 것을 확인하였다.

얼굴 인식률 향상을 위한 손상된 얼굴 영역의 복원 (Reconstruction of Partially Damaged face for Improving a Face Recognition Rate)

  • 최재영;황승호;김낙빈
    • 한국멀티미디어학회논문지
    • /
    • 제7권3호
    • /
    • pp.308-318
    • /
    • 2004
  • 손상된 얼굴영상을 인식하는 문제는 자동 얼굴인식 시스템의 상용화에 중요한 논점이 되고 있다. 손상된 영상에서 얼굴을 인식하기 위한 방법은 크게 두 가지로 나누어진다. 첫째는 손상된 정보를 제거하여 인식을 하는 것이고, 둘째는 손상된 정보를 복원한 후에 인식을 하는 것이다. 본 논문에서는 손상된 영상을 코호넨 네트워크에 입력하여 손상된 영역을 추출한 다음에 주성분 분석을 통해 얻은 특징 벡터의 계수 추정을 이용하여 복원하는 방안을 제시한다. 본 논문에서 제안한 방법은 손상되지 않은 영역을 기반으로 하여 손상된 영역의 특징 벡터를 추정하고, 추정된 특징 벡터로써 손상된 영상을 복원하는 방법으로 학습되어지지 않은 영상에서도 복원이 가능하다. 본 연구실에서 얼굴 인식에 많은 영향을 미치는 눈과 입 부위를 인위적으로 손상시킨 영상을 실험하였을 때, 복원된 영상의 인식률은 학습된 영상의 경우에는 코호넨 네트워크를 사용한 방법과는 유사한 결과를 나타내고 대칭성을 이용한 방법에 비해서는 11.8%가 향상되었으며, 학습되지 않은 영상에서의 경우에는 코호넨 네트워크를 이용한 방법과 대칭성을 이용한 방법에 비해 각각 14%, 7% 향상되었다.

  • PDF

Facial Recognition Algorithm Based on Edge Detection and Discrete Wavelet Transform

  • Chang, Min-Hyuk;Oh, Mi-Suk;Lim, Chun-Hwan;Ahmad, Muhammad-Bilal;Park, Jong-An
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제3권4호
    • /
    • pp.283-288
    • /
    • 2001
  • In this paper, we proposed a method for extracting facial characteristics of human being in an image. Given a pair of gray level sample images taken with and without human being, the face of human being is segmented from the image. Noise in the input images is removed with the help of Gaussian filters. Edge maps are found of the two input images. The binary edge differential image is obtained from the difference of the two input edge maps. A mask for face detection is made from the process of erosion followed by dilation on the resulting binary edge differential image. This mask is used to extract the human being from the two input image sequences. Features of face are extracted from the segmented image. An effective recognition system using the discrete wave let transform (DWT) is used for recognition. For extracting the facial features, such as eyebrows, eyes, nose and mouth, edge detector is applied on the segmented face image. The area of eye and the center of face are found from horizontal and vertical components of the edge map of the segmented image. other facial features are obtained from edge information of the image. The characteristic vectors are extrated from DWT of the segmented face image. These characteristic vectors are normalized between +1 and -1, and are used as input vectors for the neural network. Simulation results show recognition rate of 100% on the learned system, and about 92% on the test images.

  • PDF