• 제목/요약/키워드: Head pose

검색결과 94건 처리시간 0.025초

방향성 2차원 타원형 필터를 이용한 스테레오 기반 포즈에 강인한 사람 검출 (Stereo-based Robust Human Detection on Pose Variation Using Multiple Oriented 2D Elliptical Filters)

  • 조상호;김태완;김대진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.600-607
    • /
    • 2008
  • 이 논문은 방향성 2차원 타원형 필터(Multiple Oriented 2D Elliptical Filters;MO2DEFs)를 사용하여 스테레오 영상으로부터 포즈에 강인한 사람 검출을 제안한다. 기존의 물체 지향 크기 적응 필터(Object Oriented Scale Adaptive Filter;OOSAF)는 정면을 보고 있는 사람만을 검출하는 단점을 지니고 있는데 반해 제안한 방향성 2차원 타원형 필터는 사람의 크기나 포즈에 관계없이 사람을 검출하고 추적한다. 2D 공간-깊이 히스토그램에 특정 각도로 향하는 4개의 2차원 타원형 필터들을 적용하고, 필터링 된 히스토그램에서 임계값을 통해서 사람을 검출한 다음, MO2D2EFs 중 승적 결과가 가장 큰 2차원 타원형 필터의 방향을 사람의 방향으로 판단한다. 사람 후보들은 얼굴을 검출하거나 검출된 사람의 선택된 방향의 머리-어께 형태를 정합함으로서 검증한다. 실험 결과는 (1) 포즈 각도 예측의 정확도는 약 88%이고, (2) 제안한 MO2DEFs를 사용한 사람 검출의 성능이 OOSAF를 사용한 사람 검출의 성능보다 $15{\sim}20%$만큼 향상되었으며, 특히 정면이 아닌 사람의 경우에 더 향상이 있었다.

오류-역전파 신경망 기반의 얼굴 검출 및 포즈 추정 (Back-Propagation Neural Network Based Face Detection and Pose Estimation)

  • 이재훈;전인자;이정훈;이필규
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.853-862
    • /
    • 2002
  • 얼굴 검출은 디지털화 된 임의의 정지 영상 혹은 연속된 영상으로부터 얼굴 존재유무를 판단하고, 얼굴이 존재할 경우 영상 내 얼굴의 위치, 방향, 크기 등을 알아내는 기술로 정의된다. 이러한 얼굴 검출은 얼굴 인식이나 표정인식, 헤드 제스쳐 등의 기초 기술로서해당 시스템의 성능에 매우 중요한 변수 중에 하나이다. 그러나 영상 내의 얼굴은 표정, 포즈, 크기, 빛의 방향 및 밝기, 안경, 수염 등의 환경적 변화로 인해 얼굴 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 오류-역전파 신경망을 사용하여 몇가지 환경적 조건을 극복한 정확하고 빠른 얼굴 검출 방법을 제안한다. 제안된 방법은 표정과 포즈, 배경에 무관하게 얼굴을 검출하면서도 빠른 검출이 가능하다. 이를 위해 신경망을 이용하여 얼굴 검출을 수행하고, 검색 영역의 축소와 신경망 계산 시간의 단축으로 검출 응답 시간을 빠르게 하였다. 검색 영역의 축소는 영상 내 피부색 영역의 분할과 차영상을 이용하였고, 주성분 분석을 통해 신경망의 입력 백터를 축소시킴으로써 신경망 수행 시간과 학습 시간을 단축시켰다. 또, 추출된 얼굴 영상에서 포즈를 추정하고 눈 영역을 검출함으로써 얼굴 정보의 사용에 있어 보다 많은 정보를 추출할 수 있도록 하였다. 얼굴 검출 실험은 마할라노비스 거리를 사용하여 검출된 영상의 얼굴 여부를 판정하고, 성공률과 시간을 측정하였다. 정지 영상과 동영상에서 모두 실험하였으며, 피부색 영역의 분할을 사용할 경우 입력 영상의 칼라 설정의 유무에 다른 검출 성공률의 차를 보였다. 포즈 실험도 같은 조건에서 수행되었으며, 눈 영역의 검출은 안경의 유무에 다른 실험 결과를 보였다. 실험 결과 실시간 시스템에 사용 가능한 수준의 검색률과 검색 시간을 보였다.

PoseNet과 GRU를 이용한 Skeleton Keypoints 기반 낙상 감지 (Human Skeleton Keypoints based Fall Detection using GRU)

  • 강윤규;강희용;원달수
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.127-133
    • /
    • 2021
  • 낙상 판단을 위한 최근 발표되는 연구는 RNN(Recurrent Neural Network)을 이용한 낙상 동작 특징 분석과 동작 분류에 집중되어 있다. 웨어러블 센서를 기반으로 한 접근 방식은 높은 탐지율을 제공하나 사용자의 착용 불편으로 보편화 되지 못했고 최근 영상이나 이미지 기반에 딥러닝 접근방식을 이용한 낙상 감지방법이 소개 되었다. 본 논문은 2D RGB 저가 카메라에서 얻은 영상을 PoseNet을 이용해 추출한 인체 골격 키포인트(Keypoints) 정보로 머리와 어깨의 키포인트들의 위치와 위치 변화 가속도를 추정함으로써 낙상 판단의 정확도를 높이기 위한 감지 방법을 연구하였다. 특히 낙상 후 자세 특징 추출을 기반으로 Convolutional Neural Networks 중 Gated Recurrent Unit 기법을 사용하는 비전 기반 낙상 감지 솔루션을 제안한다. 인체 골격 특징 추출을 위해 공개 데이터 세트를 사용하였고, 동작분류 정확도를 높이는 기법으로 코, 좌우 눈 그리고 양쪽 귀를 포함하는 머리와 어깨를 하나의 세그먼트로 하는 특징 추출 방법을 적용해, 세그먼트의 하강 속도와 17개의 인체 골격 키포인트가 구성하는 바운딩 박스(Bounding Box)의 높이 대 폭의 비율을 융합하여 실험을 하였다. 제안한 방법은 기존 원시골격 데이터 사용 기법보다 낙상 탐지에 보다 효과적이며 실험환경에서 약 99.8%의 성공률을 보였다.

두경부의 이물질 삽입에 의한 관통성 외상 (Penetrating Injuries by Foreign Body in the Head and Neck Region)

  • 홍순재;백지영;차인호
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제22권3호
    • /
    • pp.351-355
    • /
    • 2000
  • 두경부 관통성 외상의 기본적 처치는 먼저 초기 단계에서 환자의 정확한 병력 및 이학 검사, 호흡 억제 유무 평가, 중대한 출혈 유무의 평가 등을 시행한다. 중대한 출혈의 평가는 외부 출혈 유무, 급속히 커지는 혈종 유무, 혈류역학적으로 불안정한 생징후를 보이는 경우, 맥박 소실, 저혈량성 쇼크의 소견, 혈종격동이나 혈흉 소견이 있는 경우 등이다. 이러한 경우 즉각적인 외과적 처치를 시행해야 한다. 중대한 출혈의 소견을 보이지는 않지만 혈관 손상이 의심되거나 가능성이 높다고 생각되는 경우로는 혈류 잡음, 삽입 이물질이 큰 혈관에 근접 위치한 경우, 맥박 소실이나 중추 신경학적 문제가 발생한 경우 등이 해당된다. 이때는 혈관조영술과 CT촬영을 시행한 후 보존적으로 관찰을 할지 외과적 처치를 시행할지를 결정한다. 이때도 외과적 처치가 필요한 경우 지체없이 시행한다. 또한 두경부 이몰 삽입에 의해 환자가 자신의 생명에 심각한 위협을 받았다고 느끼기때문에 정신적인 충격을 해소해 주어야 한다.

  • PDF

실시간 목 자세 모니터링을 위한 웨어러블 센서를 이용한 두개척추각 추정 (The Estimation of Craniovertebral Angle using Wearable Sensor for Monitoring of Neck Posture in Real-Time)

  • 이재현;지영준
    • 대한의용생체공학회:의공학회지
    • /
    • 제39권6호
    • /
    • pp.278-283
    • /
    • 2018
  • Nowdays, many people suffer from the neck pain due to forward head posture(FHP) and text neck(TN). To assess the severity of the FHP and TN the craniovertebral angle(CVA) is used in clinincs. However, it is difficult to monitor the neck posture using the CVA in daily life. We propose a new method using the cervical flexion angle(CFA) obtained from a wearable sensor to monitor neck posture in daily life. 15 participants were requested to pose FHP and TN. The CFA from the wearable sensor was compared with the CVA observed from a 3D motion camera system to analyze their correlation. The determination coefficients between CFA and CVA were 0.80 in TN and 0.57 in FHP, and 0.69 in TN and FHP. From the monitoring the neck posture while using laptop computer for 20 minutes, this wearable sensor can estimate the CVA with the mean squared error of 2.1 degree.

각속도 및 광센서를 이용한 헤드 마우스 (Head Mouse System Based on A Gyro and Opto Sensors)

  • 박민제;유재하;김수찬
    • 전자공학회논문지SC
    • /
    • 제46권4호
    • /
    • pp.70-76
    • /
    • 2009
  • 본 연구에서는 자동차 사고나 뇌졸중 둥에 의해 경추 이하의 마비나 손, 발 등의 움직임이 자유롭지 못한 사람들의 컴퓨터 사용을 돕고자 손이나 발을 이용하지 않고 머리의 움직임과 눈의 깜박임만으로 컴퓨터 마우스 제어가 가능한 장치를 제안하였다. 마우스의 위치는 각속도 센서를 이용하여 머리의 움직임으로 추정하고, 눈 깜빡임에 의한 클릭과 더블 클릭은 광센서의 시야를 방해하지 않는 위치에 장착하여 커 클위치와 이벤트를 검출하였다. 제안한 마우스의 공간 이동 능력과 이벤트 검출을 비교한 실험에서는 좌우, 상하 이동은 기존 마우스와 비교하여 속도 면에서는 큰 차이는 없었으나, 정확도가 조금 떨어지는 이유로 인하여 정확한 위치로 이동시키는데 소요시간이 3$\sim$4배 정도 더 필요하였다. 데드 존을 갖는 비선형 상대 좌표계 방식을 이용하여 주기적으로 적분 에러를 제거해야 하는 문제를 해결하였고, 이동 거리와 속도를 함께 고려하여 직관적인 마우스 포인터 제어가 가능하도록 하였다. 주변광의 영향을 최소화하도록 광원 제어 회로를 설계하여 외부 광원의 변화에도 마우스 이벤트 검출이 영향을 받지 않았다.

적대적 생성 신경망을 통한 얼굴 비디오 스타일 합성 연구 (Style Synthesis of Speech Videos Through Generative Adversarial Neural Networks)

  • 최희조;박구만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.465-472
    • /
    • 2022
  • 본 연구에서는 기존의 동영상 합성 네트워크에 스타일 합성 네트워크를 접목시켜 동영상에 대한 스타일 합성의 한계점을 극복하고자 한다. 본 논문의 네트워크에서는 동영상 합성을 위해 스타일갠 학습을 통한 스타일 합성과 동영상 합성 네트워크를 통해 스타일 합성된 비디오를 생성하기 위해 네트워크를 학습시킨다. 인물의 시선이나 표정 등이 안정적으로 전이되기 어려운 점을 개선하기 위해 3차원 얼굴 복원기술을 적용하여 3차원 얼굴 정보를 이용하여 머리의 포즈와 시선, 표정 등의 중요한 특징을 제어한다. 더불어, 헤드투헤드++ 네트워크의 역동성, 입 모양, 이미지, 시선 처리에 대한 판별기를 각각 학습시켜 개연성과 일관성이 더욱 유지되는 안정적인 스타일 합성 비디오를 생성할 수 있다. 페이스 포렌식 데이터셋과 메트로폴리탄 얼굴 데이터셋을 이용하여 대상 얼굴의 일관된 움직임을 유지하면서 대상 비디오로 변환하여, 자기 얼굴에 대한 3차원 얼굴 정보를 이용한 비디오 합성을 통해 자연스러운 데이터를 생성하여 성능을 증가시킴을 확인했다.

다중 크기 블록 지역 이진 패턴을 이용한 랜덤 포레스트 기반의 머리 방향 분류 기법 (Head Pose Classification using Multi-scale Block LBP and Random Forest)

  • 강민주;이하연;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.253-255
    • /
    • 2016
  • 본 논문에서는 다중 지역 이진 패턴(Multi-scale Bock LBP, MB-LBP) 특징과 랜덤 포레스트에 기반한 새로운 기법의 머리 방향 분류 기법을 제안한다. 제안 기법에서는 occlusion 과 조명의 변화에 강인한 분류 정확도를 얻기 위해서 랜덤화된 트리를 학습하는 것을 목표로 한다. 우선, 얼굴 이미지로부터 많은 MB-LBP 특징을 추출하고, 얼굴 영상들을 랜덤하게 입력하고 MB-LBP 크기 파라미터와 같은 랜덤 특징과 블록 좌표들을 사용하여 트리를 생성한다. 게다가 각 노드에서 정보 이득을 최대화 하는 트리의 내부 노드를 생성하기 위해서 uniform LBP 의 특성을 고려한 분할 함수를 개발한다. 랜덤화된 트리는 랜덤 포레스트에 포함되어 있으며 마지막 결정단계에서 Maximum-A-Posteriori criterion 으로 최종 결정을 한다. 실험 결과는 제안 기법이 다양한 조명, 자세, 표현, occlusion 상황에서 기존의 방법보다 개선된 성능으로 머리 방향을 분류 할 수 있음을 보여준다.

  • PDF

DETECTION OF FACIAL FEATURES IN COLOR IMAGES WITH VARIOUS BACKGROUNDS AND FACE POSES

  • Park, Jae-Young;Kim, Nak-Bin
    • 한국멀티미디어학회논문지
    • /
    • 제6권4호
    • /
    • pp.594-600
    • /
    • 2003
  • In this paper, we propose a detection method for facial features in color images with various backgrounds and face poses. To begin with, the proposed method extracts face candidacy region from images with various backgrounds, which have skin-tone color and complex objects, via the color and edge information of face. And then, by using the elliptical shape property of face, we correct a rotation, scale, and tilt of face region caused by various poses of head. Finally, we verify the face using features of face and detect facial features. In our experimental results, it is shown that accuracy of detection is high and the proposed method can be used in pose-invariant face recognition system effectively

  • PDF

얼굴의 포즈정보를 이용한 헤드 제스처 인식에 관한 연구 (The Recognition of Head Gestures using Face Pose Information)

  • 김정연;박형철;전병환
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.463-468
    • /
    • 2000
  • 본 논문에서는 얼굴의 9가지 상태를 인식하고 이를 상태 시퀀스로 생성한 후, 오토마타 기법을 적용하여 13가지(준비, 상측, 하측, 좌측, 우측, 전진, 후퇴, 좌 윙크, 우 윙크, 좌 더블 윙크, 우 더블 윙크, 긍정, 부정) 헤드 제스처를 인식하는 방법을 제안한다. 얼굴 영역을 추출하는 방법에서는 최적의 얼굴색 정보와 적응적 움직임 정보를 이용하여 얼굴 영역을 추출한다. 눈의 후보 영역을 추출하는 방법에서는 소벨 연산자와 투영 기법을 이용한다. 이 때 눈의 후보들을 제거하기 위하여 눈의 기하학적 정보와 눈은 쌍으로 존재한다는 정보를 이용한다. 얼굴의 상태를 인식하기 위해서는 계층적인 특징분석 방법을 사용한다. 13가지 헤드 제스처는 얼굴 상태 인식의 처리에서 생성된 상태 시퀀스를 이용한 오토마타 기법에 의해 인식된다. 실험 결과, 93.3%의 헤드제스처 인식률을 얻었다.

  • PDF