• 제목/요약/키워드: Human pose recognition

검색결과 83건 처리시간 0.03초

3차원 손 모델링 기반의 실시간 손 포즈 추적 및 손가락 동작 인식 (Real-Time Hand Pose Tracking and Finger Action Recognition Based on 3D Hand Modeling)

  • 석흥일;이지홍;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.780-788
    • /
    • 2008
  • 손 포즈 모델링 및 추적은 컴퓨터 시각 분야에서 어려운 문제로 알려져 있다. 손 포즈 3차원 복원을 위한 방법에는 사용되는 카메라의 수에 따라 다중 카메라 또는 스테레오 카메라 기반 방식과 단일카메라 기반 방식이 있다. 다중 카메라의 경우 여러 대의 카메라를 설치하거나 동기화를 시키는 등에 대한 제약사항이 따른다. 본 논문에서는 확률 그래프 모델에서 신뢰 전파 (Belief Propagation) 알고리즘을 이용하여 단안 카메라에서 획득된 2차원 입력 영상으로부터 3차원 손 포즈를 추정하는 방법을 제안한다. 또한, 은닉 마르코프 모델(Hidden Markov Model)을 인식기로 하여 손가락 클릭 동작을 인식한다. 은닉 노드로 손가락의 관절 정보를 표현하고, 2차원 입력 영상에서 추출된 특징을 관측 노드로 표현한 확률 그래프 모델을 정의한다. 3차원 손 포즈 추적을 위해 그래프 모델에서의 신뢰 전파 알고리즘을 이용한다. 신뢰 전파 알고리즘을 통해 3차원 손 포즈를 추정 및 복원하고, 복원된 포즈로부터 손가락의 움직임에 대한 특징을 추출한다. 추출된 정보는 은닉 마르코프 모델의 입력값이 된다. 손가락의 자연스러운 동작을 위해 본 논문에서는 한 손가락의 클릭 동작 인식에 여러 손가락의 움직임을 함께 고려한다. 제안한 방법을 가상 키패드 시스템에 적응한 결과 300개의 동영상 테스트 데이타에 대해 94.66%의 높은 인식률을 보였다.

비디오 등장인물 검색을 위한 얼굴검출 (Face Detection for Cast Searching in Video)

  • 백승호;김준환;유지상
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.983-991
    • /
    • 2005
  • 드라마와 같은 비디오에서 사람의 얼굴은 일반적으로 자주 등장하며 비디오 내용을 분석하기 위한 유용한 정보를 제공한다. 얼굴검출은 얼굴인식 및 얼굴영상의 DB 관리와 같은 응용분야에 중요한 역할을 한다. 본 논문에서는 비디오 등장인물 검색을 위한 얼굴검출 기법을 제안하였다. 전체 과정은 크게 세단계로 구성되며 첫 번째 장면전환 검출단계, 두 번째 얼굴영역 검출단계, 마지막으로 얼굴의 특징점인 눈과 입 검출단계로 구성되며, 색상에 기반한 얼굴영역 검출단계에서 발생된 얼굴 특징점을 눈과 입의 검출에 적용하였다. 실험결과 다양한 환경에서 성공적으로 얼굴을 검출하며, 기존의 색상기반 얼굴검출 방법에 비해 측면영상에서 $24\%$의 성능향상을 보였다.

Interactive Experience Room Using Infrared Sensors and User's Poses

  • Bang, Green;Yang, Jinsuk;Oh, Kyoungsu;Ko, Ilju
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.876-892
    • /
    • 2017
  • A virtual reality is a virtual space constructed by a computer that provides users the opportunity to indirectly experience a situation they have not experienced in real life through the realization of information for virtual environments. Various studies have been conducted to realize virtual reality, in which the user interface is a major factor in maximizing the sense of immersion and usability. However, most existing methods have disadvantages, such as costliness or being limited to the physical activity of the user due to the use of special devices attached to the user's body. This paper proposes a new type of interface that enables the user to apply their intentions and actions to the virtual space directly without special devices, and test content is introduced using the new system. Users can interact with the virtual space by throwing an object in the space; to do this, moving object detectors are produced using infrared sensors. In addition, the users can control the virtual space with their own postures. The method can heighten interest and concentration, increasing the sense of reality and immersion and maximizing user's physical experiences.

소 부류 객체 분류를 위한 CNN기반 학습망 설계 (Training Network Design Based on Convolution Neural Network for Object Classification in few class problem)

  • 임수창;김승현;김연호;김도연
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.144-150
    • /
    • 2017
  • 최근 데이터의 지능적 처리 및 정확도 향상을 위해 딥러닝 기술이 응용되고 있다. 이 기술은 다층의 데이터 처리 레이어들로 구성된 계산 모델을 통해 이루어지는데, 이 모델은 여러 수준의 추상화를 거쳐 데이터의 표현을 학습한다. 딥러닝의 한 부류인 컨볼루션 신경망은 인간 행동 추정, 얼굴 인식, 이미지 분류, 음성 인식 같은 연구 분야에서 많이 활용되고 있다. 이미지 분류에 좋은 성능을 보여주는 컨볼루션 신경망은 깊은 학습망과 많은 부류를 이용하면 효과적으로 분류율을 높일수 있지만, 적은 부류의 데이터를 사용할 경우, 과적합 문제가 발생할 확률이 높아진다. 따라서 본 논문에서는 컨볼루션 신경망기반의 소부류의 분류을 위한 학습망을 제작하여 자체적으로 구축한 이미지 DB를 학습시키고, 객체를 분류하는 연구를 실험 하였으며, 1000개의 부류를 분류하기 위해 제작된 기존 공개된 망들과 비교 실험을 통해 기존 망보다 평균 7.06%이상의 상승된 분류율을 보여주었다.

공격 행동 인식 및 중재를 위한 IMU 기반 웨어러블 시스템 개발 (Design of an IMU-based Wearable System for Attack Behavior Recognition and Intervention)

  • 정우순;정규만;류정탁;박경옥;오유수
    • 스마트미디어저널
    • /
    • 제13권5호
    • /
    • pp.19-25
    • /
    • 2024
  • 발달장애인의 사회 진입을 막는 가장 큰 행동 유형은 공격 행동이다. 공격 행동은 발달장애인 자신의 안전뿐만 아니라 타인의 신체적 안전에도 위협이 될 수 있다. 본 연구에서는 저전력 프로세서를 활용한 웨어러블 시스템을 제안한다. 제안된 시스템은 IMU(Inertial Measurement Unit, 관성 측정 장치)가 적용되어, 사용자의 행동을 분석할 수 있으며, 개발된 시스템에 부착된 LED 배열을 통해 일정 시간 이상 공격 행동이 감지되지 않을 시, 흥미로운 LED 패턴을 표현하여 발달장애인에게 보상을 통한 행동 중재를 제공한다. 전원이 제한된 환경에서 장시간 착용해야 하는 시스템을 구현하기 위해 데이터의 전처리 과정부터 AI 모델 적용까지 전 단계에 걸쳐서 성능-에너지 소모 간 최적화 방법을 제시한다.

의료자산보호에서 얼굴인식을 위한 가보 웨이블릿 분석 (Gabor Wavelet Analysis for Face Recognition in Medical Asset Protection)

  • 전인자;정경용;이영호
    • 한국콘텐츠학회논문지
    • /
    • 제11권11호
    • /
    • pp.10-18
    • /
    • 2011
  • 개인정보보호법의 시행은 의료기관에서 의료자산에 대한 보안이 중요시 되고 있으며 이를 위한 얼굴인식은 가장 흥미롭지만 다양한 문제점을 가지고 있는 요소 중의 하나이다. 얼굴인식은 얼굴 영상의 변화하는 요인인 포즈, 조명, 표정과 크기의 변화요소를 포함하고 있다. 이와 같은 변화 요인 중에서 빛의 위치와 방향의 변화요인이 가장 큰 어려움중의 하나이다. 이와 같은 단점을 극복하기 위하여 본 논문에서는 의료자산 보호를 위한 CCTV 관제에서 얼굴인식을 위하여 가보웨이블릿의 계수의 분석, 커널 선정, 특징점, 커널크기와 같은 요소를 분석하였다. 제안된 방법은 분석으로 구성되어있다. 첫 번째 분석은 이미지로부터 커널을 선정하기 위한 것이며, 두 번째 분석은 커널 크기에 대한 계수 분석이다. 마지막으로 입력 영상의 크기에 따른 가보커널 크기의 변화에 대한 측정이다. 실험을 통하여 도출된 계수를 이용하여 얼굴인식을 수행하였으며, 평균 97.3%라는 인식 결과를 도출하였다. 제안하는 방법을 개발하여 논리적 타당성과 유효성을 검증하기 위해 실험적인 적용을 시도하고자 한다. 따라서 얼굴인식에서 서비스의 만족도와 질을 향상시켰다.

손 동작 인식을 통한 인간 - 컴퓨터 인터페이스용 저가형 비주얼 모션 데이터 글러브 (Inexpensive Visual Motion Data Glove for Human-Computer Interface Via Hand Gesture Recognition)

  • 한영모
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.341-346
    • /
    • 2009
  • 모션 데이터 글러브는 손의 움직임을 측정하여 컴퓨터에 입력하는 대표적인 인간과 컴퓨터간의 인터페이스 도구로서, 홈 오토에이션, 가상 현실, biometrics, 모션 캡쳐 등의 컴퓨터 신기술에 사용되는 필수 장비이다. 본 논문에서는 대중화를 위하여, 별도의 특수 장비 없이 사용 가능한 저가형 비주얼 모션 데이터 글러브를 개발하고자 한다. 본 방식의 특징은 기존의 모션 데이터 글러브에 사용되었던, 고가의 모션 센싱 섬유를 사용하지 않음으로써, 저가형으로 개발이 가능하다는 것이다. 따라서 제작이 용이하고 대중화에 크게 기여할 수 있다는 장점을 가진다. 본 방식에서는 모션 센싱 섬유를 사용하는 기계적인 방식대신 광학적 모션 캡쳐 기술을 개량한 비주얼 방식을 채택한다. 기존의 비주얼 방식에 비해 본 방식은 다음과 같은 장점과 독창성을 가진다. 첫째, 기존의 비주얼 방식은 가려짐 현상을 제거하고 3차원 자세 복원을 위해 많은 수의 카메라와 장비를 사용하는 데 비해, 본 방식은 모노비전 방식을 채택하여 장비가 간소하고 저가형 개발이 가능하다. 둘째, 기존의 모노비전방삭은 가려짐 현상에 취약하여 영상에서 가려진 부분은 3차원 자세 복원이 어려웠다. 하지만 본 논문은 독창적으로 설계된 막대 모양의 지시자를 사용하여, 영상에서 가려진 부분도 3차원 자세 복원이 가능하다. 셋째, 기존의 모노 비전 방식은 비선형 수치해석 형태의 영상 해석 알고리즘을 사용하는 경우가 많아서 초기화나 계산시간 면에서 불편하였다. 하지만, 본 논문에서는 독창적인 공식화 방법을 사용하여 닫힌 형태의 영상해석 알고리즘을 도출함으로써 이와 같은 불편을 개선하였다. 넷째, 기존의 닫힌 형태의 알고리즘은 공식화 과정에서 근사화 방법을 도입하는 경우가 많아서 정확도가 떨어지고 특이점에 의한 응용분야에 제한이 있었다. 하지만 본 방식은 오일러 각과 같은 국부적인 매개화나 근사화 등을 사용하는 대신 지수형태의 트위스트좌표계를 사용하는 독창적인 공식화 방법을 사용하여, 공식화 단계에서의 근사화 방법 없이 닫힌 형태의 알고리즘을 도출함으로써 이 문제들을 개선하였다.

다중 분류기의 판정단계 융합에 의한 얼굴인식 (Multi-classifier Decision-level Fusion for Face Recognition)

  • 염석원
    • 대한전자공학회논문지SP
    • /
    • 제49권4호
    • /
    • pp.77-84
    • /
    • 2012
  • 얼굴인식 기술은 지능형 보안, 웹에서 콘텐츠 검색, 지능로봇의 시각부분, 머신인터페이스 등, 활용이 광범위 하다. 그러나 일반적으로 대상자의 표정과 포즈 변화, 주변의 조명 환경과 같은 문제가 있으며 이와 더불어 원거리에서 획득한 영상의 경우 저해상도를 비롯하여 블러와 잡음에 의한 영상의 열화 등의 여러 가지 어려움이 발생한다. 본 논문에서는 포톤 카운팅(Photon-counting) 선형판별법(Linear Discriminant Analysis)을 이용한 다중 분류기(Classifier)에 의한 판정을 융합하여 얼굴 영상 인식을 수행한다. Fisher 선형판별법은 집단 간 분산을 최대로 하고 집단 내 분산을 최소로 하는 공간으로 선형 투영하는 방법으로, 학습영상의 수가 적을 경우 특이행렬 문제가 발생하지만 포톤카운팅 선형 판별법은 이러한 문제가 없으므로 차원축소를 위한 전 처리 과정이 필요 없다. 본 논문의 다중 분류기는 포톤 카운팅 선형판별법의 유클리드 거리(Euclidean Distance) 또는 정규화된 상관(Normalized Correlation)을 적용하는 판정규칙에 따라 구성된다. 다중분류기의 판정의 융합은 각 분류기 cost의 정규화(Normalization), 유효화(Validation), 그리고 융합규칙(Fusion Rule)으로 구성된다. 각 분류기에서 도출된 cost는 같은 범위로 정규화된 후 유효화 과정에서 선별되고 Minimum, 또는 Average, 또는 Majority-voting의 융합규칙에 의하여 융합된다. 실험에서는 원거리에서 획득한 효과를 구현하기 위하여 고해상도 데이터베이스 영상을 인위적으로 Unfocusing과 Motion 블러를 이용하여 열화하여 테스트하였다. 실험 결과는 다중분류기 융합결과의 인식률은 단일분류기보다 높다는 것을 보여준다.

자이로 센서와 LED를 이용한 마우스 개발 (Development of a computer mouse using gyro-sensors and LEDs)

  • 박민제;강신욱;김수찬
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.701-706
    • /
    • 2009
  • 본 연구에서는 자동차 사고나 뇌졸중 등에 의해 경추 이하의 마비나 손, 발 등의 움직임은 자유롭지 않은 사람들의 컴퓨터 사용을 돕고자 손이나 발을 이용하지 않고 머리의 움직임과 눈의 깜박임만으로 컴퓨터 마우스 제어가 가능한 장치를 제안하였다. 마우스의 좌우, 상하 이동은 자이로 센서를 이용하여 머리의 움직임으로 유발하고, 클릭과 더블 클릭은 광 센서를 시야를 방해하지 않는 위치에 장착하여 감지할 수 있도록 하였다. 머리의 움직임에 의한 마우스 이동은 절대 좌표계와 상대 좌표계를 이용하는 두 가지 방법으로 실험하였다. 제안한 장치의 클릭과 더블 클릭의 인식율은 평균 86%에 편차는 5%정도다, 반응속도는 기존 마우스의 이동 속도와 비교해 볼 때 큰 차이는 없었다. 마지막으로 종합적인 평가를 위해 마우스 이동과 클릭을 동시에 수행하였을 경우에는 정확도가 80%에 편차는 4%정도로 기존 마우스보다는 낮았다. 특히 상대 좌표계를 이용하는 경우 절대 좌표를 이용하는 경우보다 좌표의 누적 에러로 인한 reset 빈도를 줄일 수 있었고, 정밀한 마우스 포인터 조작에 편리하였다.

  • PDF

FLD를 이용한 얼굴 검출 알고리즘의 성능 향상 (Performance Enhancement of Face Detection Algorithm using FLD)

  • 남미영;김광백
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.783-788
    • /
    • 2004
  • 영상에서 얼굴이 있는 위치를 찾거나 얼굴을 검출하기 위한 많은 방법들이 연구되고 있다. 영상에서 얼굴 검출은 얼굴의 크기, 얼굴이 있는 위치, 그리고 다양한 포즈, 조명 상태 등의 변화에 따라 달라진다 따라서 얼굴 검출과 인식에 있어서의 어려운 점은 얼굴의 크기와 위치, 거리, 조명, 포즈 때문에 나타나는 것이다. 본 논문에서는 다양한 얼굴 크기와 얼굴이 있는 위치 등에 강인한 얼굴 검출을 위해 피셔의 선형 판별 함수를 이용하는 방법을 제안한다. 선형 판별식을 이용하여 효과적으로 얼굴을 검출하기 위해서는 학습 방법 및 학습에 사용되는 데이터들의 구성이 중요하다. 그 이유는, 얼굴 검출을 위해 사용되는 학습 데이터들은 조명과 포즈에 영향을 받기 때문에 얼굴의 특징들을 반영하는 학습 데이터들의 구성이 중요하다. 따라서 본 논문에서는 복잡한 배경과 다양한 크기의 얼굴을 검출하기 위한 계층적인 방법을 제시하며, 효과적인 피셔 판별 분석을 위하여 얼굴과 비얼굴 학습 데이터의 효율적인 분류 방법을 제안한다.