통합 검색 | Korea Science

단일 이미지에 기반을 둔 사람의 포즈 추정에 대한 연구 동향 (Recent Trends in Human Pose Estimation Based on a Single Image)

조정찬
- 한국차세대컴퓨팅학회논문지
- /
- 제15권5호
- /
- pp.31-42
- /
- 2019
최근 딥러닝 기술이 발전함에 따라 많은 컴퓨터 비전 연구 분야에서 주목할 만한 성과들이 지속적으로 나오고 있다. 단일 이미지를 기반으로 사람의 2차원 및 3차원 포즈를 추정하는 연구에서도 비약적인 성능향상을 보여주고 있으며, 많은 연구자들이 문제의 범위를 확장하며 활발한 연구 활동을 진행하고 있다. 사람의 포즈 추정은 다양한 응용 분야가 존재하고, 특히 이미지나 비디오 분석에서 사람의 포즈는 행동 및 상태, 의도 파악을 위한 핵심 요소가 되기 때문에 상당히 중요한 연구 분야이다. 이러한 배경에 따라 본 논문은 단일 이미지를 기반으로 한 사람의 포즈 추정 기술에 대한 연구 동향을 살펴보고자 한다. 강인하고 정확한 문제 해결을 위해 다양한 연구 활동 결과가 존재한다는 점에서 본 논문에서는 사람의 포즈 추정 연구를 2차원 및 3차원 포즈 추정에 대해서 나누어 살펴보고자 한다. 끝으로 연구에 필요한 데이터 세트 및 사람의 포즈 추정 기술을 적용하는 다양한 연구 사례를 살펴볼 것이다.

방송용 스포츠 경기 비디오에서 제스처의 자동 추출 (Automatic Spotting of Gestures in Broadcast Sports Videos)

노명철;이성환
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
- /
- pp.841-843
- /
- 2005
비디오 데이터 분석은 감시, 검색, 스포츠 경기 자동 요약 등 많은 분야에서 사용되는 기술이다. 그러나 감시 카메라나 스포츠 경기 비디오와 같이 사람의 영역이 저해상도인 환경에서는 포즈 추정, 모델과의 매칭이 어렵기 때문에 제스처 인식 연구는 많이 이루어지고 있지 못하다. 본 논문에서는 카메라가 Pan/Tilt/Zoom 동작을 하고 사람이 빠르게 움직이는 방송용 테니스 비디오에서, 사람을 추출하고, Curvature Scale Space를 기반으로 한 특징을 추출하여 학습된 포즈 모델과 매칭하는 방법과, 차원의 축소를 통해 일련의 포즈들을 학습된 제스처와 매칭하는 방법을 제안한다. 50개의 방송용 테니스 경기 비디오 장면에 대하여 서브 제스처 추출을 수행한 결과, 서브 포즈에 대하여 모델과 매칭이 잘 되고, 매칭이 되지 않는 포즈를 포함하는 시퀀스에 대해서도 강인한
PDF

방향성 2차원 타원형 필터를 이용한 스테레오 기반 포즈에 강인한 사람 검출 (Stereo-based Robust Human Detection on Pose Variation Using Multiple Oriented 2D Elliptical Filters)

조상호;김태완;김대진
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제35권10호
- /
- pp.600-607
- /
- 2008
이 논문은 방향성 2차원 타원형 필터(Multiple Oriented 2D Elliptical Filters;MO2DEFs)를 사용하여 스테레오 영상으로부터 포즈에 강인한 사람 검출을 제안한다. 기존의 물체 지향 크기 적응 필터(Object Oriented Scale Adaptive Filter;OOSAF)는 정면을 보고 있는 사람만을 검출하는 단점을 지니고 있는데 반해 제안한 방향성 2차원 타원형 필터는 사람의 크기나 포즈에 관계없이 사람을 검출하고 추적한다. 2D 공간-깊이 히스토그램에 특정 각도로 향하는 4개의 2차원 타원형 필터들을 적용하고, 필터링 된 히스토그램에서 임계값을 통해서 사람을 검출한 다음, MO2D2EFs 중 승적 결과가 가장 큰 2차원 타원형 필터의 방향을 사람의 방향으로 판단한다. 사람 후보들은 얼굴을 검출하거나 검출된 사람의 선택된 방향의 머리-어께 형태를 정합함으로서 검증한다. 실험 결과는 (1) 포즈 각도 예측의 정확도는 약 88%이고, (2) 제안한 MO2DEFs를 사용한 사람 검출의 성능이 OOSAF를 사용한 사람 검출의 성능보다 $15{\sim}20%$만큼 향상되었으며, 특히 정면이 아닌 사람의 경우에 더 향상이 있었다.
PDF KSCI

회전무관 3D Star Skeleton 특징 추출 (Rotation Invariant 3D Star Skeleton Feature Extraction)

전성국;홍광진;정기철
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제36권10호
- /
- pp.836-850
- /
- 2009
포즈인식은 최근에 유비쿼터스 환경, 행위 예술, 로봇 제어 등에서 그 필요성이 증가되고 있는 분야로써, 컴퓨터비전, 패턴인식 등에서 활발히 연구되고 있다. 하지만 기존의 포즈인식 연구들은 사람의 회전이나 이동에 따라서 불안정한 인식률을 보인다는 단점을 갖고 있다. 이는 포즈 인식을 위해 추출한 특징이 사람의 회전, 이동 등의 다양한 변수에 영향을 크게 받기 때문이다. 이를 극복하기 위하여 본 논문에서는, 다 시점(multi-view) 환경에서의 3D Star Skeleton과 주성분 분석(principal component analysis: PCA)에 기반한 사람의 회전에 강건한 특징 추출을 제안한다. 제안된 시스템은 포즈의 특징 추출을 위해 다 시점 환경 기반의 visual hull을 생성하는 과정에서 획득 가능한 깊이 정보를 표현하는 8개의 projection map을 입력데이터로 사용한다. 이를 통해 포즈의 3D 정보를 반영하는 3D Star Skeleton을 구성하고 주성분 분석 기반의 회전에 강건한 특징을 추출한다. 실험결과에서는 다양하게 회전된 사람으로부터 생성된 3D Star Skeleton에서 특징을 추출하고 다양한 인식기를 통해 포즈인식을 해보았으며, 제안된 특징 추출 방법이 사람의 회전에 강건함을 알 수 있었다.
PDF KSCI

3차원 공간 데이터 특징을 이용한 포즈 인식 방법 (Posture Recognition Method using 3D Space Data Feature)

치옥용;조성재;엄기현;조경은
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 추계학술발표대회
- /
- pp.1696-1697
- /
- 2015
최근 포즈 인식 기술의 연구는 HCI, 인공지능 등의 분야에서 활발히 진행되고 있다. 하지만 대부분의 연구는 센서와 사용 환경으로부터 많은 영향을 받는다. 본 논문에서는 이러한 종속성을 최소화하여 범용성 있는 포즈 인식 방법을 제안한다. 이 방법을 통해 사람의 다양한 포즈로부터 획득한 특징 데이터를 최적화함으로써 다양한 포즈를 실시간에 인식할 수 있다.
https://doi.org/10.3745/PKIPS.y2015m10a.1696 인용 PDF

비디오속의 얼굴추적 및 PCA기반 얼굴포즈분류와 (2D)²PCA를 이용한 얼굴인식 (Face Tracking and Recognition in Video with PCA-based Pose-Classification and (2D)²PCA recognition algorithm)

김진율;김용석
- 한국지능시스템학회논문지
- /
- 제23권5호
- /
- pp.423-430
- /
- 2013
통상의 얼굴인식은 사람이 똑바로 카메라를 응시해야 하거나, 혹은 이동하는 통로의 정면과 같이 특정 얼굴포즈를 취득할 수 있는 위치에 카메라를 설치하는 등 통제적인 환경에서 이루어진다. 이러한 제약은 사람에게 불편을 초래하고 얼굴인식의 적용 범위를 제한하는 문제가 있다. 본 논문은 이러한 기존방식의 한계를 극복하기 위하여 대상이 특별한 제약 없이 자유롭게 움직이더라도 동영상 내에서 대상의 얼굴을 추적하고 얼굴인식을 하는 방법을 제안한다. 먼저 동영상 속의 얼굴은 IVT(Incremental Visual Tracking) 추적기를 사용하여 지속적으로 추적이 되며 이때 얼굴의 크기변화와 기울기가 보상이 되어 추출이 된다. 추출된 얼굴영상은 사람과 카메라의 각도를 특정각도로 제한하지 않았으므로 다양한 포즈를 가지게 되며 따라서 얼굴인식을 하기 위해서 포즈에 대한 판정이 선행되어야 한다. 본 논문에서는 PCA(Principal Component Analysis)기반의 얼굴포즈판정방법을 사용하여 추적기에서 추출된 이미지가 5개 포즈별 DB속의 학습된 포즈와 유사한 것으로 판정될 때만 얼굴인식을 수행하여 인식률을 높이는 방법을 제안하였다. 얼굴인식에서는 PCA, 2DPCA, $(2D)^2PCA$의 인식알고리즘을 사용하여 얼굴인식률과 수행시간을 비교 제시하였다.
https://doi.org/10.5391/JKIIS.2013.23.5.423 인용 PDF KSCI

원통형 모델을 이용한 포즈와 조명 불변 얼굴인식 (Pose and Illumination Invariant Face Recognition Using Cylindrical Model)

노진우;김상준;박귀태
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2008년도 제39회 하계학술대회
- /
- pp.1909-1910
- /
- 2008
본 논문에서는 실린더 모델을 이용하여 머리의 다양한 포즈 변화와 조명 변화에 대해 강인한 얼굴 인식을 제안하고자 한다. 실린더 모델은 사람의 머리가 실린더 모양과 유사하고 그 표면은 얼굴에 해당된다고 가정한다. 실린더 모델은 6가지의 모션 파라메터를 따라 움직이며 Lucas-Kanade 알고리즘에 의해 모션 파라메터의 양을 결정한다. 강인한 동작을 위해 템플릿을 지속적으로 바꿔주는 동적 템플릿(dynamic template)방법과 그에 따른 에러가 누적되는 것을 막기 위해 re-registration방법을 사용한다. 조명 문제를 해결하기 위해 템플릿에서 조명 주성분 벡터를 추출하여 제거하는 방법으로 조명 효과를 제거한다. 실험에서는 다양한 포즈 변화와 조명 변화가 반영된 얼굴 데이터베이스를 구축하고 추출한 텍스쳐 맵(texture map image)을 SVM에 적용함으로서 포즈, 조명 변화에 강인한 얼굴인식을 보인다.
PDF

시점 불변인 특징과 확률 그래프 모델을 이용한 인간 행위 인식 (Human Activity Recognition using View-Invariant Features and Probabilistic Graphical Models)

김혜숙;김인철
- 정보과학회 논문지
- /
- 제41권11호
- /
- pp.927-934
- /
- 2014
본 논문에서는 Kinect와 같은 RGB-D 센서를 이용하여 사람의 3차원 신체 포즈 스트림 데이터를 생성하고, 이로부터 사람의 일상 행위를 효과적으로 인식하는 방법을 제안한다. Kinect SDK나 OpenNI에서 제공하는 실시간 신체 포즈 데이터는 Kinect 중심의 3차원 데카르트 좌표계로 표현되기 때문에, 시점 변화 문제와 크기 변화 문제를 겪을 가능성이 높다. 이러한 문제를 해결하고 시점 및 크기 불변인 특징을 얻기 위해, 본 논문에서는 신체 포즈 데이터를 실험자의 골반을 원점으로 하는 구면 좌표계로 변환하고 실험자의 팔 길이를 이용한 크기 정규화를 수행한다. 또한, 본 논문에서는 확률 그래프 모델 중 하나인 은닉 조건부 랜덤 필드를 이용하여, 고수준의 일상 행위들이 내포하는 다양한 내부 구조를 효과적으로 표현한다. 두 가지 데이터 집합 KAD-70과 CAD-60을 이용한 실험을 통해, 본 논문에서 제안한 행위 인식 방법과 구현 시스템의 높은 인식 성능을 확인하였다.
https://doi.org/10.5626/JOK.2014.41.11.927 인용

OpenPose기반 딥러닝을 이용한 운동동작분류 성능 비교 (Performance Comparison for Exercise Motion classification using Deep Learing-based OpenPose)

손남례;정민아
- 스마트미디어저널
- /
- 제12권7호
- /
- pp.59-67
- /
- 2023
최근 인간의 자세와 행동을 추적하는 행동 분석 연구가 활발해지고 있다. 특히 2017년 CMU에서 개발한 오픈소스인 오픈포즈(OpenPose)는 사람의 외모와 행동을 추정하는 대표적인 방법이다. 오픈포즈는 사람의 키, 얼굴, 손 등의 신체부위를 실시간으로 감지하고 추정할 수 있어 스마트 헬스케어, 운 동 트레이닝, 보안시스템, 의료 등 다양한 분야에 적용될 수 있다. 본 논문에서는 헬스장에서 사용자들이 가장 많이 운동하는 Squat, Walk, Wave, Fall-down 4개 동작을 오픈포즈기반 딥러닝인 DNN과 CNN을 이용하여 운동 동작 분류 방법을 제안한다. 학습데이터는 녹화영상 및 실시간으로 카메라를 통해 사용자의 동작을 캡처해서 데이터 셋을 수집한다. 수집된 데이터 셋은 OpenPose을 이용하여 전처리과정을 진행하고, 전처리과정이 완료된 데이터 셋은 본 논문에서 제안한 DNN 및 CNN 모델 이용하여 운동 동작 분류를 학습한다. 제안한 모델에 대한 성능 오차는 MSE, RMSE, MAE를 사용한다. 성능 평가 결과, 제안한 DNN 모델 성능이 제안한 CNN 모델보다 우수한 것으로 나타났다.
https://doi.org/10.30693/SMJ.2023.12.7.59 인용 PDF

CNN 기반의 모델 학습을 통한 관계 분류 모델 : AI 기반의 셀프사진관 포즈 추천 프레임워크 (Relationship classification model through CNN-based model learning: AI-based Self-photo Studio Pose Recommendation Frameworks)

백강민;한연지
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- pp.951-952
- /
- 2023
소위 '인생네컷'이라 불리는 셀프사진관은 MZ 세대의 새로운 놀이 문화로 떠오르며 사용자 수가 나날이 증가하고 있다. 그러나 짧은 시간 내에 다양한 포즈를 취해야 하는 셀프사진관 특성상 촬영이 낯선 사람에게는 여전히 진입장벽이 존재한다. 더불어 매번 비슷한 포즈와 사진 결과물에 기존 사용자는 점차 흥미를 잃어가는 문제점도 발생하고 있다. 이에 본 연구에서는 셀프사진관 사용자의 관계를 분류하는 모델을 개발하여 관계에 따른 적합하고 다양한 포즈를 추천하는 프레임워크를 제안한다. 사용자의 관계를 'couple', 'family', 'female_friend', 'female_solo', 'male_friend', 'male_solo' 총 6 개로 구분하였고 실제 현장과 유사하도록 단색 배경의 이미지를 우선으로 학습 데이터를 수집하여 모델의 성능을 높였다. 모델 학습 단계에서는 모델의 성능을 높이기 위해 여러 CNN 기반의 모델을 전이학습하여 각각의 정확도를 비교하였다. 결과적으로 195 장의 test_set 에서 accuracy 0.91 의 성능 평가를 얻었다. 본 연구는 객체 인식보다 객체 간의 관계를 학습시켜 관계성을 추론하고자 하는 것을 목적으로, 연구 결과가 희박한 관계 분류에 대한 주제를 직접 연구하여 추후의 방향성이나 방법론과 같은 초석을 제안할 수 있다. 또한 관계 분류 모델을 CCTV 에 활용하여 미아 방지 혹은 추적과 구조 등에 활용하여 국가 치안을 한층 높이는 데 기대할 수 있다.
https://doi.org/10.3745/PKIPS.y2023m11a.951 인용 PDF

검색결과 37건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)