• 제목/요약/키워드: Pose tracking

검색결과 157건 처리시간 0.025초

통계학적 학습을 이용한 머리와 어깨선의 위치 찾기 (Localizing Head and Shoulder Line Using Statistical Learning)

  • 권무식
    • 한국통신학회논문지
    • /
    • 제32권2C호
    • /
    • pp.141-149
    • /
    • 2007
  • 영상에서 사람의 머리위치를 찾는 문제에 있어서 어깨선 정보를 이용하는 것은 아주 유용하다. 영상에서 머리 외곽선과 어깨선의 형태는 일정한 변형을 유지하면서 같이 움직이므로 이를 ASM(Active Shape Model) 기법을 사용해서 통계적으로 모델링 할 수 있다. 그러나 ASM 모델은 국부적인 에지나 그래디언트에 의존하므로 배경 에지나 클러터 성분에 민감하다. 한편 AAM(Active Appearance Model) 모델은 텍스쳐 등을 이용하지만, 사람의 피부색, 머리색깔, 옷 색깔 등의 차이로 인해서 통계적인 학습방법을 쓰기가 어렵고, 전체 비디오에서 외모(Appearance)가 시간적으로 변한다. 따라서, 본 논문에서는 외모(Apperance) 모델을 변화에 따라 바꾸는 대신, 영상의 각 화소를 머리, 어깨, 배경으로 구분하는 분별적 외모 모델(discriminative appearance)를 사용한다. 실험을 통해서 제안된 방법이 기존의 기법에 비해서 포즈변화와 가려짐, 조명의 변화 등에 강인함을 보여준다. 또한 제안된 기법은 실시간으로 작동하는 장점 또한 가진다.

효과적인 평면 호모그래피 추정을 위한 CS-RANSAC 기반의 특징점 필터링 방법 (Feature Point Filtering Method Based on CS-RANSAC for Efficient Planar Homography Estimating)

  • 김대우;윤의녕;조근식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권6호
    • /
    • pp.307-312
    • /
    • 2016
  • 증강현실 분야에서 호모그래피(Homography)를 이용한 비마커 기반의 객체 추적 기술(Markerless tracking)은 카메라의 방향, 위치를 파악하여 실세계의 영상에 가상의 객체를 정확하고 자연스럽게 증강할 수 있는 기술이다. 이와 같은 호모그래피를 추정하기 위한 방법으로 RANSAC 알고리즘이 많이 사용되고 있으며, 최근 기존의 RANSAC 알고리즘에 제약 조건 문제(Constraint Satisfaction Problem)를 적용하여 정확도를 향상시키고, 처리시간을 줄인 CS-RANSAC 알고리즘에 대한 연구가 진행되고 있다. 하지만 CS-RANSAC 알고리즘은 샘플링 단계에서 정확도가 낮은 호모그래피를 추정하게 하는 특징점이 선택되어 불필요한 연산으로 인해 알고리즘의 효율성이 저하되는 경우가 있다. 따라서 본 논문에서는 효과적인 평면 호모그래피 추정을 위한 CS-RANSAC 기반의 특징점 필터링 방법을 제안한다. 제안하는 방법은 호모그래피 평가 단계에서 Symmetric Transfer Error로 정확도가 높은 호모그래피를 추정하게 하는 특징점인지를 평가하고 불필요한 특징점들을 다음 샘플링 단계에서 제외함으로써 정확도를 향상키고 처리시간을 줄였다. 제안하는 CS-RANSAC 기반의 특징점 필터링 방법의 성능평가를 위하여 제안하는 방법을 적용한 알고리즘과 기존의 RANSAC 알고리즘, CS-RANSAC 알고리즘의 수행시간과 오차율(Symmetric Transfer Error), 참정보 포함비율을 비교하였다. 실험 결과 본 논문에서 제안한 방법이 기존 CS-RANSAC 알고리즘보다 수행시간이 평균적으로 약 5% 단축되었고 오차율은 약 14% 줄어들어 더욱 정확한 호모그래피를 추정 할 수 있게 되었다.

신호교차로 내 실시간 교통사고 자동검지 알고리즘 개발 (Development of the Algorithm for Traffic Accident Auto-Detection in Signalized Intersection)

  • 오주택;임재극;황보희
    • 대한교통학회지
    • /
    • 제27권5호
    • /
    • pp.97-111
    • /
    • 2009
  • 영상기반의 교통정보수집시스템은 관리 및 운영상의 한계를 보이고 있는 기존의 루프검지기의 역할을 대체하는 검지기로써의 역할뿐만 아니라 다양한 교통류의 정보를 제공하고 관리할 수 있다는 점에서 여러 나라에서 보급 활용되기 시작했다. 또한 용도와 사용범위에 있어서도 획기적인 확장세에 있다. 반면에 교통사고 관리와 관련하여 현재까지는 단순히 교통사고 예상지역에 감시카메라를 설치해 두고 기록되는 자료의 디지털화를 추진하는 정도의 영상처리기술을 활용하고 있는 형편이다. 교차로 내 교통사고의 발생 전과 후의 순차적인 상황을 정확히 기록하고, 이 자료를 통해 발생된 교통사고의 사고 매커니즘을 객관적이고 명확하게 조명하고 분석하는 것은 교통사고 처리에 있어서 어느 것보다 시급하고 중요한 부분이다. 기존 기술들은 교차로의 환경적 다양한 변화로 인해 극복하기 매우 어려운 차량의 객체분리, 추적 등의 기술을 가지고 있음에도 불구하고 엄청난 데이터처리용량으로 실시간으로 적용하기 어려운 문제들을 갖고 있다. 이에 본 연구는 이를 극복할 수 있는 기술 방식을 제시하고자 한다. 또한 기존에 잘 알려진 환경적 장애요소 제거방식 중 가장 우수한 방식으로 평가받고 있는 가우시안 복합모델 분석기법에서 조차 환경적인 요인으로 인해 자주 발생하고 있는 오 검지 상황들을 효과적으로 저감시킬 수 있는 능동적이고 환경적응적인 기법을 제시하고 구현하여 그 기술의 성능을 평가하고자 한다. 기존의 교통사고자동기록장치와 비교해 본 연구의 결과가 비교우위의 성능을 구현하였음을 입증하기 위해 실제 운용되고 있는 신호교차로의 영상을 실시간 온라인으로 입력받아 시험하였으며 이 시험결과를 기존의 다른 기술의 성능과 비교평가를 실시하였다.

다중 플레이어들의 팀워크에 기반한 동작-구동 조정 게임 (A Motion-driven Rowing Game based on Teamwork of Multiple Players)

  • 김혜진;심재혁;임승찬;고영노;한다성
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권3호
    • /
    • pp.73-81
    • /
    • 2018
  • 본 논문은 다중의 플레이어들이 단합된 동작을 통해 노를 저어 보트를 이동시키도록 하기 위해 동작에 의해 구동되는 조정(rowing) 시뮬레이션 프레임워크를 제안한다. 실제 조정 경기에서 보트를 가속하기 위해서는 선수들이 시간과 자세에 대해 노 젓는 동작을 동기화 시키는 것이 매우 중요하다. 조정의 이러한 흥미로운 특징을 이용하여, 본 논문에서는 다중 플레이어들이 노 젓는 동작을 수행하는 동안 그들 사이의 동작 유사도를 실시간으로 측정하고 그 유사도에 기반하여 가상 환경에서 보트의 속도를 제어한다. 또한 제안된 프레임워크에 아이템 획득과 같은 게임적인 요소들을 추가하여 플레이어들의 조화된 행동에 의해 아이템을 획득한 경우 아이템 종류에 따라 배의 속도가 증가하거나 감소하도록 한다. 이러한 게임적인 요소들은 플레이어들이 단합된 조정 동작을 생성하기 위한 좋은 팀워크를 훈련할 때 좀더 적극적으로 참여하도록 장려한다. 노 젓는 동작과 아이템을 획득하는 동작을 인식하기 위해 본 논문에서 제안하는 방법은 머리와 양손에 대한 추적 데이터만을 필요로 하며 실시간에 동작할 정도로 충분히 빠르다. 몰입감을 높이기 위해 조정 시뮬레이션 결과를 대형 곡면 스크린에 프로젝션 한다.

정밀하지 않은 깊이정보와 2D움직임 정보를 이용한 사용자 검출과 주요 신체부위 추정 (User Detection and Main Body Parts Estimation using Inaccurate Depth Information and 2D Motion Information)

  • 이재원;홍성훈
    • 방송공학회논문지
    • /
    • 제17권4호
    • /
    • pp.611-624
    • /
    • 2012
  • '제스처'는 음성을 제외한 가장 직관적인 인간의 의사표현 수단이다. 따라서 키보드나 마우스를 대체하여 제스처를 입력으로 컴퓨터를 제어할 수 있는 방법에 대한 연구가 많이 진행되고 있다. 이러한 연구에서 사용자 객체의 검출과 주요 신체부위의 추정은 매우 중요한 과정 중의 하나이다. 본 논문에서는 깊이정보가 부정확한 조건에서 사용자 객체검출과 주요 신체부위를 추정하는 방법을 제시한다. 본 논문에서는 2D 영상정보와 3D 깊이정보를 이용하여 조명 변화와 잡음에 강인하고, 3D 깊이정보를 1D 신호로 변환하여 처리함으로써 실시간에 적합하며, 이전 객체정보를 이용하여 더욱 정확하고 환경변화에 강인한 사용자 검출 방법을 제안한다. 또한 주요 신체부위 추정 방법에서 본 논문에서는 2D 외곽선 정보와 3D 깊이정보 및 추적을 혼합 사용하여 사용자 자세를 추정하는 방법을 제안한다. 실험결과 제안된 사용자 객체 검출방법은 2D정보만을 이용하는 방법에 비해 조명변화와 복잡한 환경에 강인하고, 깊이정보가 부정확한 경우에도 정확한 객체검출을 수행하였다. 또한 제안된 주요 신체부위 추정방법은 2D 외곽선 정보만 이용할 경우 겹친 부분에 대한 검출이 불가능하고, 색상 정보를 사용하는 방법은 조명이나 환경에 민감한 단점을 극복함을 확인할 수 있다.

몬테카를로 시뮬레이션을 이용한 방사선원 위치 검출기의 각도의존성 연구 (Evaluation of Angle Dependence on Positional Radioisotope Source Detector using Monte Carlo Simulation in NDT)

  • 한무재;허승욱;신요한;정재훈;김교태;허예지;이득희;조흥래;박성광
    • 한국방사선학회논문지
    • /
    • 제13권1호
    • /
    • pp.141-146
    • /
    • 2019
  • 산업 비파괴 분야에서 사용되는 방사선원은 장비의 노후화 및 작업자의 부주의로 인해 선원이 노출되는 사고가 발생되어 왔다. 이에 선원의 위치를 실시간으로 추적할 수 있는 안전관리 시스템의 필요성이 부곽되고 있다. 이에 본 연구에서는 방사선원의 위치 추적을 위한 line-array 선량계를 구성하는 unit-cell 선량계 단위의 각도의존성을 분석하기 위해 Monte Carlo Simulation을 수행하였다. 그 결과 각 기울기에서 상위 10% 수치에 대한 오차율은 $0^{\circ}$에서 5.90%, $30^{\circ}$에서 8.08%, $60^{\circ}$에서 20.90%의 오차율을 보였다. 총 흡수선량의 비율은 $0^{\circ}$(100%)를 기준으로 $30^{\circ}$에서 83.77%, $60^{\circ}$에서 53.36%로 나타났으며 기울기가 증가함에 따라 낮아지는 경향성을 보였다. 모든 기울기에서 최대 수치는 $30^{\circ}$의 No. 9에서 나타났으며, No. 10에서는 7.24% 낮아지는 경향성을 보였다. 본 연구 결과 각도의존성은 크게 발생되는 것으로 나타났으며, 이를 낮추기 위해서는 선원과 line-array 선량계의 적정거리는 1 cm 이상의 거리에서 유지해야 하는 것으로 사료된다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.