• Title/Summary/Keyword: pose estimation

Search Result 389, Processing Time 0.024 seconds

Pose Estimation through 3D modeling based on NeRF (NeRF 기반 3차원 모델링을 통한 자세 추정)

  • Park, Chan;Kim, Hyungju;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.600-602
    • /
    • 2022
  • 2차원 이미지 또는 영상을 통한 자세 추정의 경우, 영상 내에서 발생할 수 있는 탐지 오류, 피사체 잘림, 폐색(Occlusion) 등으로 인해 자세 추정 정확도가 감소할 수 있다. 본 논문에서는 4장 이상의 다양한 각도로 촬영한 이미지를 NeRF(Neural Radiance Fields)를 통해 이미지 합성(Image synthesis)을 진행하여 3차원 모델을 생성한다. 이후 DeepLabCut을 사용하여 관절 좌표와 골격(Skeleton)을 구축한다. 구축한 골격을 인공지능에 학습시킨 뒤 2차원 영상에서의 관절 좌표 인식, 골격 구축, 자세 추정을 진행한다. 2차원 영상 테스트 데이터를 통해, 3차원 모델을 사전 학습한 인공지능 모델과 기존 2차원 이미지를 사용하여 학습한 인공지능 모델의 자세 추정 정확도를 비교한다.

Study of Target Pose Estimation System: Distance Measurement Based Deep Learning Using Single Camera (딥러닝 단일카메라 거리 측정 기술 활용 구조대상자 위치추정시스템 연구)

  • Do-Yun Kim;Jong-In Choi ;Seo-Won Park ;Kwang-Young Park
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.560-561
    • /
    • 2023
  • 지진, 대형화재와 같은 많은 재해의 발생으로 인해 재난 안전 분야에 관심이 증가하고 있으며, 재난재해 시 신속하고 안전한 구조는 생존율에 영향을 준다. 기존 연구에서는 다양한 센서와 멀티카메라를 이용한 위치 추정 연구는 있으나, 가장 많이 설치된 단일카메라 기반의 위치 추정연구는 부족한 상태이다. 본 논문에서 단일카메라를 활용한 딥러닝 객체탐지와 거리측정 알고리즘을 이용하여 인명구조를 위한 구조대상자 위치추정시스템을 제안한다. 딥러닝을 활용한 객체탐지 기술을 이용하여 단일카메라 영상 내 객체와 해상도에 따른 바운딩 박스의 너비를 활용한 거리 계산식으로 거리를 추정하고, 객체의 위치좌표를 제공하여 신속한 재난 구조에 도움이 되는 시스템을 제안한다.

Dance Movement Guide System using MediaPipe (MediaPipe를 활용한 춤동작 가이드 시스템)

  • Hyeonseo Kim;Jaeyeung Jeong;Mikyeong Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.355-356
    • /
    • 2023
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 초보자들은 자신의 동작이 어떻게 보이는지 평가하는 데 어려움을 겪어 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 시스템을 통해 사용자의 춤동작에 대한 피드백을 받을 수 있으며 초보자들도 정확한 춤동작을 연습할 수 있을 것으로 기대한다.

  • PDF

Anomaly Detection by Human Pose Estimation On Surveillance Videos in Bridge (교량 CCTV 화면에서의 자세 추정 기반 이상 행동 탐지)

  • Su-Bin Oh;Min-Jeong Kang;Sang-Min Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.691-694
    • /
    • 2023
  • 본 논문은 CCTV 화면에서의 다양한 이상상황 중 교량 데이터에 특화된 자세 추정 기반 이상탐지 알고리즘을 소개한다. 교량은 크게 도로, 인도 이렇게 두 구역으로 나눠지며, 사람들의 이동방향이 한정적이라는 특징을 가지는 장소 중 하나이다. 이러한 장소적 특징을 이용하고자 사람 자세 추정을 통해 이상의 기준을 잡고 교량 데이터에 특화된 이상탐지 알고리즘을 제안한다. CCTV 영상은 이상을 정하기 어렵고 이상에 대한 레이블이 없는 데이터가 대부분이며 이상에 대한 레이블 생성시 많은 비용 발생이 필수적이다. 본 연구에서는 이러한 한계점을 극복하고자 영상 데이터를 이미지 단위가 아닌 영상 단위로 레이블이 담긴 weakly label 을 가지는 데이터를 활용한 이상탐지 모델을 이용하였다. 특히, 교량에서의 이상상황의 특징인 사람 자세 추정으로 추출한 특질을 추가하여 기존 알고리즘의 이상탐지 예측 성능을 개선하였다.

Spatiotemporal Patched Frames for Human Abnormal Behavior Classification in Low-Light Environment (저조도 환경 감시 영상에서 시공간 패치 프레임을 이용한 이상행동 분류)

  • Widia A. Samosir;Seong G. Kong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.634-636
    • /
    • 2023
  • Surveillance systems play a pivotal role in ensuring the safety and security of various environments, including public spaces, critical infrastructure, and private properties. However, detecting abnormal human behavior in lowlight conditions is a critical yet challenging task due to the inherent limitations of visual data acquisition in such scenarios. This paper introduces a spatiotemporal framework designed to address the unique challenges posed by low-light environments, enhancing the accuracy and efficiency of human abnormality detection in surveillance camera systems. We proposed the pre-processing using lightweight exposure correction, patched frames pose estimation, and optical flow to extract the human behavior flow through t-seconds of frames. After that, we train the estimated-action-flow into autoencoder for abnormal behavior classification to get normal loss as metrics decision for normal/abnormal behavior.

Comparison of two approaches to acupoints inference using artificial intelligence (인공지능을 활용한 경혈위치 추론: 두 가지 접근법 비교)

  • Seon-Deok Seo;Byung-il Lee;Myunggi Yi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.566-567
    • /
    • 2023
  • 최근 인공지능을 활용한 경혈의 위치를 추론하는 연구가 활발하게 진행되고 있다. 본 논문은 자세 추정(Pose Estimation)을 통해 경혈 검출을 위한 두 가지 접근법인 Top down 방식과 Bottom up 방식의 추론 결과를 비교함으로써 어떤 방식이 경혈의 위치를 추론하기에 더 적합한 지 알아보고자 한다.

Metaverse Interaction Technology Trends and Development Prospects (메타버스 상호작용 기술 동향 및 발전 전망)

  • S.M. Baek;Y.H. Lee;J.Y. Kim;S.H. Park;Y.-H. Gil
    • Electronics and Telecommunications Trends
    • /
    • v.39 no.2
    • /
    • pp.12-23
    • /
    • 2024
  • The Metaverse industry is developing rapidly, and related technologies are being actively improved. Tools such as controllers, keyboards, and mouses are used to interact in the Metaverse, but they are not natural and intuitive interfaces to resemble real-world interactions. Immersive interaction in a Metaverse space requires the engagement of various senses such as vision, touch, and proprioception. Moreover, in terms of body senses, it requires a sense of body ownership and agency. In addition, eliciting cognitive and emotional empathy based on non-verbal expression, which cannot be suitably conveyed to the digital world, requires higher-level technologies than existing emotion measurement solutions. This diversity of technologies can converge to build an immersive realistic Metaverse environment. We review the latest research trends in technologies related to immersive interactions and analyze future development prospects.

Photorealistic Real-Time Dense 3D Mesh Mapping for AUV (자율 수중 로봇을 위한 사실적인 실시간 고밀도 3차원 Mesh 지도 작성)

  • Jungwoo Lee;Younggun Cho
    • The Journal of Korea Robotics Society
    • /
    • v.19 no.2
    • /
    • pp.188-195
    • /
    • 2024
  • This paper proposes a photorealistic real-time dense 3D mapping system that utilizes a neural network-based image enhancement method and mesh-based map representation. Due to the characteristics of the underwater environment, where problems such as hazing and low contrast occur, it is hard to apply conventional simultaneous localization and mapping (SLAM) methods. At the same time, the behavior of Autonomous Underwater Vehicle (AUV) is computationally constrained. In this paper, we utilize a neural network-based image enhancement method to improve pose estimation and mapping quality and apply a sliding window-based mesh expansion method to enable lightweight, fast, and photorealistic mapping. To validate our results, we utilize real-world and indoor synthetic datasets. We performed qualitative validation with the real-world dataset and quantitative validation by modeling images from the indoor synthetic dataset as underwater scenes.

Segmentation-Based Depth Map Adjustment for Improved Grasping Pose Detection (물체 파지점 검출 향상을 위한 분할 기반 깊이 지도 조정)

  • Hyunsoo Shin;Muhammad Raheel Afzal;Sungon Lee
    • The Journal of Korea Robotics Society
    • /
    • v.19 no.1
    • /
    • pp.16-22
    • /
    • 2024
  • Robotic grasping in unstructured environments poses a significant challenge, demanding precise estimation of gripping positions for diverse and unknown objects. Generative Grasping Convolution Neural Network (GG-CNN) can estimate the position and direction that can be gripped by a robot gripper for an unknown object based on a three-dimensional depth map. Since GG-CNN uses only a depth map as an input, the precision of the depth map is the most critical factor affecting the result. To address the challenge of depth map precision, we integrate the Segment Anything Model renowned for its robust zero-shot performance across various segmentation tasks. We adjust the components corresponding to the segmented areas in the depth map aligned through external calibration. The proposed method was validated on the Cornell dataset and SurgicalKit dataset. Quantitative analysis compared to existing methods showed a 49.8% improvement with the dataset including surgical instruments. The results highlight the practical importance of our approach, especially in scenarios involving thin and metallic objects.

Improve the Performance of People Detection using Fisher Linear Discriminant Analysis in Surveillance (서베일런스에서 피셔의 선형 판별 분석을 이용한 사람 검출의 성능 향상)

  • Kang, Sung-Kwan;Lee, Jung-Hyun
    • Journal of Digital Convergence
    • /
    • v.11 no.12
    • /
    • pp.295-302
    • /
    • 2013
  • Many reported methods assume that the people in an image or an image sequence have been identified and localization. People detection is one of very important variable to affect for the system's performance as the basis technology about the detection of other objects and interacting with people and computers, motion recognition. In this paper, we present an efficient linear discriminant for multi-view people detection. Our approaches are based on linear discriminant. We define training data with fisher Linear discriminant to efficient learning method. People detection is considerably difficult because it will be influenced by poses of people and changes in illumination. This idea can solve the multi-view scale and people detection problem quickly and efficiently, which fits for detecting people automatically. In this paper, we extract people using fisher linear discriminant that is hierarchical models invariant pose and background. We estimation the pose in detected people. The purpose of this paper is to classify people and non-people using fisher linear discriminant.