• 제목/요약/키워드: pose estimation

검색결과 388건 처리시간 0.027초

딥러닝 단일카메라 거리 측정 기술 활용 구조대상자 위치추정시스템 연구 (Study of Target Pose Estimation System: Distance Measurement Based Deep Learning Using Single Camera)

  • 김도윤;최종인 ;박서원;박광영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.560-561
    • /
    • 2023
  • 지진, 대형화재와 같은 많은 재해의 발생으로 인해 재난 안전 분야에 관심이 증가하고 있으며, 재난재해 시 신속하고 안전한 구조는 생존율에 영향을 준다. 기존 연구에서는 다양한 센서와 멀티카메라를 이용한 위치 추정 연구는 있으나, 가장 많이 설치된 단일카메라 기반의 위치 추정연구는 부족한 상태이다. 본 논문에서 단일카메라를 활용한 딥러닝 객체탐지와 거리측정 알고리즘을 이용하여 인명구조를 위한 구조대상자 위치추정시스템을 제안한다. 딥러닝을 활용한 객체탐지 기술을 이용하여 단일카메라 영상 내 객체와 해상도에 따른 바운딩 박스의 너비를 활용한 거리 계산식으로 거리를 추정하고, 객체의 위치좌표를 제공하여 신속한 재난 구조에 도움이 되는 시스템을 제안한다.

MediaPipe를 활용한 춤동작 가이드 시스템 (Dance Movement Guide System using MediaPipe)

  • 김현서;정재영;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.355-356
    • /
    • 2023
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 초보자들은 자신의 동작이 어떻게 보이는지 평가하는 데 어려움을 겪어 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 시스템을 통해 사용자의 춤동작에 대한 피드백을 받을 수 있으며 초보자들도 정확한 춤동작을 연습할 수 있을 것으로 기대한다.

  • PDF

교량 CCTV 화면에서의 자세 추정 기반 이상 행동 탐지 (Anomaly Detection by Human Pose Estimation On Surveillance Videos in Bridge)

  • 오수빈;강민정;이상민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.691-694
    • /
    • 2023
  • 본 논문은 CCTV 화면에서의 다양한 이상상황 중 교량 데이터에 특화된 자세 추정 기반 이상탐지 알고리즘을 소개한다. 교량은 크게 도로, 인도 이렇게 두 구역으로 나눠지며, 사람들의 이동방향이 한정적이라는 특징을 가지는 장소 중 하나이다. 이러한 장소적 특징을 이용하고자 사람 자세 추정을 통해 이상의 기준을 잡고 교량 데이터에 특화된 이상탐지 알고리즘을 제안한다. CCTV 영상은 이상을 정하기 어렵고 이상에 대한 레이블이 없는 데이터가 대부분이며 이상에 대한 레이블 생성시 많은 비용 발생이 필수적이다. 본 연구에서는 이러한 한계점을 극복하고자 영상 데이터를 이미지 단위가 아닌 영상 단위로 레이블이 담긴 weakly label 을 가지는 데이터를 활용한 이상탐지 모델을 이용하였다. 특히, 교량에서의 이상상황의 특징인 사람 자세 추정으로 추출한 특질을 추가하여 기존 알고리즘의 이상탐지 예측 성능을 개선하였다.

저조도 환경 감시 영상에서 시공간 패치 프레임을 이용한 이상행동 분류 (Spatiotemporal Patched Frames for Human Abnormal Behavior Classification in Low-Light Environment)

  • ;공성곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.634-636
    • /
    • 2023
  • Surveillance systems play a pivotal role in ensuring the safety and security of various environments, including public spaces, critical infrastructure, and private properties. However, detecting abnormal human behavior in lowlight conditions is a critical yet challenging task due to the inherent limitations of visual data acquisition in such scenarios. This paper introduces a spatiotemporal framework designed to address the unique challenges posed by low-light environments, enhancing the accuracy and efficiency of human abnormality detection in surveillance camera systems. We proposed the pre-processing using lightweight exposure correction, patched frames pose estimation, and optical flow to extract the human behavior flow through t-seconds of frames. After that, we train the estimated-action-flow into autoencoder for abnormal behavior classification to get normal loss as metrics decision for normal/abnormal behavior.

인공지능을 활용한 경혈위치 추론: 두 가지 접근법 비교 (Comparison of two approaches to acupoints inference using artificial intelligence)

  • 서선덕;이병일;이명기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.566-567
    • /
    • 2023
  • 최근 인공지능을 활용한 경혈의 위치를 추론하는 연구가 활발하게 진행되고 있다. 본 논문은 자세 추정(Pose Estimation)을 통해 경혈 검출을 위한 두 가지 접근법인 Top down 방식과 Bottom up 방식의 추론 결과를 비교함으로써 어떤 방식이 경혈의 위치를 추론하기에 더 적합한 지 알아보고자 한다.

메타버스 상호작용 기술 동향 및 발전 전망 (Metaverse Interaction Technology Trends and Development Prospects)

  • 백성민;이용호;김주영;박상헌;길연희
    • 전자통신동향분석
    • /
    • 제39권2호
    • /
    • pp.12-23
    • /
    • 2024
  • The Metaverse industry is developing rapidly, and related technologies are being actively improved. Tools such as controllers, keyboards, and mouses are used to interact in the Metaverse, but they are not natural and intuitive interfaces to resemble real-world interactions. Immersive interaction in a Metaverse space requires the engagement of various senses such as vision, touch, and proprioception. Moreover, in terms of body senses, it requires a sense of body ownership and agency. In addition, eliciting cognitive and emotional empathy based on non-verbal expression, which cannot be suitably conveyed to the digital world, requires higher-level technologies than existing emotion measurement solutions. This diversity of technologies can converge to build an immersive realistic Metaverse environment. We review the latest research trends in technologies related to immersive interactions and analyze future development prospects.

자율 수중 로봇을 위한 사실적인 실시간 고밀도 3차원 Mesh 지도 작성 (Photorealistic Real-Time Dense 3D Mesh Mapping for AUV)

  • 이정우;조영근
    • 로봇학회논문지
    • /
    • 제19권2호
    • /
    • pp.188-195
    • /
    • 2024
  • This paper proposes a photorealistic real-time dense 3D mapping system that utilizes a neural network-based image enhancement method and mesh-based map representation. Due to the characteristics of the underwater environment, where problems such as hazing and low contrast occur, it is hard to apply conventional simultaneous localization and mapping (SLAM) methods. At the same time, the behavior of Autonomous Underwater Vehicle (AUV) is computationally constrained. In this paper, we utilize a neural network-based image enhancement method to improve pose estimation and mapping quality and apply a sliding window-based mesh expansion method to enable lightweight, fast, and photorealistic mapping. To validate our results, we utilize real-world and indoor synthetic datasets. We performed qualitative validation with the real-world dataset and quantitative validation by modeling images from the indoor synthetic dataset as underwater scenes.

물체 파지점 검출 향상을 위한 분할 기반 깊이 지도 조정 (Segmentation-Based Depth Map Adjustment for Improved Grasping Pose Detection)

  • 신현수;무하마드 라힐 아파잘;이성온
    • 로봇학회논문지
    • /
    • 제19권1호
    • /
    • pp.16-22
    • /
    • 2024
  • Robotic grasping in unstructured environments poses a significant challenge, demanding precise estimation of gripping positions for diverse and unknown objects. Generative Grasping Convolution Neural Network (GG-CNN) can estimate the position and direction that can be gripped by a robot gripper for an unknown object based on a three-dimensional depth map. Since GG-CNN uses only a depth map as an input, the precision of the depth map is the most critical factor affecting the result. To address the challenge of depth map precision, we integrate the Segment Anything Model renowned for its robust zero-shot performance across various segmentation tasks. We adjust the components corresponding to the segmented areas in the depth map aligned through external calibration. The proposed method was validated on the Cornell dataset and SurgicalKit dataset. Quantitative analysis compared to existing methods showed a 49.8% improvement with the dataset including surgical instruments. The results highlight the practical importance of our approach, especially in scenarios involving thin and metallic objects.

서베일런스에서 피셔의 선형 판별 분석을 이용한 사람 검출의 성능 향상 (Improve the Performance of People Detection using Fisher Linear Discriminant Analysis in Surveillance)

  • 강성관;이정현
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.295-302
    • /
    • 2013
  • 사람 검출은 정지된 영상 혹은 동영상으로부터 사람의 움직임이나 자세를 추정하고, 사람이 찾아질 경우 영상 내 사람의 좌표, 동작 인식, 보안관련 인증 등을 알아내는 기술로 정의된다. 이러한 사람 검출은 다른 객체의 검출이나 사람과 컴퓨터와의 상호작용, 동작 인식 등의 기초 기술로서 해당 시스템의 성능에 영향을 미치는 매우 중요한 변수 중에 하나이다. 그러나 영상 내의 사람은 움직임, 자세, 크기, 빛의 방향 및 밝기, 다른 객체와의 중복 등의 환경적 변화로 인해 사람 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 피셔의 선형 판별 분석을 이용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 사람 검출 방법을 제안한다. 제안된 방법은 사람 움직임 및 자세와 배경에 무관하게 빠른 시간 안에 사람을 검출하는 것이 가능하다. 이를 위해 계층적인 방법으로 사람 검출을 수행하며, 휴리스틱한 방법, 피셔의 판별 분석을 이용하여 사람 검출을 수행하고, 검색 영역의 축소와 선형 결정의 계산 시간의 단축으로 검출 응답 시간을 빠르게 하였다. 추출된 사람 영상에서 사람의 자세를 추정하고 사람의 영역을 검출함으로써 사람 정보의 사용에 있어 보다 많은 정보를 추출할 수 있도록 하였다.

이미지 인식률 개선을 위한 CNN 기반 이미지 회전 보정 알고리즘 (CNN-based Image Rotation Correction Algorithm to Improve Image Recognition Rate)

  • 이동구;선영규;김수현;심이삭;이계산;송명남;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.225-229
    • /
    • 2020
  • 이미지 인식 및 영상처리, 컴퓨터 비전 등의 분야에서 합성곱 인공신경망 (Convolutional Neural Network, CNN)은 다양하게 응용되고 탁월한 성능을 내고 있다. 본 논문에서는 CNN을 활용한 이미지 인식 시스템에서 인식률을 저하시키는 요인 중 하나인 이미지의 회전에 대한 해결책으로써 CNN 기반 이미지 회전 보정 알고리즘을 제안한다. 본 논문에서는 Leeds Sports Pose 데이터셋을 활용하여 이미지를 임의의 각도만큼 회전시킨 학습데이터로 인공지능 모델을 학습시켜 출력으로 회전된 각도를 추정하도록 실험을 진행하였다. 학습된 인공지능 모델을 100장의 테스트 데이터 이미지로 실험하여 mean absolute error (MAE) 성능지표를 기준으로 4.5951의 값을 얻었다.