통합 검색 | Korea Science

다중 사용자 포즈 추정 및 트래킹 알고리즘의 구현 (Development of Multi-Person Pose-Estimation and Tracking Algorithm)

김승렬;안소윤;서영호
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.215-217
- /
- 2021
본 논문은 3D 공간에서 사용자를 추출한 뒤, 체적 정보 분석을 통한 3D 스켈레톤(skeleton) 분석 과정을 통해 정확도 높은 다수 사용자의 위치 추적 기술에 대해 연구하였다. 이를 위하여 YOLO(You Only Look Once)를 활용하여 실시간으로 객체를 검출(Real-Time Object Detection)한 뒤 Google의 Mediapipe를 활용해 스켈레톤 추출, 스켈레톤 정규화(normalization)를 통한 스켈레톤의 크기 및 상대적 비율 계산, RGB 영상 스케일링(Scaling) 후 주요 마디 인접 영역의 RGB 색상 정보를 추출하는 방법을 통해 정확도가 개선된 높은 성능의 다중 사용자 추적 기술을 연구하였다.
PDF

영상인식 기반 운동 자세 교정 시스템 (Exercise posture correction system based on image recognition)

김동욱;함기범;이강민;임태호;임현혁;염상호;윤태진
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
- /
- pp.489-490
- /
- 2023
본 논문에서는 신체 영상 인식 기술을 이용한 운동 자세 교정 시스템을 제안하고 개발하였다. 구글에서 제공하는 미디어파이프 포즈(MediaPipe Pose) 오픈소스를 사용하여 웹캠으로 사용자의 운동 동작을 실시간으로 인식하여, 인식된 신체 구조의 33개의 관절 위치로 Pose Landmark를 사용하여 사용자의 운동 자세에 대한 횟수 카운트, 운동 동작의 정확도 측정을 할 수 있게 하여 혼자 운동하거나 처음 운동하는 사람들에게 운동의 접근성을 높이고, 올바른 자세로 운동을 하도록 유도할 수 있다.
PDF

인물 객체 간 상호작용 인식을 위한 물리접촉 검출 (Physical Contact Detection for Recognizing Interactions between Person Objects)

박승보;정의손;함동균;금용호
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
- /
- pp.175-178
- /
- 2023
본 논문은 영화의 스토리 인식을 위해 인물 간 상호작용 중 물리적 상호작용 즉, 물리접촉을 검출하는 방법을 제안한다. YOLO를 사용해 영상에서 인간객체를 탐지하고, Mediapipe를 사용해 골격 감지를 진행함으로써 인물의 뼈대를 랜드마크화 하고 타 객체 간의 랜드마크가 일정값 이하로 내려오면 Threshold를 적용해 객체 간의 물리적 접촉을 판단한다, 실험 결과, 50개 17,741 frame의 영상에서 정확도 99.66%의 정밀도 77.27%, 재현율 62.38%로 모델의 전반적인 성능을 나타내는 F1점수는 69%로 나타났다.
PDF

무인 점포 사용자 이상행동을 탐지하기 위한 지능형 모션 패턴 인식 알고리즘 (Intelligent Motion Pattern Recognition Algorithm for Abnormal Behavior Detections in Unmanned Stores)

최영준;나지영;안준호
- 인터넷정보학회논문지
- /
- 제24권6호
- /
- pp.73-80
- /
- 2023
최근 최저시급의 가파른 인상으로 인건비에 대한 부담이 늘어남과 함께 코로나19의 여파로 무인 상점의 점유율이 높아지고 있는 추세이다. 그로 인해 무인 점포를 타겟으로 하는 도난 범죄들도 같이 늘어나고 있어 이러한 도난 사고를 방지하기 위해 Just-Walk-Out 시스템을 도입하고 고비용의 LiDAR 센서, 가중치 센서 등을 사용하거나 수동으로 지속적인 CCTV 감시를 통해서 확인하고 있다. 하지만 이런 고가의 센서를 많이 사용할수록 점포 운영에 있어 비용 부담이 늘어나게 되고, CCTV 확인은 관리자가 24시간 내내 감시하기 어려워서 사용이 제한적이다. 본 연구에서는 이런 센서들이나 사람에 의지하는 부분을 해결할 수 있고 무인점포에서 사용할 수 있는 저비용으로 도난 등의 이상행동을 하는 고객을 탐지하여 클라우드 기반의 알림을 제공하는 인공지능 영상 처리 융합 알고리즘을 제안하고자 한다. 또한 본 연구에서는 mediapipe를 이용한 모션캡쳐, YOLO를 이용한 객체탐지 그리고 융합 알고리즘을 통해 무인 점포에서 수집한 행동 패턴 데이터를 바탕으로 각 알고리즘들에 대한 정확도를 확인하며 다양한 상황 실험을 통해 융합 알고리즘의 성능을 증명했다.
https://doi.org/10.7472/jksii.2023.24.6.73 인용 PDF HTML

StyleGAN 딥러닝 기술을 활용한 카메라 기반 캐릭터 생성 및 모션 제어 시스템 개발 (Development of Camera-based Character Creation and Motion Control System using StyleGAN Deep Learning Technology)

이정훈;김주형;신동현;양재형;장문수
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2022년도 추계학술발표대회
- /
- pp.934-936
- /
- 2022
현재 사회적인(COVID-19) 영향으로 메타버스에 대한 수요가 급증하였지만, 메타버스 플랫폼 진입을 지원하는 XR(AR/VR) 장비의 높은 가격대와 전문성 요구로 폭넓은 수요층을 포괄하기 어려운 상황이다. 본 논문에서는 이러한 수요층의 어려움을 개선하고자 웹 캠이나 스마트폰 카메라로 생성된 개인의 사진 이미지를 StyleGAN 딥러닝 기술과 접목시켜 캐릭터를 생성해 Mediapipe를 활용하여 모션 측정 및 제어를 처리하는 서비스를 제안하여 메타버스 시장의 대중화에 기여하고자 한다.
https://doi.org/10.3745/PKIPS.y2022m11a.934 인용 PDF

얼굴 및 손동작 인식 활용한 자율주행 선풍기 개발 (Development of self-driving fan using face and hand gesture recognition)

김소정;조형국;김우혁;배재준;김창우;고석환;정영석
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
- /
- pp.261-262
- /
- 2023
거동이 불편한 사람의 경우 직접적인 제어보다 손동작으로 간접적인 제어를 함으로써 생활에 어려움이 줄고 편리한 사용이 가능하다. 사람을 인식 후 판단하고 제어가 가능할 뿐만 아니라 손동작 인식이 가능한 선풍기가 사람들에게 더 편하게 활용되고, 간단한 동작으로 제어할 수 있다. 본 논문에서는 Mediapipe를 활용하여 간단한 손동작을 바탕으로 실시간으로 풍속을 제어하고 사람을 인식하는 기능을 제공한다. 야외나 에어컨이 없는 장소의 경우 SLAM을 활용해 주행이 가능한 이동식 선풍기를 개발했다. 기존의 선풍기의 직접적인 조작 제어가 불편한 것이 누구나 쉽게 간단한 손동작을 통해 먼 거리에서의 인식을 통한 제어와 이동 기능이 기존 기능에 비해 향상됨을 기대할 수 있다.
PDF

손 표현 인식을 위한 계층적 손 자세 모델 (Hierarchical Hand Pose Model for Hand Expression Recognition)

허경용;송복득;김지홍
- 한국정보통신학회논문지
- /
- 제25권10호
- /
- pp.1323-1329
- /
- 2021
손 표현 인식을 위해서는 손의 정적인 형태를 기반으로 하는 손 자세 인식과 손의 동적인 움직임을 기반으로 하는 손 동작 인식이 함께 사용된다. 이 논문에서는 손 표현 인식을 위해 손가락의 위치와 형태를 기반으로 하는 계층적 손 자세 모델을 제안한다. 손 자세 인식을 위해서는 오픈소스인 미디어파이프를 기반으로 하고, 손가락 상태를 나타내는 모델과 이를 통해 손 자세를 나타내는 모델을 계층적으로 구성하였다. 손가락 모델 역시 손가락 하나의 굽힘과 손가락 두 개의 닿음을 사용하여 계층적으로 구성하였다. 제안하는 모델은 손을 통해 정보를 전달하는 다양한 응용에 사용할 수 있으며, 수화에서의 숫자 인식에 적용하여 그 유용성을 검증하였다. 제안하는 모델은 수화 인식 이외에 컴퓨터의 사용자 인터페이스에서 다양한 응용이 가능할 것으로 기대한다.
https://doi.org/10.6109/jkiice.2021.25.10.1323 인용 PDF KSCI

청각장애인의 수어 교육을 위한 MediaPipe 활용 수어 학습 보조 시스템 개발 (Development of a Sign Language Learning Assistance System using Mediapipe for Sign Language Education of Deaf-Mutility)

김진영;심현
- 한국전자통신학회논문지
- /
- 제16권6호
- /
- pp.1355-1362
- /
- 2021
최근 선천적 청각장애 뿐만 아니라 후천적 요인으로 인해 청각장애를 가지게 되는 사람들도 증가하고 있지만, 수어를 익힐 수 있는 환경은 열악한 상황이다. 이에 본 연구에서는 수어를 배우는 수어 학습자를 위한 수어학습 보조도구로써 수어(지숫자/지문자) 평가 시스템을 제시하고자 한다. 이에 본 논문에서는 OpenCV 라이브러와 MediaPipe를 이용하여 손과 손가락을 추적하여 수어 동작을 인식하고 CNN기법을 이용하여 수어의 의미를 텍스트 형태의 데이터로 변환하여 학습자에게 제공하는 시스템을 연구한다. 이를 통해 수어를 배우는 학습자가 스스로 올바른 수형인지를 판단할 수 있도록 자기주도학습을 가능하게 하여 수어를 익히는데 도움이 되는 수어학습보조 시스템을 개발하고, 청각장애인들의 의사소통의 주언어인 수어학습을 지원하기 위한 방안으로 수어학습보조 시스템을 제안하는 데 목적이 있다.
https://doi.org/10.13067/JKIECS.2021.16.6.1355 인용 PDF KSCI

위치 분포 및 그래프 절단에 의한 모발 분류와 영역 분할 (Hair Classification and Region Segmentation by Location Distribution and Graph Cutting)

김용길;문경일
- 한국인터넷방송통신학회논문지
- /
- 제22권3호
- /
- pp.1-8
- /
- 2022
최근 소개된 구글 MediaPipe의 모발 분할 방식은 실시간 모바일 애플리케이션을 위해 특별히 설계된 단일 카메라 입력에서 신경망 기반 모발 분할을 위한 새로운 접근 방식을 제시한다. 상대적으로 작은 신경망으로 가상 머리카락 다시 칠하기와 같은 증강 현실 효과에 매우 적합한 고품질 머리카락 분할 마스크를 생성한다. 그렇지만, 모발 스타일 또는 모발 영역에 잡음이 있는 경우에 모발 분할 정확도가 떨어지는 문제점들이 있다. 이에 본 연구에서는 지정된 라벨에서 모발 위치와 모발 색상 가능성의 추정된 사전 분포에 따라 이미지의 에너지 함수를 구성하고, 이것을 그래프 절단 알고리즘에 따라 최적화시키는 방식으로 초기 모발 영역을 얻는 방식을 도입한다. 그런 다음에, 초기 모발 영역에 클러스터링 알고리즘과 사후 처리 기법을 적용하여 최종 모발 영역을 정밀하게 분할 할 수 있도록 한다. 제안된 방식은 MediaPipe의 모발 분할 파이프라인에 적용된다.
https://doi.org/10.7236/JIIBC.2022.22.3.1 인용 PDF KSCI HTML

시각장애인 안전을 위한 영상 기반 저비용 보행 공간 인지 알고리즘 (Vision-based Low-cost Walking Spatial Recognition Algorithm for the Safety of Blind People)

강성현;이세훈;안준호
- 인터넷정보학회논문지
- /
- 제24권6호
- /
- pp.81-89
- /
- 2023
현대사회에서 시각장애인들은 도보, 승강기, 횡단보도 등 일반적인 환경에서 보행을 하는데 어려움이 있다. 시각장애인의 불편 해소를 위한 연구로 영상이나 음성을 이용한 연구가 있으며, 이런 연구는 고비용의 웨어러블 장치, 고성능 CCTV, 음성 센서 등을 사용하여 실생활에 적용하는 데는 한계가 있다. 본 논문에서 시각장애인이 보행 중에 안전한 이동을 위해서 스마트폰에 포함된 저비용의 영상 센서를 활용하여 주변 도보 공간을 인지하는 인공지능 융합 알고리즘을 제안한다. 제안된 알고리즘은 이동 중인 사람 탐지를 위해서 모션 캡처 알고리즘과 장애물 탐지를 위한 객체 탐지 알고리즘을 융합하여 개발하였다. 모션 캡처 알고리즘으로 mediapipe을 사용하여 이동 중에 있는 주변 보행자들을 모델링 및 탐지하였다. 객체 탐지 알고리즘을 사용했으며 도보 중에 발생하는 다양한 장애물을 모델링 하였다. 실험을 통하여 인공지능 융합 알고리즘을 검증했으며, 정확도 0.92, 정밀도 0.91, 재현율 0.99. F1 score 0.95로 결과를 얻어서 알고리즘의 성능을 확인하였다. 본 연구로 보행 중에 발생하는 볼라드, 공유 킥보드, 자동차 등의 주변 장애물 및 이동 중인 보행자 회피하여 시각장애인들의 통행에 도움을 줄 수 있다.
https://doi.org/10.7472/jksii.2023.24.6.81 인용 PDF HTML

검색결과 20건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)