• 제목/요약/키워드: 키포인트

검색결과 41건 처리시간 0.022초

라즈베리 파이를 이용한 OpenCV 기반 CMT 알고리즘의 객체 추적 기법 (An Object Tracking Technique on OpenCV-based CMT Algorithm Using Raspberry Pi)

  • 송기범;양용준;이상구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.895-898
    • /
    • 2017
  • 동영상 플랫폼 확산에 따라 영상 콘텐츠 수요와 공급이 폭발적으로 성장하여 영상 콘텐츠 확산에 큰 영향을 미치고 있다. 이와 같은 콘텐츠 확산으로 인해 전문가의 영역에 해당하는 영상 제작 기술이 일반적인 기술의 범주로 인식될 만큼 영상 처리 및 제작에 대한 기술의 발전이 나날이 급증하고 있으며 이러한 기술의 발전에 따라 사람의 수작업을 통해서만 영상을 조절하던 과정 또한 객체 추적 기술을 활용함에 따라 자동화 과정이 가능하게 되었다. 본 연구에서는 객체 추적 알고리즘 중 특징 점을 키포인트로 나눠 객체를 추적하는 OpenCV 기반 CMT 알고리즘으로 라즈베리파이를 활용하여 객체를 추적하는 기법을 소개한다. 본 시스템은 방송용 카메라의 객체 추적에 잘 활용될 수 있다.

딥러닝 기반의 객체 맥락정보 탐지 (Contextual Object Detection using Deep Learning)

  • 김건욱;신재용;황기수;허유진;오승준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.120-122
    • /
    • 2018
  • 이미지에서 단순히 객체탐지를 하는 것이 아닌, 맥락정보를 탐지하는 해내는 것은 이미지 분석 분야에서 활발히 진행해온 연구분야 중 하나이다. 본 논문은 검출된 객체와 사람 간의 맥락 정보를 실시간으로 검출하기 위해 관심있는 객체와 인체의 키포인트를 탐지한 후, 그 두 영역 사이의 거리정보를 이용하여 맥락정보를 추출하는 알고리즘을 제안한다. 이는 CNN으로 이루어진 단일 구조 방식이기에 낮은 시스템 복잡도를 갖는다. 이 방법을 통하여 사람과 연관된 객체 사이의 맥락 정보와 그 위치정보를 출력함으로써 CCTV내 무장한 테러범의 위치나 축구 경기 내 공을 소유한 선수를 찾는 경우 등의 실질적인 이미지 분석에 활용할 수 있다.

  • PDF

GAN 및 키포인트와 로컬 아핀 변환을 이용한 스타일 변환 동적인 이미지 애니메이션 네트워크 구축 (Construction of Dynamic Image Animation Network for Style Transformation Using GAN, Keypoint and Local Affine)

  • 장준보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.497-500
    • /
    • 2022
  • High-quality images and videos are being generated as technologies for deep learning-based image style translation and conversion of static images into dynamic images have developed. However, it takes a lot of time and resources to manually transform images, as well as professional knowledge due to the difficulty of natural image transformation. Therefore, in this paper, we study natural style mixing through a style conversion network using GAN and natural dynamic image generation using the First Order Motion Model network (FOMM).

손톱 검출을 이용한 가상 네일아트 (Virtual Nail Art Using Nail Detection)

  • 문새별;허훈;오정수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.413-415
    • /
    • 2021
  • 본 논문은 OpenPose를 활용한 손톱 검출 알고리즘을 제안하고 이를 이용한 가상 네일아트를 구현한다. OpenPose에 의해 검출된 키포인트들을 기준으로 각 손가락마다 피부색 특징을 이용하여 손가락 영역을 검출한다. 검출된 손가락 영역의 에지 영상에서 손톱 영역을 검출한다. 그리고 나서 손톱 영역에 네일팁을 합성하여 가상 네일아트를 구현한다. 어느 정도 제어된 촬영 환경에서 실험 결과들은 제안된 알고리즘이 손톱 영역을 잘 검출하고 가상 네일아트를 잘 구현하고 것을 보여 주고 있다.

  • PDF

행동 인식을 위한 스켈레톤 데이터셋에 비밀 메시지를 은닉하기 위한 스테가노그라피 연구 (A Study on Steganography to Hide Secret Messages in Skeleton Datasets for Action Recognition)

  • 성락빈;이대원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.157-160
    • /
    • 2022
  • 딥러닝이 각광받기 시작하면서 인간의 자세와 행동을 인식하고 분류하기 위한 인공지능 기술 또한 급속도로 발전하게 되었다. 영상에서 인간의 자세를 디지털 데이터로 표현할 때 인체의 주요 관절점의 위치와 연결관계를 나타내는 스켈레톤 표현 방식을 주로 사용한다. 본 논문에서는 스켈레톤 데이터에 비밀 메시지를 은닉할 수 있는 스테가노그라피 알고리즘에 대해 소개하고, 스켈레톤을 구성하는 주요 관절점 키포인트를 조작했을 때 행동 인식 인공지능 모델이 어떻게 반응하는지 살펴봄으로써 스켈레톤 데이터에 대한 스테가노그라피 알고리즘의 특성과 보안성에 대해 논의한다.

컨볼루션 뉴럴 네트워크와 키포인트 매칭을 이용한 짧은 베이스라인 스테레오 카메라의 거리 센싱 능력 향상 (Improving Detection Range for Short Baseline Stereo Cameras Using Convolutional Neural Networks and Keypoint Matching)

  • 박병재
    • 센서학회지
    • /
    • 제33권2호
    • /
    • pp.98-104
    • /
    • 2024
  • This study proposes a method to overcome the limited detection range of short-baseline stereo cameras (SBSCs). The proposed method includes two steps: (1) predicting an unscaled initial depth using monocular depth estimation (MDE) and (2) adjusting the unscaled initial depth by a scale factor. The scale factor is computed by triangulating the sparse visual keypoints extracted from the left and right images of the SBSC. The proposed method allows the use of any pre-trained MDE model without the need for additional training or data collection, making it efficient even when considering the computational constraints of small platforms. Using an open dataset, the performance of the proposed method was demonstrated by comparing it with other conventional stereo-based depth estimation methods.

인간 캐릭터 포즈 식별: FPS 게임에서의 포즈 추정 기법 (Pose Estimation Techniques for Humanoid Characters in FPS Gaming Environments)

  • 한유정;이민섭;차민수;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.29-30
    • /
    • 2024
  • 본 논문은 Krafton의 PUBG: BATTLEGROUNDS 게임에서 플레이어 분류를 목표로 하며, 포즈 추정기술을 사용하여 일반 플레이어와 봇을 구분한다. 이는 게임에서 직접 수집한 비디오 데이터를 기반으로 하며, 다음과 같은 두 가지 접근 방식을 제안한다. 첫 번째 방법은 동작 시퀀스 분석을 통해, 사용자의 특정동작 패턴을 식별하고 로지스틱 회귀 모델을 활용해 사용자 유형을 분류한다. 두 번째 방법은 YOLO-pose 모델을 사용하여 비디오 데이터에서 키포인트를 추출하고, 이를 LSTM 모델에 적용하여 프레임별로 사용자의 유형을 분류한다. 이러한 이중 접근 방식은 게임의 공정성과 사용자 경험을 향상시키는 새로운 도구를 제공하며, 보다 안전한 게임 환경에 기여할 수 있다. 이 연구는 게임 산업뿐만 아니라 보안 및 모니터링 분야에서도 동작 분석에 대한 혁신적인 접근 방식으로 활용될 잠재력을 가지고 있다.

  • PDF

Stereo Vision과 AlphaPose를 이용한 다중 객체 거리 추정 방법에 관한 연구 (A Study on the Estimation of Multi-Object Social Distancing Using Stereo Vision and AlphaPose)

  • 이주민;배현재;장규진;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.279-286
    • /
    • 2021
  • 최근 COVID-19 확산 방지를 위한 공공장소에서는 최소 1m 이상을 유지하는 물리적 거리두기 정책을 실행하고 있다. 본 논문에서는 드론과 CCTV가 취득한 스테레오 영상에서 실시간으로 사람들 간의 거리를 추정하는 방법과 추정된 거리에서 1m 이내의 객체를 인식하는 자동화 시스템을 제안한다. 기존의 CCTV를 이용하여 다중 객체 간의 거리 추정에 사용되었던 방법의 문제점으로는 한 대의 CCTV만을 이용하여 객체의 3차원 정보를 얻지 못한다는 것이다. 선, 후행하거나 겹쳐진 사람 간의 거리를 구하기 위해서는 3차원 정보가 필요하기 때문이다. 또한, 일반적인 Detected Bounding Box를 사용하여 영역 안에서 사람이 존재하는 정확한 좌표를 얻지 못한다. 따라서 사람이 존재하는 정확한 위치 정보를 얻기 위해 스켈레톤 추출하여 관절 키포인트의 2차원 좌표를 획득한 후, Stereo Vision을 이용한 카메라 캘리브레이션을 적용하여 3차원 좌표로 변환한다. 3차원으로 변환된 관절 키포인트의 중심좌표를 계산하고 객체 간 사이의 거리를 추정한다. 3차원 좌표의 정확성과 객체(사람) 간의 거리 추정 실험을 수행한 결과, 1m 이내에 존재하는 다수의 사람 간의 거리 추정에서 0.098m 이내 평균오차를 보였다.

50인 이하 소규모 제조업에 대한 효과적인 BCMS 적용 (A Study on How to Effectively apply BCMS for small-scale manufacturing under 50 employees)

  • 이대형;정종수
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2017년 정기학술대회
    • /
    • pp.255-256
    • /
    • 2017
  • 본 논문에서는 50인 이하 소규모 제조업에 대해 어떤 방법으로 접근하는 것이 BCMS를 적용 하는데 효과적인지 연구하였다. BCMS의 적용범위가 상당히 광범위하고 현재 BCMS를 적용하고 있는 기업의 규모는 대부분 크며, 기업인들의 인식도 큰 규모만이 BCMS가 적용될 수 있다고 믿고 있다. 이에 실질적으로 한국의 기업군을 대부분 차지하고 있는 50인 이하의 제조업이 어떻게 BCMS를 적용하는 것이 효과적인지를 개발하여 소규모 기업도 어떠한 상황 하에서도 사업이 지속가능할 수 있도록 BCMS를 적용 하고자 한다. 일단 50인 이하 소규모 업체는 조직의 상황이 대기업이나 중견기업에 비해 간단하다. 또한 이해관계자도 대부분 많지 않다. 그렇기 때문에 BCMS를 수립하기 위해 파악하여야 할 핵심 업무나 관련 리스크도 많지 않을 것이다. 여기에 착안을 하여 기존에 대부분 갖추고 있는 품질, 환경, 안전보건시스템과 연계하여 사업연속성관리 시스템을 구축하면 50인 이하 기업도 별도의 추가시스템이 아닌 통합시스템의 일환으로 손쉽게 BCMS를 적용하여 어떠한 리스크에도 사업의 연속성을 갖출 수 있는 능력을 가질 것이다. BCMS에서 요구하는 사항에 대해 개별적인 접근방식보다 기존에 갖추고 있는 시스템을 적용하여 통합시스템 접근방식이 키포인트이다.

  • PDF

수어 동작 키포인트 중심의 시공간적 정보를 강화한 Sign2Gloss2Text 기반의 수어 번역 (Sign2Gloss2Text-based Sign Language Translation with Enhanced Spatial-temporal Information Centered on Sign Language Movement Keypoints)

  • 김민채;김정은;김하영
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1535-1545
    • /
    • 2022
  • Sign language has completely different meaning depending on the direction of the hand or the change of facial expression even with the same gesture. In this respect, it is crucial to capture the spatial-temporal structure information of each movement. However, sign language translation studies based on Sign2Gloss2Text only convey comprehensive spatial-temporal information about the entire sign language movement. Consequently, detailed information (facial expression, gestures, and etc.) of each movement that is important for sign language translation is not emphasized. Accordingly, in this paper, we propose Spatial-temporal Keypoints Centered Sign2Gloss2Text Translation, named STKC-Sign2 Gloss2Text, to supplement the sequential and semantic information of keypoints which are the core of recognizing and translating sign language. STKC-Sign2Gloss2Text consists of two steps, Spatial Keypoints Embedding, which extracts 121 major keypoints from each image, and Temporal Keypoints Embedding, which emphasizes sequential information using Bi-GRU for extracted keypoints of sign language. The proposed model outperformed all Bilingual Evaluation Understudy(BLEU) scores in Development(DEV) and Testing(TEST) than Sign2Gloss2Text as the baseline, and in particular, it proved the effectiveness of the proposed methodology by achieving 23.19, an improvement of 1.87 based on TEST BLEU-4.