• 제목/요약/키워드: 모델 키포인트

검색결과 9건 처리시간 0.022초

산업용 형상 품질 검사 비전을 위한 딥러닝 기반 형상 키포인트 검출 모델 구현 (Implementation of a Deep Learning-based Keypoint Detection Model for Industrial Shape Quality Inspection Vision)

  • 김석주;권중장
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.37-38
    • /
    • 2023
  • 본 논문에서는 딥러닝을 기반으로 하는 키포인트 인식 모델을 산업용 품질검사 머신비전에 응용하는 방법을 제안한다. 전이학습 방법을 이용하여 딥러닝 모델의 인식률을 높이는 방법을 제시하였고, 전이시킨 특성 추출 모델에 대해 추가로 데이터 세트에 대한 학습을 진행하는 것이 특성추출 모델의 초기 ImageNet 가중치를 동결시켜 학습하는 것보다 학습 속도나 정확도가 높다는 것을 보여준다. 실험을 통해 딥러닝을 응용하는 산업용 품질 검사 공정에는 특성추출 모델의 추가 학습이 중요하다는 점을 확인할 수 있었다.

  • PDF

관절 적응형 Gaussian Mixture 히트맵 회귀법을 이용한 하향식 사람 자세 추정에 관한 연구 (Study of the Gaussian Mixture Joint-Adaptive Heatmap Regression for Top-Down Human Pose Estimation)

  • 왕준기;조정찬;최상일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.35-36
    • /
    • 2022
  • 본 논문은 딥러닝 사람 자세 추정 모델이 사람의 관절 키포인트를 예측하는데 관절의 2차원 면적에 의해 키포인트별 𝜎, 즉, 표준 편차를 가지는 가우시안 커널(Gaussian Kernel)을 예측하는 방법을 제안한다. 각 관절 키포인트에 대해 다른 𝜎를 가지는 정답 히트맵(Ground Truth Heatmap)과 제안한 Gaussian Mixture Block를 모델에 추가해서 관절의 크기를 맞는 히트맵을 예측한다.

  • PDF

RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법 (A Method for Body Keypoint Localization based on Object Detection using the RGB-D information)

  • 박서희;전준철
    • 인터넷정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.85-92
    • /
    • 2017
  • 최근 영상감시 분야에서는 영상에서 움직이는 사람을 탐지하고, 탐지된 사람의 행위를 분석하는 방식에 딥러닝 기반 학습방법이 적용되기 시작했다. 이러한 지능형 영상분석 기술을 적용할 수 있는 분야 중 하나인 인간 행위 인식은 객체를 탐지하고 탐지된 객체의 행위를 인식하기 위해 신체 키포인트를 검출 하는 과정을 거치게 된다. 본 논문에서는 RGB-D 정보를 이용한 객체 탐지 기반의 신체 키포인트 검출 방법을 제시한다. 먼저, 두 대의 카메라로 생성된 색상정보와 깊이정보를 이용하여 이동하는 객체를 배경으로부터 분할하여 탐지한다. RGB-D 정보를 이용하여 탐지된 객체의 영역을 재조정하여 생성된 입력 데이터를 한 사람의 자세 추정을 위한 Convolutional Pose Machines(CPM)에 적용한다. CPM을 이용하여 한 사람당 14개의 신체부위에 대한 신념 지도(Belief Map)를 생성하고, 신념 지도를 기반으로 신체 키포인트를 검출한다. 이와 같은 방법은 키포인트를 검출할 객체에 대한 정확한 영역을 제공하게 되며, 개별적인 신체 키포인트의 검출을 통하여 단일 신체 키포인트 검출에서 다중 신체 키포인트 검출로 확장 할 수 있다. 향후, 검출된 키포인트를 이용하여 인간 자세 추정을 위한 모델을 생성할 수 있으며 인간 행위 인식 분야에 기여 할 수 있다.

AlphaPose를 활용한 LSTM(Long Short-Term Memory) 기반 이상행동인식 (LSTM(Long Short-Term Memory)-Based Abnormal Behavior Recognition Using AlphaPose)

  • 배현재;장규진;김영훈;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.187-194
    • /
    • 2021
  • 사람의 행동인식(Action Recognition)은 사람의 관절 움직임에 따라 어떤 행동을 하는지 인식하는 것이다. 이를 위해서 영상처리에 활용되는 컴퓨터 비전 태스크를 활용하였다. 사람의 행동인식은 딥러닝과 CCTV를 결합한 안전사고 대응서비스로서 안전관리 현장 내에서도 적용될 수 있다. 기존연구는 딥러닝을 활용하여 사람의 관절 키포인트 추출을 통한 행동인식 연구가 상대적으로 부족한 상태이다. 또한 안전관리 현장에서 작업자를 지속적이고 체계적으로 관리하기 어려운 문제점도 있었다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관절 키포인트와 관절 움직임 정보만을 이용하여 위험 행동을 인식하는 방법을 제안하고자 한다. 자세추정방법(Pose Estimation)의 하나인 AlphaPose를 활용하여 신체 부위의 관절 키포인트를 추출하였다. 추출된 관절 키포인트를 LSTM(Long Short-Term Memory) 모델에 순차적으로 입력하여 연속적인 데이터로 학습을 하였다. 행동인식 정확률을 확인한 결과 "누워있기(Lying Down)" 행동인식 결과의 정확도가 높음을 확인할 수 있었다.

인간 캐릭터 포즈 식별: FPS 게임에서의 포즈 추정 기법 (Pose Estimation Techniques for Humanoid Characters in FPS Gaming Environments)

  • 한유정;이민섭;차민수;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.29-30
    • /
    • 2024
  • 본 논문은 Krafton의 PUBG: BATTLEGROUNDS 게임에서 플레이어 분류를 목표로 하며, 포즈 추정기술을 사용하여 일반 플레이어와 봇을 구분한다. 이는 게임에서 직접 수집한 비디오 데이터를 기반으로 하며, 다음과 같은 두 가지 접근 방식을 제안한다. 첫 번째 방법은 동작 시퀀스 분석을 통해, 사용자의 특정동작 패턴을 식별하고 로지스틱 회귀 모델을 활용해 사용자 유형을 분류한다. 두 번째 방법은 YOLO-pose 모델을 사용하여 비디오 데이터에서 키포인트를 추출하고, 이를 LSTM 모델에 적용하여 프레임별로 사용자의 유형을 분류한다. 이러한 이중 접근 방식은 게임의 공정성과 사용자 경험을 향상시키는 새로운 도구를 제공하며, 보다 안전한 게임 환경에 기여할 수 있다. 이 연구는 게임 산업뿐만 아니라 보안 및 모니터링 분야에서도 동작 분석에 대한 혁신적인 접근 방식으로 활용될 잠재력을 가지고 있다.

  • PDF

행동 인식을 위한 스켈레톤 데이터셋에 비밀 메시지를 은닉하기 위한 스테가노그라피 연구 (A Study on Steganography to Hide Secret Messages in Skeleton Datasets for Action Recognition)

  • 성락빈;이대원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.157-160
    • /
    • 2022
  • 딥러닝이 각광받기 시작하면서 인간의 자세와 행동을 인식하고 분류하기 위한 인공지능 기술 또한 급속도로 발전하게 되었다. 영상에서 인간의 자세를 디지털 데이터로 표현할 때 인체의 주요 관절점의 위치와 연결관계를 나타내는 스켈레톤 표현 방식을 주로 사용한다. 본 논문에서는 스켈레톤 데이터에 비밀 메시지를 은닉할 수 있는 스테가노그라피 알고리즘에 대해 소개하고, 스켈레톤을 구성하는 주요 관절점 키포인트를 조작했을 때 행동 인식 인공지능 모델이 어떻게 반응하는지 살펴봄으로써 스켈레톤 데이터에 대한 스테가노그라피 알고리즘의 특성과 보안성에 대해 논의한다.

Lightening of Human Pose Estimation Algorithm Using MobileViT and Transfer Learning

  • Kunwoo Kim;Jonghyun Hong;Jonghyuk Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.17-25
    • /
    • 2023
  • 본 논문에서는 매개변수가 더 적고, 빠르게 추정 가능한 MobileViT 기반 모델을 통해 사람 자세 추정 과업을 수행할 수 있는 모델을 제안한다. 기반 모델은 합성곱 신경망의 특징과 Vision Transformer의 특징이 결합한 구조를 통해 경량화된 성능을 입증한다. 본 연구에서 주요 매커니즘이 되는 Transformer는 그 기반의 모델들이 컴퓨터 비전 분야에서도 합성곱 신경망 기반의 모델들 대비 더 나은 성능을 보이며, 영향력이 커지게 되었다. 이는 사람 자세 추정 과업에서도 동일한 상황이며, Vision Transformer기반의 ViTPose가 COCO, OCHuman, MPII 등 사람 자세 추정 벤치마크에서 모두 최고 성능을 지키고 있는 것이 그 적절한 예시이다. 하지만 Vision Transformer는 매개변수의 수가 많고 상대적으로 많은 연산량을 요구하는 무거운 모델 구조를 가지고 있기 때문에, 학습에 있어 사용자에게 많은 비용을 야기시킨다. 이에 기반 모델은 Vision Transformer가 많은 계산량을 요구하는 부족한 Inductive Bias 계산 문제를 합성곱 신경망 구조를 통한 Local Representation으로 극복하였다. 최종적으로, 제안 모델은 MS COCO 사람 자세 추정 벤치마크에서 제공하는 Validation Set으로 ViTPose 대비 각각 5분의 1과 9분의 1만큼의 3.28GFLOPs, 972만 매개변수를 나타내었고, 69.4 Mean Average Precision을 달성하여 상대적으로 우수한 성능을 보였다.

이동형 정보 증강 시스템을 위한 실시간 장소 인식 (Real-Time Place Recognition for Augmented Mobile Information Systems)

  • 오수진;남양희
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.477-481
    • /
    • 2008
  • 이동 중 사용자에게 필요한 정보를 제공하기 위해서는 장소를 인지하는 기술이 필요하다. 본 논문에서는 건물 내에서 이동하면서 카메라에 의해 포착된 영상 정보를 분석하여 현재 장소를 파악하고 카메라 영상에 관련 정보를 증강하는 비디오 기반 실시간 장소인식 시스템을 제안한다. 영상의 전역적 특징을 이용한 기존 연구들은 장면의 부분적인 폐색이나 잡음에 민감하고, 물체인식을 행하는 지역적 특징 의존 방식은 계산량이 많아 실시간 적용이 어렵다. 또한, 그러한 특징들로부터 장소인식 결과를 도출하기 위해서는 통계적 그래프 기반 모델이나 베이시안 네트웍등이 이용되어 왔는데, 전자의 경우 장소 이동의 확률을 얻기 위한 많은 통계 데이타가 필요하며, 후자는 장소 이동문맥을 활용하지 못하므로 물체 인식 결과에만 의존하는 단점이 있다. 본 논문에서는 장소 문맥 정보를 활용하면서 영상의 지역적, 전역적 특징추출법의 결합을 통해 부분 폐색 및 잡음에 대한 전역적 방법의 민감성을 보완하고, 지역적 방법의 느린 처리속도를 보완한 시스템을 제안한다. 제안된 방법을 건물 내부를 이동하면서 장소에 대한 정보를 얻는 정보증강 시스템에 적용하여 실시간 성능을 확인하였다.

3차원 수치지도 생성을 위한 지형공간 데이터 모델링 (Geospatial Data Modeling for 3D Digital Mapping)

  • 이동천;배경호;유근홍
    • 한국측량학회지
    • /
    • 제27권3호
    • /
    • pp.393-400
    • /
    • 2009
  • 최근 실세계를 재현하기 위한 3차원 기술개발의 필요성과 요구가 증가하게 되어 이러한 요구를 충족하기 위해 실세계 재현에 대한 연구가 국내외적으로 활발히 진행되고 있다. 기존에 구축된 공간분석을 위한 데이터는 2차원을 목적으로 제작되었으며 이는 3차원의 현실세계를 반영하는데 한계성이 있다. 또한 데이터 활용성이 제한적이며 데이터 재생산은 비용과 시간의 측면에서 비효율적이므로 기존의 데이터를 활용하여 효과적으로 3차원의 현실세계를 재현할 수 있는 방법에 대한 연구의 필요성이 증대되었다. DEM(Digital Elevation Model: 수치표고모델)은 활용 분야별로 다양한 요구조건을 만족하는 개별적인 방법으로 제작되어 활용되며 기존의 DEM 제작은 일률적인 보간법과 해상도로 제작되므로 데이터의 효율성이 떨어진다. 이는 실세계를 반영하기 위한 정확성에서의 한계성을 가지므로 다양한 데이터를 포함하면 효율성을 높일 수 있다. 본 연구에서는 지형분석을 통해 산악지, 구릉지, 평지로 분류 하여 서로 상이한 보간법과 해상도로 다중 해상도 DEM을 생성하였고 지형의 특성을 대표하는 model keypoint 데이터를 생성하여 포함하였다. 또한 3차원 공간정보를 포함하는 데이터 융합을 위해 도화원도와 통합하여 포괄적, 적응적 및 융통적 지형공간 데이터 모델링을 방안을 제안하였다.