• 제목/요약/키워드: 포즈추론

검색결과 3건 처리시간 0.021초

CNN 기반의 모델 학습을 통한 관계 분류 모델 : AI 기반의 셀프사진관 포즈 추천 프레임워크 (Relationship classification model through CNN-based model learning: AI-based Self-photo Studio Pose Recommendation Frameworks)

  • 백강민;한연지
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.951-952
    • /
    • 2023
  • 소위 '인생네컷'이라 불리는 셀프사진관은 MZ 세대의 새로운 놀이 문화로 떠오르며 사용자 수가 나날이 증가하고 있다. 그러나 짧은 시간 내에 다양한 포즈를 취해야 하는 셀프사진관 특성상 촬영이 낯선 사람에게는 여전히 진입장벽이 존재한다. 더불어 매번 비슷한 포즈와 사진 결과물에 기존 사용자는 점차 흥미를 잃어가는 문제점도 발생하고 있다. 이에 본 연구에서는 셀프사진관 사용자의 관계를 분류하는 모델을 개발하여 관계에 따른 적합하고 다양한 포즈를 추천하는 프레임워크를 제안한다. 사용자의 관계를 'couple', 'family', 'female_friend', 'female_solo', 'male_friend', 'male_solo' 총 6 개로 구분하였고 실제 현장과 유사하도록 단색 배경의 이미지를 우선으로 학습 데이터를 수집하여 모델의 성능을 높였다. 모델 학습 단계에서는 모델의 성능을 높이기 위해 여러 CNN 기반의 모델을 전이학습하여 각각의 정확도를 비교하였다. 결과적으로 195 장의 test_set 에서 accuracy 0.91 의 성능 평가를 얻었다. 본 연구는 객체 인식보다 객체 간의 관계를 학습시켜 관계성을 추론하고자 하는 것을 목적으로, 연구 결과가 희박한 관계 분류에 대한 주제를 직접 연구하여 추후의 방향성이나 방법론과 같은 초석을 제안할 수 있다. 또한 관계 분류 모델을 CCTV 에 활용하여 미아 방지 혹은 추적과 구조 등에 활용하여 국가 치안을 한층 높이는 데 기대할 수 있다.

제조업 노동자 근골격계 부담요인 데이터셋 클래스 분류와 유효성 검증 (Class Classification and Validation of a Musculoskeletal Risk Factor Dataset for Manufacturing Workers)

  • 강영진;노태경;김기환;정석찬
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.49-59
    • /
    • 2023
  • 제조업의 안전보건 기준은 다양한 항목이 존재하지만, 질병 재해자 기준에서 업무상 질병과 근골격계 질환으로 나눌 수 있다. 이 중 근골격계 질환은 제조업에서 가장 많이 발생하며, 나아가서 제조 현장의 노동생산성감소 및 경쟁력 약화까지 유발할 수 있어서 이를 사전에 확인할 수 있는 시스템이 필요한 실정이다. 본 논문에서는 제조업 노동자의 근골격계 유해 요인을 검출하기 위하여 근골격계 부담작업 요인 분석 데이터 속성, 유해 요인 작업자세, 관절 키포인트를 정의하고 인공지능 학습용 데이터를 구축하였다. 구축한 데이터의 유효성을 판단하기 위해서 YOLO, Dite-HRNet, EfficientNet 등의 AI 알고리즘을 활용하여 학습하고 검증하였다. 실험 결과 사람 탐지 정확도는 99%, 탐지된 사람의 관절 위치 추론 정확도는 @AP0.5 88%, 추론된 관절 위치를 종합하여 자세를 평가한 정확도는 LEGS 72.2%, NECT 85.7%, TRUNK 81.9%, UPPERARM 79.8%, LOWERARM 92.7%를 도출하였으며, 추가로 딥러닝 기반의 근골격계 질병을 예방할 수 있는 연구에 필요한 요소를 고찰하였다.

증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구 (AI-Based Object Recognition Research for Augmented Reality Character Implementation)

  • 이석환;이정금;심현
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1321-1330
    • /
    • 2023
  • 본 연구는 증강현실에서 적용할 캐릭터 생성에서 단일 이미지를 통해 여러 객체에 대한 3D 자세 추정 문제를 연구한다. 기존 top-down 방식에서는 이미지 내의 모든 객체를 먼저 감지하고, 그 후에 각각의 객체를 독립적으로 재구성한다. 문제는 이렇게 재구성된 객체들 사이의 중첩이나 깊이 순서가 불일치 하는 일관성 없는 결과가 발생할 수 있다. 본 연구의 목적은 이러한 문제점을 해결하고, 장면 내의 모든 객체에 대한 일관된 3D 재구성을 제공하는 단일 네트워크를 개발하는 것이다. SMPL 매개변수체를 기반으로 한 인체 모델을 top-down 프레임워크에 통합이 중요한 선택이 되었으며, 이를 통해 거리 필드 기반의 충돌 손실과 깊이 순서를 고려하는 손실 두 가지를 도입하였다. 첫 번째 손실은 재구성된 사람들 사이의 중첩을 방지하며, 두 번째 손실은 가림막 추론과 주석이 달린 인스턴스 분할을 일관되게 렌더링하기 위해 객체들의 깊이 순서를 조정한다. 이러한 방법은 네트워크에 이미지의 명시적인 3D 주석 없이도 깊이 정보를 제공하게 한다. 실험 결과, 기존의 Interpenetration loss 방법은 MuPoTS-3D가 114, PoseTrack이 654에 비해서 본 연구의 방법론인 Lp 손실로 네트워크를 훈련시킬 때 MuPoTS-3D가 34, PoseTrack이 202로 충돌수가 크게 감소하는 것으로 나타났다. 본 연구 방법은 표준 3D 자세벤치마크에서 기존 방법보다 더 나은 성능을 보여주었고, 제안된 손실들은 자연 이미지에서 더욱 일관된 재구성을 실현하게 하였다.