• 제목/요약/키워드: 포즈 인식

검색결과 114건 처리시간 0.018초

로봇활용 공동 주의 훈련자극에 대한 사용자 반응상태를 추정하는 프로세스 (The process of estimating user response to training stimuli of joint attention using a robot)

  • 김다영;윤상석
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1427-1434
    • /
    • 2021
  • 본 연구는 사회성 상호작용 훈련자극에 반응하는 아동의 행동 및 정서적 긴장상태를 연산하는 심리반응 상태 추정 프로세스를 제안한다. 행동 중재에 필요한 훈련자극으로는 공동 주의(Joint attention) 사회성 훈련을 채택하고, 훈련프로토콜은 불연속 개별시도 훈련(DTT: Discrete trial training)기법이 적용된다. 공동 주의 훈련에서 사용자의 집중과 긴장 정도를 확인하기 위해 3가지 훈련자극용 콘텐츠를 구성한 후, 캐릭터 형태의 탁상 로봇을 이용하여 사용자에게 훈련자극을 수행하게 된다. 그런 다음, 비전 기반 헤드 포즈 인식기와 기하학 연산모델로 사용자 응시반응을 추정하고, PPG와 GSR의 생체신호를 심박변이도와 히스토그램 기법으로 신경계 반응을 분석한다. 로봇을 활용한 실험에서 공동 주의에 대한 각 콘텐츠 별 훈련에 사용자의 심리반응을 정량화 할 수 있음을 확인하였다.

증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구 (AI-Based Object Recognition Research for Augmented Reality Character Implementation)

  • 이석환;이정금;심현
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1321-1330
    • /
    • 2023
  • 본 연구는 증강현실에서 적용할 캐릭터 생성에서 단일 이미지를 통해 여러 객체에 대한 3D 자세 추정 문제를 연구한다. 기존 top-down 방식에서는 이미지 내의 모든 객체를 먼저 감지하고, 그 후에 각각의 객체를 독립적으로 재구성한다. 문제는 이렇게 재구성된 객체들 사이의 중첩이나 깊이 순서가 불일치 하는 일관성 없는 결과가 발생할 수 있다. 본 연구의 목적은 이러한 문제점을 해결하고, 장면 내의 모든 객체에 대한 일관된 3D 재구성을 제공하는 단일 네트워크를 개발하는 것이다. SMPL 매개변수체를 기반으로 한 인체 모델을 top-down 프레임워크에 통합이 중요한 선택이 되었으며, 이를 통해 거리 필드 기반의 충돌 손실과 깊이 순서를 고려하는 손실 두 가지를 도입하였다. 첫 번째 손실은 재구성된 사람들 사이의 중첩을 방지하며, 두 번째 손실은 가림막 추론과 주석이 달린 인스턴스 분할을 일관되게 렌더링하기 위해 객체들의 깊이 순서를 조정한다. 이러한 방법은 네트워크에 이미지의 명시적인 3D 주석 없이도 깊이 정보를 제공하게 한다. 실험 결과, 기존의 Interpenetration loss 방법은 MuPoTS-3D가 114, PoseTrack이 654에 비해서 본 연구의 방법론인 Lp 손실로 네트워크를 훈련시킬 때 MuPoTS-3D가 34, PoseTrack이 202로 충돌수가 크게 감소하는 것으로 나타났다. 본 연구 방법은 표준 3D 자세벤치마크에서 기존 방법보다 더 나은 성능을 보여주었고, 제안된 손실들은 자연 이미지에서 더욱 일관된 재구성을 실현하게 하였다.

소셜미디어를 활용한 콘텐츠 액티비즘 분석 연구 - 톰 무어의 '100바퀴 챌린지'와 '평화의 소녀상' 전시를 중심으로- (A Study on Contents Activism Analysis using Social Media - Focusing on Cases Related to Tom Moore's 100 Laps Challenge and the Exhibition of the Statue of Peace -)

  • 신정아
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권8호
    • /
    • pp.91-106
    • /
    • 2021
  • 본 연구의 목적은 콘텐츠 기획과 제작, 유통의 과정을 통해 자기실현과 사회적 연대를 이끌어내는 과정을 콘텐츠 액티비즘으로 정의하고, 구체적인 실행 단계를 유형화하는 것이다. 이를 토대로 구체적인 사례 분석을 시도함으로써 콘텐츠 액티비즘의 실천이 갖는 사회적 의미와 효과를 규명하고자 한다. 연구 방법은 선행 연구 검토를 통해 전통적 액티비즘과 콘텐츠 액티비즘의 차이를 살펴본 후 콘텐츠 액티비즘의 구체적인 실행 과정을 7단계로 유형화하였다. 콘텐츠 액티비즘의 실행모델은 1)문제의 발견, 2)현상 인식과 정보의 수집, 3)액티비즘 대상 및 목적 설계, 4)콘텐츠 기획과 제작, 5)콘텐츠 유통과 확산, 6)액티비즘 참여 및 효과 공유, 7)지속적인 액티비즘 과제 검토 등 7단계로 유형화하였다. 이 모델을 적용하여 본 연구에서는 콘텐츠 액티비즘 사례 두 가지를 분석하였다. 첫 번째 사례는 코로나19의 공포가 확산되던 2020년 초, 100세 생일을 앞둔 노인이 기획한 뒷마당 100바퀴 챌린지이다. 영국에 사는 톰 무어 경은 국가보건서비스 소속 의료진들이 보호장비가 부족하여 코로나 감염과 사망이 증가하자, 이들을 돕기 위해 뒷마당 100바퀴 걷기에 도전했다. 암 수술과 낙상 후유증으로 보조기 없이 보행이 어려운 그의 도전은 많은 이들의 공감과 참여를 이끌어내면서 글로벌 연대를 이끌어냈다. 두 번째 사례는 2019 일본 아이치트리엔날레 기획전시 김서경, 김운성 작가의 '표현의 부자유, 그 후'를 분석한 다. '표현의 부자유, 그 후' 전시는 평화의 소녀상과 일본군 위안부 할머니들의 삶을 전시하는 프로젝트였으나 극우 세력들의 협박과 공격으로 전시 3일 만에 철회되었다. 이 소식을 들은 해외의 예술가들은 트리엔날레의 결정에 저항하며 트위터와 인스타그램 등 소셜미디어에 소녀상과 같은 포즈로 사진을 찍고 공유하면서 평화의 소녀상이 갖는 역사적 의미에 공감했다. 예술가들로부터 시작된 액티비즘은 소셜미디어를 통해 다양한 지역에 사는 평범한 시민들의 집과 일터, 거리로 확장되었다. 두 사례는 콘텐츠를 통해 누군가와 연대하고 소통하면서 사회적 실천을 이끌어낸 콘텐츠 액티비즘이라고 할 수 있다. 이처럼 콘텐츠 액티비즘은 소셜미디어 시대의 새로운 리터러시이자 윤리적 실천의 도구가 되고 있다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.