• 제목/요약/키워드: pose estimation

검색결과 388건 처리시간 0.028초

인공지능을 활용한 스트리밍 서비스/SNS 내에서의 폭력 감지 시스템 (Violence Detection System in Streaming Service and SNS Using Artificial Intelligence Technologies)

  • 김선민;이석원;임승수;최상일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.442-445
    • /
    • 2020
  • 인터넷 및 IT 기술의 발전과 더불어 미디어산업에도 큰 변화가 일어나고 있다. TV 를 대신하여 스트리밍 서비스를 이용하는 사람들이 늘고 있으며 SNS 를 활용하여 서로의 경험을 간접적으로 공유하는 형태의 새로운 문화 컨텐츠가 자리잡아가고 있다. 하지만 이러한 컨텐츠를 소비하는 주요 계층 중에는 초중고 학생들도 포함되어 있다. 인터넷 혹은 SNS 에서 소비되는 컨텐츠들을 관리 감독하는 컨트롤 타워가 부족하거나 전무하기 때문에 폭력, 음주, 흡연 등 사회적으로 악영향을 줄 수 있는 영상 또는 사진이 무분별하게 생산되어 청소년들에 의해 소비되고 있으며 더 나아가 이것이 사회적 문제로까지 대두되고 있다. 이러한 문제를 해결하기 위해 인공지능 기술을 활용한 여러 다양한 감시 시스템 개발을 위한 연구가 한창이다. 본 연구에서는 SNS 및 스트리밍 서비스에서 제공되는 영상 및 사진을 Pose Estimation 및 표정 인식 기술을 활용하여 폭력을 자동적으로 감지할 수 있는 폭력 감지 시스템을 개발하는데 그 목적이 있다.

저성능 디바이스를 이용한 자세추정 기반 3D 모델 움직임 제어 (Pose estimation-based 3D model motion control using low-performance devices)

  • 장재훈;최유주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.763-765
    • /
    • 2023
  • 본 논문에서는 저성능 컴퓨터나 스마트폰의 카메라를 통해 입력받은 영상을 기반으로 사용자의 포즈를 추정하고, 실시간으로 사용자의 포즈에 따라 3D 모델의 모션이 제어되어 가시화 될 수 있는 클라이어트-서버 구조의 "자세추정 및 3D 모델 모션 제어 시스템"을 제안한다. 제안 시스템은 소켓통신 기반의 클라이언트-서버구조로 구성되어, 서버에서는 실시간 자세 추정을 위한 딥러닝 모델이 수행되고, 저성능 클라이언트에서는 실시간으로 카메라 영상을 획득하여 영상을 서버에 전송하고, 서버로부터 자세 추정 정보를 받아 이를 3D 모델에 반영하고 렌더링 함으로써 사용자와 함께 3D 모델이 같은 동작을 수행하는 증강현실 화면을 생성한다. 고성능을 요구하는 객체 자세 추정 모듈은 서버에서 실행하고, 클라이언트에서는 영상 획득 및 렌더링만을 실행하기 때문에, 모바일 앱에서의 실시간 증강현실을 위한 자세 추정 및 3D 모델 모션 제어가 가능하다. 제안 시스템은 "증강현실 기반 영상 찍기 앱" 에 반영되어 사용자의 움직임을 따라하는 3D 캐릭터들의 영상을 쉽게 생성할 수 있도록 할 수 있다.

메타버스 보안 강화를 위한 동작 기반 사용자 인증 (Motion-Based User Authentication for Enhanced Metaverse Security)

  • 박성규;류권상
    • 정보보호학회논문지
    • /
    • 제34권3호
    • /
    • pp.493-503
    • /
    • 2024
  • 본 논문에서는 메타버스 환경 내에서의 사용자 지속 인증 문제에 대해 다룬다. 최근 메타버스는 개인의 상호작용, 엔터테인먼트, 교육 및 비즈니스 분야에서 중요한 역할을 하고 있으며, 특히 사용자 신원 확인과 관련된 취약점이 주요한 문제로 인식되고 있다. 본 연구는 자세 추정 모델로 메타버스 환경의 캐릭터 움직임을 추출하고 분석하여 사용자의 신원을 확인하는 새로운 방법을 제안한다. 이 방법은 영상 데이터만을 이용하여 사용자를 인증하기 때문에 제한적인 환경에서도 활용할 수 있으며, 다양한 실험을 통해 캐릭터의 움직임이 사용자 식별에 어떻게 기여할 수 있는지를 분석한다. 또한, 이 접근 방식의 다른 디지털 플랫폼으로의 확장 가능성을 탐구한다. 이러한 연구는 메타버스 환경 내에서의 보안 강화와 사용자 신원 확인 방식의 혁신에 중요한 기여할 것으로 기대된다.

K-Means 클러스터링을 적용한 향상된 CS-RANSAC 알고리즘 (Improved CS-RANSAC Algorithm Using K-Means Clustering)

  • 고승현;윤의녕;;조근식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권6호
    • /
    • pp.315-320
    • /
    • 2017
  • 이미지를 기반으로 하는 증강현실 시스템에서 가상의 객체를 실제 영상에 저작할 때 생기는 이질감을 줄이기 위해서는 실제 영상에 저작된 가상객체의 방향과 위치에 대해 정확하게 추정을 해야 하며, 이때 호모그래피를 사용한다. 호모그래피를 추정하기 위해서는 SURF와 같은 특징점을 추출하고 추출된 특징점들을 통해 호모그래피 행렬을 추정한다. 호모그래피 행렬의 추정을 위해서 RANSAC 알고리즘이 주로 사용되고 있으며, 특히 RANSAC에 제약 조건 만족 문제(Constraint Satisfaction Problem)와 여기에 사용되는 제약조건을 동적으로 적용하여 속도와 정확도를 높인 DCS-RANSAC 알고리즘이 연구되었다. DCS-RANSAC 알고리즘에서 사용된 이미지 그룹 데이터는 수동적인 방법을 통해 직관적으로 분류되어 있지만 특징점 분포 패턴이 다양하지 않고, 이미지들을 정확하게 분류하기가 어려워서 이로 인해 알고리즘의 성능이 저하되는 경우가 있다. 따라서 본 논문에서는 K-means 클러스터링을 적용하여 이미지들을 자동으로 분류하고 각 이미지 그룹마다 각기 다른 제약조건을 적용하는 KCS-RANSAC 알고리즘을 제안한다. 제안하는 알고리즘은 머신러닝 기법인 K-means 클러스터링을 사용하여 전처리 단계에서 이미지를 특징점 분포 패턴에 따라 자동으로 분류하고, 분류된 이미지에 제약조건을 적용하여 알고리즘의 속도와 정확도를 향상시켰다. 실험 결과 본 논문에서 제안하는 KCS-RANSAC이 DCS-RANSAC 알고리즘에 비해 수행시간이 약 15% 단축되었고, 오차율은 약 35% 줄어들었으며, 참정보 비율은 약 14% 증가되었다.

합성곱 신경망 기반 맨하탄 좌표계 추정 (Estimation of Manhattan Coordinate System using Convolutional Neural Network)

  • 이진우;이현준;김준호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권3호
    • /
    • pp.31-38
    • /
    • 2017
  • 본 논문에서는 도심 영상에 대해 맨하탄 좌표계를 추정하는 합성곱 신경망(Convolutional Neural Network) 기반의 시스템을 제안한다. 도심 영상에서 맨하탄 좌표계를 추정하는 것은 영상 조정, 3차원 장면 복원 등 컴퓨터 그래픽스 및 비전 문제 해결의 기본이 된다. 제안하는 합성곱 신경망은 GoogLeNet[1]을 기반으로 구성한다. 합성곱 신경망을 훈련하기 위해 구글 스트리트 뷰 API로 영상을 수집하고 기존 캘리브레이션 방법으로 맨하탄 좌표계를 계산하여 데이터셋을 생성한다. 장면마다 새롭게 합성곱 신경망을 학습해야하는 PoseNet[2]과 달리, 본 논문에서 제안하는 시스템은 장면의 구조를 학습하여 맨하탄 좌표계를 추정하기 때문에 학습되지 않은 새로운 장면에 대해서도 맨하탄 좌표계를 추정한다. 제안하는 방법은 학습에 참여하지 않은 구글 스트리트 뷰 영상을 검증 데이터로 테스트하였을 때 $3.157^{\circ}$의 중간 오차로 맨하탄 좌표계를 추정하였다. 또한, 동일 검증 데이터에 대해 제안하는 방법이 기존 맨하탄 좌표계 추정 알고리즘[3]보다 더 낮은 중간 오차를 보이는 것을 확인하였다.

운전자 시선 및 선택적 주의 집중 모델 통합 해석을 통한 운전자 보조 시스템 (Driver Assistance System for Integration Interpretation of Driver's Gaze and Selective Attention Model)

  • 김지훈;조현래;장길진;이민호
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.115-122
    • /
    • 2016
  • 본 논문은 차량의 내부 및 외부 정보를 통합하여 운전자의 인지 상태를 측정하고, 안전운전을 보조하여 주는시스템을 제안한다. 구현된 시스템은 운전자의 시선 정보와 외부 영상을 분석하여 얻은 주변정보를 mutual information기반으로 통합하여 구현되며, 차량의 앞부분과 내부 운전자를 검출하는 2개의 카메라를 이용한다. 외부 카메라에서 정보를 얻기 위해 선택적 집중모델을 기반으로 하는 게슈탈트법칙을 제안하고, 이를 기반으로 구현된 saliency map (SM) 모델은 신호등과 같은 중요한 외부 자극을 두드러지게 표현한다. 내부 카메라에서는 얼굴의 특징정보를 이용하여 운전자의 주의가 집중되는 외부 응시 정보를 파악하고 이를 통해 운전자가 응시하고 있는 영역을 검출한다. 이를 위해서 우리는 실시간으로 운전자의 얼굴특징을 검출하는 알고리즘을 사용한다. 운전자의 얼굴을 검출하기 위하여 modified census transform (MCT) 기반의 Adaboost 알고리즘을 사용하였으며, POSIT (POS with ITerations)알고리즘을 통해 3차원 공간에서 머리의 방향과 운전자 응시 정보를 측정하였다. 실험결과를 통하여 제안한 시스템이 실시간으로 운전자의 응시하고 있는 영역과, 신호등과 같은 운전에 도움이 되는 정보를 파악하는데 도움이 되었음을 확인할 수 있으며, 이러한 시스템이 운전보조 시스템에 효과적으로 적용될 것으로 판단된다.

격자형 선폭들의 투영변화비를 이용한 카메라 교정 파라메터 추정 (Camera calibration parameters estimation using perspective variation ratio of grid type line widths)

  • Jeong, Jun-Ik;Choi, Seong-Gu;Rho, Do-Hwan
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.30-32
    • /
    • 2004
  • With 3-D vision measuring, camera calibration is necessary to calculate parameters accurately. Camera calibration was developed widely in two categories. The first establishes reference points in space, and the second uses a grid type frame and statistical method. But, the former has difficulty to setup reference points and the latter has low accuracy. In this paper we present an algorithm for camera calibration using perspective ratio of the grid type frame with different line widths. It can easily estimate camera calibration parameters such as lens distortion, focal length, scale factor, pose, orientations, and distance. The advantage of this algorithm is that it can estimate the distance of the object. Also, the proposed camera calibration method is possible estimate distance in dynamic environment such as autonomous navigation. To validate proposed method, we set up the experiments with a frame on rotator at a distance of 1, 2, 3, 4[m] from camera and rotate the frame from -60 to 60 degrees. Both computer simulation and real data have been used to test the proposed method and very good results have been obtained. We have investigated the distance error affected by scale factor or different line widths and experimentally found an average scale factor that includes the least distance error with each image. The average scale factor tends to fluctuate with small variation and makes distance error decrease. Compared with classical methods that use stereo camera or two or three orthogonal planes, the proposed method is easy to use and flexible. It advances camera calibration one more step from static environments to real world such as autonomous land vehicle use.

  • PDF

기후학적 물수지를 적용한 기후변화에 따른 농업기상지표 변동예측의 불확실성 (Uncertainty Characteristics in Future Prediction of Agrometeorological Indicators using a Climatic Water Budget Approach)

  • 남원호;홍은미;최진용;조재필
    • 한국농공학회논문집
    • /
    • 제57권2호
    • /
    • pp.1-13
    • /
    • 2015
  • The Coupled Model Intercomparison Project Phase 5 (CMIP5), coordinated by the World Climate Research Programme in support of the Intergovernmental Panel on Climate Change (IPCC) AR5, is the most recent, provides projections of future climate change using various global climate models under four major greenhouse gas emission scenarios. There is a wide selection of climate models available to provide projections of future climate change. These provide for a wide range of possible outcomes when trying to inform managers about possible climate changes. Hence, future agrometeorological indicators estimation will be much impacted by which global climate model and climate change scenarios are used. Decision makers are increasingly expected to use climate information, but the uncertainties associated with global climate models pose substantial hurdles for agricultural resources planning. Although it is the most reasonable that quantifying of the future uncertainty using climate change scenarios, preliminary analysis using reasonable factors for selecting a subset for decision making are needed. In order to narrow the projections to a handful of models that could be used in a climate change impact study, we could provide effective information for selecting climate model and scenarios for climate change impact assessment using maximum/minimum temperature, precipitation, reference evapotranspiration, and moisture index of nine Representative Concentration Pathways (RCP) scenarios.

비선형 줌-렌즈 왜곡 모델을 이용한 비디오 영상에서의 줌-렌즈 왜곡 보정 (Zoom Lens Distortion Correction Of Video Sequence Using Nonlinear Zoom Lens Distortion Model)

  • 김대현;신형철;오주현;남승진;손광훈
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.299-310
    • /
    • 2009
  • 본 논문은 줌-렌즈로 취득한 비디오 영상에 대해서 줌-렌즈의 왜곡을 자동으로 보상할 수 있는 새로운 방법을 제안하였다. 먼저, 초점거리의 증가에 따라 렌즈의 왜곡 계수가 비선형적으로 단조 감소하는 특징으로부터 초점거리와 렌즈 왜곡 계수로 표현되는 비선형 줌-렌즈 왜곡 모델을 정의하였다. 그리고 취득한 비디오 영상으로부터 몇 장의 샘플 영상을 선정하고, 이 샘플영상에 대한 초점거리와 렌즈 왜곡 계수는 기존의 방법들을 이용하여 측정하였다. 이렇게 측정한 초점거리와 렌즈 왜곡 계수들로 부터 줌-렌즈 왜곡 모델을 최적화 시켰다. 최적화된 줌-렌즈 왜곡 모델은 각 비디오 영상의 초점거리를 입력으로 하여 렌즈 왜곡계수를 자동으로 계산할 수 있다. 본 논문에서 제안한 방법은 다양한 실사 영상과 비디오 영상에 적용하여 그 성능을 검증하였으며, 화질의 열화 없이 영상의 왜곡을 보상할 수 있었다.

실시간 손동작 인식을 위한 동작 평면 추정 (Motion Plane Estimation for Real-Time Hand Motion Recognition)

  • 정승대;장경호;정순기
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.347-358
    • /
    • 2009
  • 손동작을 인식하는 연구가 오랫동안 이뤄져 왔지만 대개의 시스템들이 값비싼 깊이 카메라를 사용하거나 여러 개의 카메라를 사용해 분석하는 등 그 비용이 크며 작동이 가능한 작업 공간이 지극히 제한적이었다. 본 논문에서는 가전제품을 원격 제어하기 위한 목적으로 두 개의 회전 모터를 사용해 작업 공간을 확대하고 저렴한 일반 카메라를 사용해서 효율적으로 손동작을 인식하기 위한 시스템을 제안한다. 이 시스템은 입력된 카메라의 자세 정보와 이미지상의 2차원적 손가락 위치 정보를 이용하여 3차원 궤적을 추정하고 이를 동작 평면으로 투영시켜 의미 있는 선형 동작 패턴으로 복원한다. 또한 본 논문에서는 개발된 시스템을 테스트하여 주어진 목적에 맞는 정확도를 가지는 작업 영역을 정의한다.