• 제목/요약/키워드: Monocular

검색결과 236건 처리시간 0.028초

트랜스포머 기반의 다중 시점 3차원 인체자세추정 (Multi-View 3D Human Pose Estimation Based on Transformer)

  • 최승욱;이진영;김계영
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.48-56
    • /
    • 2023
  • 3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.

  • PDF

Distance Measurement Using a Single Camera with a Rotating Mirror

  • Kim Hyongsuk;Lin Chun-Shin;Song Jaehong;Chae Heesung
    • International Journal of Control, Automation, and Systems
    • /
    • 제3권4호
    • /
    • pp.542-551
    • /
    • 2005
  • A new distance measurement method with the use of a single camera and a rotating mirror is presented. A camera in front of a rotating mirror acquires a sequence of reflected images, from which distance information is extracted. The distance measurement is based on the idea that the corresponding pixel of an object point at a longer distance moves at a higher speed in a sequence of images in this type of system setting. Distance measurement based on such pixel movement is investigated. Like many other image-based techniques, this presented technique requires matching corresponding points in two images. To alleviate such difficulty, two kinds of techniques of image tracking through the sequence of images and the utilization of multiple sets of image frames are described. Precision improvement is possible and is one attractive merit. The presented approach with a rotating mirror is especially suitable for such multiple measurements. The imprecision caused by the physical limit could be improved through making several measurements and taking an average. In this paper, mathematics necessary for implementing the technique is derived and presented. Also, the error sensitivities of related parameters are analyzed. Experimental results using the real camera-mirror setup are reported.

동적 환경에서 강인한 영상특징을 이용한 스테레오 비전 기반의 비주얼 오도메트리 (Stereo Vision-based Visual Odometry Using Robust Visual Feature in Dynamic Environment)

  • 정상준;송재복;강신천
    • 로봇학회논문지
    • /
    • 제3권4호
    • /
    • pp.263-269
    • /
    • 2008
  • Visual odometry is a popular approach to estimating robot motion using a monocular or stereo camera. This paper proposes a novel visual odometry scheme using a stereo camera for robust estimation of a 6 DOF motion in the dynamic environment. The false results of feature matching and the uncertainty of depth information provided by the camera can generate the outliers which deteriorate the estimation. The outliers are removed by analyzing the magnitude histogram of the motion vector of the corresponding features and the RANSAC algorithm. The features extracted from a dynamic object such as a human also makes the motion estimation inaccurate. To eliminate the effect of a dynamic object, several candidates of dynamic objects are generated by clustering the 3D position of features and each candidate is checked based on the standard deviation of features on whether it is a real dynamic object or not. The accuracy and practicality of the proposed scheme are verified by several experiments and comparisons with both IMU and wheel-based odometry. It is shown that the proposed scheme works well when wheel slip occurs or dynamic objects exist.

  • PDF

적외선 조명 및 단일카메라를 이용한 입체거리 센서의 개발 (3D Range Measurement using Infrared Light and a Camera)

  • 김인철;이수용
    • 제어로봇시스템학회논문지
    • /
    • 제14권10호
    • /
    • pp.1005-1013
    • /
    • 2008
  • This paper describes a new sensor system for 3D range measurement using the structured infrared light. Environment and obstacle sensing is the key issue for mobile robot localization and navigation. Laser scanners and infrared scanners cover $180^{\circ}$ and are accurate but too expensive. Those sensors use rotating light beams so that the range measurements are constrained on a plane. 3D measurements are much more useful in many ways for obstacle detection, map building and localization. Stereo vision is very common way of getting the depth information of 3D environment. However, it requires that the correspondence should be clearly identified and it also heavily depends on the light condition of the environment. Instead of using stereo camera, monocular camera and the projected infrared light are used in order to reduce the effects of the ambient light while getting 3D depth map. Modeling of the projected light pattern enabled precise estimation of the range. Identification of the cells from the pattern is the key issue in the proposed method. Several methods of correctly identifying the cells are discussed and verified with experiments.

Fast, Accurate Vehicle Detection and Distance Estimation

  • Ma, QuanMeng;Jiang, Guang;Lai, DianZhi;cui, Hua;Song, Huansheng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.610-630
    • /
    • 2020
  • A large number of people suffered from traffic accidents each year, so people pay more attention to traffic safety. However, the traditional methods use laser sensors to calculate the vehicle distance at a very high cost. In this paper, we propose a method based on deep learning to calculate the vehicle distance with a monocular camera. Our method is inexpensive and quite convenient to deploy on the mobile platforms. This paper makes two contributions. First, based on Light-Head RCNN, we propose a new vehicle detection framework called Light-Car Detection which can be used on the mobile platforms. Second, the planar homography of projective geometry is used to calculate the distance between the camera and the vehicles ahead. The results show that our detection system achieves 13FPS detection speed and 60.0% mAP on the Adreno 530 GPU of Samsung Galaxy S7, while only requires 7.1MB of storage space. Compared with the methods existed, the proposed method achieves a better performance.

다중크기와 다중객체의 실시간 얼굴 검출과 머리 자세 추정을 위한 심층 신경망 (Multi-Scale, Multi-Object and Real-Time Face Detection and Head Pose Estimation Using Deep Neural Networks)

  • 안병태;최동걸;권인소
    • 로봇학회논문지
    • /
    • 제12권3호
    • /
    • pp.313-321
    • /
    • 2017
  • One of the most frequently performed tasks in human-robot interaction (HRI), intelligent vehicles, and security systems is face related applications such as face recognition, facial expression recognition, driver state monitoring, and gaze estimation. In these applications, accurate head pose estimation is an important issue. However, conventional methods have been lacking in accuracy, robustness or processing speed in practical use. In this paper, we propose a novel method for estimating head pose with a monocular camera. The proposed algorithm is based on a deep neural network for multi-task learning using a small grayscale image. This network jointly detects multi-view faces and estimates head pose in hard environmental conditions such as illumination change and large pose change. The proposed framework quantitatively and qualitatively outperforms the state-of-the-art method with an average head pose mean error of less than $4.5^{\circ}$ in real-time.

HSI/YCbCr 색상모델과 에이다부스트 알고리즘을 이용한 실시간 교통신호 인식 (Real Time Traffic Signal Recognition Using HSI and YCbCr Color Models and Adaboost Algorithm)

  • 박상훈;이준웅
    • 한국자동차공학회논문집
    • /
    • 제24권2호
    • /
    • pp.214-224
    • /
    • 2016
  • This paper proposes an algorithm to effectively detect the traffic lights and recognize the traffic signals using a monocular camera mounted on the front windshield glass of a vehicle in day time. The algorithm consists of three main parts. The first part is to generate the candidates of a traffic light. After conversion of RGB color model into HSI and YCbCr color spaces, the regions considered as a traffic light are detected. For these regions, edge processing is applied to extract the borders of the traffic light. The second part is to divide the candidates into traffic lights and non-traffic lights using Haar-like features and Adaboost algorithm. The third part is to recognize the signals of the traffic light using a template matching. Experimental results show that the proposed algorithm successfully detects the traffic lights and recognizes the traffic signals in real time in a variety of environments.

단안 PSD 카메라를 이용한 모션캡쳐 시스템을 위한 전방향성 능동마커 개발 (Development of Omnidirectional Active Marker for Motion Capture System with a Monocular PSD Camera)

  • 서평원;유영기;오춘석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.379-381
    • /
    • 2008
  • 본 논문에서는 가정용 비디오 게임에 사용 가능한 고속의 저가형 모션캡쳐, 시스템에 사용되는 전 방향 특성을 갖는 IR 능동 마커의 개발을 목표로 하고 있다. 현재 영화나 게임에서 모션캡쳐를 응용한 시스템 및 컨텐츠들이 많이 선보기고 있으며, 인기를 모으고 있는 추세이다. 이러한 흐름에 맞추어 우리는 이미 저가이면서 속도가 빠른 PSD(Position Sensitive Detector) 센서를 이용만 스테레오 비젼 기반의 PSD 모션캡쳐 시스템(Stereo vision based PSD motion capture system)과 광량 보정 기반의 단일 PSD 모션캡쳐 시스템(Intensity Calibration based single PSD motion capture system) 그리고 일정간격의 두 능동마커 기반의 단안 PSD 모션캡쳐 시스템(Two active markers at fixed distance based single PSD motion capture system)등을 소개한 바 있다. 본 논문에서 제안하는 전방향 특성을 갖는 IR 능동 마커는 일정간격의 두 능동마커 기반의 단안 PSD 모션캡쳐 시스템에 적용하여 보다 정밀한 3차원 좌표 측정을 할 수 있도록 한다. 이를 위해 본 논문에서는 동일 특성을 갖는 마커를 제작하고 평가하여 일정간격의 두 능동마커 기반의 단안 PSD 모션캡쳐 시스템에 적합한 마커의 제작 방법을 제안하였다.

  • PDF

카메라와 초음파센서 융합에 의한이동로봇의 주행 알고리즘 (Mobile Robot Navigation using Data Fusion Based on Camera and Ultrasonic Sensors Algorithm)

  • 장기동;박상건;한성민;이강웅
    • 한국항행학회논문지
    • /
    • 제15권5호
    • /
    • pp.696-704
    • /
    • 2011
  • 본 논문에서는 단일 카메라와 초음파센서 데이터를 융합하는 이동 로봇 주행제어 알고리즘을 제안하였다. 이진화 영상처리를 위한 임계값을 영상 정보와 초음파센서 정보를 이용하는 퍼지추론기법으로 설정하였다. 임계값을 상황에 따라 가변하면 조도가 낮은 환경에서도 장애물 인식이 향상된다. 카메라 영상 정보와 초음파 센서 정보를 융합하여 장애물에 대한 격자지도를 생성하고 원궤적 경로기법으로 장애물을 회피하도록 한다. 제안된 알고리즘의 성능을 입증하기 위하여 조도가 낮은 실내와 좁은 복도에서 Pioneer 2-DX 이동로봇의 주행제어에 적용하였다.

실시간 3차원 얼굴 방향 식별 (Real Time Discrimination of 3 Dimensional Face Pose)

  • 김태우
    • 한국정보전자통신기술학회논문지
    • /
    • 제3권1호
    • /
    • pp.47-52
    • /
    • 2010
  • 본 논문에서는 능동적 적외선 조명을 이용한 3차원 얼굴 방향 식별을 위한 새로운 방법을 제안하고자 한다. 적외선 조명 하에서 밝게 나타나는 동공을 효과적으로 실시간 검출하여 추적할 수 있는 알고리즘을 제안한다. 다른 방향의 얼굴들에서 동공의 기하학적 왜곡을 탐지하여, 3차원 얼굴 방향과 동공의 기하학적 특성 사이의 관계를 나타낸 학습 데이터를 사용하여 고유한 눈 특징 공간을 구축하였고, 입력된 질의 영상에 대한 3차원 얼굴 방향을 고유한 눈 특징 공간을 사용하여 실시간으로 얼굴 방향을 측정할 수 있었다. 실험결과 카메라에 근접한 실험 대상자들에 대하여 최소 94.67%, 최고 100% 의 식별 결과를 나타내었다.

  • PDF