• 제목/요약/키워드: multi-vision

검색결과 481건 처리시간 0.034초

다중센서 융합 상이 지도를 통한 다중센서 기반 3차원 복원 결과 개선 (Refinements of Multi-sensor based 3D Reconstruction using a Multi-sensor Fusion Disparity Map)

  • 김시종;안광호;성창훈;정명진
    • 로봇학회논문지
    • /
    • 제4권4호
    • /
    • pp.298-304
    • /
    • 2009
  • This paper describes an algorithm that improves 3D reconstruction result using a multi-sensor fusion disparity map. We can project LRF (Laser Range Finder) 3D points onto image pixel coordinatesusing extrinsic calibration matrixes of a camera-LRF (${\Phi}$, ${\Delta}$) and a camera calibration matrix (K). The LRF disparity map can be generated by interpolating projected LRF points. In the stereo reconstruction, we can compensate invalid points caused by repeated pattern and textureless region using the LRF disparity map. The result disparity map of compensation process is the multi-sensor fusion disparity map. We can refine the multi-sensor 3D reconstruction based on stereo vision and LRF using the multi-sensor fusion disparity map. The refinement algorithm of multi-sensor based 3D reconstruction is specified in four subsections dealing with virtual LRF stereo image generation, LRF disparity map generation, multi-sensor fusion disparity map generation, and 3D reconstruction process. It has been tested by synchronized stereo image pair and LRF 3D scan data.

  • PDF

한 이미지 평면에서 다물체 위치의 실시간 화상처리 알고리즘 개발 (Development of Real-Time Image Processing Algorithm on the Positions of Multi-Object in an Image Plane)

  • 장완식;김경석;이성민
    • 비파괴검사학회지
    • /
    • 제22권5호
    • /
    • pp.523-531
    • /
    • 2002
  • 본 연구는 속도 향상을 고려한 실시간 다물체 화상처리 알고리즘을 개발하고자 한다. 최근 들어 비전시스템의 사용은 검사 및 로봇 위치 제어 풍에서 급속히 증가하고 있다. 이러한 비전시스템을 적용하기 위해서는 3차원 공간상 물체의 좌표를 CCD 카메라에 의해서 얻어진 이미지 정보로 변환하는 것이 필요하다. 검사 및 로봇 위치 제어 작업들에 비전시스템을 적용하기 위해서 이미지 평면에서 물체의 중심 위치를 알아야 한다. 특히, 그것의 물체 형상을 표시하기 위하여 여러 개 큐들을 사용하는 강체의 경우에는 여러 개 큐들의 각각 위치 값들이 동시에 하나의 이미지 평면에서 결정되어 져야 한다. 이러한 문제를 해결하기 위하여 여러 개 큐 (다물체)에 대한 화상처리 알고리즘 개발 과정을 본 논문에서 제시하고, 개발된 알고리즘의 타당성을 제시하였다.

인공지능 기반 멀티태스크를 위한 비디오 코덱의 성능평가 방법 (Evaluation of Video Codec AI-based Multiple tasks)

  • 김신;이예지;윤경로;추현곤;임한신;서정일
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.273-282
    • /
    • 2022
  • MPEG 내 VCM 그룹은 머신을 위한 비디오 코덱을 표준화하는 것으로 목표로 하고 있다. VCM 그룹은 객체 탐지, 객체 분할, 객체 추적 등 3가지의 머신비전 태스크를 포함한 데이터 세트와 데이터 세트 별 기준 데이터인 Anchor를 제공하고 있으며, 평가 템플릿을 이용하여 후보 기술군과 Anchor의 압축 대비 머신비전 성능을 비교할 수 있다. 하지만 성능 비교는 머신비전 태스크 별로 분리하여 수행되고 있으며, 다수의 머신비전 태스크에 대한 성능 평가를 수행할 수 있는 비트스트림을 생성할 수 있는 데이터는 별도로 제공하고 있지 않다. 본 논문에서는 인공 지능 기반 멀티 태스크를 위한 비디오 코덱의 성능 평가 방안에 대해 제안한다. 하나의 비트스트림의 크기 척도인 픽셀 당 비트수(BPP, Bits Per Pixel) 와 각 태스크의 정확도 결과인 Mean Average Precision(mAP)를 기반으로 산술 평균, 가중 평균, 조화 평균 등 총 3가지의 멀티 태스크 성능 평가 지표를 제안하며 mAP 결과를 기반으로 성능 결과를 비교하고자 한다. 멀티 태스크에서 태스크 별 mAP 결과 값의 범위의 차이가 있을 수 있으며 차이로 인해 생길 수 있는 성능 평가와 관련된 문제를 방지하고자 정규화한 mAP 기반 멀티 태스크 성능 결과를 산출하고 평가하고자 한다.

다개체 협력 시스템을 위한 비젼 기반 축구 로봇 시스템의 개발 (Development of vision-based soccer robots for multi-agent cooperative systems)

  • 심현식;정명진;최인환;김종환
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1997년도 한국자동제어학술회의논문집; 한국전력공사 서울연수원; 17-18 Oct. 1997
    • /
    • pp.608-611
    • /
    • 1997
  • The soccer robot system consists of multi agents, with highly coordinated operation and movements so as to fulfill specific objectives, even under adverse situation. The coordination of the multi-agents is associated with a lot of supplementary work in advance. The associated issues are the position correction, prevention of communication congestion, local information sensing in addition to the need for imitating the human-like decision making. A control structure for soccer robot is designed and several behaviors and actions for a soccer robot are proposed. Variable zone defense as a basic strategy and several special strategies for fouls are applied to SOTY2 team.

  • PDF

Human Action Recognition Using Pyramid Histograms of Oriented Gradients and Collaborative Multi-task Learning

  • Gao, Zan;Zhang, Hua;Liu, An-An;Xue, Yan-Bing;Xu, Guang-Ping
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권2호
    • /
    • pp.483-503
    • /
    • 2014
  • In this paper, human action recognition using pyramid histograms of oriented gradients and collaborative multi-task learning is proposed. First, we accumulate global activities and construct motion history image (MHI) for both RGB and depth channels respectively to encode the dynamics of one action in different modalities, and then different action descriptors are extracted from depth and RGB MHI to represent global textual and structural characteristics of these actions. Specially, average value in hierarchical block, GIST and pyramid histograms of oriented gradients descriptors are employed to represent human motion. To demonstrate the superiority of the proposed method, we evaluate them by KNN, SVM with linear and RBF kernels, SRC and CRC models on DHA dataset, the well-known dataset for human action recognition. Large scale experimental results show our descriptors are robust, stable and efficient, and outperform the state-of-the-art methods. In addition, we investigate the performance of our descriptors further by combining these descriptors on DHA dataset, and observe that the performances of combined descriptors are much better than just using only sole descriptor. With multimodal features, we also propose a collaborative multi-task learning method for model learning and inference based on transfer learning theory. The main contributions lie in four aspects: 1) the proposed encoding the scheme can filter the stationary part of human body and reduce noise interference; 2) different kind of features and models are assessed, and the neighbor gradients information and pyramid layers are very helpful for representing these actions; 3) The proposed model can fuse the features from different modalities regardless of the sensor types, the ranges of the value, and the dimensions of different features; 4) The latent common knowledge among different modalities can be discovered by transfer learning to boost the performance.

멀티카메라 비전시스템을 위한 산업용 PC와 PLC간 제어 방법 개발 (The implementation of interface between industrial PC and PLC for multi-camera vision systems)

  • 김현수
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.453-458
    • /
    • 2016
  • 머신비전은 고속화된 자동화 생산 시스템의 품질 검사 방법으로 널리 활용되어 왔다. 본 연구에서는 멀티카메라를 사용하여 PC와 PLC 간 제어를 통해 용접부위의 치수를 실시간으로 측정하여 검사하는 머신비전 시스템을 개발하였다. 제안한 검사시스템은 맞대기 용접부위의 길이와 폭을 측정하여 용접부의 치수 균일성을 검사하도록 설계하였다. 광학계 및 물류는 병렬제어를 위해 PC와 PLC 간 TCP/IP 멀티쓰레딩 통신기법을 적용하였다. 금속재료의 반사 특성을 고려하여 용접비드의 형태나 용접시 발생하는 그을음에도 균일하게 검사부위의 영상획득이 가능한 동축조명계를 적용하였고, 검사 알고리즘은 OpenCV 라이브러리를 사용하여 용접치수검사에 맞게 개발하였다. 제작한 시스템을 실제 전자부품의 용접 자동화 라인에 설치하여 시스템의 작동오류 및 검사 성능을 검증한 결과, 요구되는 기능 및 검사 성능을 모두 성공적으로 수행하였다.

ACC/AEBS 시스템용 센서퓨전을 통한 주행경로 추정 알고리즘 (Development of the Driving path Estimation Algorithm for Adaptive Cruise Control System and Advanced Emergency Braking System Using Multi-sensor Fusion)

  • 이동우;이경수;이재완
    • 자동차안전학회지
    • /
    • 제3권2호
    • /
    • pp.28-33
    • /
    • 2011
  • This paper presents driving path estimation algorithm for adaptive cruise control system and advanced emergency braking system using multi-sensor fusion. Through data collection, yaw rate filtering based road curvature and vision sensor road curvature characteristics are analyzed. Yaw rate filtering based road curvature and vision sensor road curvature are fused into the one curvature by weighting factor which are considering characteristics of each curvature data. The proposed driving path estimation algorithm has been investigated via simulation performed on a vehicle package Carsim and Matlab/Simulink. It has been shown via simulation that the proposed driving path estimation algorithm improves primary target detection rate.

Development of a Mobile Robot for Handicapped People

  • Shin, Ig-Awa;Kim, Hyoung-Seop;Ishikawa, Seiji
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.25.2-25
    • /
    • 2001
  • This paper describes a mobile robot intended for being employed in a multi-agent system. We have already proposed a multi-agent system which realizes patient-aid by helping a lying patient take a distant object on the table. In this paper, a mobile robot agent is developed and is included in the system. An effective man-machine communication strategy is proposed by use of a vision agent settled on the ceiling. If a human (assumed to be a patient) wishes to take an object distant on the floor, he points to the object. The vision agent detects the direction of his arm by image processing and guesses which object he intends to take. The vision agent asks him if it is what he wants and, if yes, the mobile robot runs to take and bring it to him. The system is overviewed with the explanation of a mobile robot. Some experimental results are shown with discussion.

  • PDF

머신비젼을 이용한 잉크젯 드랍 측정 시스템의 신뢰성 향상에 대한 연구 (Study on the upgrade reliability of inkjet droplet measurement using machine vision)

  • 김동억;이준호;정성욱
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2007년도 하계학술발표회 논문집
    • /
    • pp.365-366
    • /
    • 2007
  • Micro jetting drop inspection system is essential to measuring micro drop volume. Measuring pico-liter drop volume is useful for new LCD color filter product process that is based on inkjet printing technology. To upgrade the reliability in drop measurement system, we use the auto focusing & multi drop reiteration & blurring average algorism. First of all we used standard mark for gage R&R in the vision system. Finding the most suitable threshold for multi blurring drop, is the main key of this research. Sensitivity of vision system is a standard in measuring the upgrade system level. So, suitable threshold can upgrade the performance of jetting drop inspection system.

  • PDF

인서트 자동검사를 위한 시각인식 알고리즘 (A Machine Vision Algorithm for the Automatic Inspection of Inserts)

  • 이문규;신승호
    • 제어로봇시스템학회논문지
    • /
    • 제4권6호
    • /
    • pp.795-801
    • /
    • 1998
  • In this paper, we propose a machine vision algorithm for inspecting inserts which are used for milling and turning operations. Major defects of the inserts are breakage and crack on insert surfaces. Among the defects, breakages on the face of the inserts can be detected through three stages of the algorithm developed in this paper. In the first stage, a multi-layer perceptron is used to recognize the inserts being inspected. Edge detection of the insert image is performed in the second stage. Finally, in the third stage breakages on the insert face are identified using Hough transform. The overall algorithm is tested on real specimens and the results show that the algorithm works fairly well.

  • PDF