• 제목/요약/키워드: Computer vision technology

검색결과 666건 처리시간 0.029초

자율 주행 UGV를 위한 정지선과 횡단보도 인식 알고리즘 설계 및 구현 (Design and Implementation of the Stop line and Crosswalk Recognition Algorithm for Autonomous UGV)

  • 이재환;윤희병
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.271-278
    • /
    • 2014
  • 정지선과 횡단보도는 자율 주행에서 가장 기본적으로 인식해야 하는 인식대상임에도 불구하고 추출할 수 있는 특징이 매우 제한적이고 영상기반의 인식기술을 제외한 레이저나 RF, GPS/INS 인식기술로는 인식이 어려운 분야다. 이러한 이유로 이 분야에 대한 연구는 매우 제한적으로 수행되어왔다. 본 논문에서는 비전센서를 통해 입력된 정지선과 횡단보도 영상을 영상기반으로 인식할 수 있는 알고리즘을 설계하고 구현한다. 제안한 알고리즘은 3개 부분으로 구성된다. 즉 특징추출에 필요한 영역을 사전에 선정하여 처리속도를 향상시키는 관심영역 설정 부분, 일정비율 이상의 백색이 검출된 영상만 인식되도록 하여 불필요한 연산을 제거하는 색상패턴 검사 부분, 에지특징을 추출하고 추출된 에지특징을 사전에 모델링한 특징모델과 비교하여 정지선과 횡단보도 여부를 식별하는 특징 추출과 인식 부분이다. 특징추출과 인식 부분에는 유형별 특징비교 알고리즘을 적용하여 정지선과 횡단보도가 병행하여 존재하거나 각각 존재하는 경우에 대해 모두 식별되도록 한다. 또한 제안한 알고리즘은 기존연구를 발전시키기 위해 카메라의 차량내부 설치의 효과, 역광 및 그림자와 같은 다양한 제약조건에 대한 인식률 변화와 거리에 따른 적정 인식률 평가를 비교 분석하였다.

Counting and Localizing Occupants using IR-UWB Radar and Machine Learning

  • Ji, Geonwoo;Lee, Changwon;Yun, Jaeseok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.1-9
    • /
    • 2022
  • 사람이나 사물 등의 위치를 알아낼 수 있는 측위기술은 사람의 유동량 측정, 보안, 인원 구조 등 다양한 환경에서 요구되고 사용될 수 있다. 측위를 위해 카메라와 같은 시각 센서기술을 사용하기도 하지만 이는 빛, 온도 등 주변 환경에 민감하며 사생활 노출 문제가 발생할 수 있다. 본 논문에서는 앞서 말한 문제들이 없는 초광대역 (UWB, ultra wideband) 레이더 기술과 머신러닝을 이용하여 벽 뒤 다른 실내공간에 있는 점유자의 수와 위치를 인식하는 연구를 수행하였다. 네 가지 상황 (강의실 내 몇 명이 있는지, 28가지의 위치를 정하고 어느 위치에 있는지, 28가지의 위치 중 한 위치에서 더 세부적인 16가지 위치 중 어느 위치에 있는지, 두 명이 동시에 있는 상황에서 어느 위치에 있는지)에 대해 극단적 랜덤 트리 등 네 가지 알고리즘 별로 모델을 생성하고 그 결과를 비교하였다. 전체적으로 네 가지 알고리즘 모두 좋은 결과를 보여주었으며 머신러닝을 이용해 위치인식 및 위치측정이 가능함을 검증하였다. 또한 oneM2M 표준 플랫폼을 활용하여 서비스 확장 가능성을 고려하였으며 이 기술을 여러 분야에서 활용한다면 더욱 많은 서비스나 제품을 창출할 수 있을 것으로 기대한다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

A Study on Swarm Robot-Based Invader-Enclosing Technique on Multiple Distributed Object Environments

  • Ko, Kwang-Eun;Park, Seung-Min;Park, Jun-Heong;Sim, Kwee-Bo
    • Journal of Electrical Engineering and Technology
    • /
    • 제6권6호
    • /
    • pp.806-816
    • /
    • 2011
  • Interest about social security has recently increased in favor of safety for infrastructure. In addition, advances in computer vision and pattern recognition research are leading to video-based surveillance systems with improved scene analysis capabilities. However, such video surveillance systems, which are controlled by human operators, cannot actively cope with dynamic and anomalous events, such as having an invader in the corporate, commercial, or public sectors. For this reason, intelligent surveillance systems are increasingly needed to provide active social security services. In this study, we propose a core technique for intelligent surveillance system that is based on swarm robot technology. We present techniques for invader enclosing using swarm robots based on multiple distributed object environment. The proposed methods are composed of three main stages: location estimation of the object, specified object tracking, and decision of the cooperative behavior of the swarm robots. By using particle filter, object tracking and location estimation procedures are performed and a specified enclosing point for the swarm robots is located on the interactive positions in their coordinate system. Furthermore, the cooperative behaviors of the swarm robots are determined via the result of path navigation based on the combination of potential field and wall-following methods. The results of each stage are combined into the swarm robot-based invader-enclosing technique on multiple distributed object environments. Finally, several simulation results are provided to further discuss and verify the accuracy and effectiveness of the proposed techniques.

스켈레톤 조인트 매핑을 이용한 딥 러닝 기반 행동 인식 (Deep Learning-based Action Recognition using Skeleton Joints Mapping)

  • 타스님;백중환
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.155-162
    • /
    • 2020
  • 최근 컴퓨터 비전과 딥러닝 기술의 발전으로 비디오 분석, 영상 감시, 인터렉티브 멀티미디어 및 인간 기계 상호작용 응용을 위해 인간 행동 인식에 관한 연구가 활발히 진행되고 있다. 많은 연구자에 의해 RGB 영상, 깊이 영상, 스켈레톤 및 관성 데이터를 사용하여 인간 행동 인식 및 분류를 위해 다양한 기술이 도입되었다. 그러나 스켈레톤 기반 행동 인식은 여전히 인간 기계 상호작용 분야에서 도전적인 연구 주제이다. 본 논문에서는 동적 이미지라 불리는 시공간 이미지를 생성하기 위해 동작의 종단간 스켈레톤 조인트 매핑 기법을 제안한다. 행동 클래스 간의 분류를 수행하기 위해 효율적인 심층 컨볼루션 신경망이 고안된다. 제안된 기법의 성능을 평가하기 위해 공개적으로 액세스 가능한 UTD-MHAD 스켈레톤 데이터 세트를 사용하였다. 실험 결과 제안된 시스템이 97.45 %의 높은 정확도로 기존 방법보다 성능이 우수함을 보였다.

스마트폰을 이용한 위치정보기반 AR 시스템에서의 부정합 현상 최소화를 위한 기법 (Error Correction Scheme in Location-based AR System Using Smartphone)

  • 이주용;권준식
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.179-187
    • /
    • 2015
  • 스마트폰의 보급 확산으로 다양한 콘텐츠가 등장하고 있다. 이러한 콘텐츠 중에서 위치 기반 서비스를 이용한 증강현실 응용프로그램의 필요성이 널리 대두되고 있다. 본 논문에서는 안드로이드 스마트폰을 이용한 위치정보기반 AR 시스템에서 발생하는 정합 오차를 컴퓨터 비전 기술을 이용하여 효과적으로 줄이는 방법을 제안한다. 위치정보 오차 누적 때문에 객체가 정확하게 정합되지 않는 부정합 현상 최소화를 위해 연산 속도는 유지하면서 연산량을 줄여 성능을 향상한 방법인 SURF(Speeded Up Robust Features)를 사용해 초기 특징점을 검출하고 검출된 특징점을 추적하여 모바일 환경에 적용한다. 위치정보 검색을 위해 GPS 정보를 사용하고 자세추정 및 방향 정보를 위해 자이로 센서, G-센서 등을 이용한다. 하지만 위치정보의 누적된 오차는 객체가 고정되지 않는 부정합 현상을 유발한다. 또한, 증강현실 기술은 구현하면서 많은 연산량이 필요하므로 모바일 환경에서 구현하는데 어려움이 발생한다. 제안된 방법은 모바일 환경에서 성능 저하를 최소화하고 비교적 간단하게 구현할 수 있어 기존 시스템 및 다양한 모바일 환경에서 유용하게 이용될 수 있다.

손 모양 인식을 이용한 모바일 로봇제어 (Mobile Robot Control using Hand Shape Recognition)

  • 김영래;김은이;장재식;박세현
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.34-40
    • /
    • 2008
  • 본 논문에서는 손 모양 인식을 이용한 비전기반의 모바일 로봇제어 시스템을 제안한다. 손 모양을 인식하기 위해서는 움직이는 카메라로부터 정확한 손의 경계선을 추출하고 추적하는 것이 필요하다. 이를 위해 본 논문에서는 초기 윤곽선 위치 및 경계에 강건하고, 빠른 물체를 정확히 추적할 수 있는 mean shift를 이용한 활성 윤곽선 모델(ACM) 추적 방법을 개발하였다. 제안된 시스템은 손 검출기, 손 추적기, 손 모양 인식기, 로봇 제어기 4가지 모듈로 구성된다. 손 검출기는 영상에서 피부색 영역으로 정확한 모양을 손으로 추출한 이후 활성 윤곽선 모델(ACM) 과 mean shift를 사용하여 손 영역을 정확히 추적한다. 마지막으로 Hue 모멘트에 이용하여 손의 형태를 인식한다. 제안된 시스템의 적합성을 평가하기 위하여 2족 보행로봇 RCB-1에서 실험이 수행되었다. 실험 결과는 제안된 시스템의 효율성을 증명하였다.

OWC based Smart TV Remote Controller Design Using Flashlight

  • Mariappan, Vinayagam;Lee, Minwoo;Choi, Byunghoon;Kim, Jooseok;Lee, Jisung;Choi, Seongjhin
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제10권1호
    • /
    • pp.71-76
    • /
    • 2018
  • The technology convergence of television, communication, and computing devices enables the rich social and entertaining experience through Smart TV in personal living space. The powerful smart TV computing platform allows to provide various user interaction interfaces like IR remote control, web based control, body gesture based control, etc. The presently used smart TV interaction user control methods are not efficient and user-friendly to access different type of media content and services and strongly required advanced way to control and access to the smart TV with easy user interface. This paper propose the optical wireless communication (OWC) based remote controller design for Smart TV using smart device Flashlights. In this approach, the user smart device act as a remote controller with touch based interactive smart device application and transfer the user control interface data to smart TV trough Flashlight using visible light communication method. The smart TV built-in camera follows the optical camera communication (OCC) principle to decode data and control smart TV user access functions according. This proposed method is not harmful as radio frequency (RF) radiation does it on human health and very simple to use as well user does need to any gesture moves to control the smart TV.

움직임 감지 기반의 파티클 시스템을 이용한 디지털 거울 (Digital Mirror using Particle System based on Motion Detection)

  • 임찬;윤재선
    • 한국콘텐츠학회논문지
    • /
    • 제11권11호
    • /
    • pp.62-69
    • /
    • 2011
  • 센서 기술의 발달과 디지털 미디어의 진화는 인터액티브 미디어아트라는 새로운 예술장르를 탄생시켰다. 그 중 디지털 거울은 컴퓨터비전 기술과 비디오아트의 융합을 기반으로 등장한 작품분야로서, 관객의 시각적 이미지를 다양한 매체를 통해 재구성하여 표현한다. 이러한 디지털 거울의 미학적 측면과 높은 관객 접근성을 바탕으로 많은 디지털 거울 작품이 등장했다. 하지만 대다수의 디지털 거울은 관객의 참여 정도와 무관한 시각적 이미지를 표현하고 있으며, 이는 지속적인 관객참여와 상호작용 유지를 저해하는 요소로 작용될 수 있다. 이에 본 논문은 기존의 디지털 거울에 차영상 기반의 움직임 감지 알고리즘과 파티클 시스템을 연동하여 관객의 움직임 정도에 따라 유기적으로 변화하는 디지털 거울을 제안한다. 먼저 입력된 관객이미지를 처리하여 관객의 움직임 정보를 추출하고, 이를 파티클의 속성에 적용시켜 관객의 움직임에 따라 변화하는 파티클 시스템을 디자인한다. 그리고 이를 기반으로 관객의 이미지를 재구성하여 표현했다.

향상된 표적 추적 기법을 이용한 무유도 대전차 로켓의 조준 오차 제거 방법 (A Method for Eliminating Aiming Error of Unguided Anti-Tank Rocket Using Improved Target Tracking)

  • 송진모;김태완;박태선;도주철;배종수
    • 한국군사과학기술학회지
    • /
    • 제21권1호
    • /
    • pp.47-60
    • /
    • 2018
  • In this paper, we proposed a method for eliminating aiming error of unguided anti-tank rocket using improved target tracking. Since predicted fire is necessary to hit moving targets with unguided rockets, a method was proposed to estimate the position and velocity of target using fire control system. However, such a method has a problem that the hit rate may be lowered due to the aiming error of the shooter. In order to solve this problem, we used an image-based target tracking method to correct error caused by the shooter. We also proposed a robust tracking method based on TLD(Tracking Learning Detection) considering characteristics of the FCS(Fire Control System) devices. To verify the performance of our proposed algorithm, we measured the target velocity using GPS and compared it with our estimation. It is proved that our method is robust to shooter's aiming error.