• 제목/요약/키워드: HOG feature

검색결과 66건 처리시간 0.025초

DNN과 HoG Feature를 이용한 도로 소실점 검출 방법 (Method for Road Vanishing Point Detection Using DNN and Hog Feature)

  • 윤대은;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.125-131
    • /
    • 2019
  • 소실점이란 실제 공간의 평행한 선들이 영상 내에 투영되면서 한곳에 모이는 점으로, 도로 공간에서의 소실점은 매우 중요한 공간정보이다. 도로 공간에서의 소실점을 이용해 추출된 차선의 위치를 개선하거나, 깊이지도 영상을 생성할 수 있다. 본 논문에서는 자동차의 시점을 기준으로 도로를 촬영한 영상을 Deep Neural Network(DNN)과 Histogram of Oriented Gradient(HoG) Feature를 이용한 소실점 검출 방법을 제안한다. 제안하는 알고리즘에서는 영상을 블록별로 나눠서 주요 에지 방향을 추출하는 HoG Feature 추출 단계와 DNN 학습 단계, 그리고 Test 단계로 나뉜다. 학습단계에서는 자동차 시점으로 기준으로 도로 영상 2300장으로 학습을 진행한다. 그리고 Test 단계에서는 Normalized Euclidean Distance(NormDist) 방법을 사용하여 제안하는 알고리즘의 효율성을 측정한다.

다수의 보행자 추적과정에서 특징정보를 이용한 보행자 검출 알고리즘 설계 (Design of Pedestrian Detection Algorithm Using Feature Data in Multiple Pedestrian Tracking Process)

  • 한명호;류창주;이상덕;한승조
    • 한국정보통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.641-647
    • /
    • 2018
  • 최근 여러 목적으로 영상 정보를 제공하는 CCTV는 지능형으로 변화하고 있으며, 컴퓨터 비전을 이용한 자동화 응용 범위가 증가하고 있다. 보행자 및 차량 등의 정확한 인식을 위해 신뢰성이 높은 검출방법을 수행하여야 하며 이를 위해 다양한 방법들이 연구되고 있다. 본 논문에서는 다수의 보행자가 움직이는 상황에서 보행자의 세 가지 특징 정보를 획득하여 다수의 보행자들을 검출하는 방법을 제안한다. 제안하는 방법은 보행자 검출 및 추적에 실패하거나 혼동되는 상황을 최소화 하면서 각각의 보행자를 구별한다. 보행자들끼리 근접하거나 겹치는 경우 미리 저장된 프레임 특징 정보를 이용하여 보행자를 구별 및 검출한다.

회전에 강인한 고속 이진패턴을 이용한 실시간 교통 신호 표지판 인식 (Real-time Traffic Sign Recognition using Rotation-invariant Fast Binary Patterns)

  • 황민철;고병철;남재열
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.562-568
    • /
    • 2016
  • 본 논문에서는 다양한 교통 표지판 중에서 운전자의 안전운행에 밀접하게 관계가 있는 속도 표지판을 인식하는 연구에 초점을 맞추고 있다. HOG (histogram of gradient)와 LBP (local binary patterns) 가 객체 인식을 위한 대표적 특징이지만, 이러한 특징들은 패턴을 생성할 때 목표 객체의 회전을 고려하지 않음으로써 객체의 회전에 약한 특성을 가지고 있다. 따라서 본 논문에서는 회전에 강인한 이진 패턴을 생성하기 위해 FRIBP (fast rotation-invariant binary patterns)를 제안하고 있다. 본 논문에서 제안하는 FRIBP 알고리즘은 히스토그램에서 불필요한 레이어를 삭제하고 비교연산과 시프트 연산을 제거하여 빠르게 원하는 특징을 추출할 수 있도록 설계되었다. 제안된 FRIBP 알고리즘은 GTSRB (German Traffic Sign Recognition Benchmark) 데이터에 적용되어, 다른 비교 알고리즘과 유사한 성능을 보여주었다. 또한, 12,630개의 테스트 데이터에 대해 기존의 방법들보다 약 0.47초가 향상된 인식 속도를 보여주었다.

방사형 기저함수 신경회로망 기반 숫자 인식 시스템의 설계 : 전처리 알고리즘을 이용한 인식성능의 비교연구 (Design of Digits Recognition System Based on RBFNNs : A Comparative Study of Pre-processing Algorithms)

  • 김은후;김봉연;오성권
    • 전기학회논문지
    • /
    • 제66권2호
    • /
    • pp.416-424
    • /
    • 2017
  • In this study, we propose a design of digits recognition system based on RBFNNs through a comparative study of pre-processing algorithms in order to recognize digits in handwritten. Histogram of Oriented Gradient(HOG) is used to get the features of digits in the proposed digits recognition system. In the pre-processing part, a dimensional reduction is executed by using Principal Component Analysis(PCA) and (2D)2PCA which are widely adopted methods in order to minimize a loss of the information during the reduction process of feature space. Also, The architecture of radial basis function neural networks consists of three functional modules such as condition, conclusion, and inference part. In the condition part, the input space is partitioned with the use of fuzzy clustering realized by means of the Fuzzy C-Means algorithm. Also, it is used instead of gaussian function to consider the characteristic of input data. In the conclusion part, the connection weights are used as the extended type of polynomial expression such as constant, linear, quadratic and modified quadratic. By using MNIST handwritten digit benchmarking database, experimental results show the effectiveness and efficiency of proposed digit recognition system when compared with other studies.

영상정보만을 이용한 사람과 로봇간 실시간 상대위치 추정 알고리즘 (Real-Time Algorithm for Relative Position Estimation Between Person and Robot Using a Monocular Camera)

  • 이정욱;선주영;원문철
    • 대한기계학회논문집A
    • /
    • 제37권12호
    • /
    • pp.1445-1452
    • /
    • 2013
  • 본 논문에서는 단안 카메라를 이용하여 사람과 로봇(카메라)간의 상대위치를 실시간으로 추정하는 알고리즘을 제안한다. HOG(기울기 히스토그램) 특징벡터와 SVM(서포트 벡터 머신) 분류기를 이용하여 사람의 두부 및 어깨영역을 검출한다. 검출된 영역의 크기와 위치를 이용하여 사람과 로봇(카메라)간의 상대 위치 및 각도를 계산한다. 또한 알고리즘 수행속도를 향상시키기 위하여 본 논문에서는 NVIDIA의 GPU와 CUDA 라이브러리를 사용하였다. 그 결과 알고리즘 수행속도는 초당 15 프레임의 영상데이터를 처리할 수 있다. 알고리즘의 정확도 비교를 위해서 SICK 레이저 스캐너 출력과 비교하였다.

사용자 인증을 위한 딥러닝 기반 얼굴인식 기술 동향 (A Survey on Deep Learning based Face Recognition for User Authentication)

  • 문형진;김계희
    • 산업융합연구
    • /
    • 제17권3호
    • /
    • pp.23-29
    • /
    • 2019
  • 차이가 나는 물체를 구별하는 물체인식과 달리, 얼굴인식은 유사한 패턴을 가진 얼굴의 Identity를 구별한다. 이에 따라 LBP, HOG, Gabor과 같은 특징 추출 알고리즘이 딥러닝 기반으로 대체되고 있다. 딥 러닝 기술을 활용하여 머신러닝으로 얼굴을 식별할 수 있는 기술이 발전하면서 다양한 분야에서 얼굴인식 기술이 활용되고 있다. 특히, 금융 거래 외에도 사용자 식별이 필요한 다양한 오프라인 환경에서 활용되어 세밀하고 개인에 적합한 서비스가 제공될 수 있다. 얼굴 인식 기술은 스마트 미러와 같은 장치를 통해 손쉽게 사용자 인증을 하고, 식별이 된 사용자에게 서비스를 제공할 수 있는 기술로 발전할 수 있다. 본 논문에서는 사용자 인증의 다양한 기법 중에서 얼굴인식 기술에 대한 조사 및 파이썬으로 작성된 얼굴인식 사례 소스 분석과 얼굴인식 기술을 활용한 다양한 서비스의 가능성을 제시하고자 한다.

구조 인식 심층 합성곱 신경망 기반의 영상 잡음 제거 (Image Denoising Via Structure-Aware Deep Convolutional Neural Networks)

  • 박기태;손창환
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.85-95
    • /
    • 2018
  • 스마트폰의 보급이 확산되고 대중화됨에 따라 대부분의 사람들은 사진을 촬영하기 위해 모바일 카메라를 애용하고 있다. 하지만 저조도 환경에서 사진을 촬영할 때 광량이 부족한 이유로 원치 않는 잡음이 발생할 수 있다. 이런 잡음을 제거하기 위해, 최근 심층 합성곱 신경망에 기반한 잡음 제거 기법이 제안되었다. 이 기법은 성능 측면에서 큰 진전을 보였을지라도 여전히 텍스처 및 에지 표현 능력이 부족하다. 따라서 본 논문에서는 영상의 구조를 향상시키기 위해 에지의 방향 정보를 나타내는 호그 영상을 활용하고자 한다. 그리고 잡음 영상과 호그 영상을 스택으로 쌓은 후, 입력 텐서를 형성하여 심층 합성곱 신경망을 학습시키는 기법을 제안하고자 한다. 실험 결과를 통해, 제안한 기법은 기존의 기법보다 정량적인 화질 평가에서 더 우수한 결과를 얻을 수 있었으며 시각적인 측면에서도 텍스처 및 에지의 향상을 달성할 수 있었다.

적응 휴리스틱 분할 알고리즘을 이용한 실시간 차량 번호판 인식 시스템 (Real-Time Vehicle License Plate Recognition System Using Adaptive Heuristic Segmentation Algorithm)

  • 진문용;박종빈;이동석;박동선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.361-368
    • /
    • 2014
  • 차량 번호판 인식 시스템은 복잡한 교통환경의 효율적 관리를 위해 발전되어 현재 많은 곳에 사용되고 있다. 그러나 조명, 잡음, 배경변화, 번호판 훼손 등 환경변화에 큰 영향을 받기 때문에 제한된 환경에서만 동작하며, 실시간으로 사용하기 어렵다. 본 논문에서는 조명변화와 잡음에 강건하며 빠른 번호판 인식을 위한 휴리스틱 분할 알고리즘 및 이를 이용한 실시간 번호판 인식 시스템을 제안한다. 첫 번째 단계는 Haar-like 특징과 Adaboost를 이용하여 번호판을 검출한다. 이 방법은 적분영상을 이용하며 케스케이드 구조로 구성되어 있어 빠른 검출이 가능하다. 두 번째 단계에서 적응 히스토그램 평활화 방법과 노이즈를 경감시키는 바이레터럴 필터를 이용하여 번호판의 종류를 결정한 후, 번호판 종류에 따라 적분영상을 이용한 적응 이진화, 픽셀 프로젝션, 사전지식 등을 기반으로 빠르고 정확한 문자 분할을 한다. 세번째 단계에서는 HOG와 신경망 알고리즘을 이용하여 숫자를 인식하고, SVM을 이용해 한글을 인식한다. 실험결과는 번호판검출에 94.29%의 검출률, 2.94%의 오경보율을 보이며, 문자분할에서는 검출률 97.23%, 2.94%의 오경보율을 보였다. 문자인식에서 평균 인식률은 98.38%이다. 평균 운용시간은 140ms으로 빠르고 강인한 실시간 시스템을 만들 수 있다.

모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용한 깊이 정보 기반의 연속적인 사람 행동 인식 시스템 (Depth-Based Recognition System for Continuous Human Action Using Motion History Image and Histogram of Oriented Gradient with Spotter Model)

  • 음혁민;이희진;윤창용
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.471-476
    • /
    • 2016
  • 본 논문은 깊이 정보를 기반으로 모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용하여 연속적인 사람 행동들을 인식하는 시스템을 설명하고 연속적인 행동 인식 시스템에서 인식 성능을 개선하기 위해 행동 적출을 수행하는 적출 모델을 제안한다. 본 시스템의 구성은 전처리 과정, 사람 행동 및 적출 모델링 그리고 연속적인 사람 행동 인식으로 이루어져 있다. 전처리 과정에서는 영상 분할과 시공간 템플릿 기반의 특징을 추출하기 위하여 Depth-MHI-HOG 방법을 사용하였으며, 추출된 특징들은 사람 행동 및 적출 모델링 과정을 통해 시퀀스들로 생성된다. 이 생성된 시퀀스들과 은닉 마르코프 모델을 사용하여 정의된 각각의 행동에 적합한 사람 행동 모델과 제안된 적출 모델을 생성한다. 연속적인 사람 행동 인식은 연속적인 행동 시퀀스에서 적출 모델에 의해 의미 있는 행동과 의미 없는 행동을 분할하는 행동 적출과 의미 있는 행동 시퀀스에 대한 모델의 확률 값들을 비교하여 연속적으로 사람 행동들을 인식한다. 실험 결과를 통해 제안된 모델이 연속적인 행동 인식 시스템에서 인식 성능을 효과적으로 개선하는 것을 검증한다.

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.