• 제목/요약/키워드: Gradient Histogram

검색결과 116건 처리시간 0.021초

영상정보만을 이용한 사람과 로봇간 실시간 상대위치 추정 알고리즘 (Real-Time Algorithm for Relative Position Estimation Between Person and Robot Using a Monocular Camera)

  • 이정욱;선주영;원문철
    • 대한기계학회논문집A
    • /
    • 제37권12호
    • /
    • pp.1445-1452
    • /
    • 2013
  • 본 논문에서는 단안 카메라를 이용하여 사람과 로봇(카메라)간의 상대위치를 실시간으로 추정하는 알고리즘을 제안한다. HOG(기울기 히스토그램) 특징벡터와 SVM(서포트 벡터 머신) 분류기를 이용하여 사람의 두부 및 어깨영역을 검출한다. 검출된 영역의 크기와 위치를 이용하여 사람과 로봇(카메라)간의 상대 위치 및 각도를 계산한다. 또한 알고리즘 수행속도를 향상시키기 위하여 본 논문에서는 NVIDIA의 GPU와 CUDA 라이브러리를 사용하였다. 그 결과 알고리즘 수행속도는 초당 15 프레임의 영상데이터를 처리할 수 있다. 알고리즘의 정확도 비교를 위해서 SICK 레이저 스캐너 출력과 비교하였다.

DNN과 HoG Feature를 이용한 도로 소실점 검출 방법 (Method for Road Vanishing Point Detection Using DNN and Hog Feature)

  • 윤대은;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.125-131
    • /
    • 2019
  • 소실점이란 실제 공간의 평행한 선들이 영상 내에 투영되면서 한곳에 모이는 점으로, 도로 공간에서의 소실점은 매우 중요한 공간정보이다. 도로 공간에서의 소실점을 이용해 추출된 차선의 위치를 개선하거나, 깊이지도 영상을 생성할 수 있다. 본 논문에서는 자동차의 시점을 기준으로 도로를 촬영한 영상을 Deep Neural Network(DNN)과 Histogram of Oriented Gradient(HoG) Feature를 이용한 소실점 검출 방법을 제안한다. 제안하는 알고리즘에서는 영상을 블록별로 나눠서 주요 에지 방향을 추출하는 HoG Feature 추출 단계와 DNN 학습 단계, 그리고 Test 단계로 나뉜다. 학습단계에서는 자동차 시점으로 기준으로 도로 영상 2300장으로 학습을 진행한다. 그리고 Test 단계에서는 Normalized Euclidean Distance(NormDist) 방법을 사용하여 제안하는 알고리즘의 효율성을 측정한다.

블록 HOG 군집화 기반의 1-D 바코드 크로스라인 결정 (Determination of Bar Code Cross-line Based on Block HOG Clustering)

  • 김동욱
    • 한국정보통신학회논문지
    • /
    • 제26권7호
    • /
    • pp.996-1003
    • /
    • 2022
  • 본 논문에서는 비전 기반의 1-D 바코드 검출을 위한 스캔 라인 및 범위 결정을 위한 새로운 방법을 제시한다. 블록 HOG(histogram of gradient)를 바탕으로 DBSCAN 군집화 방법을 적용하여 유효한 바코드 대표점 및 방향을 검출하고 이를 바탕으로 스캔 라인 및 바코드 크로스라인을 결정하는 방법에 관한 연구이다. 본 논문에서는 얻어진 스캔라인을 바탕으로 바코드의 크로스라인 범위를 결정하기 위해 최소 및 최대탐색 기법이 적용되었다. 이것은 바코드의 크기에 무관하게 적용될 수 있다. 제안된 기법은 바코드의 일부 영역만 검출해도 바코드 인식이 가능하며, 또한 바코드 영역 검출 후 코드를 읽기 위해 회전을 필요로 하지 않는다. 또한, 다양한 크기의 바코드 검출이 가능하다. 본 논문의 제안된 기법에 대한 성능을 평가를 위해 다양한 실험결과를 제시하였다.

경계선 검출의 향상을 위한 Mean Shift 알고리즘과 자기 적응적 Canny 알고리즘의 활용 (Using Mean Shift Algorithm and Self-adaptive Canny Algorithm for I mprovement of Edge Detection)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권7호
    • /
    • pp.33-40
    • /
    • 2009
  • 전경계선 검출은 저수준 영상 처리에서 매우 중요하다. 하지만, 대부분의 경계선 검출 방법들은 노이즈 포인트들의 영향으로 효과적이지 못하며 서로 다른 입력 영상에서도 유연하지 못하다. 이 문제를 해결하기 위하여 본 논문에서는 먼저 외부 노이즈 제거 단계를 제시하였고, 다음으로 기울기 폭 히스토그램과 내부 클래스 최소 변이에 따른 양쪽 임계치의 자동 선택을 제시하였다. 이 알고리즘을 사용하여 민감한 노이즈 포인트들의 대부분을 줄일 수 있었고 실제 파라미터를 인위적으로 세팅하지 않고 서로 다른 영상을 위한 목적 임계치를 계산하며, 퍼지 알고리즘에 의하여 경계선 픽셀들을 선택하였다. 결론적으로 이전의 Canny 알고리즘보다 훨씬 더 좋은 결과를 얻을 수 있었다.

Mean-Shift의 색 수렴성과 모양 기반의 재조정을 이용한 실시간 머리 추적 알고리즘 (A Real-Time Head Tracking Algorithm Using Mean-Shift Color Convergence and Shape Based Refinement)

  • 정동길;강동구;양유경;나종범
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.1-8
    • /
    • 2005
  • 이 논문에서는 팬-틸트-줌 기능을 가지는 실시간 능동카메라 시스템에 적합한 2단계 머리 추적 알고리즘을 제안한다. 먼저, 색 수렴 단계에서는 머리의 모양을 타원으로 가정하고 모델 색-히스토그램을 얻는다. 그 후, 모델과 후보 타원의 색-히스토그램간의 유사도를 검사하여 목표 물체의 대략적인 위치를 구하기 위해 mean-shift 방법을 이용한다. 여기에서 영상 내 물체 영역의 색 분포가 카메라의 관찰 방향에 따라 달라지는 것을 고려하기 위하여, 모델 히스토그램 뿐 아니라 이전 프레임에서 얻어진 타원의 색 히스토그램도 함께 고려함으로써 mean-shift의 수렴성을 향상시킨다. 특히, 이전 프레임에서 결정된 타원 내부의 가장자리 영역에 포함되어 있는 배경 색 성분에 의한 오류 누적 문제를 해소하기 위해, 모델 히스토그램을 이용하여 타원의 크기를 적응적으로 축소함으로써 이전 추적 결과중 머리 영역에 해당되는 색 히스토그램을 얻는다. 또한 영상 내의 전역 움직임을 예측하고 이를 보상하여 정확한 초기 위치를 찾음으로써 mean-shift의 색 수렴성을 더욱 향상시킨다. 이 때, 고속 움직임 추정을 위해 1-D 투사 데이터 기반의 방법을 제안한다. 다음 단계에서는, 모양 정보를 이용하여 수렴단계에서 얻어진 타원의 위치와 크기를 보다 정확히 재조정한다. 이를 위해 영상 내 경사도의 방향에 기반한 강건한 모양 유사도 함수를 정의하고 사용한다. 다양한 환경을 고려한 실험을 통하여, 사람의 움직임이 빠른 경우, 영상 내 머리 크기의 변화가 심한 경우, 그리고 배경의 색과 모양이 매우 복잡한 경우에 대해서도 제안한 알고리즘이 비교적 정확히 추적을 수행함을 보였다. 아울러 제안한 알고리즘은 추적을 수행하는데 일반 PC에서 약 30fps의 처리 속도를 보여 실시간 시스템에 적합하다.

Gabor Filter Bank를 이용한 보행자 검출 알고리즘 (Pedestrian Detection Algorithm using a Gabor Filter Bank)

  • 이세원;장진원;백광렬
    • 제어로봇시스템학회논문지
    • /
    • 제20권9호
    • /
    • pp.930-935
    • /
    • 2014
  • A Gabor filter is a linear filter used for edge detectionas frequency and orientation representations of Gabor filters are similar to those of the human visual system. In this thesis, we propose a pedestrian detection algorithm using a Gabor filter bank. In order to extract the features of the pedestrian, we use various image processing algorithms and data structure algorithms. First, color image segmentation is performed to consider the information of the RGB color space. Second, histogram equalization is performed to enhance the brightness of the input images. Third, convolution is performed between a Gabor filter bank and the enhanced images. Fourth, statistical values are calculated by using the integral image (summed area table) method. The calculated statistical values are used for the feature matrix of the pedestrian area. To evaluate the proposed algorithm, the INRIA pedestrian database and SVM (Support Vector Machine) are used, and we compare the proposed algorithm and the HOG (Histogram of Oriented Gradient) pedestrian detector, presentlyreferred to as the methodology of pedestrian detection algorithm. The experimental results show that the proposed algorithm is more accurate compared to the HOG pedestrian detector.

에지 영상의 방향성분 히스토그램 특징을 이용한 자동차 번호판 영역 추출 (Extraction of Car License Plate Region Using Histogram Features of Edge Direction)

  • 김우태;임길택
    • 한국산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.1-14
    • /
    • 2009
  • 본 논문에서는 번호판 영역의 추출에 사용될 수 있는 특징 벡터와 이를 이용하여 문자와 비문자를 판별하고 숫자를 인식하는 방법을 제안한다. 제안하는 특징 벡터는 영상의 기울기 벡터에서 얻어지는 에지 영상의 방향 코드 히스토그램으로부터 추출된다. 추출된 특징 벡터를 MD로 구현되는 문자 및 비문자 인식기에 입력하여 문자와 비문자를 판별함으로써 번호판 영역의 위치를 추정하고, 숫자를 인식한다. 실험 결과 제안하는 방법이 문자와 비문자의 정확한 판별, 번호판 영역의 위치 추정 및 숫자의 인식에 유용하게 적용될 수 있음을 알 수 있었다.

화소의 기울기와 레이블링을 이용한 효율적인 바코드 검출 알고리즘 (Bar Code Location Algorithm Using Pixel Gradient and Labeling)

  • 김승진;정윤수;김봉석;원종운;원철호;조진호;이건일
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1171-1176
    • /
    • 2003
  • 바코드의 기하학적 특징과 레이블링을 이용하여 효율적으로 추출하는 알고리즘을 제안하였다. 네 개의 라인 연산자(line operator)[8]를 이용하여 화소가 가지는 방향을 구한 후, 블록 별로 각 방향에 대한 화소의 누적 히스토그램(histogram)을 구한다. 히스토그램에서 최대값과 최소값의 차가 가장 큰 블록을 바코드 영역의 블록이라고 결정한다. 구해진 블록만을 이용하여 바코드의 중심을 지나가는 직선을 구할 수도 있지만 좀더 정확한 직선을 구하기 위해 바코드 영역에 있는 많은 블록들을 찾는다. 가장 큰 차 값을 이용하여 문턱값을 구하고 블록별로 히스토그램의 최대값과 최소값의 차가 문턱값보다 큰 블록을 바코드의 기하학적(a) 특징을 갖는 블록으로 분류함으로써 블록을 대상으로 영상을 이진화한다. 이진화 한 영상에 대해 레이블링(labeling)[8,9]을 행하여 바코드 영역의 후보 블록들을 결정한다. 후보 블록들의 화소를 이용하여 바코드의 기울기와 중심점을 바코드의 중심점을 구하여 바코드와 수직이고 바코드의 중심을 지나가는 직선을 그을 수 있으며 바코드를 검출 할 수 있다. 수직선이 지나갈 때 화소값을 순차적으로 획득함으로써 바코드가 가지고 있는 정보를 파악한다.

Local Prominent Directional Pattern을 이용한 얼굴 사진과 스케치 영상 성별인식 방법 (Local Prominent Directional Pattern for Gender Recognition of Facial Photographs and Sketches)

  • ;채옥삼
    • 융합보안논문지
    • /
    • 제19권2호
    • /
    • pp.91-104
    • /
    • 2019
  • 본 논문에서는 성별 인식을 위해 얼굴 영상을 효과적으로 기술하는 새로운 지역 패턴 방법 Local Prominent Directional Pattern (LPDP)를 제안한다. 제안된 LPDP 방법은 성별 인식에 중요한 얼굴 모양을 명확하게 구분하기 위해 주변 패턴이 누적된 히스토그램을 통계적으로 분석하고 패턴 변화가 크게 발생하는 픽셀을 부호화 한다. 통계적인 정보를 사용하는 얼굴 모양 구분에 중요한 뚜렷한 에지 방향 패턴 영역을 구분하는 중요한 정보를 제공 할 수 있다. 이는 뚜렷한 에지 방향 패턴이 나타나는 영역의 주변도 유사한 에지 방향 패턴이 나타내기 때문에 통계적으로 특정 방향이 히스토그램에 많이 누적될 수 있기 때문이다. 또한 통계적인 방법은 주변 영역의 정보를 많이 수용하기 때문에 잡음으로 발생하는 에지 방향 변화 오류에 강력한 장점이 있다. 제안된 방법은 기존 방법들 보다 더 강력한 성별인식에 중요한 얼굴 모양 구분 능력을 보여주면서 국소적으로 발생하는 잡음에 견고함을 보여준다. 우리는 제안된 방법의 성능을 평가하기 위해 밝기, 표정, 연령, 머리 포즈가 변화하는 성별 인식 데이터 셋에 다양한 실험을 실험 했고 기존 방법 보다 제안된 방법의 성능이 우수함을 입증했다.

Improved Feature Selection Techniques for Image Retrieval based on Metaheuristic Optimization

  • Johari, Punit Kumar;Gupta, Rajendra Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.40-48
    • /
    • 2021
  • Content-Based Image Retrieval (CBIR) system plays a vital role to retrieve the relevant images as per the user perception from the huge database is a challenging task. Images are represented is to employ a combination of low-level features as per their visual content to form a feature vector. To reduce the search time of a large database while retrieving images, a novel image retrieval technique based on feature dimensionality reduction is being proposed with the exploit of metaheuristic optimization techniques based on Genetic Algorithm (GA), Extended Binary Cuckoo Search (EBCS) and Whale Optimization Algorithm (WOA). Each image in the database is indexed using a feature vector comprising of fuzzified based color histogram descriptor for color and Median binary pattern were derived in the color space from HSI for texture feature variants respectively. Finally, results are being compared in terms of Precision, Recall, F-measure, Accuracy, and error rate with benchmark classification algorithms (Linear discriminant analysis, CatBoost, Extra Trees, Random Forest, Naive Bayes, light gradient boosting, Extreme gradient boosting, k-NN, and Ridge) to validate the efficiency of the proposed approach. Finally, a ranking of the techniques using TOPSIS has been considered choosing the best feature selection technique based on different model parameters.