• 제목/요약/키워드: HOG feature

검색결과 67건 처리시간 0.022초

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.

Post-Processing for JPEG-Coded Image Deblocking via Sparse Representation and Adaptive Residual Threshold

  • Wang, Liping;Zhou, Xiao;Wang, Chengyou;Jiang, Baochen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1700-1721
    • /
    • 2017
  • The problem of blocking artifacts is very common in block-based image and video compression, especially at very low bit rates. In this paper, we propose a post-processing method for JPEG-coded image deblocking via sparse representation and adaptive residual threshold. This method includes three steps. First, we obtain the dictionary by online dictionary learning and the compressed images. The dictionary is then modified by the histogram of oriented gradient (HOG) feature descriptor and K-means cluster. Second, an adaptive residual threshold for orthogonal matching pursuit (OMP) is proposed and used for sparse coding by combining blind image blocking assessment. At last, to take advantage of human visual system (HVS), the edge regions of the obtained deblocked image can be further modified by the edge regions of the compressed image. The experimental results show that our proposed method can keep the image more texture and edge information while reducing the image blocking artifacts.

Cody Recommendation System Using Deep Learning and User Preferences

  • Kwak, Naejoung;Kim, Doyun;kim, Minho;kim, Jongseo;Myung, Sangha;Yoon, Youngbin;Choi, Jihye
    • International Journal of Advanced Culture Technology
    • /
    • 제7권4호
    • /
    • pp.321-326
    • /
    • 2019
  • As AI technology is recently introduced into various fields, it is being applied to the fashion field. This paper proposes a system for recommending cody clothes suitable for a user's selected clothes. The proposed system consists of user app, cody recommendation module, and server interworking of each module and managing database data. Cody recommendation system classifies clothing images into 80 categories composed of feature combinations, selects multiple representative reference images for each category, and selects 3 full body cordy images for each representative reference image. Cody images of the representative reference image were determined by analyzing the user's preference using Google survey app. The proposed algorithm classifies categories the clothing image selected by the user into a category, recognizes the most similar image among the classification category reference images, and transmits the linked cody images to the user's app. The proposed system uses the ResNet-50 model to categorize the input image and measures similarity using ORB and HOG features to select a reference image in the category. We test the proposed algorithm in the Android app, and the result shows that the recommended system runs well.

IR-UWB 레이다를 이용한 모션 인식에 관한 연구 (A Study of Motion Recognition Using IR-UWB Radar)

  • 이진섭;윤정원
    • 한국전자파학회논문지
    • /
    • 제30권3호
    • /
    • pp.236-242
    • /
    • 2019
  • UWB(Ultra-WideBand)는 수 GHz 이상 광대역의 매우 짧은 신호를 이용하여 고속의 송수신이 가능한 기술로서, 최근 레이다 분야에 응용되고 있다. IR(Impulse Radio)-UWB 레이다의 경우, 높은 분해능으로 모션 인식 분야에도 적용되고 있다. 따라서, 본 논문에서는 IR-UWB 레이다를 이용한 모션 인식에 관한 연구를 진행하였다. 모션에 대한 데이터를 획득하기 위해 개발 환경을 구축하고, 성능 향상을 위한 신호처리 알고리즘을 구현하였다. 그리고 신호처리 결과를 바탕으로 모션의 특징 추출과 학습을 통해 성능을 검증하였다.

Person-Independent Facial Expression Recognition with Histograms of Prominent Edge Directions

  • Makhmudkhujaev, Farkhod;Iqbal, Md Tauhid Bin;Arefin, Md Rifat;Ryu, Byungyong;Chae, Oksam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.6000-6017
    • /
    • 2018
  • This paper presents a new descriptor, named Histograms of Prominent Edge Directions (HPED), for the recognition of facial expressions in a person-independent environment. In this paper, we raise the issue of sampling error in generating the code-histogram from spatial regions of the face image, as observed in the existing descriptors. HPED describes facial appearance changes based on the statistical distribution of the top two prominent edge directions (i.e., primary and secondary direction) captured over small spatial regions of the face. Compared to existing descriptors, HPED uses a smaller number of code-bins to describe the spatial regions, which helps avoid sampling error despite having fewer samples while preserving the valuable spatial information. In contrast to the existing Histogram of Oriented Gradients (HOG) that uses the histogram of the primary edge direction (i.e., gradient orientation) only, we additionally consider the histogram of the secondary edge direction, which provides more meaningful shape information related to the local texture. Experiments on popular facial expression datasets demonstrate the superior performance of the proposed HPED against existing descriptors in a person-independent environment.

영상 폐색영역 검출 및 해결을 위한 딥러닝 알고리즘 적용 가능성 연구 (A Study on the Applicability of Deep Learning Algorithm for Detection and Resolving of Occlusion Area)

  • 배경호;박홍기
    • 한국산학기술학회논문지
    • /
    • 제20권11호
    • /
    • pp.305-313
    • /
    • 2019
  • 최근 드론을 이용한 공간정보 구축이 활성화되면서 공간정보 산업발전에 많은 기여를 하고 있다. 하지만 드론 공간정보는 카메라의 중심투영에 의한 발생하는 폐색영역 뿐 아니라 가로수, 보행자, 현수막과 같은 적치물에 의한 폐색 영역이 필연적으로 발생한다. 이러한 폐색영역을 효율적으로 해결하기 위한 다양한 방안이 연구되고 있다. 본 연구에서는 폐색영역 해결을 위해 원초적인 재촬영이 아닌 딥러닝 알고리즘을 적용하기 위한 다양한 알고리즘별 조사 및 비교 연구를 수행하였다. 그 결과, 객체 검출 알고리즘인 HOG부터 기계학습 방법인 SVM, 딥러닝 방식인 DNN, CNN, RNN까지 다양한 모델들이 개발 및 적용되고 있으며, 이 중 영상의 분류, 검출에 가장 보편적이고 효율적인 알고리즘은 CNN 기법임을 확인하였다. 향후 AI 기반의 자동 객체 탐지와 분류는 공간정보 분야에서 각광받는 최신 과학기술이다. 이를 위해 다양한 알고리즘에 대한 검토와 적용은 중요하다. 따라서, 본 연구에서 제시하는 알고리즘별 적용 가능성은 자동으로 드론 영상의 폐색영역을 탐지하고 해결할 수 있어 공간정보 구축의 시간, 비용, 인력에 대한 효율성 향상에 기여할 것으로 판단된다.

개선된 영상 정보를 이용한 가혹한 환경에서의 후방 차량 감지 방법 (Rear Vehicle Detection Method in Harsh Environment Using Improved Image Information)

  • 정진성;김현태;장영민;조상복
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.96-110
    • /
    • 2017
  • 기존의 차량 검출 연구들의 대부분은 일반렌즈 또는 광각렌즈를 가지는 후방 카메라를 사용하기 때문에 사각지대가 넓으며, 영상에 노이즈 및 다양한 외부 환경에 취약한 부분이 있다. 본 논문에서는 사각지대를 줄이고, 노이즈 및 가혹한 외부 환경에서도 인식이 가능한 검출 방법을 제안한다. 먼저 광각렌즈보다 더 넓은 화각을 가진 어안렌즈를 이용해 사각지대를 최소화한다. 렌즈의 화각이 커진 만큼 비선형 방사왜곡도 커지게 되므로, 정확한 영상 결과를 얻기 위해서 왜곡 상수 초기화와 최적화를 실시한 후 Calibration을 이용하였다. 그리고 Calibration과 동시에 원본 영상을 분석하여 안개가 자욱한 상황과 갑작스러운 조도 변화로 인해 생기는 명순응, 암순응 현상에 의한 시야 방해 상황에서도 인식이 가능하도록 안개 제거와 밝기 보정을 이용하였다. 안개 제거는 일반적으로 계산 시간이 매우 크다. 따라서 계산 시간을 줄이기 위해 대표적인 안개 제거 알고리즘인 Dark channel prior를 기반으로 안개를 제거하였다. 밝기 보정 시에는 Gamma correction을 이용했고, 보정에 필요한 Gamma value를 결정하기 위해 영상에 대한 밝기 및 명암 평가가 수행하였다. 평가는 영상의 전체가 아닌 일부분을 이용하여 할애되는 계산시간을 줄였다. 밝기 및 명암 값이 계산되면 그 값을 이용해 Gamma value를 결정하고 전체 영상에 보정을 실시하였다. 그리고 밝기 보정과 안개 제거로 나누어 병렬 처리한 후, 영상을 하나로 정합함으로써 전 처리 과정의 연산시간을 줄였다. 이후 보정된 영상으로부터 특징추출법인 HOG를 이용하여 차량을 검출하였다. 그 결과 본 논문에서 제안하는 방법의 영상 보정을 이용한 차량 검출을 하는데 1프레임당 0.064초가 걸렸으며, 기존의 차량 검출 방법에 비해 7.5%의 향상된 검출률을 얻었다.