• 제목/요약/키워드: Gradient Histogram

검색결과 116건 처리시간 0.029초

에지 투영의 유사도를 이용한 압축된 영상에 대한 Reduced-Reference 화질 평가 (Reduced-Reference Quality Assessment for Compressed Videos Based on the Similarity Measure of Edge Projections)

  • 김동오;박래홍;심동규
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.37-45
    • /
    • 2008
  • 화질 평가는 원영상과 열화된 영상 간의 차이를 측정함으로써, 열화된 영상의 화질이 좋고 나쁨을 판단하는 것을 목표로 한다. 본 논문에서는 열화된 영상의 화질 평가를 위해, 원영상과 열화된 영상 전체를 비교하는 것 대신, 원영상과 열화된 영상, 각각의 특징으로 에지 투영을 이용하는 방법을 제안하였다. 여기서 에지 투영은 에지 맵에서 수직, 수평 방향으로 투영시킴으로써 얻을 수 있다. 에지 투영 시 수직, 수평 방향에 대한 그래디언트 크기를 고려함으로써, 보다 나은 화질 평가 방법을 제안하였다. 제안한 방법의 탁월함을 기존의 화질 평가 방법인 structural similarity(SSIM), edge peak signal-to-noise ratio(EPSNR), 그리고 edge histogram descriptor(EHD) 방법과 비교 실험을 통해 보였다.

모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용한 깊이 정보 기반의 연속적인 사람 행동 인식 시스템 (Depth-Based Recognition System for Continuous Human Action Using Motion History Image and Histogram of Oriented Gradient with Spotter Model)

  • 음혁민;이희진;윤창용
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.471-476
    • /
    • 2016
  • 본 논문은 깊이 정보를 기반으로 모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용하여 연속적인 사람 행동들을 인식하는 시스템을 설명하고 연속적인 행동 인식 시스템에서 인식 성능을 개선하기 위해 행동 적출을 수행하는 적출 모델을 제안한다. 본 시스템의 구성은 전처리 과정, 사람 행동 및 적출 모델링 그리고 연속적인 사람 행동 인식으로 이루어져 있다. 전처리 과정에서는 영상 분할과 시공간 템플릿 기반의 특징을 추출하기 위하여 Depth-MHI-HOG 방법을 사용하였으며, 추출된 특징들은 사람 행동 및 적출 모델링 과정을 통해 시퀀스들로 생성된다. 이 생성된 시퀀스들과 은닉 마르코프 모델을 사용하여 정의된 각각의 행동에 적합한 사람 행동 모델과 제안된 적출 모델을 생성한다. 연속적인 사람 행동 인식은 연속적인 행동 시퀀스에서 적출 모델에 의해 의미 있는 행동과 의미 없는 행동을 분할하는 행동 적출과 의미 있는 행동 시퀀스에 대한 모델의 확률 값들을 비교하여 연속적으로 사람 행동들을 인식한다. 실험 결과를 통해 제안된 모델이 연속적인 행동 인식 시스템에서 인식 성능을 효과적으로 개선하는 것을 검증한다.

Sub Oriented Histograms of Local Binary Patterns for Smoke Detection and Texture Classification

  • Yuan, Feiniu;Shi, Jinting;Xia, Xue;Yang, Yong;Fang, Yuming;Wang, Rui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권4호
    • /
    • pp.1807-1823
    • /
    • 2016
  • Local Binary Pattern (LBP) and its variants have powerful discriminative capabilities but most of them just consider each LBP code independently. In this paper, we propose sub oriented histograms of LBP for smoke detection and image classification. We first extract LBP codes from an image, compute the gradient of LBP codes, and then calculate sub oriented histograms to capture spatial relations of LBP codes. Since an LBP code is just a label without any numerical meaning, we use Hamming distance to estimate the gradient of LBP codes instead of Euclidean distance. We propose to use two coordinates systems to compute two orientations, which are quantized into discrete bins. For each pair of the two discrete orientations, we generate a sub LBP code map from the original LBP code map, and compute sub oriented histograms for all sub LBP code maps. Finally, all the sub oriented histograms are concatenated together to form a robust feature vector, which is input into SVM for training and classifying. Experiments show that our approach not only has better performance than existing methods in smoke detection, but also has good performance in texture classification.

그래디언트 라돈변환을 이용한 만화영상의 외곽 경계사각형 검출 (Out-Boundary Rectangle Detection in Comic Images Using the Gradient Radon Transform)

  • 김동근;양승범;황치정
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.538-545
    • /
    • 2011
  • 최근, 인터넷에 다양한 컨텐츠가 있으며, 특히 만화영상은 인기 있는 디지털 컨텐츠 중의 하나이다. 이러한 만화영상은 대부분 스캐너에 의해 스캔되며, 크기, 기울기, 경계선 부분의 여백 등이 정규화되어 있지 않다. 이와 같은 정규화 과정은 만화영상 분석에서 매우 중요한 단계로, 만화영상의 외곽 경계사각형을 검출하는 방법으로 정규화를 수행할 수 있다. 본 논문에서는 그래디언트 라돈 변환을 사용하여 만화영상에서 외곽의 경계사각형을 검출하는 방법을 제안한다. 만화영상에서 경계 사각형의 변의 후보인 선분을 검출하기 위하여 그래디언트 정보를 이용한 라돈 변환을 적용하고, 후보 선분과 지역 히스토그램을 이용하여 최종 외곽의 경계사각형 검출하였다. 제안 방법으로 만화 영상에서 효과적으로 외곽의 경계사각형을 검출함을 실험으로 보였다.

위성영상의 감독분류를 위한 훈련집합의 특징 선택에 관한 연구 (Feature Selection of Training set for Supervised Classification of Satellite Imagery)

  • 곽장호;이황재;이준환
    • 대한원격탐사학회지
    • /
    • 제15권1호
    • /
    • pp.39-50
    • /
    • 1999
  • 위성에서 관측된 다 대역 위성영상 데이터를 이용목적에 따라 분류하기 위해서는 복잡한 처리과정과 많은 시간을 필요로 하며, 감독분류시 훈련 데이터의 선택과 고려되는 다양한 특징 값들은 분류 정확도를 좌우할 만큼 민감한 특성을 나타내고 있다. 따라서 본 논문에서는 훈련데이터의 선택과 다양한 특징 값들 중 실제 영상분류에 기여도가 높은 특징을 추출하기 위하여 퍼지 기반의 $\gamma$모델을 이용한 분류네트웍을 구성하였다. 훈련집합 선택시 분류하고자 하는 지역의 밝기 분포도, 텍스쳐 특징 그리고 NDVI(Normalized Difference Vegetation Index)를 분류에 사용될 특징으로 선택하였고, 분류네트웍 출력 값의 오류가 최소화 되도록 Gradient Desoent 방법을 이용하여 각 노드의 $\gamma$파라미터를 훈련시키는 과정을 채택하였다. 이러한 훈련을 통하여 얻어진 파라미터를 이용하면 각 노드의 연결특성을 알 수 있으며, 다양한 입력 노드의 특징들 중 영상분류에 기여도가 적은 특징들을 추출하여 제거할 수 있다.

Application of An Adaptive Self Organizing Feature Map to X-Ray Image Segmentation

  • Kim, Byung-Man;Cho, Hyung-Suck
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1315-1318
    • /
    • 2003
  • In this paper, a neural network based approach using a self-organizing feature map is proposed for the segmentation of X ray images. A number of algorithms based on such approaches as histogram analysis, region growing, edge detection and pixel classification have been proposed for segmentation of general images. However, few approaches have been applied to X ray image segmentation because of blur of the X ray image and vagueness of its edge, which are inherent properties of X ray images. To this end, we develop a new model based on the neural network to detect objects in a given X ray image. The new model utilizes Mumford-Shah functional incorporating with a modified adaptive SOFM. Although Mumford-Shah model is an active contour model not based on the gradient of the image for finding edges in image, it has some limitation to accurately represent object images. To avoid this criticism, we utilize an adaptive self organizing feature map developed earlier by the authors.[1] It's learning rule is derived from Mumford-Shah energy function and the boundary of blurred and vague X ray image. The evolution of the neural network is shown to well segment and represent. To demonstrate the performance of the proposed method, segmentation of an industrial part is solved and the experimental results are discussed in detail.

  • PDF

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.

Real-Time 2D-to-3D Conversion for 3DTV using Time-Coherent Depth-Map Generation Method

  • Nam, Seung-Woo;Kim, Hye-Sun;Ban, Yun-Ji;Chien, Sung-Il
    • International Journal of Contents
    • /
    • 제10권3호
    • /
    • pp.9-16
    • /
    • 2014
  • Depth-image-based rendering is generally used in real-time 2D-to-3D conversion for 3DTV. However, inaccurate depth maps cause flickering issues between image frames in a video sequence, resulting in eye fatigue while viewing 3DTV. To resolve this flickering issue, we propose a new 2D-to-3D conversion scheme based on fast and robust depth-map generation from a 2D video sequence. The proposed depth-map generation algorithm divides an input video sequence into several cuts using a color histogram. The initial depth of each cut is assigned based on a hypothesized depth-gradient model. The initial depth map of the current frame is refined using color and motion information. Thereafter, the depth map of the next frame is updated using the difference image to reduce depth flickering. The experimental results confirm that the proposed scheme performs real-time 2D-to-3D conversions effectively and reduces human eye fatigue.

Post-Processing for JPEG-Coded Image Deblocking via Sparse Representation and Adaptive Residual Threshold

  • Wang, Liping;Zhou, Xiao;Wang, Chengyou;Jiang, Baochen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1700-1721
    • /
    • 2017
  • The problem of blocking artifacts is very common in block-based image and video compression, especially at very low bit rates. In this paper, we propose a post-processing method for JPEG-coded image deblocking via sparse representation and adaptive residual threshold. This method includes three steps. First, we obtain the dictionary by online dictionary learning and the compressed images. The dictionary is then modified by the histogram of oriented gradient (HOG) feature descriptor and K-means cluster. Second, an adaptive residual threshold for orthogonal matching pursuit (OMP) is proposed and used for sparse coding by combining blind image blocking assessment. At last, to take advantage of human visual system (HVS), the edge regions of the obtained deblocked image can be further modified by the edge regions of the compressed image. The experimental results show that our proposed method can keep the image more texture and edge information while reducing the image blocking artifacts.

퍼지로직을 이용한 보행자 충돌 경고 시스템 (A Pedestrian Collision Warning System using a Fuzzy Logic)

  • 김양호;김광수;곽수영
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.440-448
    • /
    • 2015
  • 논문에서는 지능형 차량에 적용하기 위해 보행자의 의도를 분석하여 보행자와의 사고를 미연에 방지하는 시스템을 제안한다. 제안하는 시스템은 블랙박스 영상으로부터 실시간으로 보행자를 검출하고, 소실점을 바탕으로 한 보행자의 상대 위치와 옵티컬 플로우를 이용한 움직임 방향 정보를 추출한다. 이러한 보행자의 정보와 차량의 현재 속도에 기반한 차량 정지 거리를 이용하여 보행자와의 충돌 위험도를 파악하는 퍼지 로직을 구현하였다. 최종적으로 퍼지 로직의 출력 정보인 충돌 위험도에 따라 운전자에게 경고를 주도록 하였다. 마지막으로 실제 주행 영상을 이용하여 제안된 시스템의 성능과 한계점을 분석하였다.