• 제목/요약/키워드: Object-Of-Interest

검색결과 573건 처리시간 0.025초

JPEG-2000 Gradient-Based Coding: An Application To Object Detection

  • Lee, Dae Yeol;Pinto, Guilherme O.;Hemami, Sheila S.
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.165-168
    • /
    • 2013
  • Image distortions, such as quantization errors, can have a severe negative impact on the performance of computer vision algorithms, and, more specifically, on object detection algorithms. State-of-the-art implementations of the JPEG-2000 image coder commonly allocate the available bits to minimize the Mean-Squared-Error (MSE) distortion between the original image and the resulting compressed image. However, considering that some state-of-the-art object detection methods use the gradient information as the main image feature, an improved object detection performance is expected for JPEG-2000 image coders that allocate the available bits to minimize the distortions on the gradient content. Accordingly, in this work, the Gradient Mean-Squared-Error (GMSE) based JPEG-2000 coder presents an improved object detection performance over the MSE based JPEG-2000 image coder when the object of interest is located at the same spatial location of the image regions with the strongest gradients and also for high bit-rates. For low bit-rates (e.g. 0.07bpp), the GMSE based JPEG-2000 image coder becomes overly selective in choosing the gradients to preserve, and, as a result, there is a greater chance of mismatch between the spatial locations of the gradients that the coder is trying to preserve and the spatial locations of the objects of interest.

  • PDF

초음파 영상에서 LoG 연산자를 이용한 진단 객체의 3차원 분할 (3D Segmentation of a Diagnostic Object in Ultrasound Images Using LoG Operator)

  • 정말남;곽종인;김상현;김남철
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권4호
    • /
    • pp.247-257
    • /
    • 2003
  • This paper proposes a three-dimensional (3D) segmentation algorithm for extracting a diagnostic object from ultrasound images by using a LoG operator In the proposed algorithm, 2D cutting planes are first obtained by the equiangular revolution of a cross sectional Plane on a reference axis for a 3D volume data. In each 2D ultrasound image. a region of interest (ROI) box that is included tightly in a diagnostic object of interest is set. Inside the ROI box, a LoG operator, where the value of $\sigma$ is adaptively selected by the distance between reference points and the variance of the 2D image, extracts edges in the 2D image. In Post processing. regions of the edge image are found out by region filling, small regions in the region filled image are removed. and the contour image of the object is obtained by morphological opening finally. a 3D volume of the diagnostic object is rendered from the set of contour images obtained by post-processing. Experimental results for a tumor and gall bladder volume data show that the proposed method yields on average two times reduction in error rate over Krivanek's method when the results obtained manually are used as a reference data.

안내 로봇을 향한 관람객의 행위 인식 기반 관심도 추정 (Estimating Interest Levels based on Visitor Behavior Recognition Towards a Guide Robot)

  • 이예준;김주현;정의정;김민규
    • 로봇학회논문지
    • /
    • 제18권4호
    • /
    • pp.463-471
    • /
    • 2023
  • This paper proposes a method to estimate the level of interest shown by visitors towards a specific target, a guide robot, in spaces where a large number of visitors, such as exhibition halls and museums, can show interest in a specific subject. To accomplish this, we apply deep learning-based behavior recognition and object tracking techniques for multiple visitors, and based on this, we derive the behavior analysis and interest level of visitors. To implement this research, a personalized dataset tailored to the characteristics of exhibition hall and museum environments was created, and a deep learning model was constructed based on this. Four scenarios that visitors can exhibit were classified, and through this, prediction and experimental values were obtained, thus completing the validation for the interest estimation method proposed in this paper.

깊이와 칼라 영상의 특징을 사용한 ROI 기반 객체 추출 (ROI Based Object Extraction Using Features of Depth and Color Images)

  • 류가애;장호욱;김유성;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.395-403
    • /
    • 2016
  • 최근 들어 영상처리는 여러 분야에서 사용되어지고 있다. 영상처리에서 많이 연구되어지고 있는 기술은 실시간으로 객체를 추적하는 기술이다. 객체를 추적하는 방법은 보행자를 추적하는 HOG(Histogram of Oriented Gradients), 전경과 배경 분리 방법을 사용하는 Codebook 같은 방법 들이 많이 알려져 있다. 그러나 객체가 움직이거나 동적인 배경, 조명변화가 심할 경우 객체 추출이 어려워진다. 본 논문에서는 ROI(Region of Interest)기반 깊이영상과 컬러영상의 특징을 이용해 객체를 추출하는 방법을 제안한다. 첫 번째, 깊이 영상에서 배경분리를 통해 객체의 위치를 찾아 ROI로 설정해준다. 두 번째, 컬러영상을 이용하여 영상의 특징점을 찾는다. 세 번째, 특징점과 객체의 볼록헐(convex hull) 구성점들을 이용하여 새로운 윤곽을 만들어 더 정확한 객체를 추출하도록 한다. 마지막으로 본 논문에서 제안한 방법과 기존 방법과의 비교를 통해 제안한 방법의 결과가 좀 더 정확한 객체를 추출하고 있음을 검증하였다.

딥러닝 알고리즘 기반 교통법규 위반 공익신고 영상 분석 시스템 (Analysis System for Public Interest Report Video of Traffic Law Violation based on Deep Learning Algorithms)

  • 최민성;문미경
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.63-70
    • /
    • 2023
  • 고화질 블랙박스의 확산과 '스마트 국민제보', '안전신문고' 등 모바일 애플리케이션의 도입에 따른 영향으로 교통법규 위반 공익신고가 급증하였으며, 이로 인해 이를 처리할 담당 경찰 인력은 부족한 상황이 되었다. 본 논문에서는 교통법규 위반 공익신고 영상 중, 가장 많은 비중을 차지하는 차선위반에 대해 딥러닝 알고리즘을 활용하여 자동 검출할 수 있는 시스템의 개발내용에 관해 기술한다. 본 연구에서는 YOLO 모델과 Lanenet 모델을 사용하여 차량과 실선 객체를 인식하고 deep sort 알고리즘을 사용하여 객체를 개별로 추적하는 방법, 그리고 차량 객체의 바운딩 박스와 실선 객체의 범위가 겹치는 부분을 인식하여 진로변경 위반을 검출하는 방법을 제안한다. 본 시스템을 통해 신고된 영상에 대해 교통법규 위반 여부를 자동 분석해줌으로써 담당 경찰 인력 부족난을 해소할 수 있을 것으로 기대한다.

객체기반 비디오 편집 시스템을 위한 불확실 영역기반 사용자 지원 비디오 객체 분할 기법 (Uncertain Region Based User-Assisted Segmentation Technique for Object-Based Video Editing System)

  • 유홍연;홍성훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.529-541
    • /
    • 2006
  • 본 논문에서는 객체기반 비디오 부호화 또는 멀티미디어 편집을 위한 반지동 비디오 객체 분할방식을 제안한다. 반자동 객체분할은 사용자 지원에 의한 분할 방식으로, 비디오 시퀀스의 초기 프레임에서 사용자가 관심객체의 경계를 표시하고 이후의 영상 프레임의 객체를 배경으로부터 연속적으로 분리해 낸다. 제안된 방식은 부분적으로 사용자 조력에 의한 프레임내 분할과 완전 자동에 의한 프레임간 분할 처리과정으로 구성되는데, 영상 전체에 대해 연산을 수행하는 기존 방식과는 달리 객체 경계가 존재하는 영상영역 부분에서만 연산을 수행한다. 프레임내 분할은 사용자가 관심객체의 경계를 지정하고, 이 경계 주위 화소들의 유사성을 이용한 후처리에 의해 정확한 초기 객체를 구한다. 프레임간 분할에서는 이전 프레임에서 추출한 객체의 경계 정보에 근거하여 시간적 유사성을 구한 후 경계와 영역 추적에 의해 연속적으로 동영상 객체를 추출한다. 실험결과로부터 제안된 방식은 비디오 편집, 객체기반 비디오 압축 및 인덱싱 등의 멀미디어 응용에 사용 가능할 정도로 안정되고 정확한 객체추출을 수행함을 확인하였다. 이 결과를 바탕으로 다수의 편리한 기능을 포함한 비디오 편집시스템을 개발하였다.

  • PDF

얼굴검출에 기반한 강인한 객체 추적 시스템 (Robust Object Tracking System Based on Face Detection)

  • 곽민석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권1호
    • /
    • pp.9-14
    • /
    • 2017
  • 최근 컴퓨터 기술의 발전과 함께 임베디드 기기 또한 다양한 기능을 갖추기 시작했다. 본 연구에서는 최근 활발하게 진행되고 있는 영상센서를 사용한 임베디드 기기 등 자원이 적은 기기에서 효율적인 얼굴 추적 방식을 제안한다. 정확한 얼굴을 얻기 위하여 MB-LBP 특징을 사용한 얼굴 검출 방식을 사용했으며, 다음 영상에서 얼굴 객체 추적을 위하여 얼굴 검출시 얼굴 주변 영역(Region of Interest)을 지정하였다. 그리고 얼굴을 검출을 못하는 영상에서는 기존의 객체 추적 방식인 CAM-Shift를 사용해 객체를 추적해 객체 정보의 손실 없이 정보를 유지할 수 있도록 하였다. 본 연구는 기존 연구와의 비교를 통하여 객체 추적 시스템의 정확성과 빠른 성능을 확인하였다.

A Modified Expansion-Contraction Method for Mobile Object Tracking in Video Surveillance: Indoor Environment

  • Kang, Jin-Shig
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권4호
    • /
    • pp.298-306
    • /
    • 2013
  • Recent years have witnessed a growing interest in the fields of video surveillance and mobile object tracking. This paper proposes a mobile object tracking algorithm. First, several parameters such as object window, object area, and expansion-contraction (E-C) parameter are defined. Then, a modified E-C algorithm for multiple-object tracking is presented. The proposed algorithm tracks moving objects by expansion and contraction of the object window. In addition, it includes methods for updating the background image and avoiding occlusion of the target image. The validity of the proposed algorithm is verified experimentally. For example, the first scenario traces the path of two people walking in opposite directions in a hallway, whereas the second one is conducted to track three people in a group of four walkers.

Recognizing Static Target in Video Frames Taken from Moving Platform

  • Wang, Xin;Sugisaka, Masanori;Xu, Wenli
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.673-676
    • /
    • 2003
  • This paper deals with the problem of moving object detection and location in computer vision. We describe a new object-dependent motion analysis method for tracking target in an image sequence taken from a moving platform. We tackle these tasks with three steps. First, we make an active contour model of a target in order to build some of low-energy points, which are called kernels. Then we detect interest points in two windows called tracking windows around a kernel respectively. At the third step, we decide the correspondence of those detected interest points between tracking windows by the probabilistic relaxation method In this algorithm, the detecting process is iterative and begins with the detection of all potential correspondence pair in consecutive image. Each pair of corresponding points is then iteratively recomputed to get a globally optimum set of pairwise correspondences.

  • PDF

컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 (Object-Based Image Retrieval Using Color Adjacency and Clustering Method)

  • 이형진;박기태;문영식
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.31-38
    • /
    • 2005
  • 본 논문은 컬러 인접성과 클러스터링 기법을 이용한 객체 기반 영상 검색 기법을 제안한다. 컬러 인접성이란 영상내의 서로 이웃한 영역에서 나타나는 컬러의 특징값을 말하고, 영상 데이터베이스로부터 사용자가 찾고자하는 영역과 유사한 후보 영역들을 우선 추출하는데 사용된다. 또한 클러스터링 기법은 후보 영역들 가운데 객체가 존재하는 영역만을 추출하는데 사용되고, 질의 영상과 데이터베이스 영상 사이의 유사도 측정을 위하여 히스토그램 인터섹션(histogram intersection) 방법이 사용된다. 제안하는 방법에서 사용되는 영상의 컬러쌍 정보는 객체의 이동, 회전 그리고 크기 변화에 강건하며, 실험을 통하여 제안하는 방법이 기존의 방법보다 우수함을 확인하였다.