• 제목/요약/키워드: Scene Segmentation

검색결과 147건 처리시간 0.028초

AN IMAGE SEGMENTATION LEVEL SET METHOD FOR BUILDING DETECTION

  • Konstantinos, Karantzalos;Demetre, Argialas
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.610-614
    • /
    • 2006
  • In this paper the advanced method of geodesic active contours was developed for the task of building detection from aerial and satellite images. Automatic extraction of man-made structures including buildings, building blocks or roads from remote sensing data is useful for land use mapping, scene understanding, robotic navigation, image retrieval, surveillance, emergency management procedures, cadastral etc. A level set method based on a region-driven segmentation model was implemented with which building boundaries were detected, through this curve propagation technique. The essence of this approach is to optimize the position and the geometric form of the curve by measuring information along that curve, and within the regions that compose the image partition. To this end, one can consider uniform intensities inside objects and the background. Thus, given an initial position of the curve, one can determine global, region-driven functions and provide a statistical description of the inside and outside object area. The calculus of variations and a gradient descent method was used to optimize the variational functional by an iterative steady state process. Experimental results demonstrate the potential of the proposed processing scheme.

  • PDF

A Knowledge-Based Machine Vision System for Automated Industrial Web Inspection

  • Cho, Tai-Hoon;Jung, Young-Kee;Cho, Hyun-Chan
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제1권1호
    • /
    • pp.13-23
    • /
    • 2001
  • Most current machine vision systems for industrial inspection were developed with one specific task in mind. Hence, these systems are inflexible in the sense that they cannot easily be adapted to other applications. In this paper, a general vision system framework has been developed that can be easily adapted to a variety of industrial web inspection problems. The objective of this system is to automatically locate and identify \\\"defects\\\" on the surface of the material being inspected. This framework is designed to be robust, to be flexible, and to be as computationally simple as possible. To assure robustness this framework employs a combined strategy of top-down and bottom-up control, hierarchical defect models, and uncertain reasoning methods. To make this framework flexible, a modular Blackboard framework is employed. To minimize computational complexity the system incorporates a simple multi-thresholding segmentation scheme, a fuzzy logic focus of attention mechanism for scene analysis operations, and a partitioning if knowledge that allows concurrent parallel processing during recognition.cognition.

  • PDF

EFFICIENT MULTIVIEW VIDEO CODING BY OBJECT SEGMENTATION

  • Boonthep, Narasak;Chiracharit, Werapon;Chamnongthai, Kosin;Ho, Yo-Sung
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.294-297
    • /
    • 2009
  • Multi-view video consists of a set of multiple video sequences from multiple viewpoints or view directions in the same scene. It contains extremely a large amount of data and some extra information to be stored or transmitted to the user. This paper presents inter-view correlations among video objects and the background to reduce the prediction complexity while achieving a high coding efficiency in multi-view video coding. Our proposed algorism is based on object-based segmentation scheme that utilizes video object information obtained from the coded base view. This set of data help us to predict disparity vectors and motion vectors in enhancement views by employing object registration, which leads to high compression and low-complexity coding scheme for enhancement views. An experimental results show that the superiority can provide an improvement of PSNR gain 2.5.3 dB compared to the simulcast.

  • PDF

카메라 획득 영상에서의 색 분산 및 개선된 K-means 색 병합을 이용한 텍스트 영역 추출 및 이진화 (Text Detection and Binarization using Color Variance and an Improved K-means Color Clustering in Camera-captured Images)

  • 송영자;최영우
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.205-214
    • /
    • 2006
  • 이미지에 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 정보로서 이러한 정보를 실시간에 찾아내서 인식한다면 다양한 응용에 활용할 수 있다. 본 논문에서는 카메라로 취득한 다양한 종류의 이미지로부터 텍스트를 추출하는 방법과 추출된 영역에서 텍스트를 분리하는 방법을 새롭게 제안한다. 텍스트 영역 추출을 위해서 RGB 색 공간에서 색 분산을 특징으로 제안하며, 텍스트 영역 분리를 위해서 RGB 색 공간에서 개선된 K-means 병합을 제안한다. 실험은 디지털 카메라와 핸드폰 카메라로 취득한 다양한 종류의 문서유형 이미지와 실내외의 일반적인 자연이미지를 사용하였으며, ICDAR 콘테스트[1] 이미지의 일부도 사용하였다.

Segment-based Image Classification of Multisensor Images

  • Lee, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제28권6호
    • /
    • pp.611-622
    • /
    • 2012
  • This study proposed two multisensor fusion methods for segment-based image classification utilizing a region-growing segmentation. The proposed algorithms employ a Gaussian-PDF measure and an evidential measure respectively. In remote sensing application, segment-based approaches are used to extract more explicit information on spatial structure compared to pixel-based methods. Data from a single sensor may be insufficient to provide accurate description of a ground scene in image classification. Due to the redundant and complementary nature of multisensor data, a combination of information from multiple sensors can make reduce classification error rate. The Gaussian-PDF method defines a regional measure as the PDF average of pixels belonging to the region, and assigns a region into a class associated with the maximum of regional measure. The evidential fusion method uses two measures of plausibility and belief, which are derived from a mass function of the Beta distribution for the basic probability assignment of every hypothesis about region classes. The proposed methods were applied to the SPOT XS and ENVISAT data, which were acquired over Iksan area of of Korean peninsula. The experiment results showed that the segment-based method of evidential measure is greatly effective on improving the classification via multisensor fusion.

논리연산을 이용한 주행차량 영상분할 (Segmentation of Moving Multiple Vehicles using Logic Operations)

  • 최기호
    • 한국ITS학회 논문지
    • /
    • 제1권1호
    • /
    • pp.10-16
    • /
    • 2002
  • 본 논문은 논리연산을 이용한 주행차량들의 영상분할 알고리즘을 제안하였다. 연속된 프레임 간에 XOR(Exclusive OR)연산을 행함으로써 차영상을 구하였고, Laplacian 필터링, AND 연산, 팽창(dilation)연산 등을 이용하여 주행차량들에 대해서만 에지들을 추출하고 이들을 영상분할 함으로써 기존방법에 비해 평활화 단계에서 나타날 수 있는 잡음을 제거하였고, 전처리 단계를 줄였으며, 알고리즘을 단순화 하였다 또한 분할된 영상으로부터 컬러 등 주행차량의 특징을 직접 추출 가능토록 하였다. 30fps로 90,000프레임 이상 촬영 된 주행차량들을 대상으로 제안된 알고리즘의 우수성을 보였다

  • PDF

블록기반 워터쉐드 영역분할과 다각형 근사화를 이용한 특징점 추출 (Feature Points Selection Using Block-Based Watershed Segmentation and Polygon Approximation)

  • 김영덕;백중환
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.93-96
    • /
    • 2000
  • 본 논문에서는 2D 자연영상을 MPEG-4의 메쉬 구조로 압축/저장하기 위한 메쉬 구성(meshgeneration)의 전처리에 사용될 수 있도록, 특징점들을 블록기반의 웨터쉐드 영역분할과 다각형 근사화를 통해 추출하는 방법을 제안한다. 우선 2D 자연영상을 8$\times$8 또는 4$\times$4 블록 패턴분류를 이용한 웨터쉐드 분할을 이용하여 영역별로 분리해 낸다 이렇게 분할된 영역의 구분선을 이루는 화소들은 영상의 특징을 나타내며, 이들은 폐곡선을 이루게 된다. 이들 폐곡선 위의 연속적인 화소들을 다각형 근사화와 중복 정점을 제거하는 후처리를 이용해 특징점으로 얻어낸다.

  • PDF

A Novel Text Sample Selection Model for Scene Text Detection via Bootstrap Learning

  • Kong, Jun;Sun, Jinhua;Jiang, Min;Hou, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.771-789
    • /
    • 2019
  • Text detection has been a popular research topic in the field of computer vision. It is difficult for prevalent text detection algorithms to avoid the dependence on datasets. To overcome this problem, we proposed a novel unsupervised text detection algorithm inspired by bootstrap learning. Firstly, the text candidate in a novel form of superpixel is proposed to improve the text recall rate by image segmentation. Secondly, we propose a unique text sample selection model (TSSM) to extract text samples from the current image and eliminate database dependency. Specifically, to improve the precision of samples, we combine maximally stable extremal regions (MSERs) and the saliency map to generate sample reference maps with a double threshold scheme. Finally, a multiple kernel boosting method is developed to generate a strong text classifier by combining multiple single kernel SVMs based on the samples selected from TSSM. Experimental results on standard datasets demonstrate that our text detection method is robust to complex backgrounds and multilingual text and shows stable performance on different standard datasets.

선분분류를 이용한 실내영상의 소실점 추출 (Vanishing Points Detection in Indoor Scene Using Line Segment Classification)

  • 마조청;권오봉
    • 한국콘텐츠학회논문지
    • /
    • 제13권8호
    • /
    • pp.1-10
    • /
    • 2013
  • 본 논문에서는 선분분류를 이용하여 실내영상의 소실점을 검출하는 방법을 제안한다. 실내영상을 효율적으로 검출하기 위하여 2 단계로 소실점을 추출한다. 1 단계에서는 이미지가 1 점 투시인지 2 점 투시인지 판별한다. 만일 이미지가 2 점 투시이면, 선분분류를 위하여 검출된 소실점을 지나는 수평선을 구한다. 2 단계에서는 선분분류를 이용하여 2 개의 소실점을 정확히 검출한다. 또 본 논문에서는 인공영상과 이미지 DB를 이용하여 제안한 방법을 평가하였다. 노이즈를 첨가한 인공 영상에 대해서는 노이즈가 60%를 차지할 때까지 검출한 소실점과 실제 소실점과의 차이가 16 픽셀 이하였다. A. Quattoni 와 A. Torralba가 제안한 이미지 DB를 이용한 평가에서는 87% 이상의 이미지에 대하여 소실점을 검출하였다.

스마트폰에서의 시공간적 중요도 기반의 비디오 요약 (Spatiotemporal Saliency-Based Video Summarization on a Smartphone)

  • 이원범;윌리엄;박인규
    • 방송공학회논문지
    • /
    • 제18권2호
    • /
    • pp.185-195
    • /
    • 2013
  • 본 논문에서는 스마트폰의 플랫폼으로 하여 시공간적 중요도 기반으로 비디오를 요약하는 효율적인 기법을 제안한다. 제안하는 기법은 주어진 비디오에서 카메라 및 물체의 움직임에 강건한 색상 히스토그램의 차분으로 장면 전환을 검출하고 연속적인 프레임간의 유사성, 얼굴의 영역, 개별 프레임(frame)의 중요도를 통해 시공간적 중요도를 분석한다. 그리고 검출된 장면 전환을 이용하여 과분할된 계층적 트리를 생성하고 비디오 분석 과정에서 계산한 병합 및 유지 에너지를 이용하여 반복적으로 갱신한다. 또한 갱신된 계층적 트리에서 사용자가 요구하는 재생 길이와 최소 구간 길이를 충족하고 동시에 높은 중요도를 가진 노드들로부터 탐욕 알고리즘(greedy algorithm)을 통해 프레임을 추출한다. 실험 결과 상용 스마트폰에서 2분길이 분량의 입력 비디오를 10초 내외의 수행시간으로 요약할 수 있었으며, 그 결과는 상용 비디오 편집 소프트웨어인 Muvee보다 우수함을 보였다.