• 제목/요약/키워드: Mean-shift segmentation

검색결과 46건 처리시간 0.022초

칼라/움직임 정보를 이용한 MPEG-4 비디오 객체 분할 설계 (A design of MPEG-4 video object segmentation using color/motion information)

  • 김준기;이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.206-208
    • /
    • 2000
  • 본 논문은 칼라 정보와 움직임 정보를 이용한 객체 분할 기법의 설계에 대하여 소개한다. 객체 분할 알고리즘은 L*u*v 공간의 칼라 특성과 움직임 특성을 결합하여 설계하였다. 즉 공간 분할은 mean shift 칼라 클러스터링 알고리즘(color clustering algorithm)을 사용하여 중심 칼라 영역에 따라 동일한 칼라 지역으로 통합한다. 시간 분할은 움직임 검출을 위하여 affine six parameter 움직임 모델과 optical flow equation를 이용하여 움직임이 발생한 부분을 검출한다. 다음에 공간 분할과 시간 분할에 따라 결과를 통합하고 MAD(mean absolute difference)를 사용하여 객체를 추출하는 알고리즘을 설계하였다.

  • PDF

Video-based Stained Glass

  • Kang, Dongwann;Lee, Taemin;Shin, Yong-Hyeon;Seo, Sanghyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2345-2358
    • /
    • 2022
  • This paper presents a method to generate stained-glass animation from video inputs. The method initially segments an input video volume into several regions considered as fragments of glass by mean-shift segmentation. However, the segmentation predominantly results in over-segmentation, causing several tiny segments in a highly textured area. In practice, assembling significantly tiny or large glass fragments is avoided to ensure architectural stability in stained glass manufacturing. Therefore, we use low-frequency components in the segmentation to prevent over-segmentation and subdivide segmented regions that are oversized. The subdividing must be coherent between adjacent frames to prevent temporal artefacts, such as flickering and the shower door effect. To temporally subdivide regions coherently, we obtain a panoramic image from the segmented regions in input frames, subdivide it using a weighted Voronoi diagram, and thereafter project the subdivided regions onto the input frames. To render stained glass fragment for each coherent region, we determine the optimal match glass fragment for the region from a dataset consisting of real stained-glass fragment images and transfer its color and texture to the region. Finally, applying lead came at the boundary of the regions in each frame yields temporally coherent stained-glass animation.

Design of a Recognizing System for Vehicle's License Plates with English Characters

  • Xing, Xiong;Choi, Byung-Jae;Chae, Seog;Lee, Mun-Hee
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제9권3호
    • /
    • pp.166-171
    • /
    • 2009
  • In recent years, video detection systems have been implemented in various infrastructures such as airport, public transportation, power generation system, water dam and so on. Recognizing moving objects in video sequence is an important problem in computer vision, with applications in several fields, such as video surveillance and target tracking. Segmentation and tracking of multiple vehicles in crowded situations is made difficult by inter-object occlusion. In the system described in this paper, the mean shift algorithm is firstly used to filter and segment a color vehicle image in order to get candidate regions. These candidate regions are then analyzed and classified in order to decide whether a candidate region contains a license plate or not. And then some characters in the license plate is recognized by using the fuzzy ARTMAP neural network, which is a relatively new architecture of the neural network family and has the capability to learn incrementally unlike the conventional BP network. We finally design a license plate recognition system using the mean shift algorithm and fuzzy ARTMAP neural network and show its performance via some computer simulations.

An Effective Framework for Contented-Based Image Retrieval with Multi-Instance Learning Techniques

  • Peng, Yu;Wei, Kun-Juan;Zhang, Da-Li
    • Journal of Ubiquitous Convergence Technology
    • /
    • 제1권1호
    • /
    • pp.18-22
    • /
    • 2007
  • Multi-Instance Learning(MIL) performs well to deal with inherently ambiguity of images in multimedia retrieval. In this paper, an effective framework for Contented-Based Image Retrieval(CBIR) with MIL techniques is proposed, the effective mechanism is based on the image segmentation employing improved Mean Shift algorithm, and processes the segmentation results utilizing mathematical morphology, where the goal is to detect the semantic concepts contained in the query. Every sub-image detected is represented as a multiple features vector which is regarded as an instance. Each image is produced to a bag comprised of a flexible number of instances. And we apply a few number of MIL algorithms in this framework to perform the retrieval. Extensive experimental results illustrate the excellent performance in comparison with the existing methods of CBIR with MIL.

  • PDF

휴머노이드 로봇을 위한 사람 검출, 추적 및 실루엣 추출 시스템 (Human Tracking and Body Silhouette Extraction System for Humanoid Robot)

  • 곽수영;변혜란
    • 한국통신학회논문지
    • /
    • 제34권6C호
    • /
    • pp.593-603
    • /
    • 2009
  • 본 논문은 스테레오 카메라가 이동하는 환경에서 카메라 움직임을 보정하여 새로운 다수의 사람을 검출하는 방법과 검출된 사람을 추적하고, 실루엣을 추출하는 통합된 시스템을 제안한다. 제안하는 시스템은 사람 검출, 추적, 실루엣 추출 3가지 모듈로 구성되어 있으며 3가지 모듈은 카메라가 이동하는 환경을 고려한 것이다. 사람 검출 모듈에서는 카메라 움직임(egomotion) 보정을 이용한 움직이는 영역 추출 결과와 스테레오 정보를 결합하여 움직이는 객체를 검출하였으며, 추적모듈은 변위 정보가 가중된 히스토그램 알고리즘으로 검출된 객체를 추적한다. 실루엣을 추출하는 모듈은 트라이맵(trimap)을 이용하여 사람의 실루엣 부분을 대략적으로 추정하는 단계와 그래프컷(graph cut)을 적용하여 정교하게 실루엣 추출하는 단계로 이루어져 있다. 본 논문에서 제안하는 방법을 실내 환경에서 팬-틸트(pan-tilt) 스테레오 카메라로 획득한 실험데이터를 대상으로 실험한 결과 다수의 사람의 검출 및 추적, 정교한 실루엣 추출이 가능한 것을 확인하였다. 본 논문의 실루엣 추출결과는 제스처 인식이나 걸음걸이 인식 등의 다양한 분야에도 적용가능하다.

도로와 하늘 영역 추출을 위한 적응적 분할 방법 (Adaptive Segmentation Approach to Extraction of Road and Sky Regions)

  • 박경환;남광우;이양원;이창우
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.105-115
    • /
    • 2011
  • 비젼기반 지능형교통정보시스템(ITS, Intelligent Transportation System) 환경에서 도로영역의 분할이 가장 기초적인 역할을 한다. 따라서 본 논문은 입력영상에서 도로 영역과 하늘 영역을 분할하기 위해 적응적 패턴 추출을 통한 영역분할 방법을 제안한다. 제안된 방법은 첫째, Mean Shift 알고리즘을 이용한 초기분할 단계, 둘째, 정적 패턴매칭 방법에 기반한 후보영역선별 단계, 셋째, 동적 패턴매칭 방법에 기반한 영역확장 단계로 구성된다. 제안된 방법은 적응적 패턴을 현 분할영역의 주변 영역으로부터 추출하여 영역병합에 사용함으로서 보다 신뢰성 높은 영역병합결과를 얻을 수 있다. 제안된 방법의 장점을 평가하기 위해 정적인(static) 패턴만을 사용해서 영역을 병합하는 방법과 비교하였다. 제안된 방법의 실험결과에서는 적응적인 패턴 추출방법을 사용하였을 때가 정적인 패턴 추출에 의한 영역병합 방법보다 8.12%의 성능이 향상됨을 보였다. 제안된 방법은 수시로 변화하는 도로환경에서 안정적으로 도로나 하늘영역을 추출할 수 있으며, 비전기반 지능형교통정보시스템의 핵심적인 역할을 할 것으로 기대한다.

MSER을 이용한 다중 스케일 영상 분할과 응용 (Multi-scale Image Segmentation Using MSER and its Application)

  • 이진선;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.11-21
    • /
    • 2014
  • 다중 스케일 영상 분할은 영상 스타일링과 의료진단과 같은 여러 응용에서 매우 중요하다. 이 논문은 다중 스케일 구조를 확보하며 안정적이고 효율적인 MSER에 기반을 둔 새로운 알고리즘을 제안한다. 이 알고리즘은 영상에서 MSER를 수집한 후, 이것들을 특정한 순서대로 영상에 다시 그려 넣음으로써 영상을 분할한다. 영상 경계를 평활화하고 잡음을 제거하기 위한 계층적 모폴로지 연산을 제안한다. 알고리즘의 다중 스케일 특성을 보이기 위해, 여러 종류의 상세 단계 제어의 효과를 영상 스타일링에 적용한다. 제안한 기법은 이러한 효과를 시간이 많이 걸리는 다중 가우시언 평활화없이 수행한다. 분할 품질과 계산 시간 측면에서 민쉬프트-기반 Edison 시스템과 비교 결과를 제시한다.

가우시안 영역 분리 기반 명암 대비 향상 (Contrast Enhancement based on Gaussian Region Segmentation)

  • 심우성
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.608-617
    • /
    • 2017
  • 영역 분리에 의한 명암대비 방법들이 제안되어 왔지만 영상의 히스토그램에 따라 과포화 되는 부작용이나 밝기 값 보존과 명암대비 효과의 상반 관계에 대한 개선이 필요하다. 본 논문은 다양한 히스토그램에서도 명암 대비가 개선 되도록 영역 분리 시 각 서브 영역이 가우시안 분포를 갖도록 분리하고 영역별 평활화하는 명암 대비 방법을 제안 한다. 영역 분리는 $L^*a^*b^*$ 컬러 공간에서 K-평균 방법과 기대-최대 방법에 의해 영역맵과 확률맵을 생성하며 영역별 히스토그램 평활화 방법은 영역간 히스토그램 중복 최소를 위해 평균값 이동과 영역 분리에서 생성된 확률맵을 변환 함수에 활용함으로써 영역별 밝기값을 보존 하였다. 실험은 기존의 명암 대비 방법들과 평균 밝기 차이와 평균 엔트로피 값을 이용하여 밝기 변화가 적고 영상의 세부 정보가 표현됨에 의한 명암대비 개선을 보인다.

정적/동적 패턴을 이용한 적응적 영역 분할 방법 (Adaptive Region Segmentation using Static/Dynamic Pattern Matching)

  • 박경환;이치원;이창우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.145-148
    • /
    • 2010
  • 본 논문에서 우리는 도로 영역과 하늘 영역, 그리고 도로와 하늘이 아닌 나머지 영역으로 분할하기 위해 동적인(dynamic) 패턴을 이용한 적응적인(adaptive) 병합 방법을 제안한다. 원본영상에서 Mean Shift 알고리즘과 라벨링(Labeling)을 수행하고 영역을 과분할 한다. 컬러에 의해서 도로와 하늘영역이 검출되지 못하는 영역을 위해서 도로 영역과 하늘 영역에서 동적인 패턴 추출한 후 매칭을 통해 유사 영역을 병합한다. 이것은 도로와 하늘의 정보를 현재 환경에서 적응적으로 추출하는 방법이다. 실험에서 정적인(static) 패턴을 사용해서 병합하는 방법과 동적인 패턴을 사용해서 병합하는 방법을 비교하였다. 그 결과, 동적인 패턴을 사용하였을 때 8.12%의 향상된 성능을 보였다.

  • PDF

Image-based Soft Drink Type Classification and Dietary Assessment System Using Deep Convolutional Neural Network with Transfer Learning

  • Rubaiya Hafiz;Mohammad Reduanul Haque;Aniruddha Rakshit;Amina khatun;Mohammad Shorif Uddin
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.158-168
    • /
    • 2024
  • There is hardly any person in modern times who has not taken soft drinks instead of drinking water. The rate of people taking soft drinks being surprisingly high, researchers around the world have cautioned from time to time that these drinks lead to weight gain, raise the risk of non-communicable diseases and so on. Therefore, in this work an image-based tool is developed to monitor the nutritional information of soft drinks by using deep convolutional neural network with transfer learning. At first, visual saliency, mean shift segmentation, thresholding and noise reduction technique, collectively known as 'pre-processing' are adopted to extract the location of drinks region. After removing backgrounds and segment out only the desired area from image, we impose Discrete Wavelength Transform (DWT) based resolution enhancement technique is applied to improve the quality of image. After that, transfer learning model is employed for the classification of drinks. Finally, nutrition value of each drink is estimated using Bag-of-Feature (BoF) based classification and Euclidean distance-based ratio calculation technique. To achieve this, a dataset is built with ten most consumed soft drinks in Bangladesh. These images were collected from imageNet dataset as well as internet and proposed method confirms that it has the ability to detect and recognize different types of drinks with an accuracy of 98.51%.