• 제목/요약/키워드: Video Segmentation

검색결과 326건 처리시간 0.025초

서프 및 하프변환 기반 운전자 동공 검출기법 (Face and Iris Detection Algorithm based on SURF and circular Hough Transform)

  • 아텀 렌스키;이종수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.175-182
    • /
    • 2010
  • 본 논문에서는 얼굴과 동공을 검색하는 새로운 기법을 제시하며, 안전운행을 위한 운전자의 동공 감시에 적용한 실험결과를 포함하고 있다. 제시된 기법은 세 단계 주요 과정을 거치는데, 먼저 스킨칼라 세그먼테이션 기법으로 얼굴을 찾는 과정으로 이는 지금까지 사용된 휴리스틱모델이 아닌 학습과정 모델에 기반을 두고 있다. 다음에 얼굴 특징 세그먼테이션으로 눈, 입, 눈썹 등의 부분을 검출 하는데, 이를 위해 얼굴 각 부분에서 추출한 고유 특징들에 대한 PDF 추정을 사용하고 있다. 마지막으로 서큘러 하프 변환기법으로 눈 안의 동공을 찾아낸다. 제시된 기법을 조명이 다른 웹 얼굴 영상과 운전자의 CCD 얼굴 영상에 적용하여 동공을 찾아내는 실험을 하여, 높은 동공 검출율을 확인하였다.

텔레매틱스에서 효율적인 장면전환 검출기법을 이용한 비디오 브라우징 (Video Browsing Using An Efficient Scene Change Detection in Telematics)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.147-154
    • /
    • 2006
  • 다중 비디오 프레임들에서 컬러 특징의 효과적이고 효율적인 표현은 시각적 정보관리 시스템에서 매우 중요하다. 본 논문에서는 웹 상에서 실시간 사용자 인터페이스에 의해 비디오 내용검색과 비디오 브라우징을 모두 수행하는 비디오 브라우징 서비스(VBS)를 제시한다. 비디오 시퀀스의 장면전환과 키 프레임 추출을 위하여 RGB 컬러 히스토그램과 X2 (카이 스퀘어) 히스토그램을 합성한 효율적인 장면전환검출 기법을 제시한다. 장면전환검출에 의해 생성된 키 프레임들은 물리적 그리고 논리적으로 색인화 된다. 본 시스템은 VCR의 비디오 편집과 검색 기능을 포함한다. 비디오 브라우징을 위해서 날자, 분야, 그리고 주제의 세 가지 요소가 이용된다. 비디오 브라우징 서비스는 Apache 웹 서버에서 MySQL, PHP. JMF로 구현되었다.

  • PDF

Novel Intent based Dimension Reduction and Visual Features Semi-Supervised Learning for Automatic Visual Media Retrieval

  • kunisetti, Subramanyam;Ravichandran, Suban
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.230-240
    • /
    • 2022
  • Sharing of online videos via internet is an emerging and important concept in different types of applications like surveillance and video mobile search in different web related applications. So there is need to manage personalized web video retrieval system necessary to explore relevant videos and it helps to peoples who are searching for efficient video relates to specific big data content. To evaluate this process, attributes/features with reduction of dimensionality are computed from videos to explore discriminative aspects of scene in video based on shape, histogram, and texture, annotation of object, co-ordination, color and contour data. Dimensionality reduction is mainly depends on extraction of feature and selection of feature in multi labeled data retrieval from multimedia related data. Many of the researchers are implemented different techniques/approaches to reduce dimensionality based on visual features of video data. But all the techniques have disadvantages and advantages in reduction of dimensionality with advanced features in video retrieval. In this research, we present a Novel Intent based Dimension Reduction Semi-Supervised Learning Approach (NIDRSLA) that examine the reduction of dimensionality with explore exact and fast video retrieval based on different visual features. For dimensionality reduction, NIDRSLA learns the matrix of projection by increasing the dependence between enlarged data and projected space features. Proposed approach also addressed the aforementioned issue (i.e. Segmentation of video with frame selection using low level features and high level features) with efficient object annotation for video representation. Experiments performed on synthetic data set, it demonstrate the efficiency of proposed approach with traditional state-of-the-art video retrieval methodologies.

Very Low Bit Rate Video Image Coder Using the Fractals

  • Kim, Yong-Hon;Jang, Jong-Whan;Jeong, Jae-Gil;Park, Doo-Yeong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권2E호
    • /
    • pp.85-91
    • /
    • 1996
  • New very low bit rate segmentation video image coding technique is proposed by segmenting image into textually homogeneous regions. Regions are classified into one of three perceptually distinct texture classes(perceived constant intensity, smooth texture, and rough texture) using the Human Visual System(HVS) and the fractals. To design very low bit rate video image coder, it is very important to determine the best block size for estimation the fractal dimension and the thresholding of the fractal dimension for each texture class. Good quality reconstructed images are obtained with about 0.10 to 0.21 bit per pixel(bpp) for many different types of imagery.

  • PDF

압축영역의 비디오 객체 추출 (Video Object Extraction in Compressed Domain)

  • 김동욱;김진태
    • 한국정보통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.123-127
    • /
    • 2005
  • 본 논문은 압축된 비디오 신호로부터 움직임 객체를 효과적으로 추출하기 위한 새로운 방법을 제시한다. 압축된 비디오는 압축과정에서 얻은 비디오 객체에 관한 여러 가지 정보들을포함하고 있으며, 이러한 정보는 객체 추출에 중요한 힌트가 된다. 본 연구에서는 각 매크로 블록의 움직임 정보만을 이용하여 움직임 객체를 추출하는 알고리즘을 제시한다. 이를 위하여 프레임에서 배경과 움직임 객체를 분리하고, 움직임 벡터의 히스토그램과 복잡도를 분석하여 움직임 객체의 유효성 여부를 판단한다.

비디오 인덱싱을 이용한 수준별 학습 (Learning on Level Using Video Indexing)

  • 소윤옥;김영봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.691-693
    • /
    • 2002
  • 현대 사회에서 수요자를 고려하지 않은 산업 형태는 거의 찾아볼 수 없다. 우리 교육 또한 학생 개개인의 능력을 출발점으로 하여 학생의 눈높이에 맞춘 교육을 바람직하게 여기는 추세로 변화하고 있다. 이렇게 볼 때 가장 이상적인 학습형태는 개별화 수업이다. 최근 데이터 압축 기술과 통신 기술의 발달로 동영상 데이터(video data)를 이용한 다양한 서비스가 가능하게 되면서 교육에서도 그 사용의 폭이 넓어지고 있다. 이에 따라 동영상 데이터를 효율적으로 저장, 관리할 수 있는 검색에 대한 연구가 활발하게 이루어져오고 있다. 본 논문에서는 동영상 데이터 검색방법의 하나인 주석기반 방식(text-based retrieval)을 이용하여 하나의 교육용 비디오를 장면분할(scene segmentation)하여 학습내용의 수준에 따라 상.중.하 색인을 한다. 이 색인된 비디오에서 수준별 개별학습이 가능한 가상의 비디오 시퀸스(video sequence)를 만들어낸다.

  • PDF

비디오에서의 대표 프레임을 이용한 편집기법 (Edit Method Using Representative Frame on Video)

  • 유현수;이지현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.420-423
    • /
    • 1999
  • 본 논문에서는 비디오를 사용자가 쉽고 빠른 편집과 검색을 통하여 효율적으로 정보를 습득 할 수 있는 방법을 제안한다. 본 논문에서 제안하는 방법은 기존의 장면변환 검출 기법을 통해 추출된 후보 대표프레임들 중에서 사용자의 판단에 의해 대표프레임을 설정, 장면을 분할한 뒤 사용자 편의를 위해 시각적인 색인화를 통해 사용-자가 임의대로 각각의 장면들을 논리적으로 병합, 분리 가능하게 하여 편집할 수 있도록 한다.

  • PDF

Color Space Based Objects Detection System from Video Sequences

  • Alom, Md. Zahangir;Lee, Hyo Jong
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.347-350
    • /
    • 2011
  • This paper propose a statistical color model of background extraction base on Hue-Saturation-Value(HSV) color space, instead of the traditional RGB space, and shows that it provides a better use of the color information. HSV color space corresponds closely to the human perception of color and it has revealed more accuracy to distinguish shadows [3] [4]. The key feature of this segmentation method is based on processing hue component of color in HSV color space on image area. The HSV color model is used, its color components are efficiently analyzed and treated separately so that the proposed algorithm can adapt to different environmental illumination condition and shadows. Polar and linear statistical operations are used to calculate the background from the video frames. The experimental results show that the proposed background subtraction method can automatically segment video objects robustly and accurately in various illuminating and shadow environments.

비디오 영상에서 사전정보 기반의 도로 추적 (Road Tracking based on Prior Information in Video Sequences)

  • 이창우
    • 한국산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.19-25
    • /
    • 2013
  • 본 논문에서는 실 도로 환경에서 획득한 영상으로부터 도로 영역을 추적하는 방법을 제안한다. 제안된 방법은 이전 처리 결과로부터 미리 알려진 정보를 이용하여 현재 영상에서 도로를 검출하고 추적하는 방법이다. 제안된 방법은 시스템의 효율을 위해 연속적인 입력 영상에서 하위 60%이내에 도로가 있다고 가정하여 관심의 대상이 되는 영역(Region of Interest, ROI)을 설정하고 이 영역에서만 도로를 검출하고 추적한다. 최초 분할은 플러드필 알고리즘(Flood-fill algorithm)을 수행한 결과로부터 주위 영역과의 유사성을 평가한 후 병합하여 분할한다. 사전 정보로 사용되는 이전 영상에서 분할 결과에서 시드점(Seed Point)을 추출하고 이 시드점을 기준으로 현재 영상을 분할한다. 이전 영상에서 분할된 도로 영역과 현재 영상에서 분할된 결과를 변형된 자카드 계수(Jaccard coefficient)를 이용한 유사도 측정 결과에 따라 다음 영상에서 도로영역을 정제하고 추적한다. 연속적인 입력 영상을 대상으로 실험한 결과는 잡음이 존재하는 영상에서도 도로를 추적하는데 효과적임을 보여준다.

동영역 분할에 의한 고속 움직임 추정 부호화에 관한 연구 (A Study on the Fast Motion Estimation Coding by Moving Region Segmentation)

  • 이봉호;최경수;곽노윤;황병원
    • 대한전자공학회논문지SP
    • /
    • 제37권3호
    • /
    • pp.88-97
    • /
    • 2000
  • 본 논문은 영역분할 정보를 이용한 움직임 추정 기법을 제안하고자 한다 움직임 추정은 연산량이 매우 방대해서 소프트웨어적인 실시간 구현이 매우 어렵고 전용 칩을 사용하여 구현하고 있다 본 논문에서는 영역 분할 정보 및 가변 탐색 창 설정을 통해서 FSMA에 비해 연산량을 줄이는 영역 기반 움직임 추정 기법을 제안한다 둘째로, 분할된 영역 중 얼굴과 같은 의미를 갖는 영역을 선택적으로 부호화하기 위한 인식 기법을 제안하고자 한다 의미 영역 인식의 기본 취지는 화상 회의나 화상 전화와 같은 대체로 움직임이 적고 화자 중심으로 이루어진 영상에서 화자의 살색 영역 즉, 얼굴 영역을 우선 보호하여 주관적인 화질을 개선하자는 데에 있다.

  • PDF