• Title/Summary/Keyword: 비디오 세그멘테이션

Search Result 10, Processing Time 0.023 seconds

VDCluster : A Video Segmentation and Clustering Algorithm for Large Video Sequences (VDCluster : 대용량 비디오 시퀀스를 위한 비디오 세그멘테이션 및 클러스터링 알고리즘)

  • Lee, Seok-Ryong;Lee, Ju-Hong;Kim, Deok-Hwan;Jeong, Jin-Wan
    • Journal of KIISE:Databases
    • /
    • v.29 no.3
    • /
    • pp.168-179
    • /
    • 2002
  • In this paper, we investigate video representation techniques that are the foundational work for the subsequent video processing such as video storage and retrieval. A video data set if a collection of video clips, each of which is a sequence of video frames and is represented by a multidimensional data sequence (MDS). An MDS is partitioned into video segments considering temporal relationship among frames, and then similar segments of the clip are grouped into video clusters. Thus, the video clip is represented by a small number of video clusters. The video segmentation and clustering algorithm, VDCluster, proposed in this paper guarantee clustering quality to south an extent that satisfies predefined conditions. The experiments show that our algorithm performs very effectively with respect to various video data sets.

Modified Skyscraper Broadcasting Schemes for Periodic Broadcasting with VBR Video (VBR 리디오의 주기적 브로드캐스팅을 위한 수정 Skyscraper 브로드캐스팅 기법)

  • 이재동
    • Journal of Korea Multimedia Society
    • /
    • v.5 no.5
    • /
    • pp.571-581
    • /
    • 2002
  • Many periodic broadcasting schemes for near VoD systems are proposed. Recently non-uniform segmentation schemes have been used to develop periodic broadcasting techniques for near VoD. These techniques give significant reductions in start-up latency as compared with more conventional uniform segmentation. However, all of these schemes assume that the videos are CBR-encoded. Since a CBR-encoded video has a target average tate than an VBR encoding, there is potential to obtain further Performance Improvements by using VBR videos. Unfortunately, however, the studies concerning broadcasting with VBR video ate rare and the existing techniques have the problem of virtual loss. In this paper, we modify Skyscraper Broadcasting Scheme for broadcasting with VBR videos which is a representative non-uniform segmentation scheme lot CBR videos. A VBR video can be transmitted at constant bit rate (CBR) by using prefetching. With this idea we propose Modified Skyscraper Broadcasting Schemes for VBR videos and make performance evaluation by simulation. We show that our schemes have a better performance than Skyscraper Broadcasting Scheme for CBR videos.

  • PDF

Video Segmentation Techniques on Web (웹 상에서의 비디오 세그멘테이션)

  • 박종암;권영빈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.398-400
    • /
    • 2000
  • 이 논문은 웹에서 찾을 수 있는 비디오 포맷들에 대한, 간단하고 개선된 비디오 세그먼테이션 방법을 다룬다. 2개의 임계 값을 이용해서 효과적인 비디오 프레임간의 차이를 비교한다. 또한 개체의 이동과 같은 이유로 프레임 사이에 차이가 날 경우, 하지만 다른 비디오 세그먼테이션이라고 볼 수 없을 경우를 위해, 공간 정보를 이용한 방법과 전역 정보를 이용한 방법간의 균형점을 찾아 본다. 그렇게 하기 위해 전역적인 히스토그램은 적절한 크기의 작은 히스토그램으로 나뉘어 진다. 웹에서는 여러 가지의 비디오 포맷이 존재하기 때문에, 각 포맷과의 독립성을 위해 상위 수준에서의 프로세싱을 위주로 한다.

  • PDF

Video Based Human Motion Detection (비디오기반 사람의 모션 검출)

  • Lee, Chang-Soo;Park, Yeon-Chool;Park, Sae-Joon;Oh, Hae-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.879-883
    • /
    • 2000
  • 비디오 기반 사람의 모션 캡쳐에 관한 연구는 최근 몇 년 동안 컴퓨터 비전분야에서 폭넓은 연구가 진행되어지고 있다. 본 논문은 비디오 기반으로 사람의 모션을 전체 프레임이 진행되는 동안 프레임 별로 디스플레이 한다. 첫 프레임에서 비디오 세그멘테이션 과정에서 샷을 검출하고 이를 이용하여 객체를 분류한다. 분류된 객체에서 사람의 영역을 추출한다. 추출된 영역은 다음 프레임의 위치를 예측하게 된다.

  • PDF

Video Segmentation Using Audio and Image Information (오디오와 영상 정보를 이용한 비디오 세그먼테이션)

  • 정해준;정성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.470-472
    • /
    • 2000
  • 본 논문에서는 영상 정보뿐만 아니라 오디오 정보를 함께 사용한 비디오 세그멘테이션에 대해 연구하였다. 대용량의 정보를 가지고 있는 비디오에 대하여 장면 경계 검출(Scene Break Detection)을 할 경우, 카메라 팬이나 장면 내에 여려 가지 다른 샷(Shot)으로 인하여 영상 정보만으로는 효과적인 검출이 어렵다. 이러한 문제를 해결하기 위해 비디오 내의 오디오 정보도 함께 사용함으로써 문제를 개선했다. 뉴스, 광고, 스포츠 등 다양한 3개 분야의 TV 프로그램으로 구성된 약 4,000개 영상 프레임과 약 30,000개의 오디오 프레임으로 구성된 비디오 데이터베이스에 대하여 실험한 결과, 영상 정보만 사용한 경우보다 우수한 성능을 확인하였다. 영상 정보 특징값으로는 칼라 히스토그램과 DC계수를 사용했고, 오디오 특징값으로는 SR(Silence ratio), VSTD(Volume standard deviation), NPR(Non pitch ratio)을 사용했다.

  • PDF

Painters who Climbed Out the Museum and Disappeared (박물관 넘어 도망친 화가들)

  • Kim, Hyeonji;Song, Jiuhn;Yeo, Hwaseon;Kang, Je-won
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.358-360
    • /
    • 2020
  • 본 팀은 웹캠으로 촬영한 영상에서 원하는 물체를 선택하여 텍스처를 선택한 이미지의 스타일로 변환하는 프로젝트를 수행했다. 영상을 세그멘테이션하고 원하는 물체만을 원하는 텍스처로 변환하여 최종 아웃풋을 얻는다. 제안하는 네트워크는 물체를 다양한 스타일로 바꾸는 것이 가능한데, 이 중에서 이미지에 명화의 화풍을 입히는 것을 중점으로 하여 데모를 구현했다. 빠른 속도로 네트워크를 실행하기 위해 기존 연구들에 비디오 처리의 관점을 접목했다. 여러 프레임을 묶어 옵티컬 플로우를 생성하고, 첫 번째 프레임을 인스턴스 세그멘테이션한 후 마스크를 추출했다. 이후 마스크 영역만 뽑아낸 이미지를 새로운 입력으로 하여 스타일 트랜스퍼를 거치고, 이 첫번째 프레임과 나머지 프레임들의 옵티컬 플로우로 나머지 프레임들의 세그멘테이션과 스타일 트랜스퍼를 예측하여 다시 비디오 프레임으로 만들어 주었다. 본 알고리즘은 옵티컬 플로우 설정으로 네트워크의 계산량을 줄이며 속도를 개선했다. 빠른 데이터 처리로 사용자가 원하는 물체의 텍스쳐가 바뀔 수 있게 되었고, 이는 현실 세계가 실제로 바뀐 듯한 느낌을 들게 한다. 또한, 컴퓨터 비전에서 활발하게 연구되었던 분야를 AR로 끌어와 두 분야의 융합 가능성을 열었다. 현재 코로나의 영향으로 집에서 취미생활을 즐기는 인구가 많아졌다. 본 연구를 통해 많은 사람에게 집에서 쉽게 명화의 감성을 즐기고 느낄 수 있는 양질의 콘텐츠를 제공해주려 한다. 또한, 박물관과 미술관 등의 기관에서도 이 기술이 활용될 수 있다. 명화를 느낄 수 있는 다양한 콘텐츠를 이용하여 박물관이나 미술관의 홍보 효과도 기대할 수 있다.

  • PDF

A Study of Video Coding Based on a Morphological Representation of Wavelet Data (웨이블릿 데이터의 형태적 표현을 적용한 동영상 코딩에 관한 연구)

  • 김혜경;오해석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.541-543
    • /
    • 2000
  • 영역의 수와 윤곽선의 길이는 세그멘테이션 기반의 움직임 보상된 비디오 코딩에서 두 가지의 기본적인 제약사항이다. 이 논문에서 제안하는 코딩 스킴은 영역의 수를 축소하는 것에 초점을 맞추고, 윤곽성 코딩, 그리고 치환된 프레임 차이(DFD)의 압축에 초점을 맞춘다. 제안된 스킴의 가장 중요한 특징 중의 하나는 형태적인 필터를 기반으로 하는 spatio-temporal 단순성 알고리즘이고, 그것들과 함께 이미지는 작은 수의 영역으로 나누어질 수 있다. 이 스킴의 매우 중요한 특성은 세그멘테이션 맵 샘플링 기법으로, 그것은 윤곽선 길이를 매우 작은 복원 에러에 비례하여 약 50%까지 줄인다. 실험적인 결과는, 높은 압축 비율에 대하여 매우 작은 코딩 에러를 보여주었다.

  • PDF

XCRAB : A Content and Annotation-based Multimedia Indexing and Retrieval System (XCRAB :내용 및 주석 기반의 멀티미디어 인덱싱과 검색 시스템)

  • Lee, Soo-Chelo;Rho, Seung-Min;Hwang, Een-Jun
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.587-596
    • /
    • 2004
  • During recent years, a new framework, which aims to bring a unified and global approach in indexing, browsing and querying various digital multimedia data such as audio, video and image has been developed. This new system partitions each media stream into smaller units based on actual physical events. These physical events within oath media stream can then be effectively indexed for retrieval. In this paper, we present a new approach that exploits audio, image and video features to segment and analyze the audio-visual data. Integration of audio and visual analysis can overcome the weakness of previous approach that was based on the image or video analysis only. We Implement a web-based multi media data retrieval system called XCRAB and report on its experiment result.

Realtime Theft Detection of Registered and Unregistered Objects in Surveillance Video (감시 비디오에서 등록 및 미등록 물체의 실시간 도난 탐지)

  • Park, Hyeseung;Park, Seungchul;Joo, Youngbok
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.10
    • /
    • pp.1262-1270
    • /
    • 2020
  • Recently, the smart video surveillance research, which has been receiving increasing attention, has mainly focused on the intruder detection and tracking, and abandoned object detection. On the other hand, research on real-time detection of stolen objects is relatively insufficient compared to its importance. Considering various smart surveillance video application environments, this paper presents two different types of stolen object detection algorithms. We first propose an algorithm that detects theft of statically and dynamically registered surveillance objects using a dual background subtraction model. In addition, we propose another algorithm that detects theft of general surveillance objects by applying the dual background subtraction model and Mask R-CNN-based object segmentation technology. The former algorithm can provide economical theft detection service for pre-registered surveillance objects in low computational power environments, and the latter algorithm can be applied to the theft detection of a wider range of general surveillance objects in environments capable of providing sufficient computational power.

A Black and White Comics Generation Procedure for the Video Frame Image using Region Extension based on HSV Color Model (HSV 색상 모델과 영역 확장 기법을 이용한 동영상 프레임 이미지의 흑백 만화 카투닝 알고리즘)

  • Ryu, Dong-Sung;Cho, Hwan-Gue
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.35 no.12
    • /
    • pp.560-567
    • /
    • 2008
  • In this paper, we discuss a simple and straightforward binarization procedure which can generate black/white comics from the video frame image. Generally, the region of human's skin is colored white or light gray, while the dark region is filled with the irregular but regular patterns like hatching in most of the black/white comics. Note that it is not enough for simple threshold method to perform this work. Our procedure is decoupled into four processes. First, we use bilateral filter to suppress noise color variation and reserve boundaries. Then, we perform mean-shift segmentation for each similar colored pixels to be clustered. Third, the clustered regions are merged and extended by our region extension algorithm considering each color of their regions. Finally, we decide which pixels are on or off using by our dynamic binarization method based on the HSV color model. Our novel black/white cartooning procedure was so successful to render comic cuts from a well-known cinema in a resonable time and manual intervention.