• 제목/요약/키워드: Video Segmentation

검색결과 326건 처리시간 0.026초

뉴스 비디오 브라우저 (News Video Browser)

  • 신성윤;강오형;김형진;장대현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.336-337
    • /
    • 2021
  • 본 논문에서는 웹상에서 실시간 사용자 인터페이스를 통해 비디오 컨텐츠 검색과 비디오 브라우징을 모두 제공하는 비디오 브라우징 서비스를 제안한다. 영상 시퀀스의 장면 분할 및 키 프레임 추출을 위해 RGB 컬러 히스토그램과 𝛘2 히스토그램을 결합한 효율적인 장면 변경 감지 방법을 제안한다.

  • PDF

비디오 객체 생성을 위한 자동 영상 분할 방법 (An Automatic Segmentation Method for Video Object Plane Generation)

  • 최재각;김문철;이명호;안치득;김성대
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.146-155
    • /
    • 1997
  • 본 논문은 MPEG-4와 같이 객체 및 내용 기반 영상 부호화에 필요한 동영상의 자동 영역 분할 알고리즘을 제안한다. 통계적 가설 검증(statistical hypothesis test)을 사용하여 영상 시퀀스내에 포함된 비디오 객체들(video objects)을 움직임 물체(moving objects)와 배경 (background)으로 자동 분할하는 새로운 영상 분할 알고리즘을 제안한다. 기존 방법들이 두 개의 연속된 영상을 사용하는 반면에, 제안된 방법은 3개의 연속된 영상을 사용하여, 2개의 차영상의 평균값을 비교하여 가설검증을 행함으로써 잡음에 강한 특성을 나타낸다. 그리고 제안된 방법은 기존 방법과는 달리 참분산(true variance)을 사전에 알고 있을 필요가 없는 장점을 갖고 있다[18]. 또한 시간정보만을 이용한 변화 검출 방법의 문제점인 불규칙하고 부정확한 영역의 경계를 공간정보를 이용하여 보정하는 새로운 방법을 제안한다. 시험 결과에서 주어진 것처럼 제안된 시공간정보를 이용한 영상 분할 알고리즘이 시각적으로 의미있는 분할 결과를 제공함을 알 수 있고, 정확한 영역 경계를 추출할 수 있기 때문에 MPEG-4와 같은 객체 기반 영상 부호화에 적용할 경우에 영역 경계에서 상당히 우수한 재생 화질을 얻을 수 있다.

  • PDF

CREATING JOYFUL DIGESTS BY EXPLOITING SMILE/LAUGHTER FACIAL EXPRESSIONS PRESENT IN VIDEO

  • Kowalik, Uwe;Hidaka, Kota;Irie, Go;Kojima, Akira
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.267-272
    • /
    • 2009
  • Video digests provide an effective way of confirming a video content rapidly due to their very compact form. By watching a digest, users can easily check whether a specific content is worth seeing in full. The impression created by the digest greatly influences the user's choice in selecting video contents. We propose a novel method of automatic digest creation that evokes a joyful impression through the created digest by exploiting smile/laughter facial expressions as emotional cues of joy from video. We assume that a digest presenting smiling/laughing faces appeals to the user since he/she is assured that the smile/laughter expression is caused by joyful events inside the video. For detecting smile/laughter faces we have developed a neural network based method for classifying facial expressions. Video segmentation is performed by automatic shot detection. For creating joyful digests, appropriate shots are automatically selected by shot ranking based on the smile/laughter detection result. We report the results of user trials conducted for assessing the visual impression with automatically created 'joyful' digests produced by our system. The results show that users tend to prefer emotional digests containing laughter faces. This result suggests that the attractiveness of automatically created video digests can be improved by extracting emotional cues of the contents through automatic facial expression analysis as proposed in this paper.

  • PDF

효율적인 장면전환 검출을 이용한 비디오 브라우징 서비스 (Video Browsing Service Using An Efficient Scene Change Detection)

  • Seong-Yoon Shin;Yang-Won Rhee
    • 인터넷정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.69-77
    • /
    • 2002
  • 최근 디지털 비디오는 인터넷을 통해 제공되는 매우 중요한 정보 미디어의 하나이며 멀티미디어 분야에서 매우 중요한 역할을 수행하고 있다. 본 논문에서는 웹 상에서 실시간 사용자 인터페이스를 통해 비디오 내용 검색과 브라우징을 제공하는 비디오 브라우징 서비스를 제시한다. 비디오 시퀀스의 장면 분할과 키 프레임 추출을 위해서 RGB 컬러 히스토그램과 $x^2$(카이 스퀘어) 히스토그램을 합성한 효율적인 장면 전환 검출 방법을 제안한다. 이렇게 추출된 키 프레임들은 물리적인 방법과 논리적인 방법에 따라 색인 화된다. 이 시스템은 또한 비디오카세트리코더(VCR)가 갖고 있는 비디오 편집과 검색 기능을 포함한다. 비디오 브라우징을 위하여 날짜, 분야, 그리고 주제의 세 가지 요소가 사용되며, 비디오 브라우징 서비스는 아파치 웹서버에서 MySQL, PHP, 그리고 JMF를 이용하여 구현된다.

  • PDF

샷 경계 검출을 이용한 영상 클립 생성 (Generation of Video Clips Utilizing Shot Boundary Detection)

  • 김혁만;조성길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.582-592
    • /
    • 2001
  • 대용량 영상을 다루는 디지털 비디오 라이브러리나 웹 방송에서는 영상 색인이 매우 중요한 역할을 하며, 이는 영상을 내용 단위로 분할하는 알고리즘에 기반한다. 본 논문에서 구현된 V2Web Studio는 영상 색인을 지원하는 시스템으로서, 샷 경계 검출 알고리즘을 이용한 영상 클립 생성 시스템이다. V2Web Studio는 영상 클립 생성 과정을 1) 영상 신호를 분석하여 샷 경계를 자동 검출하는 단계, 2) 검출된 결과에 포함될 수 있는 오류를 수작업으로 제거하는 단계, 3) 물리적인 샷 경계를 논리적인 계층구조로 모델링하는 단계, 4) 계층구조로 모델링된 각 모델링 인스턴스를 다양한 표준 압축 포맷으로 생성하는 단계로 구분하고, 각 단계에 해당하는 작업은 샷 검출기, 샷 검증기, 영상 모델기, 클립 생성기라는 독립적인 소프트웨어 도구로 구현하였다.

  • PDF

활률적 클러스터링에 의한 움직임 파라미터 추정과 세그맨테이션 (Motion Parameter Estimation and Segmentation with Probabilistic Clustering)

  • 정차근
    • 방송공학회논문지
    • /
    • 제3권1호
    • /
    • pp.50-60
    • /
    • 1998
  • 본 논문에서는 콤팩트한 동영상 표현과 객체기반의 generic한 동영상압축을 위한 파라미터릭 움직임 모델의 파라미터 추정과 세그맨테이션 기법에 관해서 기술한다. 동영상의 optical flow와 같은 국소적 움직임 정보와 파라미터 움직임 모델의 특징을 이용해서 영상의 콤팩트한 구조적 표현을 추출하기 위해, 본 논문에서는 2 스템의 과정 즉, 초기영역을 추출하는 과정과, 파라미터릭 움직임 파라미터의 추정과 세그맨테이션을 동시에 수행하는 과정으로 구성된 새로운 알고리즘을 제안한다. 혼합 모델이 ML 추정에 의거한 확률적 클러스터링에 의해 움직임 물체의 움직임과 형상을 반영한 초기영역을 추출하고, 파라미터릭 움직임 모델을 사용해서 각각의 초기 영역마다 움직임 파라미터를 추정하고 세그맨테이션을 수행한다. 또한, CIF 표준 동영상을 사용한 모의 실험을 통해 본 제안 알고리즘의 유효성을 평가한다.

  • PDF

Experiment on Intermediate Feature Coding for Object Detection and Segmentation

  • Jeong, Min Hyuk;Jin, Hoe-Yong;Kim, Sang-Kyun;Lee, Heekyung;Choo, Hyon-Gon;Lim, Hanshin;Seo, Jeongil
    • 방송공학회논문지
    • /
    • 제25권7호
    • /
    • pp.1081-1094
    • /
    • 2020
  • With the recent development of deep learning, most computer vision-related tasks are being solved with deep learning-based network technologies such as CNN and RNN. Computer vision tasks such as object detection or object segmentation use intermediate features extracted from the same backbone such as Resnet or FPN for training and inference for object detection and segmentation. In this paper, an experiment was conducted to find out the compression efficiency and the effect of encoding on task inference performance when the features extracted in the intermediate stage of CNN are encoded. The feature map that combines the features of 256 channels into one image and the original image were encoded in HEVC to compare and analyze the inference performance for object detection and segmentation. Since the intermediate feature map encodes the five levels of feature maps (P2 to P6), the image size and resolution are increased compared to the original image. However, when the degree of compression is weakened, the use of feature maps yields similar or better inference results to the inference performance of the original image.

Highly-Demanded 비디오 서비스를 위한 낮은 복잡도의 혼합 멀티캐스트/브로드캐스트 알고리즘 (Hybrid Multicast/Broadcast Algorithm for Highly-Demanded Video Services with Low Complexity)

  • 이찬;박세웅
    • 한국통신학회논문지
    • /
    • 제36권1B호
    • /
    • pp.101-110
    • /
    • 2011
  • 광대역 네트워크 기술의 발전함에 따라 점점 더 많은 클라이언트들이 여러 가지 VoD (Video on Demand) 서비스를 사용할 수 있게 되었다. 많은 클라이언트들을 서포트하기 위하여, VoD 전송 방식을 설계할 때 아래의 몇가지 요소들을 고려하여야 한다. 즉 사용자 대기 시간 (Viewer's Waiting Time), 매 클라이언트에서 요구하는 최대 버퍼 요구량 (Buffer Requirement at Each Client ), 비디오 전송에 요구되는 채널개수(number of channel required for video delivery)와 비디오 분할 복잡도(video segmentation complexity) 등이다. 최근의 여러 가지 VoD 서비스들 중에서 Polyharmonic과 Staircase전송 방식이 사용자 대기 시간과 매 클라이언트에서 요구하는 최대 버퍼 요구량에서 제일 좋은 성능을 보여주고 있다. 그러나 이런 방식들은 하나의 비디오를 너무 많은 세그먼트들로 나누어야 하는데 이런 방식은 동시에 관리하고 사용하는 태널의 개수가 많아지게 한다. 이런 문제들을 해결하기 위하여 이 논문에서는 시스템 복잡도를 낮추면서 사용자 대기시간과 최대 버퍼 요구량의 성능을 동시에 향상시키기 위한 방법으로 Polyharmonic과 Staircase 모델을 헤드 파트에 적용하고 기존의 VoD 전송 방식들 가운데 가장 간단한 모델인 Staggered을 뒤 파트에 적용하여 Polyharmonic-Staircase-Staggered (PSS) 방식을 제안하고 있다. 이 방식은 간단하고 효율적이다. 수학적분석을 통해 사용자 대기시간은 기존의 Harmonic Broadcasting 방식과 비교했을 때 대역폭을 조금만 더 크게 차지하면 거의 동일한 성능을 나타내고 있고 최대 버퍼 요구량은 비디오 분할 계수의 조절에 의해 Harmonic Broadcasting보다 60% 우수한 성능을 나타냄을 알 수 있다. 제일 중요한 것은 제안된 방식은 제안된 방식은 실제 용용에서 중요한 요소인 비디오 서브세그먼트의 수, 동시에 관리하는 채널의 수, 동시에 사용하는 채널의 수도 크게 감소시켰다는 것이다. 또한 다양한 환경에 따라 비디오 분할 계수를 어떻게 적절히 조정하는지도 서술하고 있다.

MPEG-4에 사용되는 동영상 객체면의 구성을 위한 레이블링과 블록 정합 방법 (Labeling-BMA Algorithms for VOP of MPEG-4)

  • 최정화;한수영;임제탁
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.1091-1094
    • /
    • 1999
  • In this paper, we propose new algorithms to construct video object planes(VOP’s) for MPEG-4. VOP’s allow the new video standard MPEG-4 to enable content-based funtionalities. A comprehensive review summarizes some of the most important VOP’s generation techniques that have been proposed. The proposed algorithm use segmentation technique as labeling and motion estimation as three-step search algorithm(TSS). It is improved by a labeling technique that distinguishes background and object from a frame.

  • PDF

교육용 비디오의 ToC 자동 생성 방법 (A Method of Generating Table-of-Contents for Educational Video)

  • 이광국;강정원;김재곤;김회율
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.28-41
    • /
    • 2006
  • 양방향 맞춤형 방송의 실현으로 인해 비디오의 내용을 자동으로 분석하여 그 구조를 기술하거나 요약을 생성하는 등의 내용 기반 비디오 분석 기술의 필요성이 요구되고 있다. 본 논문에서는 온라인에서 수요가 높고 특히 맞춤형 방송에 적합한 방송 콘텐츠인 교육용 비디오의 ToC를 자동으로 생성하기 위한 방법을 제안한다. 제안한 ToC 생성 방법은 씬 분할과 씬 서술의 두 단계로 이루어져 있다. 씬 분할 단계에서는 삿 분할을 수행한 후 샷 간의 연결관계 분석을 통해 입력 영상을 씬 단위로 분할하게 된다. 씬 서술 단계에서는 분할된 각 씬이 장면 분류, 자막 검출, 화자 인식 등에 의해 그 내용이 자동으로 서술된다. 제안된 방법을 통해 생성된 ToC는 씬과 샷의 계층 구조를 통해 비디오의 구성을 표현하고, 검출된 여러 특정을 이용해 각 씬과 샷의 내용을 서술함으로써 사용자가 비디오의 내용을 한눈에 알아볼 수 있고 원하는 내용에 손쉽게 접근할 수 있도록 도와줄 수 있다. 또 보다 상세한 ToC가 요구되는 경우에는 유용한 정보들이 포함되어 있는 초기 형태의 ToC로써 이용되어 수작업에 의한 ToC 생성에 필요한 시간을 효과적으로 줄이는 것이 가능하다. 실험을 통해 제안한 방법으로 여러 개의 교육용 비디오에서 ToC를 효과적으로 생성될 수 있음을 확인하였다.