• Title/Summary/Keyword: 동영상 분류

Search Result 245, Processing Time 0.032 seconds

Adaptive Regularized Restoration Of 3-D Wavelet Coded Video (3차원 웨이블릿 기반압축 동영상의 적응적 정칙화 복원)

  • 장윤희;김태영;정정훈;백준기
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.407-410
    • /
    • 2000
  • 본 논문에서는 3차원 웨이블릿 부호화 방식으로 압축된 영상 시퀸스를 정칙화 기반 영상복원 방법으로 후처리하는 알고리듬을 제안한다. 우선, 웨이블릿 압축 시스템을 적절한 영상 열화 시스템으로 모델화한다. 그리고, 시간축에 관하여 프레임 간의 같은 위치에 있는 각 픽셀에 대하여 복원을 수행한다. 그 다음으로 2차원 영상 신호에 대하여 복원을 수행하는데. 즉 웨이블릿 변환 계수 정보를 이용하여 영상 및 시간 정보를 여러 스케일의 에지로 분류한 다음, 에지의 방향에 따른 적응적인 제약조건을 사용한다. 이는 각각의 에지 방향에 적합한 고주파 성분을 유지하고, 신호의 각 특성에 적합한 적응적인 정칙화 매개변수를 적용한다. 마지막으로 시간 축에서의 복원과 그것에 이어지는 적응적인 공간 복원에 대한 실험 결과를 보여준다.

  • PDF

Joint Object Detection and Tracking in Video Sequences (동영상을 위한 객체 검출 기법과 추적 기법의 결합)

  • Lim, Kyungsun;Kim, Han-Ul;Kim, Chang-Su
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.300-301
    • /
    • 2016
  • 본 논문에서는 동영상에서 제한된 종류의 동적 객체를 자동적으로 검출하여 추적하는 기법을 제안한다. 제안하는 기법은 객체 검출 기법[1]과 객체 추적 기법[2]의 협업을 통해 이를 수행한다. 검출기는 매 장면마다 객체들을 검출하고 이 중 높은 신뢰도의 객체에 대해 추적을 시작한다. 추적기는 이전 장면에서 학습된 분류기에 기반하여 객체를 추적한다. 추적 결과와 겹치는 검출 결과를 분석하여 현재 장면에서 객체의 정확한 위치와 모양을 추정한다. 겹치는 검출 결과가 없을 때는 검출기로 부터 추적 결과의 신뢰도를 측정하고 문턱값에 따라 추적을 계속 진행하거나 종료한다. 실험 결과를 통해 제안하는 기법이 기존 검출 기법에 비해 우수한 검출 성능을 보임을 확인한다.

  • PDF

Adaptive Video Browsing Service Using User Profile (사용자 프로파일을 이용한 적응력 있는 비디오 브라우징 서비스)

  • 고경철;신성윤;임정훈;이양원
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.308-313
    • /
    • 2001
  • 최근 인터넷의 급속한 성장과 빠른 보급, 정보통신 분야의 기술퓨전 현상들은 인터넷을 이용한 다양한 컨텐츠의 개발을 가속화시키고 있다. 특히 멀티미디어 스트리밍 기술은 일반 사용자들에게 동영상은 물론 풍부한 멀티미디어 데이터 전송을 통하여 능동적인 대화형 서비스를 제공할 수 있는 장점들을 가지고 있다. 본 논문에서는 사용자의 접속 횟수 및 접속시간 등의 빈도수에 따른 사용자 개인 가중치를 이용하여 사용자에게 보다 친숙하고 흥미를 유발할 수 있는 비디오 데이터 서비스를 제공하고자 하였으며, 카테고리 기반 및 키워드 기반에 따른 사용자 접근 정보를 이용하여 비디오 데이터를 분류하고 선별한 검색 서비스를 제공하고자 하였다. 또한 비디오 브라우징 시스템을 이용하여 사용자가 원하는 항목에 대한 비디오 검색을 장면 검색에서 샷 검색까지 프레임단위로 동영상을 이용하여 브라우징 할 수 있도록 하였으며, 해당 영역의 텍스트 및 관련 정보를 보다 세밀하고 정확하게 브라우징 할 수 있도록 정보를 제공하고자 하였다.

  • PDF

A Study on the semantic information analysis and classification for SNS image (SNS 이미지 의미정보 분석 및 분류에 관한 연구)

  • Lee, Seongjae;Cho, Sungwoo;Cho, Soosun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.507-509
    • /
    • 2012
  • 많은 사용자가 직접 글을 작성하고 데이터를 업로드 하는 SNS 서비스의 데이터 분류 및 분석에서 빅 데이터 활용방안이 다양하게 논의되고 있다. 특히 기존에 활용하던 텍스트 기반의 분류에서 이미지, 동영상에 대한 분류가 다양하게 시도되고 있다. 본 논문에서는 위키피디아를 이용한 이미지 태그의 의미정보를 바탕으로 플리커에서 샘플 이미지를 추출하고 이를 활용하여 'bag of visual word' 기법으로 사용자가 업로드한 이미지를 자동 분류하는 방법을 소개한다.

A Video Analysis Method based on Deep Learning for Multiple Event Analysis (복수 이벤트 분석을 위한 딥러닝 기반 영상 분석 기법)

  • Park, Jisun;Wen, Mingyun;Xi, Yulong;Han, Woochul;Jang, Hyeonjun;Xu, Jiajia;He, Yanmin;Cho, Seoungjae;Cho, Kyungeun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.694-695
    • /
    • 2018
  • 최근 딥러닝을 활용한 이미지 분석 기술 향상에 힘입어 동영상 분석 연구들이 활발히 진행되고 있다. 하지만 기존 연구들의 경우 특정 영상을 입력으로 단일 이벤트로만 분류한다. 본 논문에서는 복수 이벤트를 분석할 수 있는 딥러닝 기반 영상 분석 기법을 설계하고 실험 및 분석하였다.

An Efficient Hardware-Software Co-Implementation of an H.263 Video Codec (하드웨어 소프트웨어 통합 설계에 의한 H.263 동영상 코덱 구현)

  • 장성규;김성득;이재헌;정의철;최건영;김종대;나종범
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.4B
    • /
    • pp.771-782
    • /
    • 2000
  • In this paper, an H.263 video codec is implemented by adopting the concept of hardware and software co-design. Each module of the codec is investigated to find which approach between hardware and software is better to achieve real-time processing speed as well as flexibility. The hardware portion includes motion-related engines, such as motion estimation and compensation, and a memory control part. The remaining portion of theH.263 video codec is implemented in software using a RISC processor. This paper also introduces efficient design methods for hardware and software modules. In hardware, an area-efficient architecture for the motion estimator of a multi-resolution block matching algorithm using multiple candidates and spatial correlation in motion vector fields (MRMCS), is suggested to reduce the chip size. Software optimization techniques are also explored by using the statistics of transformed coefficients and the minimum sum of absolute difference (SAD)obtained from the motion estimator.

  • PDF

Custom Metadata Storage Method Using XMP (XMP를 이용한 커스텀 메타데이터 저장 방법)

  • Hyun, Chang-Jong;Kim, Dong-Ho
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.2
    • /
    • pp.323-330
    • /
    • 2019
  • Recently, as the growth of the Internet has led to a rapid increase in the consumption of multimedia such as photographs and moving images, the importance of metadata has been emphasized. In the case of existing metadata, only limited information such as GPS value or focal length according to the format is stored. However, with the development of mobile devices and multimedia acquisition devices, various sensors can be used in the devices. Therefore, this paper describes a method that can store not only the existing metadata format information at the time of multimedia acquisition but also another existing format of metadata such as information of various sensors which is the gyroscope and acceleration sensor of the device. We propose an application program that provides moving location information. The proposed method is expected to provide various applications such as image matching and effective image classification.

Lip Shape Synthesis of the Korean Syllable for Human Interface (휴먼인터페이스를 위한 한글음절의 입모양합성)

  • 이용동;최창석;최갑석
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.19 no.4
    • /
    • pp.614-623
    • /
    • 1994
  • Synthesizing speech and facial images is necessary for human interface that man and machine converse naturally as human do. The target of this paper is synthesizing the facial images. In synthesis of the facial images a three-dimensional (3-D) shape model of the face is used for realizating the facial expression variations and the lip shape variations. The various facial expressions and lip shapes harmonized with the syllables are synthesized by deforming the three-dimensional model on the basis of the facial muscular actions. Combications with the consonants and the vowels make 14.364 syllables. The vowels dominate most lip shapes but the consonants do a part of them. For determining the lip shapes, this paper investigates all the syllables and classifies the lip shapes pattern according to the vowels and the consonants. As the results, the lip shapes are classified into 8 patterns for the vowels and 2patterns for the consonants. In advance, the paper determines the synthesis rules for the classified lip shape patterns. This method permits us to obtain the natural facial image with the various facial expressions and lip shape patterns.

  • PDF

Analysis of YouTube Channels of Domestic Companies from IMC Perspective (IMC 관점에서 국내기업의 유튜브채널 분석)

  • Kim, Byung-Dae
    • Management & Information Systems Review
    • /
    • v.39 no.3
    • /
    • pp.127-140
    • /
    • 2020
  • This study conducted analysis of YouTube channels by domestic companies as the marketing strategies of domestic companies vary due to the rapid growth of the Internet and YouTube channels. The YouTube channel analysis analyzed the number of subscribers, plays, videos and classifications of domestic companies on YouTube channels, the top 100 domestic companies in the YouTube ranking site "Company/Official. The analysis showed that 4.53 million companies had the largest number of subscribers, Samsung mobile, 544.69 million circuit Samsung mobile, and 11,416 League of Legends-Korea channels had the largest number of videos. The most product classification showed that food/dining companies were engaged in a lot of YouTube activities. The use of YouTube, which is rapidly growing in companies through analyzing YouTube channels from the perspective of a company's new marketing strategy, is a new tool for integrated marketing communications. It is expected that the YouTube channel, which enables two-way communication of companies' marketing strategies, will be used as basic data when producing YouTube content in the future.

Implementation of UEP using Turbo Codes and EREC Algorithm for Video Transmission (동영상 전송을 위하여 터보코드와 EREC알고리즘을 이용한 UEP설계)

  • 심우성;허도근
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.7A
    • /
    • pp.994-1004
    • /
    • 2000
  • In this paper, bitstreams are composed of using H.263 for a moving picture coding in the band-limited and error-prone environment such as wireless environment. EREC sub-frames are implemented by applying the proposed EREC algorithm in order to be UEP for the real data parts of implemented bitstreams. Because those are able to do resynchronization with a block unit, propagation of the error can be minimized, and the position of the important bits such as INTRADC and MVD can be known. Class is separated using the position of these important bits, and variable puncturing tables are designed by the class informations and the code rates of turbo codes are differently designed in according to the class. Channel coding used the turbo codes, and an interleaver to be designed in the turbo codes does not eliminate redundancy bits of the important bits in applying variable code rates of EREC sub-frames unit and is always the same at the transmitter and the receiver although being variable frame size. As a result of simulation, UEP with the code rate similar to EEP is obtained a improved result in the side of bit error probability. And the result of applying it to image knows that the subjective and objective quality have been improved by the protection of important bits.

  • PDF