• 제목/요약/키워드: Video generator

검색결과 49건 처리시간 0.022초

텍스트-비디오 검색 모델에서의 캡션을 활용한 비디오 특성 대체 방안 연구 (A Study on the Alternative Method of Video Characteristics Using Captioning in Text-Video Retrieval Model)

  • 이동훈;허찬;박혜영;박상효
    • 대한임베디드공학회논문지
    • /
    • 제17권6호
    • /
    • pp.347-353
    • /
    • 2022
  • In this paper, we propose a method that performs a text-video retrieval model by replacing video properties using captions. In general, the exisiting embedding-based models consist of both joint embedding space construction and the CNN-based video encoding process, which requires a lot of computation in the training as well as the inference process. To overcome this problem, we introduce a video-captioning module to replace the visual property of video with captions generated by the video-captioning module. To be specific, we adopt the caption generator that converts candidate videos into captions in the inference process, thereby enabling direct comparison between the text given as a query and candidate videos without joint embedding space. Through the experiment, the proposed model successfully reduces the amount of computation and inference time by skipping the visual processing process and joint embedding space construction on two benchmark dataset, MSR-VTT and VATEX.

Transforming Text into Video: A Proposed Methodology for Video Production Using the VQGAN-CLIP Image Generative AI Model

  • SukChang Lee
    • International Journal of Advanced Culture Technology
    • /
    • 제11권3호
    • /
    • pp.225-230
    • /
    • 2023
  • With the development of AI technology, there is a growing discussion about Text-to-Image Generative AI. We presented a Generative AI video production method and delineated a methodology for the production of personalized AI-generated videos with the objective of broadening the landscape of the video domain. And we meticulously examined the procedural steps involved in AI-driven video production and directly implemented a video creation approach utilizing the VQGAN-CLIP model. The outcomes produced by the VQGAN-CLIP model exhibited a relatively moderate resolution and frame rate, and predominantly manifested as abstract images. Such characteristics indicated potential applicability in OTT-based video content or the realm of visual arts. It is anticipated that AI-driven video production techniques will see heightened utilization in forthcoming endeavors.

UHD급 영상패턴 제어를 위한 전송선로의 신호 왜곡현상 분석 (Analysis of Signal Distortion for Ultra High Definition Video Pattern Control)

  • 손희배;진종호;이영철
    • 한국전자통신학회논문지
    • /
    • 제9권10호
    • /
    • pp.1197-1205
    • /
    • 2014
  • 최근 초고화질(4K-UHD) 영상 시스템의 신호전송은 비압축 고속 데이터로 전송되며 고속 신호의 인터페이스 구간에 서로 다른 케이블 사이에서 나타나는 EMI, 스큐(skew) 문제로 인하여 영상신호의 왜곡, 지터 등으로 시스템 구현에 한계가 있다. 이와 같이 비압축 고속 데이터를 고속전송하기 위하여 V-by-One HS 인터페이스 기법을 적용하여 본 논문에서는 고속 영상신호에 대하여 HSD(High Speed Differential) 전송선로의 신호무결성을 분석하였다. UHD 영상패턴 제어 인터페이스의 PCB 설계 방법을 RF 전송기법으로 적용하였으며 구현된 4K-UHD급 영상패턴 제어 신호발생기의 V-by-One HS 영상신호를 측정한 결과, 전송품질이 고속전송신호규격에 만족함을 보였다.

EWS급 Poly-Si TFT-LCD의 구동 시스템 설계 (Driving System Design for Poly-Si TFT LCD of EWS)

  • 권병헌;박종관;조규민;최명렬
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.3120-3122
    • /
    • 1999
  • In this paper we have designed the signal processing system for driving the Poly-Si TFT LCD of EWS. The signal processing system consist of timing controller, ramp signal generator and video signal processing system. Timing controller includes the top-down inversion. left right inversion, left-right shifting and control signal generator according to multi-source signal. The video signal processing system generates sawtooth-shaped waveform by using PROM and DAC for multi-gray scales and implements gamma correction function for compensating the TFT-LCD nonlinear charcteristic of the TFT-LCD. Finally we have discussed the experiment results and its application according to the designed TFT-LCD driving system.

  • PDF

샷 경계 검출을 이용한 영상 클립 생성 (Generation of Video Clips Utilizing Shot Boundary Detection)

  • 김혁만;조성길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.582-592
    • /
    • 2001
  • 대용량 영상을 다루는 디지털 비디오 라이브러리나 웹 방송에서는 영상 색인이 매우 중요한 역할을 하며, 이는 영상을 내용 단위로 분할하는 알고리즘에 기반한다. 본 논문에서 구현된 V2Web Studio는 영상 색인을 지원하는 시스템으로서, 샷 경계 검출 알고리즘을 이용한 영상 클립 생성 시스템이다. V2Web Studio는 영상 클립 생성 과정을 1) 영상 신호를 분석하여 샷 경계를 자동 검출하는 단계, 2) 검출된 결과에 포함될 수 있는 오류를 수작업으로 제거하는 단계, 3) 물리적인 샷 경계를 논리적인 계층구조로 모델링하는 단계, 4) 계층구조로 모델링된 각 모델링 인스턴스를 다양한 표준 압축 포맷으로 생성하는 단계로 구분하고, 각 단계에 해당하는 작업은 샷 검출기, 샷 검증기, 영상 모델기, 클립 생성기라는 독립적인 소프트웨어 도구로 구현하였다.

  • PDF

비디오 디스플레이 유니트용 고압발생 장치의 전압변동에 관한 연구 (A Study on the Voltage Regulation of High Voltage Generator for Video Display Unit.)

  • 지철근;박지식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(I)
    • /
    • pp.706-709
    • /
    • 1987
  • In this paper, the circuit analysis during the retrace period of E.H.T. generator is performed by means of the simplified equivalent circuit. The E.H.T. voltage and the beam current are computed by using Newton-Raphson method and the computed results are compared with those of experiment.

  • PDF

A Design of A Multistandard Digital Video Encoder using a Pipelined Architecture

  • Oh, Seung-Ho;Park, Han-Jun;Kwon, Sung-Woo;Lee, Moon-Key
    • Journal of Electrical Engineering and information Science
    • /
    • 제2권5호
    • /
    • pp.9-16
    • /
    • 1997
  • This paper describes the design of a multistandard video encoder. The proposed encoder accepts conventional NTSC/PAL video signals, It also processes he PAL-plus video signal which is now popular in Europe. The encoder consists of five major building functions which are letter-box converter, color space converter, digital filters, color modulator and timing generator. In order to support multistandard video signals, a programmable systolic architecture is adopted in designing various digital filters. Interpolation digital filters are also used to enhance signal-to-noise ratio of encoded video signals. The input to the encoder can be either YCbCr signal or RGB signal. The outputs re luminance(Y), chrominance(C), and composite video baseband(Y+C) signals. The architecture of the encoder is defined by using Matlab program and is modelled by using Veriflog-HDL language. The overall operation is verified by using various video signals, such as color bar patterns, ramp signals, and so on. The encoder contains 42K gates and is implemented by using 0.6um CMOS process.

  • PDF

UHD급 영상패턴 제어 신호발생기를 위한 고속 시리얼 인터페이스의 신호 무결성 분석 (Analysis of Signal Integrity of High Speed Serial Interface for Ultra High Definition Video Pattern Control Signal Generator)

  • 손희배;권오근
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.726-735
    • /
    • 2014
  • 최근 초고화질(UHD) 영상시스템의 출현으로 인해 고해상도, 대용량의 4K-UHD급 LCD TV 신호 전송은 높은 해상도와 데이터 확장에 따른 케이블 및 커넥터 수의 증가로 서로 다른 케이블 간의 EMI, 스큐(Skew) 문제로 시스템 구현에 한계가 있다. 차세대 V-by-One HS 인터페이스는 초고해상도 영상처리 IC 및 TCON 간의 새로운 인터페이스 기술로써 600Mbps에서 3.75Gbps의 다양한 데이터 속도로 효율적인 전송이 가능하여 한계를 극복할 수 있다. 본 논문에서는 V-by-One HS IBIS(Input/Output Buffer Information Specification) 모델 시뮬레이션을 통하여 주파수 공진모드의 전압 분포와 PCB 설계 방법을 제안하고 고속영상 신호에 대한 신호 무결성의 검증 방법을 제안하였다.

스포츠 중계를 위한 자막 인식 시스템 개발 (Development of a Video Caption Recognition System for Sport Event Broadcasting)

  • 오주현
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.94-98
    • /
    • 2009
  • 메이저리그 야구 중계 등 해외 스포츠 중계제작에서 해결해야 할 문제 중 하나는 MPH(miles per hour)와 같이 영미식 단위로 표시된 자막을 국내 실정에 맞게 km/h 등으로 변환하는 것이다. 이를 위해 중계화면에 표시된 자막영역의 변화로부터 해당 자막이 표시되었음을 감지하고 숫자 정보를 인식하여 이를 국내실정에 맞는 SI 단위로 변환하는 스포츠 자막 인식 시스템을 개발하였다. 변환된 자막은 후단의 문자발생기 (CG) 시스템으로 전달되어 최종적으로 TV 화면에 표시된다. 일반적으로 문자 인식에 주로 사용되는 신경망(neural networks) 기반 방식은 사전에 유사 데이터를 이용한 신경망의 학습(training) 과정이 필수적으로 요구되며, 또한 학습에 사용된 데이터와 다른 모양의 자막이 예고 없이 사용되었을 경우 대처할 수 없다는 단점이 있다. 생방송이라는 사용 환경을 고려하여 새로운 폰트로 제작된 자막에도 신속하게 대처할 수 있는 템플릿 매칭(template matching) 방식을 사용하였다. 여러 가지 실험 영상으로 테스트한 결과 97% 이상의 정확한 인식 결과를 얻었으며, 정확성을 요하는 생방송의 특성상 매칭의 확신도(confidence)가 높지 않은 경우에는 작업자가 판단한 후 핫키를 이용하여 정확한 자막을 출력할 수 있게 하였다.

  • PDF

세포융합시 전계하에서 식물세포가 받는 영향에 관한연구 (Effect of the Electric Field on the Plant Protoplasts During Cell Fusion)

  • 이상훈;이연민;차현철
    • 대한의용생체공학회:의공학회지
    • /
    • 제17권2호
    • /
    • pp.173-178
    • /
    • 1996
  • The objective of this paper is to investigate the effect of AC field on the protoplast of plant cells. The results of investigation will be the basis for the development of etectric cell fusion device. For the experiment, we made the electrode and AC and DC pulse generator and observed the behavior of the protoplasts through the inverted microscope which is connected to the monitor and video recorder by the CCD camera. As a result, the numbers of rotating, moving and destructed protoplasts and viability of the protoplasts have close relation to the amplitude of AC field, while the rotation rate is closely related to the frequency of AC pulse.

  • PDF