• 제목/요약/키워드: Video processing

검색결과 2,159건 처리시간 0.03초

효과적인 인터랙티브 비디오 저작을 위한 얼굴영역 기반의 어노테이션 방법 (Annotation Method based on Face Area for Efficient Interactive Video Authoring)

  • 윤의녕;가명현;조근식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.83-98
    • /
    • 2015
  • TV를 보면서 방송에 관련된 정보를 검색하려는 많은 시청자들은 정보 검색을 위해 주로 포털 사이트를 이용하고 있으며, 무분별한 정보 속에서 원하는 정보를 찾기 위해 많은 시간을 소비하고 있다. 이와 같은 문제를 해결하기 위한 연구로써, 인터랙티브 비디오에 대한 연구가 활발하게 진행되고 있다. 인터랙티브 비디오는 일반적인 비디오에 추가 정보를 갖는 클릭 가능한 객체, 영역, 또는 핫스팟을 동시에 제공하여 사용자와 상호작용이 가능한 비디오를 말한다. 클릭 가능한 객체를 제공하는 인터랙티브 비디오를 저작하기 위해서는 첫째, 증강 객체를 생성하고, 둘째, 어노테이터가 비디오 위에 클릭 가능한 객체의 영역과 객체가 등장할 시간을 지정하고, 셋째, 객체를 클릭할 때 사용자에게 제공할 추가 정보를 지정하는 과정을 인터랙티브 비디오 저작 도구를 이용하여 수행한다. 그러나 기존의 저작 도구를 이용하여 인터랙티브 비디오를 저작할 때, 객체의 영역과 등장할 시간을 지정하는데 많은 시간을 소비하고 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 유사한 샷들의 모임인 샷 시퀀스의 모든 샷에서 얼굴 영역을 검출한 샷 시퀀스 메타데이터 모델과 객체의 어노테이션 결과를 저장할 인터랙티브 오브젝트 메타데이터 모델, 그리고 어노테이션 후 발생될 수 있는 부정확한 객체의 위치 문제를 보완할 사용자 피드백 모델을 적용한 얼굴영역을 기반으로 하는 새로운 형태의 어노테이션 방법을 제안한다. 마지막으로 제안한 어노테이션 방법의 성능을 검증하기 위해서 인터랙티브 비디오 저작 시스템을 구현하여 기존의 저작도구들과 저작 시간을 비교하였고, 사용자 평가를 진행 하였다. 비교 분석 결과 평균 저작 시간이 다른 저작 도구에 비해 2배 감소하였고, 사용자 평가 결과 약 10% 더 유용한다고 평가 되었다.

배터리 교체형 전기자동차의 배터리 위치좌표 획득을 위한 영상처리기술 검증 (Replaceable battery electric car's battery location coordinates image processing techniques for obtaining verification)

  • 김응필;정원재;김정윤;박준석;김태희
    • 정보통신설비학회논문지
    • /
    • 제11권2호
    • /
    • pp.52-57
    • /
    • 2012
  • In this paper describe configuration about QCM system for image processing device. It presents that QCM's image processing board video from the camera recognized by the PLC's battery removable exact location coordinates to the robot image processing technology to deliver. In addition, QCM video image processing technology for improved data reliability is described. In this paper define the landmarks of battery for obtaining the location coordinates and verify battery the location coordinates acquisition process from field tests of the QCM/QTPE-BUS Battery Exchange System.

  • PDF

Caption Extraction in News Video Sequence using Frequency Characteristic

  • Youglae Bae;Chun, Byung-Tae;Seyoon Jeong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.835-838
    • /
    • 2000
  • Popular methods for extracting a text region in video images are in general based on analysis of a whole image such as merge and split method, and comparison of two frames. Thus, they take long computing time due to the use of a whole image. Therefore, this paper suggests the faster method of extracting a text region without processing a whole image. The proposed method uses line sampling methods, FFT and neural networks in order to extract texts in real time. In general, text areas are found in the higher frequency domain, thus, can be characterized using FFT The candidate text areas can be thus found by applying the higher frequency characteristics to neural network. Therefore, the final text area is extracted by verifying the candidate areas. Experimental results show a perfect candidate extraction rate and about 92% text extraction rate. The strength of the proposed algorithm is its simplicity, real-time processing by not processing the entire image, and fast skipping of the images that do not contain a text.

  • PDF

SVC 기반의 위성방송 서비스를 위한 계층 분리형 PES 패킷화 및 처리 기법 (Layer-separable PES Packetization and Processing Scheme for SVC-based Satellite Broadcasting Service)

  • 지원섭;서광덕;김진수;이인기;장대익
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.561-572
    • /
    • 2009
  • 본 논문에서는 SVC 비디오를 기반으로 DVB-S2 위성 방송 서비스를 제공할 때 필요한 효율적인 비디오 계층 분리형 PES 패킷화 및 처리 기법을 제안한다. SVC 부호화 기법은 기존의 MPEG-2, MPEG-4, H.264등과 같은 단일 계층 기반의 부호화 기법과는 달리 다수의 비디오 계층을 하나로 통합하여 단일 비트스트림으로 생성한다. 따라서, 기존의 H.264 기반의 DVB-S2 위성방송 서비스와 달리 SVC 비디오를 적용할 경우 다중의 비디오 계층을 효율적으로 분리하여 처리할 수 있는 패킷화 메커니즘이 요구된다. 본 논문에서는 DVB-S2의 채널 부호화 기법인 LDPC(Low Density Parity Check) 와 SVC 부호화 기법이 결합적으로 적용되어 SVC 비디오의 계층 별로 차등화된 오류 보호 (UEP: unequal error protection)를 적용할 수 있도록 하기 위한 효율적인 PES 패킷화 및 처리 기법을 제안하고 계산량과 처리 지연시간 측면에서 제안된 기법의 효율성을 검증한다.

DRAM을 사용한 고해상도 화상 메모리의 설계 (The Design of High Resolution Video Memory using DRAMs)

  • 박건작
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.247-249
    • /
    • 1988
  • The most space-consuming element of digital image processing system is the video memory. Though this problem is solved by DRAMs, timing constraints posed by video data rates. The cycle time of DRAMs can be diminished by serial transferring and reading or writing pixel datas at the same time. This paper resents the design of 1024${\times}$512 video memory using this technique.

  • PDF

동영상에서 시간 영역 정보를 이용한 자막 검출 알고리듬 (Caption Detection Algorithm Using Temporal Information in Video)

  • 권철현;신청호;김수연;박상희
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권8호
    • /
    • pp.606-610
    • /
    • 2004
  • A noble caption text detection and recognition algorithm using the temporal nature of video is proposed in this paper. A text registration technique is used to locate the temporal and spatial positions of captions in video from the accumulated frame difference information. Experimental results show that the proposed method is effective and robust. Also, a high processing speed is achieved since no time consuming operation is included.

컬러 레이아웃을 이용한 키 프레임 추출 기법 (The Extracting Method of Key-frame Using Color Layout Descriptor)

  • 김소희;김형준;지수영;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(3)
    • /
    • pp.213-216
    • /
    • 2001
  • Key frame extraction is an important method of summarizing a long video. This paper propose a technique to automatically extract several key frames representative of its content from video. We use the color layout descriptor to select key frames from video. For selection of key frames, we calculate similarity of color layout features extracted from video, and extract key frames using similarity. An important aspect of our algorithm is that does not assume a fixed number of key frames per video; instead, it selects the number of appropriate key frames of summarizing a long video Experimental results show that our method using color layout descriptor can successfully select several key frames from a video, and we confirmed that the processing speed for extracting key frames from video is considerably fast.

  • PDF

복수시점영상기술의 경제적 파급효과 분석 (Economic Repercussion Effects of the Multi-View Video Technology)

  • 김수현
    • Journal of Information Technology Applications and Management
    • /
    • 제13권3호
    • /
    • pp.75-87
    • /
    • 2006
  • In this paper. we consider the multi-view video technology. The technology, which is a field of 3-Dimensional video processing, enables the user to watch the various view-point of video. We expect that the technology will be applicable to a lot of video services. The economic effects of new technology are very important concern for the technology developer and the technology development policy makers. We, therefore. propose a general method for the economic repercussion effects of the multi-view video technology. The method is based on the expert opinion and input-output analysis. The results for the multi-view video technology are included.

  • PDF

CMOS 센서를 이용한 휴대용 비디오스코프 및 영상처리 응용환경 개발 (Development CMOS Sensor-Based Portable Video Scope and It's Image Processing Application)

  • 김상진;김기만;강진영;김영욱;백준기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.517-520
    • /
    • 2003
  • Commercial video scope use CCD sensor and frame grabber for image capture and A/D interface but application limited by input resolution and high cost. In this paper we introduce portable video scope using CMOS sensor, USB pen and tuner card (low frame grabber) in place of commercial CCD sensor and frame grabber. Our video scope serves as an essential link between advancing commercial technology and research, providing cost effective solutions for educational, engineering and medical applications across an entire spectrum of needs. The software implementation is done using Direct Show in second version after initial trials using First version VFW (video for window), which gave very low frame rate. Our video scope operates on windows 98, ME, XP, 2000. The drawback of our video scope is crossover problem in output images caused due to interpolation, which has to be rectified for more efficient performance.

  • PDF

동영상 전화기용 다중 스레드 비디오 코딩 프로세서 (Multithread video coding processor for the videophone)

  • 김정민;홍석균;이일완;채수익
    • 전자공학회논문지A
    • /
    • 제33A권5호
    • /
    • pp.155-164
    • /
    • 1996
  • The architecture of a programmable video codec IC is described that employs multiple vector processors in a single chip. The vector processors operate in parallel and communicate with one another through on-chip shared memories. A single scalar control processor schedules each vector processor independently to achieve real-tiem video coding with special vector instructions. With programmable interconnection buses, the proposed architecture performs multi-processing of tasks and data in video coding. Therefore, it can provide good parallelism as well as good programmability. especially, it can operate multithread video coding, which processes several independent image sequences simultaneously. We explain its scheduling, multithred video coding, and vector processor architectures. We implemented a prototype video codec with a 0.8um CMOS cell-based technology for the multi-standard videophone. This codec can execute video encoding and decoding simultaneously for the QCIF image at a frame rate of 30Hz.

  • PDF