• 제목/요약/키워드: video to images

검색결과 1,348건 처리시간 0.025초

다시점 3차원 디스플레이용 비디오 프로세서의 설계 (Design of Video Processor for Multi-View 3D Display)

  • 성준호;하태현;김성식;이성주;김재석
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.452-464
    • /
    • 2003
  • FPGA를 사용하여 실시간 응용 가능한 다시점 3차원 비디오 프로세서를 설계 및 구현하였다. 본 연구에서 설계된 3차원 비디오 프로세서는 최대 16시점으로부터의 2차원 비디오 신호를 입력받아 공간분할방식의 3차원 비디오 신호로 변환해주는 역할을 한다. 3차원 카메라 시스템의 다양한 구조에 대응이 가능하며, 또한 다양한 해상도의 3차원 디스플레이 장치에 대응이 가능하도록 설계하였다. 5개의 FPGA를 사용한 검증보드를 제작하여 3차원 비디오 프로세서의 기능을 검증하였다.

Scalable Big Data Pipeline for Video Stream Analytics Over Commodity Hardware

  • Ayub, Umer;Ahsan, Syed M.;Qureshi, Shavez M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1146-1165
    • /
    • 2022
  • A huge amount of data in the form of videos and images is being produced owning to advancements in sensor technology. Use of low performance commodity hardware coupled with resource heavy image processing and analyzing approaches to infer and extract actionable insights from this data poses a bottleneck for timely decision making. Current approach of GPU assisted and cloud-based architecture video analysis techniques give significant performance gain, but its usage is constrained by financial considerations and extremely complex architecture level details. In this paper we propose a data pipeline system that uses open-source tools such as Apache Spark, Kafka and OpenCV running over commodity hardware for video stream processing and image processing in a distributed environment. Experimental results show that our proposed approach eliminates the need of GPU based hardware and cloud computing infrastructure to achieve efficient video steam processing for face detection with increased throughput, scalability and better performance.

머신러닝 기반의 영상 자동 편집 방법 및 시스템 (Video Automatic Editing Method and System based on Machine Learning)

  • 이승환;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.235-237
    • /
    • 2022
  • 영상 콘텐츠는, 길이에 따라 롱폼 영상 콘텐츠와 숏폼 영상 콘텐츠로 구분된다. 롱폼 영상 콘텐츠는 15분 이상 길이로 생성되며, 편집 없이 촬영 영상의 모든 프레임들이 포함되도록 한다. 숏폼 영상 콘텐츠는 1분이상 15분 이내로, 촬영 영상의 프레임들로부터 일부 프레임만 짧은 길이로 편집할 수 있다. 최근 1인 방송 시장의 성장으로 인하여, 시청자들을 늘리기 위한 숏폼 영상 콘텐츠에 대한 수요가 확대되고 있다. 따라서, 숏폼 영상 콘텐츠를 편집하여 생성하는 콘텐츠 편집 기술에 대한 연구가 필요하다. 본 연구는 영상, 음성, 동작을 포착하여 주요 장면의 숏폼 동영상을 생성하는 기술을 연구한다. 주요 장면의 숏폼 동영상은 머신 러닝을 통해 미리 학습된 하이라이트 추출 모델을 이용한다. 하이라이트 영상을 자동으로 생성하는 영상 자동 편집 시스템 및 방법은 숏폼 영상 콘텐츠의 핵심 기술이다. 머신러닝 기반의 영상 자동 편집 방법 및 시스템 연구는 1인 크리에이터들의 영상 편집에 투입되는 노력과 비용시간을 감소시켜, 경쟁력있는 콘텐츠 활동을 할 수 있도록 기여할 것이다.

  • PDF

장면 전환 검출을 위한 MPEG 비디오 시퀀스로부터 특징 요소 추출 (Feature Extraction for Scene Change Detection in an MPEG Video Sequence)

  • 최윤석;곽영경;고성제
    • 방송공학회논문지
    • /
    • 제3권2호
    • /
    • pp.127-137
    • /
    • 1998
  • 본 논문에서는 효율적인 장면 전환 검출을 위하여 압축된 MPEG 비디오 시퀀스로부터 특징 요소를 추출하는 방법을 제안한다. 제안한 방법은 압축된 MPEG 비디오 시퀀스로부터 일부만을 복원하여 각 DCT 블록의 주요 5개의 AC 계수를 추출하고, 이로부터 각 블록의 에지 정보를 구하여 에지 영상을 얻는다. 제안된 에지 추출 방법에서는 기존의 DC 계수를 이용하여 에지를 검출하는 방법에서 생기는 블러링 (blurring) 문제를 해결할 수 있다. 또한 제안된 방법에 의해 얻어진 에지 영상을 각 프레임의 내용 정보를 포함하고 있으므로 장면 전환 검출뿐만 아니라 내용기반 (content-based) 검색 등에도 효과적으로 이용될 수 있다. 실험 결과, AC 계수를 이용하여 구한 에지 영상은 DC 계수를 이용하여 구한 에지 방법보다 원 영상의 정보를 더 잘 나타내었으며 장면 전환 검출에 효과적으로 적용될 수 있음을 확인하였다.

  • PDF

3D Conversion of 2D Video Encoded by H.264

  • Hong, Ho-Ki;Ko, Min-Soo;Seo, Young-Ho;Kim, Dong-Wook;Yoo, Ji-Sang
    • Journal of Electrical Engineering and Technology
    • /
    • 제7권6호
    • /
    • pp.990-1000
    • /
    • 2012
  • In this paper, we propose an algorithm that creates three-dimensional (3D) stereoscopic video from two-dimensional (2D) video encoded by H.264 instead of using two cameras conventionally. Very accurate motion vectors are available in H.264 bit streams because of the availability of a variety of block sizes. 2D/3D conversion algorithm proposed in this paper can create left and right images by using extracted motion information. Image type of a given image is first determined from the extracted motion information and each image type gives a different conversion algorithm. The cut detection has also been performed in order to prevent overlapping of two totally different scenes for left and right images. We show an improved performance of the proposed algorithm through experimental results.

이머시브미디어를 3DoF+ 비디오 부호화 표준 동향 (Standardization Trend of 3DoF+ Video for Immersive Media)

  • 이광순;정준영;신홍창;서정일
    • 전자통신동향분석
    • /
    • 제34권6호
    • /
    • pp.156-163
    • /
    • 2019
  • As a primitive immersive video technology, a three degrees of freedom (3DoF) $360^{\circ}$ video can currently render viewport images that are dependent on the rotational movements of the viewer. However, rendering a flat $360^{\circ}$ video, that is supporting head rotations only, may generate visual discomfort especially when objects close to the viewer are rendered. 3DoF+ enables head movements for a seated person adding horizontal, vertical, and depth translations. The 3DoF+ $360^{\circ}$ video is positioned between 3DoF and six degrees of freedom, which can realize the motion parallax with relatively simple virtual reality software in head-mounted displays. This article introduces the standardization trends for the 3DoF+ video in the MPEG-I visual group.

디지털 방송에서 HDTV 필수 부가영역 (HDTV Essential Padding Area in Digital Broadcasting)

  • 한찬호;윤인섭
    • 한국멀티미디어학회논문지
    • /
    • 제20권6호
    • /
    • pp.853-864
    • /
    • 2017
  • HD padding area is essential redundancy in HD broadcasting. It is possible to use this padding area for the purpose of improving DTV broadcasting services. For utilization of this area, The bit of a service data was converted to black and white $8{\times}8$ block image. Converted block images are compressed with active video and are delivered to a receiver as only DC coefficients in a video stream. video quality is not effected by the proposed method, and service data was perfectly recovered in receiver without errors by using block average and threshold. The proposed utilization of HD essential padding area can possibly overcome the limited transmission stream rate with the bandwidth of HD broadcasting. If service data in transport or video stram were transferred using this padding area, it is possible to improve video quality with expanded video stream rate. Additionally, because the proposed methods are based on well-established standards, it is also useful for world-wide HD broadcasting systems such as ATSC, DVB, and IPTV.

시점 간 비선형 움직임 블록 예측에 기초한 적응적 다시점 비디오 보상 보간 기법 (Adaptive Multi-view Video Interpolation Method Based on Inter-view Nonlinear Moving Blocks Estimation)

  • 김진수
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.9-18
    • /
    • 2014
  • 최근에 무선 비디오 감사, 무선 비디오 센서 네트워크 그리고 무선 모바일 비디오와 같은 다시점 비디오 서비스에 대한 연구가 활발히 진행되고 있다. 다시점 비디오 신호처리에서 다수 개의 다른 카메라에서 획득되는 영상 사이에 존재하는 높은 상관성을 이용하는 것은 매우 핵심적인 기술이다. 본 논문에서는 카메라들 사이에 상호작용을 요구하지 않고, 다시점 분산 비디오 부호화에 효과적으로 사용할 수 있는 적응적인 다시점 보간 기법을 제안한다. 제안한 방법은 비선형적인 블록 예측, 시차 보상 시점 예측 그리고 비신뢰 블록에 대한 채우기 기법 등으로 구성된다. 모의실험을 통하여 제안한 방식은 기존의 방식에 비해 우수한 성능을 보인다.

키 프레임 기반 스테레오스코픽 변환 방법 (Stereoscopic Conversion based on Key Frames)

  • 김만배;박상훈
    • 방송공학회논문지
    • /
    • 제7권3호
    • /
    • pp.219-228
    • /
    • 2002
  • 본 논문에서는 2D 동영상을 스테레오스코픽(Stereoscopic) 동영상으로 변환하는 새로운 방법을 제안한다. 일반적으로 영상의 운동정보를 이용하여 스테레오스코픽 영상을 생성한다. 그러나 얻어진 운동 정보는 신뢰도가 낮을 수가 있고, 이것은 스테레오스코픽 영상 생성 단계에서 오류 발생의 원인이 된다. 상기 문제점의 해결 방안으로 운동 벡터 정보의 신뢰도가 높고 추정된 운동 유형이 정확한 키 프레임(Key Frame)을 활용하는 스테레오스코픽 변환 방법을 제안한다. 또한 각 운동 유형에 따른 스테레오스코픽 변환 방법을 소개한다. 제안한 스테레오스코픽 변환 방법의 성능 검증을 위해 다양한 실험 영상에 적용하고 키 프레임의 운동유형의 정확도를 측정하였다. 실험에서는 평균 90%이상의 키 프레임과 그 운동 유형을 정확히 찾는 성능을 얻었다.

MPEG 비디오의 특성 추출을 이용한 효과적인 장면 전환 검출 기법 (Effective scene change detection methods using characteristics of MPEG video)

  • 곽영경;최윤석;고성제
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1567-1576
    • /
    • 1999
  • 본 논문에서는 압축되어 있는 MPEG 비디오 시퀀스로부터 DCT의 AC 계수를 이용한 에지 영상을 구하여 급격한 장면의 전환을 검출하는 방법과 매크로블록 타입 정보를 이용하여 점진적 장면 전환인 디졸브(dissolve) 구간을 검출하는 기법을 제안하였다. 에지 추출에 기반한 장면 전환 검출 기법은 밝기의 변화에 덜 민감하며, AC 성분을 이용하면 DC 성분을 이용한 경우보다 원영상을 더욱 잘 표현하는 에지를 추출할 수 있으므로, 보다 정확한 장면 전환을 검출할 수 있다. 제안한 디졸브 검출 기법에서는 영상을 복원하지 않고, MPEG 비트스트림 내의 매크로블록 타입 정보로부터 계산된 인트라 매크로 블록의 개수를 이용하기 때문에 적은 계산량으로 디졸브를 검출할 수 있다. 제안한 장면 전환 검출 방법은 기존의 방법들에 비해서 성능이 우수함을 실험을 통해 입증하였다.

  • PDF