• 제목/요약/키워드: Video Encoding

검색결과 505건 처리시간 0.019초

다시점 비디오 부호화를 위한 고속 계층적 탐색 기법 (Fast Hierarchical Search Method for Multi-view Video Coding)

  • 윤효순;김미영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권7호
    • /
    • pp.495-502
    • /
    • 2013
  • 영상 화질과 인코더의 속도에 영향을 주는 움직임 추정은 동영상 내에 존재하는 중복된 데이터를 제거하기 때문에 동영상 압축에서 중요한 역할을 하지만 높은 계산 복잡도를 요구한다. 다시점 비디오는 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상으로 다시점 비디오를 위한 움직임 추정은 카메라 수에 비례하여 많은 계산량을 필요로 한다. 본 논문에서는 다시점 비디오 부호화를 위한 움직임 추정의 계산량을 줄이면서 영상 화질을 유지하는 고속 움직임 추정 기법을 제안한다. 제안한 기법은 계층적인 탐색 기법으로 수정된 다이아몬드 탐색 패턴, 다중 다이아몬드 탐색 패턴, 그리고 래스터 탐색 패턴으로 구성된다. 이 탐색 패턴들은 국부적 최소화 문제를 해결하기 위하여 탐색 영역 내에 탐색 점들을 규칙적, 대칭적으로 배치하거나 움직임 벡터의 분포 특성을 이용하여 탐색 점들을 배치한다. 제안한 기법의 성능은 JMVC의 고속 움직임 추정 기법인 TZ 탐색 기법의 성능과 비교한 경우, 영상 화질과 비트량을 비슷하지만 계산량을 줄임으로서 움직임 추정 속도를 약 1.2~3배 향상시킨다.

복호 신뢰도에 기반하여 점진적으로 보조정보를 향상시키는 변환영역 Wyner-Ziv 부호화 방법 (Transform domain Wyner-Ziv video coding with successively improving side information based on decoding reliability)

  • 고봉혁;심혁재;전병우
    • 방송공학회논문지
    • /
    • 제13권6호
    • /
    • pp.892-904
    • /
    • 2008
  • 센서네트워크와 같은 자원한정적인 상황에서의 비디오 부호화가 중요해짐에 따라 경량화 비디오 부호화 문제의 솔루션으로 분산비디오 부호화 기술(DVC: Distributed Video Coding)이 폭넓게 연구되고 있다. 이의 대표적인 기술인 Wyner-Ziv 부호화 기술은, 복호화기에서 영상간 유사도를 이용하여 부호화하는 현재 프레임에 대한 보조정보를 생성하고, 발생하는 잡음을 채널코드를 이용하여 제거함으로써 영상을 복원한다. 따라서 복호화기에서 보조정보를 정교하게 만들수록, 즉 제거되어야 할 잡음이 적게 생성될수록 전체적인 시스템의 부호화 효율이 좋아진다. 하지만 실제로 복호화기가 부호화하는 현재 프레임에 대한 정보 없이 정확도 높은 보조정보를 만드는 것은 상당히 어려운 일이므로, 복호되는 현재 프레임의 정보 및 그 신뢰도에 기반하여 점진적으로 보조 정보를 향상시키는 방법이 개발되었다. 하지만 복호결과를 이용하여 보조정보를 향상시키기 위해서는 복호결과 정보의 에러율에 못지않게 복호결과로부터 유효한 정보의 양 또한 중요하다. 따라서 본 논문에서는 변환영역의 Wyner-Ziv 부호화 기술에서 점진적으로 복호되는 현재 프레임에 대한 정보의 에러율 및 유효한 정보 양을 고려한 신뢰도에 기반하여 점진적으로 보조정보를 향상시키는 부호화 방법을 제안한다. 실험결과는 제안 방법이 점진적 보조정보 향상방법을 사용하지 않는 이전 변환영역 Wyner-Ziv 부호화 방법에 비해 최대 약 1.7 dB에 이르는 성능향상이 있음을 보였다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.

HEVC의 Transform Skip Mode를 위한 Rough Mode Decision 알고리즘 (A Rough Mode Decision Algorithm for Transform Skip Mode in HEVC)

  • 김영조;김재석
    • 전자공학회논문지
    • /
    • 제51권8호
    • /
    • pp.104-113
    • /
    • 2014
  • HEVC(high efficiency video coding) 표준에서 사용되는 기존의 rough mode decision(RMD) 알고리즘은 transform skip mode(TSM)와는 연관성이 낮은 DCT를 기반으로 하는 모드 선택 방법을 이용하고 있다. 따라서 기존 RMD의 결과로 구한 후보 모드가 TSM에서 사용될 때, 압축 효율이 손실되고 인코딩 시간을 낭비하게 된다. 본 논문은 HEVC에서의 TSM을 위한 새로운 RMD를 제안한다. 우리가 제안한 RMD 알고리즘은 TSM에서 최선의 모드를 선택할 확률을 높이는 새로운 비용 함수를 제안하여 코딩 효율을 향상시킨다. 또한, 제안하는 알고리즘은 새롭게 제안한 임계값을 기준으로 선택 가능성이 거의 없는 TSM의 인코딩 과정을 생략하여 인코딩 시간을 줄인다. 실험 결과 제안하는 방식은 HEVC 표준에 비해서 10%의 인코딩 시간을 줄이며 스크린 콘텐츠에 대해서 0.3%의 압축률을 향상시킨다.

H.264 인터모드 결정 방법 개선에 관한 연구 (A Study on an Improved H.264 Inter mode decision method)

  • 공재웅;정재진;황의성;김태형;김두영
    • 융합신호처리학회논문지
    • /
    • 제9권4호
    • /
    • pp.245-252
    • /
    • 2008
  • 본 논문에서는 H 264 인코딩 과정 중 모드 결정 및 움직임 예측 부분의 개선을 위한 새로운 방법을 제안한다. 제안한 방법은 H 264 모드 결정 과정 중 참조 프레임의 선택 과정 생략과 모드 결정 기준의 하나인 SAD 연산과정의 개선을 사용하여 인코딩 과정에서 수행되는 연산량을 감소시켜 인코딩 수행시간을 절감하는 방법이다. 제안하는 방법의 성능 평가를 위하여 H 264 표준에서 제공되는 QCIF 사이즈, YUV 4:2:0 포맷의 영상을 이용하여 실험 영상을 만들어 적용하였다. 본 논문에서 제안한 방법을 적용한 결과 알고리즘 1은 약간의 화질 열화를 보이며 수행시간은 10프레임씩 인코딩 하였을 때 평균 4.7% 감소하였으며, 알고리즘 2는 약 0.98dB정도의 화질 열화를 보이지만 인코딩 수행시간은 평균 9.6% 감소하였다.

  • PDF

파장 코딩된 실시간 슬릿 공초점 현미경의 설계 (Design of spectrally encoded real-time slit confocal microscopy)

  • 김정민;강동균;권대갑
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2005년도 추계학술대회 논문집
    • /
    • pp.576-580
    • /
    • 2005
  • New real-time confocal microscopy using spectral encoding technique and slit confocal aperture is proposed and designed. Spectral encoding technique, which encodes one-dimensional spatial information of a specimen in wavelength, and slit aperture make it possible to obtain two-dimensional lateral image of the specimen simultaneously at standard video rates without expensive scanning units such as polygon mirrors and galvano mirrors. The working principle and the configuration of the system are explained. The variation in axial responses for the simplified model of the system with normalized slit width is numerically analyzed based on the wave optics theory. Slit width that directly affects the depth discrimination of the system is determined by a compromise between axial resolution and signal intensity from the simulation result. On the assumption of the lateral sampling resolution of 50 nm, design variables and governing equations of the system are derived. The system is designed to have the mapping error less than the half pixel size, to be diffraction-limited and to have the maximum illumination efficiency. The designed system has the FOV of $12.8um{\times}9.6um$, the theoretical axial FWHM of 1.1 um and the lateral magnification of-367.8.

  • PDF

Bandwidth-Efficient Live Virtual Reality Streaming Scheme for Reducing View Adaptation Delay

  • Lee, Jongmin;Lee, Joohyung;Lim, Jeongyeon;Kim, Maro
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.291-304
    • /
    • 2019
  • This paper proposes a dynamic-tiling-based bandwidth-efficient (DTBE) virtual reality (VR) streaming scheme. We consider 360-degree VR contents with multiple view points such as the front, back, upper, and bottom sides. At a given time, the focus of a client is always bound to a certain view among multiple view points. By utilizing this perspective, under our proposed scheme, tiles with high encoding rates are selectively assigned to the focused view where multiple view points consist of multiple tiles with different encoding rates. The other tiles with low encoding rates are assigned to the remaining view points. Furthermore, for reducing view adaptation delay, we design a novel rapid view adaptation mechanism that selectively delivers an I-frame during view point updates by using frame indexing. We implement the proposed scheme on a commercial VR test bed where we adopt the MPEG media transport (MMT) standard with high-efficiency video coding (HEVC) tile modes. The measurement-based experiments show that the proposed scheme achieves an average data usage reduction of almost 65.2% as well as average view adaptation delay reduction of almost 57.7%.

사물 인터넷 환경을 위한 스마트 비디오 디바이스의 에너지 제어 모델 (An Energy Control Model of Smart Video Devices for the Internet of Things)

  • 정재원;이명진
    • 한국항행학회논문지
    • /
    • 제19권1호
    • /
    • pp.66-73
    • /
    • 2015
  • 본 논문에서는 사물인터넷 환경에서 저전력 동작과 에너지 하비스팅이 가능한 스마트 비디오 디바이스의 구조와 에너지 제어모델을 제안한다. 스마트 비디오 디바이스는 프로세서, 이미지 센서, 비디오 코덱, 네트워크 제어기 모듈들로 구성된다. 제안하는 에너지 제어 모델은 이미지 센싱, 비디오 부호화, 전송 시 에너지 소비량 출력과 태양전지를 통한 하비스팅 에너지 입력을 이용하여 에너지 버퍼인 배터리 입출력 관계로 정의된다. 화면률, 양자화 계수, 프로세서 동작 주파수를 에너지 레벨과 기능 블록들의 에너지 소비 제어 계수로 사용한다. 제안하는 에너지 제어 모델은 스마트폰 기반으로 에너지 제어 계수들에 따른 에너지 소비량 측정을 통해 검증되었으며, 에너지 하비스팅 기능을 이용한 지속 가능한 스마트 비디오 디바이스 설계에 활용될 수 있다.

채널 부호화된 워터마크 신호에 기반한 MPEG-2 비디오의 전송 오류 검출과 저작권 보호 (Transmission Error Detection and Copyright Protection for MPEG-2 Video Based on Channel Coded Watermark)

  • 배창석
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.745-754
    • /
    • 2005
  • 본 논문에서는 채널 부호화를 통해 MPEG-2 비디오의 전송 오류를 검출하고 저작권을 보호하는데 사용할 수 있는 정보은닉 방법을 제안한다 비디오 데이터의 저작권 정보를 길쌈 부호기로 부호화하여 워터마크 신호를 구하며, 입력 비디오 신호를 MPEG-2 비디오 스트림으로 부호화하는 동안 모든 프레임의 매크로 블록에 워터마크 신호를 은닉한다 복호기에서는 모든 프레임의 매크로 블록으로부터 은닉된 신호를 검출하고 검출한 신호를 이용하여 입력 비디오 스트림에서의 전송 오류의 위치를 판정한다. 동시에 검출한 신호를 저작권 정보로 재구성함으로써 비디오 데이터의 저작권을 주장하는 데 사용할 수 있다. 이 과정에서 채널 복호기는 검출된 워터마크 신호에서의 에러를 정정한다. 제안한 MPEG-2 비디오 코덱을 이용하여 300개의 프레임으로 구성되는 3개의 시퀀스를 대상으로 실험한 결과 제안한 방법이 복호 과정에서 비디오 스트림에서의 전송 오류를 검출할 수 있으며 저작권 정보를 보다 정확히 재구성한다는 것을 보여준다.

분산 동영상 코딩의 코딩 방식에 따른 성능 평가와 공간 계층화 코더로서의 가능성에 대한 연구 (A study on performance evaluation of DVCs with different coding method and feasibility of spatial scalable DVC)

  • 김대연;박광훈;김규헌;서덕영
    • 방송공학회논문지
    • /
    • 제12권6호
    • /
    • pp.585-595
    • /
    • 2007
  • 분산 동영상 코딩 (Distributed video coding)은 Slepian과 Wolf 그리고 Wyner와 Ziv의 정보 이론에 기반을 둔 새로운 동영상 압축 패러다임이다. 수신측의 보조정보를 이용하는 손실 압축인 분산 동영상 코딩은 계산의 복잡도를 디코더쪽으로 옮김으로써 적은 연산량의 동영상 인코딩을 가능하게 한다. RD 성능은 기존의 인트라 프레임 코딩보다 뛰어나지만 움직임 보상 (motion-compensated) 기반 인터 프레임 코딩의 성능에는 미치지 못한다. 본 논문은 DV근의 기본 개념과 구조에 대하여 소개하고 실험을 통하여 코딩 방식에 따른 성능을 비교 분석하며 나아가 공간 계층화 코더로서의 DVC의 성능을 보인다.