• 제목/요약/키워드: Intra mode coding

검색결과 162건 처리시간 0.025초

열영상에서 압축 도메인 정보를 이용한 딥러닝 기반 객체 탐지 방법 (Deep-learning based Object Detection in Thermal Video Using Compressed-Domain Information)

  • 변주형;남건욱;박장수;이종석;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.160-162
    • /
    • 2018
  • 본 논문에서는 압축 영역에서 열 영상을 이용한 딥러닝 기반의 객체 검출 방법을 제안한다. 비디오 압축 표준인 High Efficiency Video Coding(HEVC)를 이용하여 부보화된 비트스트림으로부터 Intra Prediction Mode(IPM), Prediction Unit Size(PUS), Transform Unit Size(TUS)를 추출하고 3 채널 영상으로 변환하고 객체 검출 네트워크인 YOLO 에 입력으로 넣어주어 최종적으로 객체의 위치 및 객체의 종류를 예측한다. 실험결과로써 복원된 열 영상과 검출된 결과를 주관적으로 보여줌으로써 압축영역에서 열영상을 이용한 객체 검출이 가능함을 보인다.

  • PDF

채널 간 선택적 참조 라인 공유 방법 (Selective Reference Line Sharing for Chroma Intra Prediction)

  • 이유진;박지윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.197-198
    • /
    • 2022
  • Versatile Video Coding (VVC)는 차세대 동영상 압축 표준화 과정에서 다수의 부호화 기술을 새롭게 채택하였는데, 이중 Multiple Reference Lines (MRL)을 포함한 일부 기술은 휘도 채널에만 적용될 수 있으며 색차 성분에 대해서는 적용이 고려되지 않는다. 본 논문은 VVC 에서 휘도 채널에만 적용되는 MRL 기술을 색차 채널로 확장하기 위하여, DM(Derived Mode)을 사용하는 색차 블록의 대응 휘도 블록이 MRL 을 사용하는 경우에 해당 참조 라인을 선택적으로 공유하여 색차 블록이 화면 내 예측에 복수개의 참조 라인을 고려하여 선택할 수 있도록 하는 방법을 제안한다. 실험 결과, VVC Test Model (VTM) 15.0 대비 Cb, Cr 성분 각각 -0.09%, -0.05%의 성능 향상을 보인다.

  • PDF

VVC 부호화기의 화면내 부호화 모드 결정 개선 방법 (Enhanced intra prediction mode decision method for VVC)

  • 윤병진;권대혁;최재륜;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.191-193
    • /
    • 2019
  • ISO/IEC JTC1 WG11 Moving Picture Expers Group 과 ITU-T SC16 은 Joint Video Experts Team 을 구성하여 차세대 비디오 부호화 표준으로서 Versatile Video Coding(VVC)를 표준화 중이다. VVC 는 현재 블록의 화면내 예측 모드일 가능성이 높은 모드의 집합인 Most Probable Mode(MPM) 리스트를 유도하고, MPM 을 이용하여 효율적으로 화면내 예측 모드를 부호화한다. VVC 참조 소프트웨어는 주변 블록의 화면내 예측 모드가 일치하는지 여부에 따라 1 개 또는 2 개의 모드를 최종 후보 선택을 위한 과정인 Rate-Distortion Optimization(RDO) 과정에 추가한다. 하지만 현재 MPM 은 항상 첫 번째 후보로 Planar 모드가 위치하며 이로 인하여, 주변 블록의 화면내 예측 모드가 RDO 에 추가되지 않는 경우가 존재한다. 따라서 본 논문은 VVC 의 부호화기에서 주변 블록의 화면내 예측 모드가 고려되지 않는 경우가 존재하는 문제를 해결하기 위한 방법을 제안한다. 제안 방법은 MPM 유도 과정에서 RDO 에 포함할 후보의 개수를 수정하여 RDO 과정에 항상 주변 블록의 화면내 예측 모드가 추가되도록 한다. 본 논문은 실험을 통해 제안 방법이 약 0.04%의 부호화 효율을 향상시켰음을 보인다.

  • PDF

PSNR-based Initial QP Determination for Low Bit Rate Video Coding

  • Park, Sang-Hyun
    • Journal of information and communication convergence engineering
    • /
    • 제10권3호
    • /
    • pp.315-320
    • /
    • 2012
  • In H.264/AVC, the first frame of a group of pictures (GOP) is encoded in intra mode which generates a large number of bits. The number of bits for the I-frame affects the qualities of the following frames of a GOP since they are encoded using the bits remaining among the bits allocated to the GOP. In addition, the first frame is used for the inter mode encoding of the following frames. Thus, the initial quantization parameter (QP) affects the following frames as well as the first frame. In this paper, an adaptive peak signal to noise ratio (PSNR)-based initial QP determination algorithm is presented. In the proposed algorithm, a novel linear model is established based on the observation of the relation between the initial QPs and PSNRs of frames. Using the linear model and PSNR results of the encoded GOPs, the proposed algorithm accurately estimates the optimal initial QP which maximizes the PSNR of the current GOP. It is shown by experimental results that the proposed algorithm predicts the optimal initial QP accurately and thus achieves better PSNR performance than that of the existing algorithm.

초기 CU 크기 예측과 PU 모드 예측 비용을 이용한 고속 CU 결정 알고리즘 (Fast CU Decision Algorithm using the Initial CU Size Estimation and PU modes' RD Cost)

  • 유향미;신수연;서재원
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.405-414
    • /
    • 2014
  • HEVC는 재귀적 쿼드 트리 구조를 갖는 CU를 부호화에 적용함으로써 높은 부호화 효율을 얻었다. 그러나 이러한 재귀적 쿼드 트리 구조는 HEVC의 부호화 복잡도를 매우 증가시키는 결과를 가져왔다. 본 논문에서는 이러한 재귀적 쿼드 트리 구조 안에서 빠른 CU 결정이 가능한 알고리즘을 제안한다. 제안하는 알고리즘은 CTU 부호화가 이루어지기 전에 미리 초기 CU 크기를 예측하고, CU 부호화 과정에서 CBF와 PU 모드 예측 비용을 이용한 조건을 확인하여 고속 CU 결정이 이루어지도록 한다. 또한 인터 PU 모드 예측과정에서 얻은 CBF값들을 이용하여 인트라 모드 예측 생략이 가능하다. 실험결과, 제안한 알고리즘의 조건에 포함된 가중치값에 따라 최대 평균 49.91%, 37.97%의 부호화 시간 감소 효과를 얻을 수 있었다.

저전송률 비디오 압축에서 초기 QP 결정 알고리즘 (Initial QP Determination Algorithm for Low Bit Rate Video Coding)

  • 박상현
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2071-2078
    • /
    • 2009
  • 비디오 코팅에서 첫 번째 프레임은 많은 비트를 발생시키는 인트라 모드로 압축되고 다음 프레임의 인터 모드 압축에 사용되기 때문에 첫 프레임을 위한 초기 QP (Quantization Parameter) 값은 첫 프레임뿐만 아니라 이후 프레임에도 영향을 주게 된다. 일반적으로 초기 QP 값은 bpp 값에 따라 4가지 값 중에 하나로 설정되는데, 저 전송률 비디오 코딩의 경우 전송률에 상관없이 35의 값으로 설정된다. 이렇게 설정하는 것은 간단한 반면 부정확한 문제가 있다. 정확한 초기 QP 값 예측을 위해서는 bpp 뿐만 아니라 영상의 복잡도와 전송률도 함께 고려하여야 한다. 제안하는 알고리즘에서는 전송 대역폭과 최적 초기 QP 값 사이에 존재하는 선형 반비례 관계를 모델링하기 위하여 선형 모델을 사용하였고, 첫 프레임의 공간적 복잡도에 따라 모델 파라미터를 결정하였다. 실험 결과는 제안하는 방법이 기존의 JM 알고리즘에 비해 정확하게 최적의 초기 QP 값을 예측하고 PSNR 성능도 더 우수함을 보여준다.

DV에서 MPEG-2로의 주파수 영역 변환 부호화 (A Frequency Domain DV-to-MPEG-2 Transcoding)

  • 김도년;윤범식;최윤식
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.138-148
    • /
    • 2001
  • 디지털 캠코더에서 이용하는 영상 압축 방식인 DY 부호화 방식은 DCT와 가변장 부호화 방식을 이용한다. DV 방식은 하드웨어 복잡도가 낮은 반면 압축된 비트율이 악 26Mb/s로 높은 편이다. 따라서 스튜디오에서 낮은 복잡도로 영상을 부호화 한 후 VOD 시스템에 이용하기 위하여 MPEG-2로 변환부호화 할 필요가 있다. 이때의 두 압축방식이 DCT를 이용하므로, DCT 영역에서 변환부호화 하면 중간 과정을 줄일 수 있어서 계산상의 복잡도를 줄일 수 있다. DV 방식에서 MPEG-2 인트라로 변환부호화 시에, DV 방식의 4:1:1 색차 포맷을 MPEG-2의 4:2:2 영상 포맷으로 변환할 때 와 2-4-8 DCT 모드에서 8-8 DCT 모드로 변환 시 변환 영역에 있는 데이터에 미리 계산된 행렬을 곱함으로써 병렬처리가 가능하게 하였다. MPEG-2 율제어 시에 서브 블록의 분산을 완전히 DCT 영역에서 계산하였다. 실험을 통하여 제안한 방식들을 검증하였다. MPEG-2 인터 프레임 부호화로 변환 부호화 할 때 DCT 계수를 이용하여 계층적으로 움직임을 추정하였다. 먼저 4개의 서브 블록에 있는 4개의 DC 값으로 하나의 매크로 블록에 대한 움직임을 추정한 다음 각 서브 블록의 저주파수에 해당하는 2×2에 IDCT를 취하여 16 포인트로 구성된 매크로 블록을 만든 후 이에 대한 움직임을 추정하며, 다섯 번째 단계에서 서브 화소에 대한 움직임을 추정함으로써 움직임 추정을 마친다. 탐색영역을 겹치는 방식이 겹치지 않는 방식보다 좋은 PSNR값을 보여 주었다.

  • PDF

기준선 기반 이진 형상 부호화기 (Baseline based Binary Shape Coder)

  • 이시화;조대성;조유신;손세훈;장의선;신재섭;서양석
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.114-124
    • /
    • 1997
  • 이진 영상 부호화는 종래의 영상 처리에 객체 기반 처리 기능을 제공한다. 이진 영상 부호화를 위하여 본 논문에서는 기준선을 기반으로 하는 새로운 이진 영상 부호화 방식을 제안한다. 종래 이진 부호화기와 달리 본 방식은 객체의 외곽선을 추적하면서2차원의 영상 데이터를 1차원으로 변환하여 이를 부호화한다. 추출되는 데이터는 기준선의 시작점과 거리값 리스트 그리고 변환값 리스트이다. 무손실 부호화에서 이들은 모두 부호화되나 손실 부호화에서는 가변 샘플링을 통하여 구간별로 비슷한 손실정도를 갖도록 조정이 되어 선택된 거리값들 만이 부호화 된다. 또한 프레임간의 움직임 보상에서도 거리값과 변환값을 이용하여 빠른 처리 속도를 갖도록 하였다. 실험결과 현재 MPEG-4 잠정표준안에 채택되어 있는 CAE방식에 비하여 객관적 평가에서는 정지영상부호화(intra 모드)에서는 앞서며, 동영상부호화(inter 모드)에서는 떨어지고 있다. 그러나 주관적인 평가에서는 두 경우 모두 좋은 것으로 평가받고 있다.

  • PDF

H.263을 기반으로 한 확장 가능한 비디오 코덱 (H.263-Based Scalable Video Codec)

  • 노경택
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.29-32
    • /
    • 2000
  • 계층화 비디오 코딩은 확장성을 갖기 위해 다중 비디오 스트림 안에 비디오 정보가 전송되도록 한다. 계층화 코딩 구조는 두 가지 면에서 이론상의 장점을 갖는다. 첫째, 클라이언트 프로세싱 능력과 네트워크 대역폭 면에서 네트워크와 수신자의 이질성을 허락한다. 둘째. 여러단계의 비디오 화질이 요구될 때 이용가능한 대역폭에 맞출수 있다. 본 논문에서 우리는 움직임 보상을 이용한 확장가능한 비디오 코덱 구조를 제시한다. 이것은 패킷 네트워크 상에서 실시간 오디오, 비디오 통신에 적합하다. 코딩 알고리즘은 ITU-T 추천 H.263+에 맞추면서 복잡도를 감소시키기 위한 기법들을 제시한다 빠른 움직임 검출은 H.263 베이스 레이어에서 이루어지고 상위계층에서 이용된다. 시각적 성질에 따른 매크로 블록 배제는 움직임 검출에 앞서서 모든 계층에서 이루어진다. 패킷 손실로 인한 에러확산은 주기적으로 각 계층에서 프레임 안에 인트라 블록단위의 행렬을 도입함으로써 차단되어질 수 있다.

  • PDF

다차원 DCT를 이용한 비디오 부호화기 설계 (Design of video encoder using Multi-dimensional DCT)

  • 전수열;최우진;오승준;정세윤;최진수;문경애;홍진우;안창범
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.732-743
    • /
    • 2008
  • 본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.