• 제목/요약/키워드: VIDEO ENCODER

검색결과 447건 처리시간 0.03초

슬라이스 경쟁 방식을 이용한 고속 블럭 정합 알고리즘 (A fast block-matching algorithm using the slice-competition method)

  • 정영훈;김재호
    • 대한전자공학회논문지SP
    • /
    • 제38권6호
    • /
    • pp.692-702
    • /
    • 2001
  • 본 논문에서는 표준화 영상부호화기에서 사용할 수 있는 새로운 블럭정합 방식을 제안하였다. 제안방식은 기존 방식처럼 광역-협역 탐색방식을 사용하는 방식이 아닌, 미리 선정된 각 후보에 대하여 SAD 누적추이를 사용하여 움직임 벡터를 찾는 방식이다. 확산누적배열(dispersed accumulation matrix)의 제안으로 SAD 추이곡선의 선형성(linearity)을 높여서 누적 초기에 가능성 낮은 후보를 제거하였다. 이를 토대로 고속 슬라이스 경쟁 블럭정합 방식을 제안하였다. 후보선출단계와 후보경쟁단계를 통하여 최종 움직임 벡터를 생성하였으며, 국부최소값에 빠질 확률을 줄이는 동시에 불필요한 연산을 감소시켰다. 기존의 고속 블럭정합 방법들에 비하여 연산량은 10%∼70%가 줄었으며, 18%∼35%의 실제 수행시간이 감소되었다. 평균 MAD는다양한 테스트영상에 대하여 항상 우수하였으며, 전역탐색의 결과에 가장 가까운 결과를 나타내었다.

  • PDF

효율적인 블록 스킵 기술들을 이용한 H.264에서의 고속 모드 결정 알고리즘 (Fast Mode Decision Algorithm Using Efficient Block Skip Techniques for H.264 P Slices)

  • 조영섭;정제창
    • 한국통신학회논문지
    • /
    • 제35권2C호
    • /
    • pp.193-202
    • /
    • 2010
  • 본 논문에서 우리는 H.264의 인터모드 결정에 대한 복잡도를 줄일 수 있는 고속 알고리즘을 제안한다. 주된 아이디어는 두 가지 기술들로 구성된다. 첫 번째 기술은 모드 결정과정을 조기에 끝내는 기술이다. 우리는 여기서 스킵 모드와 $16{\times}16$ 모드에 초점을 맞춘다. 왜냐하면 이 두 모드가 대부분의 시퀀스에서 최적 모드가 될 확률이 가장 크기 때문이다. 두 번째 기술은 불필요한 $8{\times}8$ 모드를 스킵하는 기술이다. $8{\times}8$ 모드를 계산하는데 걸리는 시간은 상당히 크다. 그러므로 만약 우리가 불필요한 $8{\times}8$ 모드의 계산을 제거할 수 있다면, 전체 인코딩 과정에서 많은 양의 시간이 절약 될 수 있다. 실험 결과는 제안한 알고리즘이 PSNR 손실이 거의 없이 43% 가량의 시간을 절약할 수 있음을 보여주었다. 또한 코딩된 전체 비트수의 증가도 별로 크지 않았다.

HDTV 인코더용 적응적 다중채널 율제어 방식 연구 (Study of an Adaptive Multichannel Rate Control Scheme for HDTV Encoder)

  • 남재열;강병호;이호영;하영호
    • 방송공학회논문지
    • /
    • 제2권1호
    • /
    • pp.56-64
    • /
    • 1997
  • HDTV의 경우 기존의 DTV에 비해 약 4∼6 배의 많은 화소수를 처리해야 하므로 HDTV의 한 프레임을 몇개의 분할화면으로 나누어서 각각의 분할화면을 병렬처리하는 방식을 많이 이용하고 있다. 본 논문에서는 HDTV한 프레임을 4개의 분할화면으로 나누어서 처리하는 시스템 구조를 채택하고, 국부분산을 이용한 새로운 장면전환 검출 방식을 제안하였으며 또한 장면전환 검출시 계산된 각각의 분할화면 영상의 활동도를 이용하여 적응적으로 비트를 할당하는 새로운 적응적 다중채널 율제어 방식을 제안하였다 시뮬레이션 결과 제안된 장면전환 검출방식은 HDTV동영상의 장면전환을 정확히 검출하였으며, 제안된 적응적 다중채널 율제어 방식은 각 밴드별로 일정하게 비트할당을 한 것과 비교하였을 때 우수한 성능을 보여주었다.

  • PDF

H.264/AVC 기반의 스테레오 영상 디스플레이 시스템 (Stereoscopic Video Display System Based on H.264/AVC)

  • 김태준;김지홍;윤정환;배병규;김동욱;유지상
    • 한국통신학회논문지
    • /
    • 제33권6C호
    • /
    • pp.450-458
    • /
    • 2008
  • 본 논문에서는 양안시차를 이용한 스테레오 영상의 부호화 기법을 H.264/AVC 기반으로 스테레오 영상을 실시간으로 전송하기 위한 효과적인 시스템을 제안한다. OpenCV를 이용하여 스테레오 웹캠으로부터 영상을 획득하고, 전처리 과정으로 입력 시스템을 통해 획득한 스테레오 영상을 YUV 4:2:0 파일 포맷으로 변환한다. 변환된 파일은 스테레오 부호화기로 입력되고 제안된 예측구조에 의해 부호화기의 복잡도를 감소시킴으로써 초당 30프레임 이상의 부호화 속도로 부호화 된다. 부호화된 비트스트림 파일은 복호화기에 입력되어 좌, 우 스테레오 영상으로 재 생성된다. 재 생성된 스테레오 영상은 입체영상으로 합성되어 3D 디스플레이 장치를 통해 사용자에게 보여지게 된다. 제안된 시스템은 기존의 스테레오 코덱을 사용했을 때 보다 최소 1.5dB에서 최대 3dB의 압축효율이 뛰어남을 본 실험을 통하여 검증 및 확인하였다. 본 연구는 저 대역폭, 저 전력의 실시간 전송을 위한 모바일환경에 응용이 가능할 것으로 기대된다.

터보부호화된 새로운 T-DMB 시스템 제안 및 성능 분석 (Propose and Performance Analysis of Turbo Coded New T-DMB System)

  • 김한종
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.269-275
    • /
    • 2014
  • Eureka 147 디지털오디오방송(DAB) 시스템은 CD 품질의 오디오 전송을 위하여 유럽에서 개발되었으나 한국에서는 이러한 DAB 시스템을 기반으로 하여 오디오뿐 만 아니라 비디오 신호도 전송할 목적으로 지상파 디지털 멀티미디어방송(T-DMB) 시스템을 개발하였다. 이러한 T-DMB 시스템의 성능 향상을 목적으로 본 논문에서는 양립성을 위해 기존 T-DMB 시스템 표준안에 정의된 펑쳐링 절차와 평처링 벡터를 이용하면서 터보 부호가 적용된 2가지 형태의 새로운 터보부호화된 T-DMB 시스템 모델을 제시한다. 첫 번째 모델 (Type 1)은 기존의 RS 코드, 콘볼류션 인터리빙, RCPC 코드를 터보코드로 대체시킨 것이며 두 번째 모델(Type 2)은 기존 RCPC 만을 터보부호로 대체시킨 모델이다. 시뮬레이션 결과 제안된 모델은 단지 2회 반복만으로도 상당한 성능 향상을 얻을 수 있음을 알 수 있었으며 또한 두 번째 모델은 첫 번째 모델에 비해 약간 우수한 성능을 보이고 있다.

H.264/AVC에서 PSNR 예측을 이용한 고속 매크로블록 모드 결정 방법 (A Fast Macroblock Mode Decision Method using PSNR Prediction for H.264/AVC)

  • 박성재;명진수;심동규;오승준
    • 방송공학회논문지
    • /
    • 제13권1호
    • /
    • pp.137-151
    • /
    • 2008
  • H.264/AVC는 새로운 부호화 기술을 이용하여 기존의 비디오 표준보다 높은 압축 효율을 나타내고 있다. 특히 다양한 블록 크기의 움직임 예측 방법과 비트율-왜곡 최적화 기법은 H.264/AVC에서 중요한 부호화 기술로써 높은 압축 효율을 나타내고 있지만 부호화기의 높은 복잡도를 보이는 단점이 있다. 본 논문에서는 H.264/AVC 부호화기의 높은 복잡도를 줄이기 위하여 조기 SKIP 모드 결정 방법과 선택적 인터/인트라 예측 모드 결정 방법을 제안한다. 실험결과 제안방법은 JM10.2에 비해 전체적인 영상에서 평균적으로 약 30%의 부호화 시간을 감소시켰으며, 부호화 효율의 손실은 무시할 정도로 작았다. 또한 제안 방법은 이전에 제안되었던 고속의 모드 결정 방법(FCMS)[5]과 비교하여 2배 이상의 속도 이득을 나타내었다.

시공간적 상관성을 이용한 움직임 벡터 예측 기반의 FASCO 블럭 정합 알고리즘 (The FASCO BMA based on Motion Vector Prediction using Spatio-temporal Correlations)

  • 정영훈;김재호
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1925-1938
    • /
    • 2001
  • 본 논문에서는 표준 비디오 부호화기를 위한 블럭 정합 방식을 제안하였다. 일반적으로 기존 방식에 사용되는 광역-협역 방식이 아닌 \"슬라이스 경쟁\`이라는 새로운 개념이 도입되었다. 기존의 SAD의 누적 방식인 순차 방식에서 확산 방식으로 변경함으로써 SAD증가 추이의 선형성이 확보되므로, 누적 초기에 움직임 벡터로서 가능성이 낮은 후보들을 미리 제거하여 불필요한 계산량을 줄이는 방식이다. 그리고 움직임 벡터 예측방식과 적응적 탐색 영역개념을 도입하여 블럭 정합 방식을 효율적으로 지원하였다. 이 두 방식의 도입으로 약 13%의 계산량 감소가 발생하였으며, 최종적으로 기존의 고속 블럭 정합 방식들과 비교하면 39%~77%의 SAD 누적 횟수가 감소되었다. 그리고 다양한 테스트 영상에 대하여, 평균 MAD는 항상 낮으며, 전역 탐색 블럭 정합 방식에 가장 근접한 결과를 얻었다. 얻었다.

  • PDF

움직임벡터의 거리를 고려한 H.264 to MPEG-2 Transcoding (H.264 to MPEG-2 Transcoding considering Distance of Motion Vectors)

  • 손남례;정민아;이성로
    • 한국통신학회논문지
    • /
    • 제35권5C호
    • /
    • pp.454-463
    • /
    • 2010
  • H.264표준으로 압축된 동영상들은 IPTV, DMB, 디지털콘텐츠서비스 등 다양한 응용분야에 사용되고 있다. 기존 MPEG-2표준으로 압축된 동영상들은 H.264표준을 따르는 디바이스에 적합한 트랜스코딩 방법들이 연구되어왔다. 반대로 H.264표준으로 압축된 동영상은 MPEG-2표준 디바이스를 사용하고 있는 사용자들은 시청할 수 없게 되었다. 따라서 본 논문에서는 MPEG-2표준 디바이스를 사용하고 있는 사용자들은 H.264표준을 이용할 수 있는 H.264 to MPEG-2 트랜스코딩을 제안한다. 제안한 알고리즘은 H.264부호기의 특징인 가변블록의 움직임벡터를 MPEG-2의 매크로블록에 적합한 한 개의 움직임벡터를 예측하여 MPEG-2부호기의 계산량을 향상시키는 방법을 제안한다. 이때 H.264표준의 매크로블록안에 존재하는 다양한 움직임벡터들 간의 거리에 따라 MPEG-2부호기에서 최적의 움직임벡터를 예측한다. 실험결과, 제안한 방법의 PSNR은 MPEG-2 부호기의 "전역탐색"과 거의 비슷하면서, 부호화 계산 시간은 평균적으로 약 68% 감소하였다.

인터랙티브 미디어 플랫폼 콕스에 제공될 4가지 얼굴 변형 기술의 비교분석 (Comparison Analysis of Four Face Swapping Models for Interactive Media Platform COX)

  • 전호범;고현관;이선경;송복득;김채규;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.535-546
    • /
    • 2019
  • Recently, there have been a lot of researches on the whole face replacement system, but it is not easy to obtain stable results due to various attitudes, angles and facial diversity. To produce a natural synthesis result when replacing the face shown in the video image, technologies such as face area detection, feature extraction, face alignment, face area segmentation, 3D attitude adjustment and facial transposition should all operate at a precise level. And each technology must be able to be interdependently combined. The results of our analysis show that the difficulty of implementing the technology and contribution to the system in facial replacement technology has increased in facial feature point extraction and facial alignment technology. On the other hand, the difficulty of the facial transposition technique and the three-dimensional posture adjustment technique were low, but showed the need for development. In this paper, we propose four facial replacement models such as 2-D Faceswap, OpenPose, Deekfake, and Cycle GAN, which are suitable for the Cox platform. These models have the following features; i.e. these models include a suitable model for front face pose image conversion, face pose image with active body movement, and face movement with right and left side by 15 degrees, Generative Adversarial Network.

Attention-Based Heart Rate Estimation using MobilenetV3

  • Yeo-Chan Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.1-7
    • /
    • 2023
  • 딥러닝의 발전은 의료 분야에서도 다양한 응용을 가능하게 하고 있으며 이러한 애플리케이션 중에 심박수 측정은 개인의 건강을 관리하기 위한 필수적인 아이템이라 할 수 있다. 광혈류 측정을 이용한 기존 방법의 경우 스마트워치 같은 장비의 착용이 필수적이다. 그러나 최근 딥러닝 기술의 발전은 비침습식으로 원격에서 사용자의 얼굴 이미지를 분석하여 심박수를 높은 성능으로 측정가능하게 한다. 본 연구에서는 모바일 환경에서 사용 가능한 경량화된 심박수 추정 방법론을 제안한다. 이 방법론은 2D 컨볼루션에 기반한 특화된 2채널 네트워크 구조를 사용하여, 혈류와 근육 수축으로 인한 얼굴의 미세한 움직임과 색상 변화를 고려한다. 제안하는 네트워크 구조는 이미지 특성을 분석하는 인코더와 혈류량 파동을 예측하는 회귀 레이어로 구성되어있다. 이러한 복합적인 특성을 동시에 분석함으로써, 제한된 컴퓨팅 리소스를 가진 환경에서도 심박수를 정확하게 추정할 수 있다. 이 연구의 접근 방식은 침습적인 기술 없이도 심박수를 효과적으로 모니터링 할 수 있는 새로운 경로를 제공할 것으로 예상한다.