• 제목/요약/키워드: CODEC

검색결과 694건 처리시간 0.027초

H.264에서 성능향상을 위한 Uni-directional 8X8 인트라 예측 (Uni-directional 8X8 Intra Prediction for H.264 Coding Efficiency)

  • 국승용;박광훈;이윤진;심동규;정광수;최해철;최진수;임성창
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.589-600
    • /
    • 2009
  • 본 논문은 초 고화질급(UHD) 영상으로 디지털화 되어 가는 시대에 대응하기 위하여, 현재 우리가 사용하고 있는 최신 코덱의 하나인 H.264 코덱 구조에서 인트라 예측 성능을 향상토록 한 Uni-directional $8{\times}8$ 인트라 예측 기반 코덱을 개발하여 앞으로의 동영상 압축 개발에 기여하고자 한다. Uni-directional $8{\times}8$ 인트라 예측은 $8{\times}8$ 픽셀 단위의 인트라 예측 시 $4{\times}4$ 픽셀 단위로 나누어 같은 인트라 예측방향을 사용하면서 $4{\times}4$ 픽셀 단위로 재구성된 영상을 통하여 예측을 세밀하게 할 수 있게 하는 아이디어를 기반으로 한다. 본 논문에서 제안한 Uni-directional $8{\times}8$ 인트라 예측은 H.264 코덱 구조에서 기존의 $8{\times}8$ 인트라 예측만을 수행한 코딩 결과와 비교할 경우 QCIF, CIF에서 약 7.3% BDBR 성능 향상을 가져오며, 현재의 H.264 코덱 구조에 더하여 적용하였을 경우, 약 1.3% BDBR 성능 향상을 가져왔다. 더 큰 영상 사이즈를 압축하기 위해서는 지금 영상 사이즈에 최적화 된 코덱을 그대로 쓰기보다는 지금보다 더 큰 블록 사이즈를(현재는 $4{\times}4$ 블록 단위가 최소 단위) 기준으로 할 수도 있기 때문에 새로운 코덱기술 개발에 있어 기초 연구가 될 수 있을 것이다.

차세대 지상파 4K UHD & HD 융합방송을 위한 전송 시스템 개발에 관한 연구 (A Study of Development of Transmission Systems for Next-generation Terrestrial 4K UHD & HD Convergence Broadcasting)

  • 오종규;원용주;이진섭;김용환;백종호;김준태
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.767-788
    • /
    • 2014
  • 세계적으로 아날로그 방송에서 디지털 방송으로의 전환이 마무리되고 있는 가운데, 앞으로 다가올 UHDTV 등 실감의 대용량 방송 및 방송 통신 융합 환경에 대비하기 위한 새로운 차기 방송 표준에 관한 연구의 필요성이 날로 높아져 가고 있다. 특히, 저해상도 서비스에 머물러 있던 모바일 방송에서는 기존 HD급의 서비스 제공이 가능한 모바일 실감방송으로 진화하기 때문에 고정/이동 방송 서비스가 동시에 가능한 고효율 전송 원천 기술 개발이 이루어질 필요가 있다. 이에 최근 지상파 단일 채널을 통해 4K UHD (거치형) & HD (모바일) 방송 서비스를 동시에 제공하는 융합방송 시스템 개발에 대해서 연구가 진행되고 있다. 본 논문에서는 최신의 디지털 방송 전송 기법 및 영상 압축 기술에 대해서 소개하고, 지상파 단일 채널을 통해 4K & HD 융합방송 서비스를 제공하기 위한 서비스 모델 및 전송 요구 사항들에 대해서 분석한다. 이 후 최신의 방송 전송 기법 및 영상 압축 기술을 적용하였을 때, 6MHz & 8MHz 대역폭에서 지상파 4K UHD & HD 융합방송을 전송하기 위해 필요한 최적의 전송 파라메터를 도출하고 이를 이용해 AWGN 및 TU-6 채널에서의 융합방송 수신 성능을 검증하였다. 이를 통해 6MHz 대역폭에서의 원활한 HD 모바일 데이터의 수신이 140 Km/h 수신기 속도까지는 가능하나, 그 이상에서는 대역폭의 한계로 인해 원활한 수신이 이루어지지 않음을 확인하였다. 그리고 대역폭을 8 MHz로 확장할 경우, 매우 빠른 다중경로 페이딩 채널에서도 4K UHD 및 HD 계층 데이터의 수신이 원활히 이루어지는 것을 보였다.

DMB 서비스를 위한 DCT 기반 MPEG-2/H.264 비디오 트랜스코더 시스템 구조 (DCT-domain MPEG-2/H.264 Video Transcoder System Architecture for DMB Services)

  • 이주경;권순영;박성호;김영주;정기동
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.637-646
    • /
    • 2005
  • DMB 서비스를 위해 제공되는 대부분의 비디오 컨텐츠는 MPEG-2 규격으로 압축된 채 제공되므로 실제 서비스를 위해서 H.264 규격으로 트랜스코딩을 수행해야 한다. 현재 사용되는 트랜스코딩 방식은 MPEG-2 비트열(bit-stream)의 디코딩과 H.264 규격으로의 인코딩 과정을 연속적으로 수행하는 픽셀 기반 직렬 구조형 (CPDT, Cascaded Pixel-Domain Transcoding Architecture)이다. 이 방식은 두 표준의 소스 코드를 수정 없이 사용할 수 있으므로 구현이 용이하지만 변환을 위한 처리 시간이 길고 디코딩과 인코딩을 반복하므로 화질의 열화가 발생 할 수 있다. 본 논문에서는 MPEG-2로 압축된 비디오 비트열을 H.264로 트랜스크딩 할 때 변환 시간을 향상할 수 있는 DCT 기반의 열린 회로형 트랜스코더 구조(DCT-OPEN)와 변환시간은 CPDT와 유사하지만 화질면에서 우수한 DCT 기반 닫힌 회로형 트랜스코더(DCT-CLOSED) 구조를 제안한다. 제안된 구조에서는 CPDT 방식과 달리 압축 과정의 중간 단계인 DCT(Discrete Cosine Transform)를 이용하여 변환을 수행한다. 이때, MPEG-2와 H.264의 DCT 단위와 방법이 상이하므로 [l, 2]에서 제안된 방식을 이용하여 DCT 간의 변환을 수행한다. 제안된 구조의 성능 평가를 위해 MPEG-2 TM5하 H.264 JM8 코덱을 수정하여 다양한 구조를 구현하였으며 실험 결과 DCT-OPEN의 경우 CPDT에 비하여 계산 복잡도에서 우수하지만 PSNR 성능은 낮게 나타났으며 DCT-CLOSED의 경우 계산 복잡도는 높으나 화질에서 우수한 것으로 나타났다.

병행설계를 이용한 H.264/AVC의 DCT 및 CAVLC 하드웨어 구현 (Hardware Implementation of DCT and CAVLC for H.264/AVC based on Co-design)

  • 왕덕상;서석용;고형화
    • 한국항행학회논문지
    • /
    • 제17권1호
    • /
    • pp.69-79
    • /
    • 2013
  • 본 논문에서는 H.264/AVC의 부호기를 제작하기 위하여 DCT(Discrete Cosine Transform) 부호화와 엔트로피 부호화인 CAVLC(Context-Adaptive Variable Length Coding)를 하드웨어 IP로 설계하고 나머지 부분은 소프트웨어로 설계하는 병행설계(Co-Design)방법을 이용하였다. DCT 및 Hadamard 변환의 처리속도를 개선하기 위하여 Shift table을 제안하여 기존의 방식보다 16(%)정도 빠른 연산이 가능했다. 설계된 IP들은 Xilinx ML410보드의 Virtex-4 FX60 FPGA에 다운로드하여 MicroBlaze CPU를 이용하여 H.264/AVC의 참조 소프트웨어인 JM13.2와 연동이 가능하도록 설계하였다. 검증을 위해 각 IP에 대한 기능 시뮬레이션을 ModelSim을 이용하여 수행하였다. 마지막으로 실제 FPGA에 포팅하여 정상 동작여부를 확인하였다. 실험 결과 MicroBlaze를 이용한 S/W 연산시와 비교하여 H/W를 이용할 경우 DCT는 약 16배, CAVLC는 약 10배 빠른 처리 속도를 나타내었다. 본 연구는 H.264시스템의 H/W와 S/W의 병행설계에 관한 것이지만, 개발에 사용한 방법은 다른 임베디드 시스템 개발에도 유용하게 사용할 수 있다.

DCT기반의 블라인드 워터마크를 이용한 EPG 정보 재생기 설계 (Design of EPG Information Player System using DCT based Blind Watermark)

  • 김대진;최홍섭
    • 한국콘텐츠학회논문지
    • /
    • 제11권4호
    • /
    • pp.1-10
    • /
    • 2011
  • 광대역 네트워크의 발달과 함께 멀티미디어 산업의 발달은 IPTV와 같은 디지털 콘텐츠 시장의 확산을 가져오고 있다. 일반적으로 셋탑박스와 같은 미들웨어를 통해서 습득한 디지털 콘텐츠는 PC 재생기를 이용하여 시청할 수 있다. 이 때 PC 재생기는 코덱정보, 비트레이트 등과 같은 정보만 알 수 있다. 그러나 일반 사용자들은 이러한 정보보다 콘텐츠의 내용, 설명 등과 같은 부가 정보를 보기 원한다. 따라서 기존의 PC 재생기와 달리 데이터베이스 사용하지 않고 셋탑박스를 통해서 습득한 콘텐츠 내에 삽입되어 있는 EPG 정보를 볼 수 있는 재생기를 PC상에 설계하였다. 콘텐츠 내에 EPG 정보를 삽입하기 위해서 DCT 기반의 블라인드 워터마크를 제안한다. 이는 콘텐츠 원본 없이도 정보를 추출할 수 있고, 주파수 영역에서 계수값에 비례하여 강인한 워터마크를 삽입 할 수 있다. 그리고 EPG 정보로부터 원하는 정보를 워터마크를 통하여 삽입하기 위하여 MPEG-TS에 포함된 PSI 정보를 분석하고 분리하였으며, 삽입된 콘텐츠로부터 EPG 정보를 추출하여 UI를 구성하였다. 또한 워터마크 삽입 및 추출, 콘텐츠 재생 등의 기능을 다이렉트쇼 필터를 기반으로 설계하여 시스템을 모듈화 하였다. 따라서 개발자들이 보다 쉽고, 빠르게 시스템을 개발할 수 있도록 설계하였다.

딥 러닝 기반의 이미지와 비디오 압축 기술 분석 (A Technical Analysis on Deep Learning based Image and Video Compression)

  • 조승현;김연희;임웅;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.383-394
    • /
    • 2018
  • 본 논문에서는 최근 활발히 연구되고 있는 딥 러닝 기반의 이미지와 비디오 압축 기술에 대해 살펴본다. 딥 러닝 기반의 이미지 압축 기술은 심층 신경망에 압축 대상 이미지를 입력하고 반복적 또는 일괄적 방식으로 은닉 벡터를 추출하여 부호화한다. 이미지 압축 효율을 높이기 위해 심층 신경망은 복원 이미지의 화질은 높이면서 부호화된 은닉 벡터가 보다 적은 비트로 표현될 수 있도록 학습된다. 이러한 기술들은 특히 저 비트율에서 기존의 이미지 압축 기술에 비해 뛰어난 화질의 이미지를 생성할 수 있다. 한편, 딥 러닝 기반의 비디오 압축 기술은 압축 대상 비디오를 직접 입력하여 처리하기 보다는 기존 비디오 코덱의 압축 툴 성능을 개선하는 접근법을 취하고 있다. 본 논문에서 소개하는 심층 신경망 기술들은 최신 비디오 코덱의 인루프 필터를 대체하거나 추가적인 후처리 필터로 사용되어 복원 영상의 화질 개선을 통해 압축 효율을 향상시킨다. 마찬가지로, 화면 내 예측 및 부호화에 적용된 심층 신경망 기술들은 기존 화면 내 예측 툴과 함께 사용되어 예측 정확도를 높이거나 새로운 화면 내 부호화 과정을 추가함으로써 압축 효율을 향상 시킨다.

초 고화질 텔레비전 방송을 위한 차세대 오픈 케이블 방식에 대한 연구 (A study of next generation OpenCable systems for Ultra-High Definition television broadcasting)

  • 조창연;허준;김준태
    • 방송공학회논문지
    • /
    • 제14권2호
    • /
    • pp.228-237
    • /
    • 2009
  • 본 논문에서는 최근 많은 관심을 받고 있는 초 고화질 방송(Ultra-High Definition TV: UD-TV) 에 대하여 간략히 알아보고, 무선 채널에 비해 잡음의 영향이 적은 케이블 채널에서의 전송 가능성과 효율적인 전송방식에 대하여 살펴 보고자 한다. 국내 및 북미에서 디지털 케이블 방송의 전송 표준으로 채택하고 있는 오픈 케이블(OpenCable, J.83 Annex B) 시스템을 근간으로 하여, 기존의 256QAM에서 1024QAM으로 단순 확장된 시스템의 TOV(Threshold of Visibility) 증가를 살펴 보고, 이를 개선하기 위한 오류 정정 부호기의 부호율 변화 및 터보 부호의 적용을 통해 수정 확장된 시스템의 성능을 분석함으로써 수정 확장된 1024QAM 오픈 케이블 시스템의 최대 성능 한계를 알아본다. 그 결과 기존 오류 정정 부호기의 구조를 갖는 오픈 케이블 시스템은 31.5dB 이하의 신호 대 잡음비에서는 오류 없는 수신이 불가능하며, 그보다 낮은 TOV를 얻기 위해서는 기존 오류 정정 부호기의 수정이 불가피함을 확인했다. 또한 UD-TV의 전송 가능성을 기존 6MHz채널 대역폭 내에서의 섀논 한계(Shannon Capacity) 및 차세대 동영상 압축 기술과의 관계를 통해 고찰해 보고, 2개 이상의 채널을 결합하여 UD-TV를 전송하는 여러 가지 시나리오를 제시한다.

LSP 파라미터의 분포특성을 이용한 EVRC의 음질개선에 관한 연구 (A Study on the Improvements of the Speech Quality by using Distribution Characteristics of LSP parameters in the EVRC(Enhanced Variable Rate Codec))

  • 민소연;나덕수
    • 한국산학기술학회논문지
    • /
    • 제12권12호
    • /
    • pp.5843-5848
    • /
    • 2011
  • EVRC에서는 채널 스펙트럼의 효율을 높이고 시스템의 소비 전력을 줄이기 위하여, 통화시간 중에서 사용자가 말을 할 때만 음성신호를 압축하여 전달하고, 말을 하지 않을 때는 음성신호를 전달하지 않는다. 또한, EVRC에서는 음성 프레임을 1, 1/2, 1/8의 세 가지 전송률로 구분하여 다르게 처리 하고 있으며, 예를 들어, 1/8 전송률은 입력 신호가 묵음구간인 것을 의미한다. 본 연구에서는 LSP 파라미터의 분포특성을 이용한 유성음 구간, 무성음 구간, 묵음 구간을 구분하는 방법을 사용하여, 유성음인 경우에 대해 1 rate으로 부호화하고, 무성음 구간의 경우는 1/2 rate, 묵음의 경우에는 1/8 rate으로 전송하는 방법에 대하여 제안하였다. 즉, EVRC에서 full rate으로 보내는 부분에 대해서는 기존의 방식을 그대로 적용하며, half rate은 유성음, 무성음을 구분하여 유성음일 경우 full rate으로 바꾸어 전송하였고, 묵음에 대해서는 EVRC 기본 rate을 적용하였다. 실험과정에서는, SNR, ASDM, 전송률을 측정하였으며, 제안한 알고리즘을 사용하는 경우 EVRC에 비해 음성품질이 향상됨을 증명하였다.

VoIP와 VoLTE 음성 품질 측정을 위한 통합 E-model 구현 (An Integrated E-model Implementation for Speech Quality Measurement in VoIP and VoLTE)

  • 김복순;백광현;조기환
    • 전자공학회논문지
    • /
    • 제50권7호
    • /
    • pp.10-18
    • /
    • 2013
  • 이동통신 서비스의 발달과 VoLTE 서비스 상용화 이후에 VoLTE 서비스의 품질에 대한 관심이 증가하고 있다. 이에 따라 본 논문에서는 VoIP와 VoLTE 기반 음성 통신 시스템에서 품질에 영향을 미치는 요소를 계산하여 Wideband 코덱의 음성 품질 계산에 적용 할 수 있는 통합 E-model을 제안한다. 통합 E-model은 액세스 네트워크, 네트워크 특성, 단말의 사용 환경 및 이동성 등을 고려한 R 값을 계산하는 모델이다. 이에 따라 통합 E-model의 구조 및 알고리즘을 설명하고, VoLTE를 위한 최적 E-model 파라미터 적용 방안을 제안했다. 또한 시험을 위해 VoIP는 VoiceChecker와, VoLTE는 POLQA와 비교 검증을 함으로써 10% 이내의 편차를 보임을 확인했다. 제안된 모델을 이용하면 품질에 직접적인 영향을 주는 요소와 VoLTE 단말과 망 환경에 따른 음성 품질을 계산 할 수 있으므로, 실제 무선 환경에서의 직접적인 측정 없이도 품질을 미리 예측 할 수 있는 장점이 있다.

H.264 표준의 가변 움직임 블록을 위한 고속 움직임 탐색 기법 (Fast Motion Estimation for Variable Motion Block Size in H.264 Standard)

  • 최웅일;전병우
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.209-220
    • /
    • 2004
  • 기존 비디오 표준과 비교해 볼 때, H.264 비디오 표준이 갖는 중요한 두 가지 특징으로는 높은 부호화 효율과 네트워크 친화성을 들 수 있다. 그러나 이러한 중요한 특성에도 불구하고 H.264 표준은 구현시 요구되는 메모리 대역폭과 연산량의 복잡도가 높기 때문에 실시간 응용에 적용하는데 어려움이 있다. H.264 부호화 기술 가운데 특히 복수 참조 영상을 이용한 다양한 블록 단위 움직임 탐색은 높은 부호화 효율을 갖도록 하는 핵심 요소지만 최적의 움직임 벡터를 찾기 위해 다양한 블록 단위 조합의 모든 경우에 대하여 SAD (Sum of Absolute Difference)를 구해야 하므로 상당한 계산량을 요구한다. 그러므로 본 논문에서는 움직임 탐색의 연산량을 줄이기 위해 정수화소 움직임 탐색 및 부화소 움직임 탐색을 위한 고속 알고리즘을 제안한다. 정수화소 단위 움직임 탐색의 경우, 기존의 고속 움직임 탐색 기법은 H.264의 다양한 블록 단위 움직임 탐색 구조에 그대로 적용할 경우 효과적이지 못하기 때문에 본 논문에서는 종래 다이아몬드 탐색 기반 방법을 계층적 블록 구조에 맞게 개선한 적응적 움직임 탐색 기법을 제안하도록 한다. 또한 부화소 단위 움직임 탐색을 위해서는 움직임 벡터의 통계적 특성을 이용하여 예측벡터를 중심으로 한 다이아몬드 탐색 기반 고속 알고리즘을 제안한다.