• 제목/요약/키워드: Scalable Coding

검색결과 276건 처리시간 0.025초

상황인지 기반 svc 멀티미디어 방송서비스 (Context-awareness Based SVC Multimedia Broadcast Service)

  • 이형옥;곽용완;손승철;남지승
    • 한국통신학회논문지
    • /
    • 제36권9B호
    • /
    • pp.1098-1107
    • /
    • 2011
  • 최근 유무선망의 통합과 통방 융합으로 기존의 방송국 사업자들을 통한 일률적이고 획일적인 서비스 제공 및 소비에서 4A(Any-time, Any-where, Any-device, Any-contents)서비스를 위한 차세대 멀티미디어 방송 서비스에 대한 연구가 진행되고 있다. 이러한 차세대 멀티미디어 방송 서비스에 대한 요구를 보장하기 위해서 비디오 압축부호화 기술뿐만 아니라 이동성, 다양한 디바이스의 연산능력, 사용자 네트워크의 특성 및 성능과 조건 등의 상태, 사용자 선호도 등에 대한 상황인지 기반의 기술연구에 대한 관심이 모아졌다. 본 논문에서는 현재의 인터넷 환경에서 SVC(Scalable Video Coding)부호화를 이용하여 멀티캐스트와 오버레이 멀티캐스트 전송기술을 혼합한 방송 서비스를 설계함으로써 효율적인 상황인지 기반의 SVC 멀티미디어 방송 시스템을 제안한다. 또한, ACK-Flow 최적화 오버레이 멀티캐스트 기법을 제안하여 기존의 트리기반 오버레이 멀티캐스트와 비교해 봄으로써 제안한 알고리즘의 효율성을 입증한다.

스케일러블 비디오 부호화에서 통계적 가설 검증 기법을 이용한 프레임 간 모드 결정 (Fast Intermode Decision of Scalable Video Coding using Statistical Hypothesis Testing)

  • 이범식;김문철;함상진;이근식;박근수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.111-115
    • /
    • 2006
  • 스케일러블 비디오 코딩(SVC, Scalable Video Coding)은 MPEG(Moving Picture Expert Group)과 VCEG (Video Coding Expert Group)의 JVT(Joint VIdeo Team)에 의해 현재 표준화 되고 있는 새로운 압축 표준 기술이며 시간, 공간 및 화질의 스케일러빌리티를 지원하기 위해 계층 구조를 가지고 있다. 특히 시간적 스케일러빌리티를 위해 계층적 B-픽처 구조를 채택하고 있다. 스케일러블 비디오 코딩의 기본 계층은 H.264|AVC와 호환적이므로, 모션 예측과 모드 결정과정에서 $16{\times}16,\;16{\times}8,\;8{\times}16,\;8{\times}8,\;8{\times}4,\;4{\times}8$ 그리고 $4{\times}4$와 같은 7개의 서로 다른 크기를 갖는 블록을 사용한다. 스케일러블 비디오 코딩에서 사용되고있는 계층적 B-픽처 구조는 키 픽처인 I와 P 픽처를 제외하고는 한 GOP (Group of Picture)내에서 모두 B-픽처를 사용하므로 H.264|AVC와 비교했을 때 연산량 증가와 함께 부호화 지연도 급격히 증가한다. B-픽처는 양방향 모션 벡터인 LIST0와 LIST1을 사용하고 양방향 모두에서 다중 참조 픽처를 사용하기 때문이다. 본 논문에서는 통계적 가선 검증을 이용하여 스케일러블 비디오 부호화에 적용 가능한 고속 프레임간 모드 결정 알고리듬 대해 소개한다. 제안된 방법은 $16{\times}16$ 매크로 블록과 $8{\times}8$ 서브 매크로 블록에 통계적 가설 감증 기법을 적용하여 실행되며, 현재 블록과 복원된 참조 블록간의 픽셀 값을 비교하여 RD(Rate Distortion) 최적화 기반 모드 결정을 빨리 완료함으로써 고속 프레임간 모드 결정을 가능하게 한다. 제안된 방법은 프레임 간 모드 결정을 고속화함으로써 스케일러블 비디오 부호화기의 연산량과 복잡도를 최대 57%감소시킨다. 그러나 연산량 감소에 따른 비트율의 증가나 화질의 열화는 최대 1.74% 비트율 증가 및 0.08dB PSNR 감소로 무시할 정도로 작다.

  • PDF

스케일러블 비디오 부호화에서 통계적 가설 검증 기법을 이용한 고속 화면간 모드 결정 (Fast Intermode Decision for Scalable Video Coding using Statistical Hypothesis Testing)

  • 이범식;함상진;김병선;이근식;박근수;김문철
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.250-265
    • /
    • 2007
  • 본 논문에서는 가변 움직임 블록을 이용한 움직임 예측과 계층적 B-화면 구조가 결합되어 많은 연산량이 요구되고 있는 SVC 구조에서 통계적 가설 검증 방법을 적용하여 화면간 움직임 모드 결정을 효율적으로 수행함으로써 부호화 과정의 연산량을 크게 줄일 수 있는 화면간 모드 고속 결정 알고리듬을 소개한다. 제안된 방법은 $16{\times}16$ 매크로 블록과 $8{\times}8$ 하위 매크로 블록에 통계적 가설 검증 기법을 적용하여 실행되며, 현재 블록과 복원된 참조 블록간의 화소값을 비교하여 율-왜곡 최적화 (RDO: Rate Distortion Optimization) 기반 움직임 모드 결정을 고속으로 수행함으로써 SVC의 부호화 과정에서 소요되는 부호화 시간을 전체 연산량 대비 최대 69%까지 감소시킨다. 그러나 연산량 감소에 따른 비트율의 증가나 화질의 열화는 무시할 수 있을 정도로 적음을 실험을 통해 확인하였다.

4G networks의 멀티미디어 멀티캐스트 서비스에서 PSNR기반의 효율적인 Resource allocation (PSNR based adaptive Resource allocation for multimedia multicast service over 4G networks)

  • 김준오;권용일;서덕영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.102-104
    • /
    • 2011
  • 최근 비디오 스트리밍과 대화형 비디오 서비스 등과 같은 광대역 멀티미디어 서비스를 지원하기 위하여 Wimax와 같은 4G 무선네트워크 시스템 기술이 발전해 왔다. 4G 무선네트워크의 OFDM(Orthogonal Frequency Division Multiplexing)과 MIMO(multi Input Multi Output)은 사용자들에게 매우 유연한 QoS(Quality of Service) 서비스를 제공해 줄 수 있다.[1] 이 논문에서는 다양한 네트워크 상황에서 멀티캐스트 그룹에게 효율적인 방법으로 통신 자원을 할당하기 위해 OFDM 방법을 사용 하였다. 이에 본 논문에서는 한 셀(cell) 내의 서로 다른 멀티캐스트의 그룹의 다른 SNR(Signal to noise Ratio)의 사용자 분포에 따른 적응적인 scalable 비디오 멀티캐스트 방식을 제안한다. 더 나은 수신율을 가진 사용자는 최적의 MCS(Modulation and Coding Scheme) 할당을 통해 서로 다른 화질의 scalable 비디오 계층 중 높은 해상도의 비디오를 받을 수 있다. 논문에서는 전체 전송률을 최적화 하는 대신 전송받은 전체 비디오의 평균 화질을 최적화하는 방법을 제안한다.

  • PDF

Adaptive Transcoding for Object-based MPEG-4 Scene using Optimal Configuration of Objects

  • Cha, Kyung-Ae
    • 한국멀티미디어학회논문지
    • /
    • 제9권12호
    • /
    • pp.1560-1571
    • /
    • 2006
  • In order to transmit multimedia streams over the network with a timely changing channel bandwidth such as Internet, scalable video coding schemes have been studied to represent video in flexible bitstream. Much research has been made on how to represent encoded media(such as video) bitstream in scalable ways. In this paper, rte propose an optimal selection of the objects for MPEG-4 bitstream adaptation to meet a given constraint. We adopt a multiple choice knapsack problem with multi-step selection for the MPEG-4 objects with different bit-rate scaling levels in the MPEG-4 bitstream. The bitstream adaptation based on the optimal selection result is then to fetch the necessary parts of the MPEG-4 bitstream to constitute an adapted version of the original MPEG-4 binary resource. The experiment results show that the optimal selection of MPEG-4 objects for a given constraint can promisingly be made which meets the given constraint.

  • PDF

High Performance and FPGA Implementation of Scalable Video Encoder

  • Park, Seongmo;Kim, Hyunmi;Byun, Kyungjin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권6호
    • /
    • pp.353-357
    • /
    • 2014
  • This paper, presents an efficient hardware architecture of high performance SVC(Scalable Video Coding). This platform uses dedicated hardware architecture to improve its performance. The architecture was prototyped in Verilog HDL and synthesized using the Synopsys Design Compiler with a 65nm standard cell library. At a clock frequency of 266MHz, This platform contains 2,500,000 logic gates and 750,000 memory gates. The performance of the platform is indicated by 30 frames/s of the SVC encoder Full HD($1920{\times}1080$), HD($1280{\times}720$), and D1($720{\times}480$) at 266MHz.

분산음성인식 환경에서 서버에서의 스케일러블 고품질 음성복원 (Scalable High-quality Speech Reconstruction in Distributed Speech Recognition Environments)

  • 윤재삼;김홍국;강병옥
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.423-424
    • /
    • 2007
  • In this paper, we propose a scalable high-quality speech reconstruction method for distributed speech recognition (DSR). It is difficult to reconstruct speech of high quality with MFCCs at the DSR server. Depending on the bit-rate available by the DSR system, we can send additional information associated with speech coding to the DSR sorrel, where the bit-rate is variable from 4.8 kbit/s to 11.4 kbit/s. The experimental results show that the speech quality reproduced by the proposed method when the bit-rate is 11.4 kbit/s is comparable with that of ITU-T G.729 under both ideal channel and frame error channel conditions while the performance of DSR is maintained to that of wireline speech recognition.

  • PDF

MPEG-based Transcoding for Scalable Video-on-Demand System

  • Naoki-Kobayashi;Satoshi-Ishibashi;Susumu-Ichinose
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • /
    • pp.63.1-68
    • /
    • 1999
  • MPEG-2 transcoding scheme is proposed as scalable transmission system for a video-on-demand system is described. In this system video contents encoded by MPEG-2 are transmitted to receiver terminals via communication lines that have different bit rate. A transcoding technique that directly converts a bit stream encoded by MPEG-2 into a lower coding rate stream without decoding is proposed. The transcoder called Trampeg includes size reduction and frame drop approach. The experimental results show that an MPEG-2 stream of 0 Mbps is able to be transcoded into a stream of 1.5 Mbps-300 Kbps.

무선채널환경에서 웨이블릿 기반 정지영상 전송에 관한 연구 (A Study on the Wavelet based Still Image Transmission over the Wireless Channel)

  • 나원;백중환
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.179-182
    • /
    • 2001
  • This paper has been studied a wavelet based still image transmission over the wireless channel. EZW(Embedded Zerotree Wavelet) is an efficient and scalable wavelet based image coding technique, which provides progressive transfer of signal resulted in multi-resolution representation. It reduces therefore the reduce cost of storage media. Although EZW has many advantages, it is very sensitive on error. Because coding are performed in subband by subband, and it uses arithmetic coding which is a kind of variable length coding. Therefore only 1∼2bit error may degrade quality of the entire image. So study of error localization and recovery are required. This paper investigates the use of reversible variable length codes(RVLC) and data partitioning. RVLC are known to have a superior error recovery property due to their two-way decoding capability and data partitioning is essential to applying RVLC. In this work, we show that appropriate data partitioning length for each SNR(Signal-to-Noise Power Ratio) and error localization in wireless channel.

  • PDF

지하철 사고 감시를 위한 스테레오 비디오 부호화 기법 (Stereoscopic Video Coding for Subway Accident Monitoring System)

  • 오세찬;김길동;박성혁
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.484-486
    • /
    • 2005
  • Passenger safety is a primary concern of railway system but, it has been urgent issue that dozens of people are killed every year when they falloff from train platforms. Recently, advancements in IT have enabled applying vision sensors to railway environments, such as CCTV and stereo camera sensors. In this paper, we propose a stereoscopic video coding scheme for subway accident monitoring system. The proposed scheme is designed for providing flexible video among various displays, such as control center, station employees and train driver. We uses MPEG-2 standard for coding the left-view sequence and IBMDC for predicting the P- and B-types of frames of the right-view sequence. IBMDC predicts matching block by interpolating both motion and disparity predicted macroblocks. To provide efficient stereoscopic video service. we define both temporally and spatially scalable layers for each eye's-view by using the concept of Spatio-Temporal scalability. According to the experimental results. we expect the proposed functionalities will play a key role in establishing highly flexible stereoscopic video codec for ubiquitous display environment where devices and network connections are heterogeneous.

  • PDF