• 제목/요약/키워드: codecs

검색결과 114건 처리시간 0.03초

신경망 기반 블록 단위 위상 홀로그램 이미지 압축 (Block-based Learned Image Compression for Phase Holograms)

  • 최승미;박수용;반현민;차준영;김휘용
    • 방송공학회논문지
    • /
    • 제28권1호
    • /
    • pp.42-54
    • /
    • 2023
  • 방대한 홀로그램 데이터를 디지털 형식으로 압축하는 것은 중요한 문제이다. 특히, 상용화를 위해 위상 전용 홀로그램의 압축에 관한 연구가 주목된다. 자연 영상에 최적화된 기존 표준 압축 기술은 위상 신호를 압축하는데 적합하지 않으며, 위상 신호에 대해 최적화 가능한 신경망 기반 압축 기술은 좋은 성능을 기대할 수 있으나 고해상도 홀로그램 데이터를 학습하는 데 메모리 문제가 존재한다. 본 논문에서는 메모리 문제를 해결할 수 있는 학습 가능한 신경망 기반의 블록 단위 압축 기술을 위상 전용 홀로그램에 적용해봄으로써 블록 기반이라는 동일 조건 내에서도 제안 방식이 표준 코덱보다 상당한 성능향상을 보일 수 있음을 밝혔다. 신경망 기반의 블록 단위 압축은 기존 코덱과의 호환성을 제공할 수 있으며, 메모리 문제를 해결하는 동시에 위상 전용 홀로그램 압축에 대해 월등히 좋은 성능을 보일 수 있다.

깊은 신경망을 사용한 HEVC의 루프 내 필터링 (In-Loop Filtering with a Deep Network in HEVC)

  • 김동신;이소윤;양윤모;오병태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.145-147
    • /
    • 2020
  • 딥러닝 기술이 발전함에 따라 High-Efficiency-Video-Coding(HEVC)와 같은 비디오 코덱을 딥러닝 기술을 사용해 발전시키는 방법이 많아 시도되었다. 가장 많이 연구된 분야 중 하나에는 코덱 내부의 필터들을 영상 복원 기술을 통해 개선시키는 연구가 있다. 본 논문에서는 그 중 Sample adaptive offset(SAO) 필터링 기법을 깊은 신경망으로 대체하는 방식을 제안한다. SAO는 주변 정보들을 통해 에러의 형태를 결정하고 그를 상쇄하는 값을 전송하는 형태를 가진다. 이 때 찾은 보상 값이 최적의 값이 아니기 때문에 제안 기법에서는 깊은 신경망을 통해서 그 값을 찾는다. 제안하는 네트워크는 최적의 보상 값을 찾는 부분과 에러의 형태를 찾는 부분으로 이루어져 있으며, 두 네트워크를 통해 비선형적이고 복잡한 형태의 에러를 제거할 수 있다. 실험 결과 제안하는 방식은 저지연 P 모드와 임의접근 모드에서 기존 HEVC 보다 좋은 성능을 낸 것을 확인할 수 있다.

  • PDF

확률분포기반 고속 가변장 복호화 방법 (A New Fast Variable Length Decoding Method Based on the Probabilistic Distribution of Symbols in a VLC Table)

  • 김은석;채병조;오승준
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.41-44
    • /
    • 2001
  • Variable length coding (VLC) has been used in many well known standard video coding algorithms such as MPEG and H.26x. However, VLC can not be processed parallelly because of its sequentiality. This sequentiality is a big barrier for implementing a real-time software video codec since parallel schemes can not be applied. In this paper, we propose a new fast VLD (Variable Length Decoding) method based on the probabilistic distribution of symbols in VLC tables used in MPEG as well as H.263 standard codecs. Even though MPEG suggests the table partitioning method, they do not show theoretically why the number of partitioned tables is two or three. We suggest the method for deciding the number of partitioned tables. Applying our scheme to several well-known MPEG-2 test sequences, we can reduce the computational time up to about 10% without any sacrificing video quality

  • PDF

멀티채널 오디오 압축 코덱 음질의 객관적인 측정방법 (Objective measurement of spatial auditory quality for multi channel audio codecs)

  • 최인용;전상배;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.431-434
    • /
    • 2005
  • 본 논문은 멀티채널 오디오 압축 코덱의 음질을 객관적으로 평가할 수 있는 시스템 및 파라메터에 관한 것으로, 멀티채널 오디오 신호로부터 양이입력신호(ear input signals)를 만들어내는 전처리 과정과 이 과정을 통해 출력되는 양이입력신호로부터 양이레벨차이왜곡(inter-aural level difference distortion)을 구하는 과정 및 양이레벨차이왜곡이 청취평가 결과와 일관적인 상관관계를 보임을 서술한다. 본 연구에 의하면 멀티채널 오디오 압축 코덱의 음질을 선별된 청취자에 의한 주관적인 평가와 통계처리 없이 객관적인 측정만을 통해 평가하는 것이 가능하며, 이를 사용하면 멀티채널 오디오 압축 코덱 개발자들이 시간, 경제적 부담 없이 자신이 개발한 압축 코덱의 음질을 간단하게 평가해볼 수 있다.

  • PDF

Design of Subband Codecs Using Optimized Vector Quantizer

  • Jee, Innho
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권2E호
    • /
    • pp.33-38
    • /
    • 1996
  • This paper provides an approach for representing an optimum vector quantizer by a scalar nonlinear gain-plus-additive noise model. The validity and accuracy of this analytic model is confirmed by comparing the calcuated model quantization errors with actual simulation of the optimum Linde-Buzo-Gray(LBG) vector quantizer. Using this model we frm MSE measure of an M-band filter bank codec in terms of the equivalent scalar quantizatin model and find the optimum FIR filter coefficients for each channel in the M-band structure for a given bit rate, given filter length, and given input signal correlation model. Specific design examples are worked out for 4-tap filters in the two-band paraunitary case. These theoretical results are confirmed by extensive Monte Carlo simulation.

  • PDF

MPEG-2 MVP를 이용한 스테레오 동영상부호화 (Stereoscopic Sequence Coding Using MPEG-2 MVP)

  • 배태면;권동현한규필하영호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.143-146
    • /
    • 1998
  • A new stereoscopic codec. structure using MPEG-2 multiview profile is presented in this paper. In the suggested codec., the left image is coded with motion estimation in the base layerand the right image is coded with disparity estimation in the enhancement layer. Since it is possible to calculate rough motion of the right image sequence with disparity and motion of the left image sequence, motion compensation of the enhancement layer is performed without motion estimation. Since the proposed codec. does not perform motion estimation in the enhancement layer encoding, it is simple and reduces the encoding time. We compared the PSNR of encoded image with three different structured codec., and the experimental results show that suggested codec. has comparable with other codecs.

  • PDF

VoIP 환경에서의 잡음제거를 위한 최적화된 위너 필터 (Optimized Wiener Filter for Noise Reduction in VoIP Environments)

  • 정상배;이성독;한민수
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.105-119
    • /
    • 2007
  • Noise reduction technologies are indispensable to achieve acceptable speech quality in VoIP systems. This paper proposes a Wiener filter optimized to the estimated SNR of noisy speech for the noise reduction in VoIP environments. The proposed noise canceller is applied as a pre-processor before speech encoding. The performance of the proposed method is evaluated by the PESQ in various noisy conditions. In this paper, the proposed algorithm is applied to G.711, G.723.1, and G.729A which are all VoIP speech codecs. The PESQ results show that the performance of our proposed noise reduction scheme outperforms those of the noise suppression in the IS-127 EVRC and the ETSI standard for the advanced distributed speech recognition front-end.

  • PDF

차세대 동영상 코덱 압축 효율 비교: HEVC vs VP9 (Coding Efficiency Comparison between Next Generation Video Codecs: HEVC vs VP9)

  • 김일구
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.176-179
    • /
    • 2013
  • 본 논문에서는 JCT-VC 에서 2013 년 1 월에 표준화가 완료된 High Efficiency Video Coding (HEVC)과 구글에서 2013 년 6 월에 개발 완료 예정인 VP9 의 압축 효율 비교를 수행한다. HEVC 는 UHD 등 고화질 방송 등에 대응하도록 디자인 되었으며, VP9 은 유튜브 (YouTube) 등과 같은 인터넷 비디오 스트리밍에 적합하도록 디자인되었다. VP9 의 경우 HEVC 와는 달리 로열티 프리 (royalty-free)를 지향하며 오픈소스 (open source) 방식으로 개발이 진행되고 있다. 본 논문에서는 HEVC 와 VP9 의 디자인 차별점을 소개하고, 랜덤 액세스 환경(Random Access, RA)과 저지연 환경 (Low Delay, LD)에서 HEVC 와 VP9 의 압축 효율을 비교한다. 실험 결과에 따르면, 방송 및 패키지 미디어 등에서 많이 사용될 랜덤 액세스 환경에서는 VP9 이 HEVC 대비 32.7% 열세를 보인다. 비디오 컨퍼런스등과 같은 저지연 환경에서는 VP9 이 HEVC 대비 26.7% 열세를 보인다. VP9 의 경우 개발이 완료된 것이 아니므로, 향후 압축 효율의 향상이 있을 것으로 기대된다.

  • PDF

객관적 영상 화질 평가 기준를 위한 움직임 정보에 따른 중요도 결정 기법 (Weighting Method based on Motion Information for Objective Video Quality Assessment)

  • 박수영;김태완;이상훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.909-910
    • /
    • 2008
  • For evaluating the performance of some codecs, many researchers have study and develop new objective video quality assessments. However, it's not sufficient for evaluating the temporal feature of video data yet, which is a distinguishable and representative characteristic when compared with other multimedia. This paper propose the method to apply the weight to SSIM (Structural SIMilarity) according to the cognitive psychological feature. And, we presented that the performance of objective video quality assessment applied the weight to SSIM by using the proposed method is superior to one of original SSIM.

  • PDF

MPEG 오디오의 채널 확장 기술 (Channel Expansion Technology in MPEG Audio)

  • 방희석
    • 방송공학회논문지
    • /
    • 제16권5호
    • /
    • pp.714-721
    • /
    • 2011
  • MPEG 오디오에서는 오디오 신호의 효율적인 압축을 위해서 마스킹 효과, spectral band replication을 이용한 고주파 성분 합성, parametric stereo를 이용한 채널 확장 등의 기술을 이용하고 있다. 본 논문에서는 이 중 최신 기술에 해당하는 채널 확장 기술에 대해서 소개한다. 또한, MPEG 오디오 코덱 중 이 기술을 이용하는 HE-AAC v.2, MPEG Surround, Spatial Audio Object Coding(SAOC), Unified Speech and Audio Coding (USAC)에 대해 기술 소개 및 방송의 적용 예를 기술한다.