• 제목/요약/키워드: coding delay

검색결과 248건 처리시간 0.023초

Quality Adaptation of Intra-only Coded Video Transmission over Wireless Networks

  • Shu Tang;Yuanhong Deng;Peng Yang
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.817-829
    • /
    • 2023
  • Variable wireless channel is a big challenge for real-time video applications, and the rate adaptation of realtime video streaming becomes a hot topic. Intra-video coding is important for high-quality video communication and industrial video applications. In this paper, we proposed a novel adaptive scheme for real-time video transmission with intra-only coding over a wireless network. The key idea of this scheme is to estimate the instantaneous remaining capacity of the network to adjust the quality of the next several video frames, which not only can keep low queuing delay and ensure video quality, but also can respond to bandwidth changes quickly. We compare our scheme with three different schemes in the video transmission system. The experimental results show that our scheme has higher bandwidth utilization and faster bandwidth change response, while maintaining low queuing delay.

EVRC와 G.729A 간의 상호부호화 (A Transcoding Algorithm between EVRC and G.729A)

  • 권구락;고성제
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.54-60
    • /
    • 2006
  • 본 논문에서는 EVRC와 G.729A 음성부호화기를 위한 상호부호화 알고리듬을 제안한다. 다른 음성 표준을 사용하는 통신망간에 음성신호를 연동시키는 가장 간단한 방법은 이중 부/복호화 (tandem coding) 방법이다. 이 방법은 두 번의 부/복호화 과정을 거치기 때문에 많은 계산량이 요구되며 아울러 음성 지연이 발생하게 된다. 이러한 문제점들을 개선하기 위하여 상호부호화를 사용한다. 상호부호화는 LSP (Line Spectral Pair) 변환과 피치 지연 변환 그리고 지연 시간 단축 알고리듬을 통하여 수행한다. 제안된 알고리듬은 $18{\sim}22%$의 적은 계산량과 $5{\sim}10ms$의 짧은 지연으로 상호 부/복호화에 상응하는 음성 품질을 제공함을 실험을 통해 확인할 수 있다.

효율적인 4.8 KBPS Trellis Exicitation 음성부호화방식 (AN EFFICIENT TRELLIS EXCITATION SPEECH CODING AT 4.8 KBPS)

  • 강상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.210-213
    • /
    • 1994
  • In this paper, we present a combination of trellis coded vector quantization and code-excited linear prediction coding, termed trellis excitation coding, for an efficient 4.8 kbps speech coding system. A training sequence-based algorithm is developed for designing an otimized codebook subject to the TEC structure. Also, we discuss the trellis symbol release rules that avoid excessive encoding delay. Finally, simulation results for the TEC coder are given at bit rate of 4.8 kbps.

  • PDF

FIR필터와 선형필터를 이용한 색차 보간법 (Chroma Interpolation using FIR Filter and Linear Filter)

  • 김정필;이영렬
    • 방송공학회논문지
    • /
    • 제16권4호
    • /
    • pp.624-634
    • /
    • 2011
  • 최근 차세대 비디오 코딩 표준화를 위해 JCT-VC에서 HEVC라 불리는 새로운 비디오 압축 표준 기술을 개발하고 있다. HEVC는 H.264/AVC보다 높은 성능을 갖는 많은 부호화 기술을 채택하였다. 그중 색차 신호를 보간할 때 H.264/AVC에서 사용된 선형필터보다 좋은 성능을 가지는 DCT 기반으로 한 보간 필터를 사용하고 있다. 본 논문에서는 H.264/AVC에서 사용된 FIR필터와 선형필터를 통합한 필터를 제안하여 부호화 효율을 높이는 방법을 제안한다. 제안하는 방법과 DCT 기반으로 한 보간 필터와 비교하였을 때 실험결과로 제안한 방법은 random access구조의 high efficiency 경우 색차성분 U,V에서 각각 평균 0.9%, 1.1%의 BD-rate가 감소하였고,random access의 low complexity 구조인 경우 색차성분 U,V에서 각각 평균 1.1%, 1.1%의 BD-rate가 감소하였고, low delay의 high efficiency 구조인 경우 색차성분 U,V에서 각각 평균 0.9%, 1.4%의 BD-rate가 감소하였고, low delay 구조의 low complexity인 경우 색차성분 U,V에서 각각 평균 1.8%, 1.8%의 BD-rate가 감소하였다.

Shuffled Discrete Sine Transform in Inter-Prediction Coding

  • Choi, Jun-woo;Kim, Nam-Uk;Lim, Sung-Chang;Kang, Jungwon;Kim, Hui Yong;Lee, Yung-Lyul
    • ETRI Journal
    • /
    • 제39권5호
    • /
    • pp.672-682
    • /
    • 2017
  • Video compression exploits statistical, spatial, and temporal redundancy, as well as transform and quantization. In particular, the transform in a frequency domain plays a major role in energy compaction of spatial domain data into frequency domain data. The high efficient video coding standard uses the type-II discrete cosine transform (DCT-II) and type-VII discrete sine transform (DST-VII) to improve the coding efficiency of residual data. However, the DST-VII is applied only to the Intra $4{\times}4$ residual block because it yields relatively small gains in the larger block than in the $4{\times}4$ block. In this study, after rearranging the data of the residual block, we apply the DST-VII to the inter-residual block to achieve coding gain. The rearrangement of the residual block data is similar to the arrangement of the basis vector with a the lowest frequency component of the DST-VII. Experimental results show that the proposed method reduces the luma-chroma (Cb+Cr) BD rates by approximately 0.23% to 0.22%, 0.44% to 0.58%, and 0.46% to 0.65% for the random access, low delay B, and low delay P configurations, respectively.

13kbps QCELP에서 8kbps QCELP로의 음성 패킷 변환 기술 (Voice Packet Conversion from 13kbps QCELP to 8kbps QCELP Speech Codecs)

  • 박호종;권상철
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.71-76
    • /
    • 1999
  • 디지털 이동 통신 시스템에서 서로 다른 음성 압축기를 사용하는 단말기 사이의 통신은 음성 신호를 두 번의 압축/복원 과정을 거쳐 전달하므로 음질 저하, 계산량 증가, 전달 지연 증가 등의 문제를 발생시킨다. 본 논문에서는 이와 같은 단말기 사이의 통신에서의 문제점을 해결하기 위하여 음성 패킷 변환 방법을 제안하고, 13kbps QCELP 패킷을 8kbps QCELP 패킷으로 변환하는 방법을 개발한다. 여러 음성 신호를 이용한 모의 실험 결과, 본 논문에서 개발된 패킷 변환기가 짧은 음성전달 지연과 약 33%의 계산량으로 일반적인 이중 압축 방법과 동등한 음질의 음성 신호를 합성하는 것을 확인하였다.

  • PDF

Group Delay를 이용한 GMM기반의 성별 인식 알고리즘 (GMM-Based Gender Identification Employing Group Delay)

  • 이계환;임우형;김남수;장준혁
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.243-249
    • /
    • 2007
  • 본 논문은 Group Delay(GD)를 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 일반적인 음성 인식과 관련된 시스템에서 사용되는 특징들은 위상에 관한 정보를 제거한 크기만의 정보를 이용하여 구성한다. 본 연구에서는 위상에 관한 정보를 토대로 유도되어 지는 GD의 성별에 따른 특징을 알아보고, 보다 향상된 성별인식을 위해 MFCC(Mel-frequency cepstral coefficient), LPC(linear predictive coding) 계수, 반사계수(reflection coefficient) 그리고 포만트(formant)등과 같은 크기 정보와 GD를 이용한 결합 특징 벡터를 적용하였다. 실험을 통해 성별에 따른 GD의 특징을 확인할 수 있었고, 이를 이용한 제안된 특징 벡터를 사용했을 때 우수한 인식 성능을 얻을 수 있었다.

Sum-Rate Capacity with Fairness in Correlated MIMO Broadcast Channels

  • Lee, Seung-Hwan;Kim, Jin-Up
    • Journal of electromagnetic engineering and science
    • /
    • 제9권3호
    • /
    • pp.124-129
    • /
    • 2009
  • Although the maximum sum-rate capacity of multiple-input multiple output(MIMO) broadcast channels(BCs) can be achieved by dirty-paper coding(DPC), the results were obtained without fairness considerations in uncorrelated MIMO channels. In this paper, we propose new multiuser scheduling algorithms, which find a best user set for approaching the maximum sum-rate capacity while maintaining fairness among users. We analyze the performance of the proposed algorithms using zero-forcing dirty paper coding(ZF-DPC) in the correlated MIMO BCs for throughput and delay fairness, respectively. Numerical results demonstrate that a large time window can reduce the average throughput difference between users, but it increases head-of-line(HOL) delay jitters in the case of delay fairness.

가변 지연 MDCT/IMDCT를 이용한 오디오/음성 코덱 (Audio /Speech Codec Using Variable Delay MDCT/IMDCT)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권2호
    • /
    • pp.69-76
    • /
    • 2023
  • MDCT/IMDCT 과정을 사용하는 고품질 오디오/음성 코덱은 이전 프레임 과의 중첩-합(Overlap-add) 과정을 통해 현재 프레임을 완벽 복원 가능하다. 중첩-합 과정에서 프레임 길이 만큼의 알고리즘 지연이 발생하게 된다. 본 논문에서는 알고리즘 지연을 줄이기 위해 MDCT/IMDCT에 가변적인 위상변이를 사용하여 알고리즘 지연을 줄인 MDCT/IMDCT 과정을 제안한다. 가변 지연 MDCT/IMDCT알고리즘을 ITU-T 표준 코덱 G.729.1 코덱에 적용하여 저지연 오디오/음성 코덱을 제안하였다. MDCT/IMDCT 과정에서의 알고리즘 지연은 기존 20 ms에서 1.25ms 까지 감소시킬 수 있다. 저지연 MDCT/IMDCT를 적용한 오디오/음성 코덱의 복호화된 출력신호는 객관적 음질 시험 방법인 PESQ 시험을 통해 성능 평가하였다. 전송 지연이 감소 됨에도 불구하고 기존 방법과 음질 차이가 없음을 확인할 수 있었다.

DST 기반 보간 필터를 이용한 인터 코딩 (Inter Coding using DST-based Interpolation Filter)

  • 김명준;이영렬
    • 방송공학회논문지
    • /
    • 제22권3호
    • /
    • pp.321-326
    • /
    • 2017
  • HEVC 표준은 정수 화소로 표현된 신호에 DCT-II를 기반으로 하는 보간 필터를 사용하여 부화소 신호를 생성한다. 이러한 방법으로 생성된 신호는 움직임 보상 및 예측의 성능 향상을 가져온다. HEVC 표준은 부화소를 생성하기 위해서 길이가 다른 각각의 DCT 보간 필터를 사용하고 있다. 1/2-화소를 생성할 땐, 필터의 길이가 8인 DCT 기반 보간 필터를 사용하며, 1/4-화소와 3/4-화소의 경우에는 필터의 길이가 7인 DCT 기반 보간 필터를 사용한다. 본 논문에서는 DST-VII을 기반으로 하는 보간 필터를 제안하여, 움직임 보상 및 예측의 성능 향상을 가져온다. 본 논문에서 제안하는 방법은 HEVC 표준보다 BD-rate가 Random Access와 Low Delay B configurations에서 각각 0.45%와 0.5%의 성능 향상을 가져온다.