• 제목/요약/키워드: encoder optimization

검색결과 92건 처리시간 0.029초

Two-Step Rate Distortion Optimization Algorithm for High Efficiency Video Coding

  • Goswami, Kalyan;Lee, Dae Yeol;Kim, Jongho;Jeong, Seyoon;Kim, Hui Yong;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.311-316
    • /
    • 2017
  • High Efficiency Video Coding (HEVC) is the newest video coding standard for improvement in video data compression. This new standard provides a significant improvement in picture quality, especially for high-resolution videos. A quadtree-based structure is created for the encoding and decoding processes and the rate-distortion (RD) cost is calculated for all possible dimensions of coding units in the quadtree. To get the best combination of the block an optimization process is performed in the encoder, called rate distortion optimization (RDO). In this work we are proposing a novel approach to enhance the overall RDO process of HEVC encoder. The proposed algorithm is performed in two steps. In the first step, like HEVC, it performs general rate distortion optimization. The second step is an extra checking where a SSIM based cost is evaluated. Moreover, a fast SSIM (FSSIM) calculation technique is also proposed in this paper.

주문형 게임 서비스를 위한 장면 기술자 기반 고속 게임 부호화기 (Fast Game Encoder Based on Scene Descriptor for Gaming-on-Demand Service)

  • 전찬웅;조현호;심동규
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.849-857
    • /
    • 2011
  • 주문형 게임 서비스는 서버에서 실행하는 게임을 동영상 부호화하여 클라이언트에 전송하고, 클라이언트에서 비디오 복호화를 통해 게임을 즐길 수 있게 해 준다. 다수의 사용자가 네트워크상에서 실시간 게임 서비스를 즐기기 위해서는 초고속 게임 인코더가 필요하다. 본 논문에서 제안한 방법은 장면 기술자를 정의하고, 이를 게임 영상을 부호화하는 부호화기에 부가적인 정보로 입력함으로써 움직임 예측, 율 왜곡 최적화와 같은 복잡도가 높은 부호화 과정을 생략하여 부호화기를 고속화한다. 장면 기술자를 움직임 벡터로 사용하고, 장면 기술자를 이용하여 매크로블록 모드를 결정해 부호화기를 고속화한다. 제안하는 방법의 성능 평가를 위해 H.264/AVC의 오픈 소프트웨어인 x264와 비교한 결과, x264에 어셈블리 코드가 포함되지 않은 경우에 대해서 약 192%의 부호화 속도 향상을 확인하였고, x264에서 일부 모듈에 대해서 어셈블리 최적화를 반영한 결과에 대해서는 86%의 부호화 속도가 향상되는 것을 확인할 수 있었다. 부호화기의 고속화 결과 60 FPS의 부호화 속도를 넘어 주문형 게임을 실시간으로 수행할 수 있게 되었다.

지연 시간 및 화질 제약이 있는 비디오 응용을 위한 에너지 최적화 기법 (An Energy Optimization Technique for Latency and Quality Constrained Video Applications)

  • 임채석;하순회
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권10호
    • /
    • pp.543-552
    • /
    • 2004
  • 이 논문은 지연 시간 및 화질 제약이 있는 비디오 응용을 위한 에너지 최적화 기법을 제안한다. 이는 두 가지 핵심 기법 - 프레임 생략 기법 및 버퍼링 기법 - 으로 구성되어있다. 버퍼링은 운영 체제 수준에서 유휴 시간 이용률을 증가시키고, 프레임 생략은 응용 수준에서 유휴 시간 자체를 증가시키며, 양쪽 모두 동적 전압 조절 기법의 효과를 향상시킨다. 이 논문에서는 제안한 기법을 적용하기 위해 H.263 부호기 응용을 사용한다. 실험에서는 제안한 기법이 주어진 지연 시간 및 화질 제약을 만족하면서 괄목할 만한 에너지 절감을 얻을 수 있음을 보인다.

Comparison of an ultrasonic distance sensing system and a wire draw distance encoder in motion monitoring of coupled structures

  • Kuanga, K.S.C.;Hou, Xiaoyan
    • Coupled systems mechanics
    • /
    • 제5권2호
    • /
    • pp.191-201
    • /
    • 2016
  • Coupled structures are widely seen in civil and mechanical engineering. In coupled structures, monitoring the translational motion of its key components is of great importance. For instance, some coupled arms are equipped with a hydraulic piston to provide the stiffness along the piston axial direction. The piston moves back and forth and a distance sensing system is necessary to make sure that the piston is within its stroke limit. The measured motion data also give us insight into how the coupled structure works and provides information for the design optimization. This paper develops two distance sensing systems for coupled structures. The first system measures distance with ultrasonic sensor. It consists of an ultrasonic sensing module, an Arduino interface board and a control computer. The system is then further upgraded to a three-sensor version, which can measure three different sets of distance data at the same time. The three modules are synchronized by the Arduino interface board as well as the self-developed software. Each ultrasonic sensor transmits high frequency ultrasonic waves from its transmitting unit and evaluates the echo received back by the receiving unit. From the measured time interval between sending the signal and receiving the echo, the distance to an object is determined. The second distance sensing system consists of a wire draw encoder, a data collection board and the control computer. Wire draw encoder is an electromechanical device to monitor linear motion by converting a central shaft rotation into electronic pulses of the encoder. Encoder can measure displacement, velocity and acceleration simultaneously and send the measured data to the control computer via the data acquisition board. From experimental results, it is concluded that both the ultrasonic and the wire draw encoder systems can obtain the linear motion of structures in real-time.

MPEG-2 AAC의 MDCT/IMDCT를 위한 최적 알고리즘 개발 (A Development on the Optimization Algorithm for MDCT/IMDCT of MPEG-2 AAC)

  • 김병규;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.538-541
    • /
    • 1999
  • MPEG-2 AAC(Advanced Audio Coding) is the most advanced coding scheme available for high quality audio coding. This MPEG-2 AAC audio Standard allows for ITU-R ‘indistinguishable’ quality according to at data rates of 320 kb/s for five full-bandwidth channel audio signals. The compression ratio is around a factor of 1.4 better compared to MPEG Layer 3, you get the same quality at 70% of the bitrate. This paper suggest optimization method for MDCT/IMDCT (Modified Discrete Cosine Transform/Inverse Modified Discrete Cosine Transform) in Encoder and Decoder for AAC.

  • PDF

A Fast Intra-Prediction Method in HEVC Using Rate-Distortion Estimation Based on Hadamard Transform

  • Kim, Younhee;Jun, DongSan;Jung, Soon-Heung;Choi, Jin Soo;Kim, Jinwoong
    • ETRI Journal
    • /
    • 제35권2호
    • /
    • pp.270-280
    • /
    • 2013
  • A fast intra-prediction method is proposed for High Efficiency Video Coding (HEVC) using a fast intra-mode decision and fast coding unit (CU) size decision. HEVC supports very sophisticated intra modes and a recursive quadtree-based CU structure. To provide a high coding efficiency, the mode and CU size are selected in a rate-distortion optimized manner. This causes a high computational complexity in the encoder, and, for practical applications, the complexity should be significantly reduced. In this paper, among the many predefined modes, the intra-prediction mode is chosen without rate-distortion optimization processes, instead using the difference between the minimum and second minimum of the rate-distortion cost estimation based on the Hadamard transform. The experiment results show that the proposed method achieves a 49.04% reduction in the intra-prediction time and a 32.74% reduction in the total encoding time with a nearly similar coding performance to that of HEVC test model 2.1.

Hyperparameter experiments on end-to-end automatic speech recognition

  • Yang, Hyungwon;Nam, Hosung
    • 말소리와 음성과학
    • /
    • 제13권1호
    • /
    • pp.45-51
    • /
    • 2021
  • End-to-end (E2E) automatic speech recognition (ASR) has achieved promising performance gains with the introduced self-attention network, Transformer. However, due to training time and the number of hyperparameters, finding the optimal hyperparameter set is computationally expensive. This paper investigates the impact of hyperparameters in the Transformer network to answer two questions: which hyperparameter plays a critical role in the task performance and training speed. The Transformer network for training has two encoder and decoder networks combined with Connectionist Temporal Classification (CTC). We have trained the model with Wall Street Journal (WSJ) SI-284 and tested on devl93 and eval92. Seventeen hyperparameters were selected from the ESPnet training configuration, and varying ranges of values were used for experiments. The result shows that "num blocks" and "linear units" hyperparameters in the encoder and decoder networks reduce Word Error Rate (WER) significantly. However, performance gain is more prominent when they are altered in the encoder network. Training duration also linearly increased as "num blocks" and "linear units" hyperparameters' values grow. Based on the experimental results, we collected the optimal values from each hyperparameter and reduced the WER up to 2.9/1.9 from dev93 and eval93 respectively.

Fast Enhancement Layer Encoding Method using CU Depth Correlation between Adjacent Layers for SHVC

  • Kim, Kyeonghye;Lee, Seonoh;Ahn, Yongjo;Sim, Donggyu
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.260-264
    • /
    • 2013
  • This paper proposes a fast enhancement layer coding method to reduce computational complexity for Scalable HEVC (SHVC) which is based on High Efficiency Video Coding (HEVC). The proposed method decreases encoding time by simplifying Rate Distortion Optimization (RDO)for enhancement layers (EL). The simplification is achieved by restricting CU depths based on the correlation of coding unit (CU) depths between adjacent layers and scalability (spatial or quality) of EL. Comparing with the performance of SHM 1.0 software encoder, the proposed method reduces the encoding time by up to 31.5%.

ARM Core(R)를 이용한 AMR-WB+ 오디오 부호화기의 실시간 구현 (Real-time Implementation of the AMR-WB+ Audio Coder using ARM Core(R))

  • 원양희;이형일;강상원
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.119-124
    • /
    • 2009
  • 본 논문에서는 AMR Core(R)를 이용해서 AMR-WB+ 오디오 부호화기를 실시간 구현하였다. 구현 시 사용된 최적화 방법은 어셈블리어 단계에서 수행되었고, latency를 제거하고 32비트 레지스터를 사용하였다. 구현된 음성 부호화기는 평균 복잡도가 ARM9E 버전에서 인코더 160.76MHz, 디코더 33.05MHz으로 총 193.81MHz로 측정되었다. 사용된 ROM의 크기는 인코더 65.21Kbyte, 디코더 32.01Kbyte, 공통소스 279.81Kbyte이다. 구현된 AMR-WB+ 소스 코드는 3GPP에서 제공하는 테스트 벡터들을 CodeWarrior와 목표 PDA 상에서 모두 bit-exact하게 통과함을 보임으로써 검증되었다.

부동 소수점 DSP를 이용한 MPEG-4 HVXC 인코더 및 디코더의 실시간 구현 (Real-time Implementation of MPEG-4 HVXC Encoder and Decoder on Floating Point DSP)

  • 강경옥;나훈;홍진우;정대권
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.37-44
    • /
    • 2000
  • 본 논문에서는 인터넷 폰, 디지털 이동통신 등과 같이 낮은 비트율이 요구되는 분야에 사용될 수 있는 MPEG-4 오디오의 HVXC(Harmonic Vector eXcitation Coding) 알고리즘을 부동 소수점 DSP인 TMS320C6701에 실시간 구현한 내용을 기술한다. 실시간 동작을 위한 하드웨어 구조를 채택하였으며, 소프트웨어 최적화의 경우 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어 및 어셈블리 언어 레벨의 최적화를 수행하였다. 또한, DSP의 내부 프로그램 메모리의 프로그램 캐쉬로의 활용, DSP의 내부 데이터 메모리의 영역의 중첩 활용 및 background DMA 방식을 이용한 최적화를 수행하였다. 최적화 결과 2kbps및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있으며, 인코더의 경우 2kbps의 경우에는 최적화 전에 비해 약 96% 정도로 수행시간을 단축하였다. 또한, 비공식 주관품질 평가에 의하면 2kbps의 비트율에서 약 MOS 2.45를 얻었다.

  • PDF