• 제목/요약/키워드: 역변환기

검색결과 11건 처리시간 0.038초

곱셈기를 재사용하는 16×16 HEVC 코어 역변환기 설계 (16×16 HEVC Inverse Core Transform Architecture Using Multiplier Reuse)

  • 이종배;이성수
    • 전기전자학회논문지
    • /
    • 제19권3호
    • /
    • pp.378-384
    • /
    • 2015
  • 기존의 HEVC 코어 역변환기에서는 동일한 시간에 동일한 수의 화소를 처리하기 위해서 $2n{\times}2n$ 역변환기에 여분의 $n{\times}n$ 역변환기를 추가하여 한 개의 $2n{\times}2n$ 역변환기 또는 두 개의 $n{\times}n$ 역변환기로 동작하게 하였으나 여분의 $n{\times}n$ 역변환기 때문에 하드웨어 크기가 증가하는 단점이 있다. 이러한 문제점을 해결하기 위해 곱셈기를 재사용하여 여분의 $4{\times}4$ 역변환기를 없앤 새로운 $8{\times}8$ HEVC 코어 역변환기 구조가 제안되었으며, 본 논문에서는 이를 확장한 $16{\times}16$ HEVC 코어 역변환기 구조를 제안한다. 제안하는 $16{\times}16$ HEVC 역변환기는 $4{\times}4$ 역변환, $8{\times}8$ 코어 역 변환, $16{\times}16$ 코어 역변환에서 프레임 처리 시간이 모두 동일하며, 여분의 역변환기를 사용하는 아키텍쳐에 비해 게이트 수를 13% 줄일 수 있다.

고성능 HEVC 복호기를 위한 효율적인 32×32 역변환기 설계 (The Efficient 32×32 Inverse Transform Design for High Performance HEVC Decoder)

  • 한금희;류광기
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.953-958
    • /
    • 2013
  • 본 논문에서는 고성능 HEVC 복호기를 위한 효율적인 $32{\times}32$ 역변환기 하드웨어 구조를 제안한다. HEVC는 4k, 8k 이미지와 같이 기존의 이미지코덱에 비해 훨씬 더 큰 크기의 이미지를 처리할 수 있는 새로운 영상 압축 표준이다. 큰 이미지의 데이터를 효과적으로 처리하기 위해 다양한 새 블록 구조를 채택하였으며, 이 블록들은 $4{\times}4$, $8{\times}8$, $16{\times}16$, $32{\times}32$으로 구성되었다. 이 논문에서는 $32{\times}32$ 역변환기의 효과적인 구조를 제안하며, 역변환기의 구조는 $32{\times}32$ 행렬을 $16{\times}16$ 행렬로 재구성하고 쉬프트와 덧셈기로 구성된 곱셈기를 사용하여 연산을 단순화 하였으며 멀티 사이클 패스를 구현하여 낮은 주파수에서도 동작이 가능하도록 설계하였다. 또한 HEVC 코덱의 다양한 크기의 변환이나 순방향 변환 블록에 쉽게 적용할 수 있다.

곱셈기를 재사용하는 8×8 HEVC 코어 역변환기 설계 (8×8 HEVC Inverse Core Transform Architecture Using Multiplier Reuse)

  • 이종배;이성수
    • 전기전자학회논문지
    • /
    • 제17권4호
    • /
    • pp.570-578
    • /
    • 2013
  • 본 논문에서는 곱셈기를 재사용하는 $8{\times}8$ HEVC 코어 역변환기 아키텍쳐를 제안한다. HEVC 코어 변환에서는 하위 크기 블록 전체와 상위 크기 블록의 짝수 부분이 동일하기 때문에 $8{\times}8$ 코어 변환기 하나로 $8{\times}8$$4{\times}4$ 코어 변환을 모두 수행할 수 있다. 그러나 $8{\times}8$ 코어 변환이 8 화소를 동시에 처리하는데 반하여 $4{\times}4$ 코어 변환은 4 화소만 동시에 처리하기 때문에 하나의 $8{\times}8$ 코어 변환기로 $4{\times}4$$8{\times}8$ 코어 변환을 모두 처리하게 되면 $4{\times}4$ 코어 변환에서 프레임을 처리하는데 필요한 시간이 $8{\times}8$ 코어 변환의 2배가 된다. 본 논문에서는 이러한 문제점을 해결하기 위해서 곱셈기를 재사용하여 $8{\times}8$ 코어 역변환기 하나를 두 개의 $4{\times}4$ 코어 역변환기로도 동작시킬 수 있는 새로운 코어 역변환기 아키텍쳐를 제안한다. 제안하는 $8{\times}8$ 코어 역변환기는 프레임 처리 시간이 $8{\times}8$ 코어 역변환과 $4{\times}4$ 코어 역변환에서 모두 동일하며, 기존에 제안된 아키텍쳐에 비해 게이트 수를 12% 줄일 수 있다.

HEVC 및 VP9 겸용 통합 역변환기의 설계 (Design of Unified Inverse Transformer for HEVC and VP9)

  • 정슬기;이성수
    • 전기전자학회논문지
    • /
    • 제19권4호
    • /
    • pp.596-602
    • /
    • 2015
  • 본 논문에서는 HEVC와 VP9 겸용의 통합 역변환기를 설계하였다. 제안하는 아키텍처는 $4{\times}4$부터 $32{\times}32$ 크기의 HEVC IDCT, $4{\times}4$ 크기의 HEVC IDST, $4{\times}4$부터 $32{\times}32$ 크기의 VP9 IDCT, $4{\times}4$부터 $16{\times}16$ 크기의 VP9 IADST, $4{\times}4$ 크기의 IWHT까지 모든 모드의 계수 변환을 통합 역변환기에서 처리가 가능하다. HEVC와 VP9의 IDCT는 계수의 스케일만 다를 뿐 동일한 연산을 사용하며, HEVC의 $4{\times}4$ IDST와 VP9 $4{\times}4$ IADST 또한 계수의 스케일만 다를 뿐 동일한 연산을 사용한다. 더욱이 HEVC IDCT, VP9 IDCT, VP9 IADST 또한 상위 수준 IDCT의 서브셋이다. 제안하는 아키텍처는 연산이 같은 경우 곱셈기를 재사용하고 계수가 다를 경우에도 덧셈기 및 버터플라이 구조등을 최대한 공유함으로써 하드웨어의 크기를 크게 줄였다. 0.18 um 공정에서 합성했을 때 게이트 수가 456,442 게이트로 기존 아키텍처 대비 22.6% 감소하였다.

스케일링과 변환계수 복호를 위한 효율적인 하드웨어 설계 (An Efficient Hardware Design for Scaling and Transform Coefficients Decoding)

  • 정홍균;류광기
    • 한국정보통신학회논문지
    • /
    • 제16권10호
    • /
    • pp.2253-2260
    • /
    • 2012
  • 본 논문에서는 H.264/AVC 복호기의 역변환과 역양자화를 위한 효율적인 하드웨어 구조를 제안한다. 기존 역변환 및 역양자화기에서는 AC계수와 DC계수를 복호하는 순서가 다르다. 색차 DC계수와 인트라 $16{\times}16$ 모드에서 휘도 DC계수는 역변환을 수행하고 역양자화를 수행하는 반면에, 휘도 및 색차 AC계수는 역양자화를 수행하고 역변환을 수행하기 때문에 하드웨어로 구현시 제어 복잡도가 증가한다. 제안하는 구조는 DC계수와 AC계수에 관계없이 역양자화를 수행한 후 역변환을 수행하여 제어 복잡도를 감소시키고, 역양자화 연산을 공통 연산기를 사용하여 처리함으로써 계산 복잡도가 감소한다. 기존 역양자화기에는 나눗셈 연산을 포함하고 있어 복호하는 순서를 변경할 경우 오차가 발생하기 때문에 나눗셈 연산을 역변환 후에 수행하여 오차를 방지한다. 또한, 역변환기와 역양자화기를 3단 파이프라인으로 구성하고 수평 IDCT와 수직 IDCT를 병렬로 구현하여 수행 사이클을 감소시켰다. 제안하는 역변환기와 역양자화기의 매크로블록 당 처리되는 사이클 수를 비교 분석한 결과, 기존 구조 대비 45%이상 향상된 결과를 얻었다.

DGS용 Z-원 MSVPWM 인버터 제어 (Control of Z-Source MSVPWM Inverter for DGS)

  • 박영산;배철오;남택근
    • 한국마린엔지니어링학회:학술대회논문집
    • /
    • 한국마린엔지니어링학회 2006년도 전기학술대회논문집
    • /
    • pp.277-278
    • /
    • 2006
  • This paper presents circuit models and control algorithms of distributed generation system(DGS) which consists of Z-type converter and PWM inverter Z-type converter which employs both the L and C passive components and shoot-through zero vectors instead of the conventional DC/DC converter in order to step up DC-link voltage. Discrete time sliding mode control with the asymptotic observer is used for current control.

  • PDF

RTOS기반 임베디드 S/W를 위한 API 정변환/역변환기의 개발 (An API Translator for RTOS-Based Embedded Software Considering Forward/Reverse Transformation)

  • 박병률;맹지찬;이종범;유민수;안현식;정구민
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.187-189
    • /
    • 2007
  • In this paper, we present a model-driven approach for RTOS-based embedded software development and an automated tool that produces RTOS-specific code or RTOS-independent code. We define generic RTOS APIs (Application Programming Interface) that are not bound to any specific RTOS but provide most of typical RTOS services. Generic RTOS APIs can be used to describe application's RTOS-related behavior, The proposed API translator translates task code between C-code for specific RTOS and intermediate code using generic API. Also, the result can be extended to other RTOS's modifying XML transformation rule.

  • PDF

고성능 잔여 데이터 복호기를 위한 최적화된 하드웨어 설계 (An Optimized Hardware Design for High Performance Residual Data Decoder)

  • 정홍균;류광기
    • 한국산학기술학회논문지
    • /
    • 제13권11호
    • /
    • pp.5389-5396
    • /
    • 2012
  • 본 논문에서는 H.264/AVC의 고성능 잔여 데이터 복호기를 위해 최적화된 하드웨어 구조를 제안한다. 제안하는 하드웨어 구조는 새로운 역영자화 수식들을 적용한 공통 연산기를 갖는 병렬 역양자화기와 병렬 역변환기를 통합한 하드웨어 구조이다. 새로운 역양자화 수식들은 기존 수식에서 나눗셈 연산을 제거하여 연산량 및 처리시간을 감소시키고 새로운 수식들을 처리하기 위해 곱셈기와 왼쪽 쉬프터로 구성된 하나의 공통 연산기를 사용한다. 역양자화기는 4개의 공통 연산기를 병렬처리하기 때문에 $4{\times}4$ 블록의 역양자화 수행 사이클 수를 1 사이클로 감소시키고, 제안하는 역변환기는 8개의 역변환 연산기를 사용하여 $4{\times}4$ 블록의 역변환 수행 사이클 수를 1 사이클로 감소시킨다. 또한 제안하는 구조는 역양자화 연산과 역변환 연산을 동시에 수행하기 때문에 하나의 $4{\times}4$ 블록을 처리하는 데 1 사이클이 소요되어 수행 사이클 수가 감소한다. 제안하는 구조를 Magnachip 0.18um CMOS 공정 라이브러리를 이용하여 합성한 결과 게이트 수는 21.9k, critical path delay는 5.5ns이고, 최대 동작 주파수는 181MHz이다. 최대 동작 주파수에서 제안하는 구조의 throughput은 2.89Gpixels/sec이다. 표준 참조 소프트웨어 JM 9.4에서 추출한 데이터를 이용하여 성능을 측정한 결과 제안하는 구조의 수행 사이클 수가 기존 구조들 대비 88.5% 이상 향상되었다.

임베디드 리눅스와 uCOS-2 간 소스코드 변환에 대한 연구 : 세마포어를 이용한 쓰레드 동기화 예제 (Research of the Source Code Transformation Between Embedded Linux and uCOS-2 : The Thread Synchronization Example using Semaphore)

  • 이종덕;이민철;맹지찬;유민수;안현식;정구민
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.314-315
    • /
    • 2008
  • 본 논문에서는 임베디드 리눅스와 uCOS-2 간 소스코드 변환에 대한 연구를 위해 API 정변환/역변환기(API 변환기)를 이용하여 두 RTOS 간 소스코드 변환을 실험한다. API 변환기는 임베디드 소프트웨어의 개발을 돕기 위해 개발된 프로그램으로서, 정변환과 역변환 기능을 이용하여 이종 RTOS 간 소스코드를 자동으로 상호 변환한다. 정변환이란 중간형태의 C-코드인 CIC 파일에서 특정 RTOS를 위한 C-코드로 변환하는 것을 의미한다. 반대로 역변환은 특정 RTOS를 위한 C-코드로부터 CIC 파일로 변환하는 것을 가리킨다. 본 논문의 실험에서는 임베디드 리눅스와 uCOS-2의 동기화 소스코드 예제를 API 변환기를 이용하여 상호 변환해본다. 그리고 변환된 소스코드의 정상동작 여부를 확인하기 위해 각각의 타깃보드 위에 소스코드를 포팅한다.

  • PDF

MDA에 기반한 실시간 운영체제 API 정변환/역변환기의 개발 (A Forward/Reverse API Translator for Real-Time Operating System Based on a Model-Driven Approach)

  • 박병률;맹지찬;이종범;류민수;안현식;정구민
    • 전기학회논문지
    • /
    • 제56권12호
    • /
    • pp.2247-2250
    • /
    • 2007
  • This paper presents an automated API translator for embedded software development based on a model-driven approach. Since MDA(Model Driven Architecture) provides little support for the development of embedded software, we propose a new approach containing its advantages. First, we define #generic APIs# which do not depend on any RTOS#s but provide most of typical RTOS services. We can describe RTOS-related behaviors of target application using these generic APIs in a CIC(Common Intermediate Code). Then, we propose a transformation tool for translating between a CIC using generic APIs and a C-code for specific RTOS. The proposed API translator converts them using XML transformation rule which is defined outside. It indicates that an API translator extends to other RTOS#s by modifying or adding the transformation rule. From the experiment. we validate the proposed method.