• 제목/요약/키워드: Hardware Compression

검색결과 194건 처리시간 0.028초

중간 결과값 연산 모델을 위한 2차원 DCT 구조 (Two-dimensional DCT arcitecture for imprecise computation model)

  • 임강빈;정진군;신준호;최경희;정기현
    • 전자공학회논문지C
    • /
    • 제34C권9호
    • /
    • pp.22-32
    • /
    • 1997
  • This paper proposes an imprecise compuitation model for DCT considering QOS of images and a two dimensional DCT architecture for imprecise computations. In case that many processes are scheduling in a hard real time system, the system resources are shared among them. Thus all processes can not be allocated enough system resources (such as processing power and communication bandwidth). The imprecise computtion model can be used to provide scheduling flexibility and various QOS(quality of service)levels, to enhance fault tolerance, and to ensure service continuity in rela time systems. The DCT(discrete cosine transform) is known as one of popular image data compression techniques and adopted in JPEG and MPEG algorithms since the DCT can remove the spatial redundancy of 2-D image data efficiently. Even though many commercial data compression VLSI chips include the DCST hardware, the DCT computation is still a very time-consuming process and a lot of hardware resources are required for the DCT implementation. In this paper the DCT procedure is re-analyzed to fit to imprecise computation model. The test image is simulated on teh base of this model, and the computation time and the quality of restored image are studied. The row-column algorithm is used ot fit the proposed imprecise computation DCT which supports pipeline operatiions by pixel unit, various QOS levels and low speed stroage devices. The architecture has reduced I/O bandwidth which could make its implementation feasible in VLSI. The architecture is proved using a VHDL simulator in architecture level.

  • PDF

실시간 데이터 압축을 위한 Lempel-Ziv 압축기의 효과적인 구조의 제안 (An efficient Hardware Architecture of Lempel-Ziv Compressor for Real Time Data Compression)

  • 진용선;정정화
    • 대한전자공학회논문지TE
    • /
    • 제37권3호
    • /
    • pp.37-44
    • /
    • 2000
  • 본 논문에서는 실시간 데이터 압축을 위한 Lempel-Ziv 압축기의 효과적인 하드웨어 구조를 제안한다. 일반적으로 Lempel-Ziv 알고리즘의 구현에서는 matching 바이트 탐색과 dictionary 버퍼의 누적된 shift 동작이 처리 속도에 가장 중요한 문제이다. 제안하는 구조에서는 dictionary 크기를 최적화하는 방법과 복수개의 바이트를 동시에 비교하는 matching 바이트 처리 방법, 그리고 회전 FIEO 구조를 이용하여 shift 동작 제어 방법을 이용함으로써 효과적인 Lempel-Ziv 알고리즘의 처리 구조를 제안하였다. 제안된 구조는 상용 DSP를 사용하여 하드웨어적으로 정확하게 동작함을 검증하였으며, VHDL로 기술한 후 회로 합성을 수행하여 상용 FPGA 칩에 구현하였다. 제안된 구조는 시스템 클락 33㎒, 비트율 256Kbps 전용선에서 오류 없이 동작함을 확인하였다.

  • PDF

효율적인 Transformer 모델 경량화를 위한 구조화된 프루닝 (Structured Pruning for Efficient Transformer Model compression)

  • 류은지;이영주
    • 반도체공학회 논문지
    • /
    • 제1권1호
    • /
    • pp.23-30
    • /
    • 2023
  • 최근 거대 IT 기업들의 Generative AI 기술 개발로 Transformer 모델의 규모가 조 단위를 넘어가며 기하급수적으로 증가하고 있다. 이러한 AI 서비스를 지속적으로 가능케 하기 위해선 모델 경량화가 필수적이다. 본 논문에서는 하드웨어 친화적으로 구조화된(structured) 프루닝 패턴을 찾아 Transformer 모델의 경량화 방법을 제안한다. 이는 모델 알고리즘의 특성을 살려 압축을 진행하기 때문에 모델의 크기는 줄어들면서 성능은 최대한 유지할 수 있다. 실험에 따르면 GPT2 와 BERT 언어 모델을 프루닝할 때 제안하는 구조화된 프루닝 기법은 희소성이 높은 영역에서도 미세 조정된(fine-grained) 프루닝과 거의 흡사한 성능을 보여준다. 이 접근 방식은 미세 조정된 프루닝 대비 0.003%의 정확도 손실로 모델매개 변수를 80% 줄이고 구조화된 형태로 하드웨어 가속화를 진행할 수 있다.

실시간 영상압축과 복원시스템을 위한 DWT기반의 영상처리 프로세서의 VLSI 설계 (VLSI Design of DWT-based Image Processor for Real-Time Image Compression and Reconstruction System)

  • 서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.102-110
    • /
    • 2004
  • 본 논문에서는 이차원 이산 웨이블릿 변환을 이용한 실시간 영상 압축 및 복원 프로세서의 구조를 제안하고 ASIC(Application specific integrated circuit) 라이브러리를 이용하여 최소의 하드웨어로 구현하였다. 구현된 하드웨어에서 데이터 패스부는 웨이블릿 변환과 역변환을 수행하는 DWT 커널(Kernel)부, 양자화기 및 역양자화기, 허프만 엔코더 및 디코더, 웨이블릿 역변환 시 계수의 덧셈을 수행하는 덧셈기 및 버퍼, 그리고 입출력을 위한 인터페이스와 버퍼로 구성하였다. 제어부는 프로그래밍 레지스터와 명령어를 디코딩하여 제어 신호를 생성하는 주 제어부, 그리고 상태를 외부로 알리는 상태 레지스터로 구성된다. 프로그래밍 조건에 따라서 영상을 압축할 때의 출력은 웨이블릿 계수, 양자화 계수 혹은 양자화 인덱스, 그리고 허프만 코드 중에서 선택하여 발생할 수 있고 영상을 복원할 때의 출력은 허프만 디코딩 결과, 복원된 양자화 계수 그리고 복원된 웨이블릿 계수 중에서 선택하여 발생할 수 있다. 프로그래밍 레지스터는 총 16개로 구성되어 있는데 각각이 한번의 수직 혹은 수평 방향의 웨이블릿 변환을 수행할 수 있고 각각의 레지스터들이 차례대로 동작하기 때문에 4 레벨의 웨이브릿 변환을 한번의 프로그래밍으로 수행가능하다. 구현된 하드웨어는 Hynix 0.35m CMOS 공정의 합성 라이브러리를 가지고 Synopsys 합성툴을 이용하여 게이트 레벨의 네트리스트(Netlist)를 추출하였고 이 네트리스트로부터 Vela 툴을 이용하여 타이밍정보를 추출하였다. 추출된 네트리스트와 타이밍정보(sdf 파일)를 입력으로 하여 NC-Verilog를 이용하여 타이밍 시뮬레이션을 수행하여 구현된 회로를 검증하였다. 또한 Apollo 툴을 이용하여 PNR(Place and route) 및 레이아웃을 수행하였다. 구현된 회로는 약 5만 게이트의 적은 하드웨어 자원을 가지고 최대 80MHz에서 동작 가능하였다.

H.264 율제어 알고리듬의 하드웨어 설계 (A hardware design of Rate control algorithm for H.264)

  • 서기범
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.175-181
    • /
    • 2010
  • 본 논문에서는 H.264 방식의 full HD실시간영상압축을 위한 율제어 모듈의 새로운 구조를 제안한다. 제안된 구조에서는 각 매크로블록 라인(full HD의 경우 120 매크로 블록, CIF 의 경우 22 매크로 블록)을 따라 율제어 알고리즘을 사용함으로서 QP 가 변경된다. JM의 H.264 율제어 알고리듬에는 복잡한 산술연산과 부동 소숫점 연산을 가지고 있기 때문에, 정수형 산술 CPU 를 통한 율제어 알고리듬의 구현은 불가능하다. 따라서 우리는 부동 소숫점 연산 유닛을 채용하고, 이 부동소숫점 연산 유닛을 이용하여, 율제어 알고리듬을 구현하였으며, 이 하드웨어를 통하여 실시간에 동작할 수 있음을 확인하였다.

Hadamard변환을 이용한 영상신호의 전송량 압축에 관한 연구 (A Study on Image Data Compression by using Hadamard Transform)

  • 박주용;이문호;김동용;이광재
    • 한국통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.251-258
    • /
    • 1986
  • TV와 같은 영상신호에는 중복도가 많이 존재하며, 이를 줄이기 위한 여러가지 방법들이 연구되고 있다. 본 논문에서는 Hadamard 변환을 이용하여 computer simulation과 실험 모델을 제작하여 데이터 압축에 관해 연구하였다. Hadamard matrix는 +1과 -1로 구성되며, row vector들은 서로 orthogonal하고 변환된 signal을 계산하기 위해서는 가산과 감산만이 필요하기 때문에 가산뿐 아니라 승산이 필요한 Fourier transform등 다른 orthogonal transform 에 비해 hardware구성이 용이하다. 링컨데이타 (64$ imes$64)를 8차와 16차 Hadamard 변환으로 simulation하였고, 8차를 hardware로 구성하였으며 이 경우 이론과 실험을 통해 연구한 결과 좋은 화질을 얻기 위해서는 2.0bits/sample가 필요했다.

  • PDF

Full-HD급 PC기반 DVR System 구현을 위한 FPGA 활용에 관한 연구 (A Study on FPGA utilization For PC-based Full-HD DVR System Implementation)

  • 김기화
    • 한국산학기술학회논문지
    • /
    • 제15권4호
    • /
    • pp.2363-2369
    • /
    • 2014
  • DVR 시스템은 다수의 카메라를 지원하고 채널당 30프레임의 영상을 실시간으로 받을 수 있어야 한다. 따라서 Full-HD급 Multiplexer와 별도의 하드웨어 압축 Codec을 사용하는데, 본 논문에서는 이들을 사용하지 않고 FPGA와 CPU가 가지고 있는 GPU를 이용하여 4채널 Full-HD급 PC기반 DVR의 설계 및 구현 방법에 대하여 기술한다. Multiplexer와 H/W Codec을 사용하지 않는 기존의 방법으로는 실시간으로 채널당 20프레임 정도의 영상을 획득하는 단점을 가지고 있다. FPGA를 이용하여 다채널의 영상을 실시간으로 획득하는 시스템을 설계하였으며, 소프트웨어로는 Intel Media SDK를 이용하여 영상 압축을 구현하였다. 구현된 제품의 성능 평가 결과, 제시한 요구 성능을 모두 만족하였고, 하드웨어 압축 코덱디바이스를 제거함으로써 시스템의 실용성을 확인 하였다.

Lattice 구조를 갖는 효율적인 2차원 이산 웨이블렛 변환 필터 설계 (An Efficient 2D Discrete Wavelet Transform Filter Design Using Lattice Structure)

  • 박태근;정선경
    • 대한전자공학회논문지SD
    • /
    • 제39권6호
    • /
    • pp.59-68
    • /
    • 2002
  • 본 논문에서는 블록 효과(blocking effect)가 없고, 압축성능 또한 높아 영상압축을 포함한 여러 응용 분야에서 널리 사용되고 있는 2차원 이산 웨이블렛 변환(DWT, Discrete Wavelet Transform) 필터를 설계하였다. 필터로는 4개의 필터 탭을 갖는 Two-channel QMF(Quadrature Mirror Filter) PR(Perfect Reconstruction) Lattice 필터를 사용하였다. 제안된 DWT 아키텍쳐는 단순하지만 효과적인 스케줄링 기법을 이용하여 설계되어 최소의 하드웨어(곱셈기, 덧셈기, 레지스터 등)로 구성되었고, 이 아키텍쳐에 두 개의 연속적인 입력이 동시에 제공되면 효율적으로 2차원 DWT를 수행함을 보였다. 제안된 아키텍쳐는 RTL 레벨 시뮬레이션을 통해 검증되었고, 100% 하드웨어 이용도(utilization)를 나타낸다. 다른 연구 결과들과 비교하였을 때 최소의 하드웨어를 사용하여 상대적으로 높은 수행능력을 보였다. 효과적인 메모리 매핑 방법과 그를 위한 주소 발생 방법이 제안되었으며, 고정 소수점 연산 시에 발생하는 에러를 분석하여 적절한 양자화 비트를 결정하기 위한 다양한 시뮬레이션과 성능이 분석되었다.

저전력 테스트를 고려한 효율적인 테스트 데이터 압축 방법 (An Efficient Test Data Compression/Decompression for Low Power Testing)

  • 전성훈;임정빈;김근배;안진호;강성호
    • 대한전자공학회논문지SD
    • /
    • 제42권2호
    • /
    • pp.73-82
    • /
    • 2005
  • 스캔 테스트를 위한 테스트 데이터의 양과 파워 소모는 SoC 테스트에서의 최근의 직면한 가장 큰 문제들이다. 따라서 본 논문에서는 저전력 테스트를 고려한 새로운 테스트 데이터 압축 방법을 제안한다. 제안하는 압축 방법은 테스트 데이터 압축을 위해 압축율, 전력 소모 감소율과 하드웨어 오버헤드를 고려하여 최대 효율을 가지도록 하는데 기초하고 있다. 압축율과 전력 감소율을 높이기 위해서 본 논문에서는 IR (Input Reduction) 기법과 MSCIR (Modified Statistical Code using Input Reduction) 압축 코드을 사용하며, 뿐만아니라 이를 위한 사전 작업인 새로운 스캔 플립플롭 순서 재조합 기법 및 테스트 패턴 순서 재조합 방법을 제안한다. 기존의 연구와는 달리 CSR 구조를 사용하지 않고 원래의 테스트 데이터 $T_D$를 사용하여 압축하는 방법을 사용한다. 이렇게 함으로써 제안하는 압축 방법은 기존의 연구에 비해 훨씬 높은 압축율을 가지며 낮은 하드웨어 오버헤드의 디컴프레션 구조와 적은 전력 소모를 가진다. ISCAS '89 벤치 회로에 대찬 기존의 연구와의 비교로서 그 결과를 알 수 있다.

JPEG 표준안을 이용한 의료 영상 압축 (Medical Image Compression Using JPEG International Standard)

  • 안창범;한상우;김일연
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1993년도 하계학술대회 논문집 A
    • /
    • pp.504-506
    • /
    • 1993
  • JPEG(Joint Photographic Experts Group) 표준안은 디지털 정지 압축을 위하여 국제표준화기구(ISO/SC29/WG10)와 국제전신전화 자문회의(CCITT SG VIII)에 의해서 제안되었다. JPEG 표준안은 전자영상, 컴퓨터 그래픽, 멀티미디어 등과 관련하여 널리 응용되고 있으나, 의료 영상분야에서는 JPEG 압축의 손실 특성 때문에 사용이 매우 제한적이었다. 본 논문에서는 JPEG 표준안을 핵자기 공명 단층 영상 (256 gray levels, $256{\times}256$ size) 압축에 적용하여 그 성능을 조사하였다. 이를 위하여 JPEG 표준안 중 DCT에 기반을 둔 순차식 부호화 압축을 C-Cube Microsystems의 CL550 chip을 사용하여 구현하였고, 점진식 및 무손실 부호화 방식은 특별한 Hardware 없이 Software로 구현하여 실험하였다. 본 실험을 통하여 핵자기 공명 단층 시험 영상에 대해 거의 왜곡없이 약 10-20 정도의 압축률이 얻어짐을 확인할 수 있었다. 특히 JPEG으로 압축하였을 경우 재구성한 영상과 원영상과의 에러 신호가 random noise에 가깝게 나타남으로써 특별한 artifact가 없는 것도 JPEG의 큰 장점으로 부각된다. 한편 JPEG의 점진식 및 게층식 부호화 방식은 압축률과 신호대 잡음비에 있어서는 순차식과 동일하나, 거대한 영상 데이터 베이스 내에서의 빠른 탐색과 비교적 속도가 느린 공중망을 통한 원격 진단에 유용한 특성을 갖는다.

  • PDF