Search | Korea Science

Dynamic Rank Subsetting with Data Compression

Hong, Seokin
- Journal of the Korea Society of Computer and Information
- /
- v.25 no.4
- /
- pp.1-9
- /
- 2020
In this paper, we propose Dynamic Rank Subsetting (DRAS) technique that enhances the energy-efficiency and the performance of memory system through the data compression. The goal of this technique is to enable a partial chip access by storing data in a compressed format within a subset of DRAM chips. To this end, a memory rank is dynamically configured to two independent sub-ranks. When writing a data block, it is compressed with a data compression algorithm and stored in one of the two sub-ranks. To service a memory request for the compressed data, only a sub-rank is accessed, whereas, for a memory request for the uncompressed data, two sub-ranks are accessed as done in the conventional memory systems. Since DRAS technique requires minimal hardware modification, it can be used in the conventional memory systems with low hardware overheads. Through experimental evaluation with a memory simulator, we show that the proposed technique improves the performance of the memory system by 12% on average and reduces the power consumption of memory system by 24% on average.
https://doi.org/10.9708/jksci.2020.25.04.001 인용 PDF KSCI

Methods reducing frame memories of a video decoder and its comparisons (비디오 디코더의 프레임 메모리를 줄이는 알고리즘 및 성능 분석)

김이랑;이동호
- Proceedings of the IEEK Conference
- /
- 2001.09a
- /
- pp.47-50
- /
- 2001
본 논문에서는 프레임 메모리를 줄이는 간이형 비디오 디코더의 다섯가지 알고리즘을 연구하여 성능을 비교한다. fixed-length ADPCM 기법을 적용하여 메모리를 줄이는 알고리즘과 수평 방향으로 decimation 하는 방법, 그리고 DCT 계수를 filtering 하는 방법을 구현하고 이보다 더 압축률을 높여서 수평 방향으로 decimation 하거나 DCT 계수를 filtering 하는 방법에 ADPCM 기법을 결합한다. 이렇게 함으로써 원래의 비디오 디코더 프레임 메모리의 25% 까지 메모리를 줄일 수가 있다. 메모리 크기를 줄이는 이점 이외에, 하나의 비디오 디코더 구조가 몇가지 압축 모드를 구성하므로 원하는 복잡도와 메모리 크기에 따라 응용이 자유롭다.
PDF

Overlapped Block-wise End-to-End Image Compression Method (중첩 블록 단위 종단간 이미지 압축 방법)

Kim, Min-Sub;Lee, Jong-Seok;Sim, Dong-Gyu
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2020.11a
- /
- pp.155-157
- /
- 2020
본 논문은 딥러닝 기반의 중첩 블록 단위 이미지 압축 방법에 대하여 제안한다. 이미지를 블록 단위로 나누어 압축을 진행하며, 그 과정에서 생길 수 있는 블록화 현상을 제거하기 위해 블록의 주변부를 압축에 이용한다. 이로 인한 추가적인 부하를 제거하기 위해 복호화에 필요한 부하 영역을 제거한 뒤, 복호화기에서 특징맵들을 병합하여, 제거한 영역에 대해 주변 블록의 정보를 사용하여 복호화를 진행한다. 압축을 진행하고자 하는 이미지의 크기에 따라 급격하게 증가하는 요구 메모리를 이미지의 크기에 상관 없이 고정된 작은 메모리로 이미지 압축을 진행할 수 있다는 장점이 있다. 실험 결과로써 4K 이미지를 통해서 복원된 화질과 메모리의 사용량을 측정한 결과, 동일한 화질을 유지함과 동시에, 기존 방법대비 약 500배 적은 메모리 사용량을 보인다.
PDF

Implementation of A Low-Power Embedded System via Scratch-pad Memory Compression (스크래치 패드 메모리의 압축을 통한 저전력 임베디드 시스템의 구현)

Suh, Hyo-Joong
- The KIPS Transactions:PartA
- /
- v.15A no.5
- /
- pp.269-274
- /
- 2008
Recently, lots of embedded processors which can run streaming multimedia with high resolution display are introduced. Among the applications running on these embedded processors, real-time audio streaming is one of the applications that suffer from the lack of energy and memory space. In this paper, we propose a novel data compression method on scratch-pad memory, which saves both useful space on the scratch-pad memory and energy. We have implemented the data compression scheme on the GDM1202 real-time audio streaming processor, and the performance results show that we obtained 13.3% energy saving while maintaining comparable application performance to that of the non-compression case.
https://doi.org/10.3745/KIPSTA.2008.15-A.5.269 인용 PDF KSCI

The Efficient Memory Mapping of FPGA Implementation for Real-Time 2-D Discrete Wavelet Transform (실시간 이차원 웨이블릿 변환의 FPGA 구현을 위한 효율적인 메모리 사상)

김왕현;서영호;김종현;김동욱
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.26 no.8B
- /
- pp.1119-1128
- /
- 2001
본 논문에서는 이차원(2-D) 이산 웨이블릿 면환(Discrete Wavelet Transform, DWT)을 이용한 연상압축기를 FPGA 칩에서 실시간으로 동작 가능하도록 하는 효율적인 메모리 스케줄링 방법(E$^2$M$^2$)을 제안하였다. S/W적으로 위의 메모리 사상 방법을 검증한 후, 실제로 상용화된 SFRAM을 선정하여 메모리 제어기를 구현하였다. 본 논문에서는 Mallet-tree를 이용한 2-D DWT 영상압축 칩을 구현할 경우를 가정하였다. 이 알고리즘은 연산 과정에서 많은 데이터를 정장하여야 하는데, FPGA는 많은 데이터를 저장할 수 있는 메모리가 내장되어 있지 않으므로 외부 메모리를 사용하여야 한다. 외부메모리는 열(row)에 대해서만 연속(burst) 읽기, 쓰기 동작이 가능하기 때문에 Mallet-tree 알고리즘의 데이터 입출력을 그대로 적용할 경우 실시간 동작을 수행하는 DWT 압축 칩을 구현할 수 없다. 본 논문에서는 데이터 쓰기를 수행할 경우에는 메모리 셀(cell)의 수직 방향을 저장시키고 읽기를 수행할 때는 수평으로 데이터의 연속 읽기를 수행함으로써 필터가 항상 수평 방향에 위치하게 하는 방법을 제안하였다. 입방법을 C-언어로 DWT 커넬(Kernel)과 메모리의 에뮬레이터(emulator)를 구현하여 실험한 결과, Mallat-tree 이론을 그대로 적용시켰을 때와 동일한 필터링을 수행할 수 있음을 검증하였다. 또한, 상용화된 SDRAM의 메모리 제어기를 H/W로 구현하여 시뮬레이션 함으로써 본 논문에서 제안한 방법이 실제적인 하드웨어로 실시간 동작을 할 수 있음을 보였다.
PDF

Motion Estimation Architecture for Low Memory Access in H.264/AVC (메모리 접근 감소를 위한 움직임 예측기)

Choi, Min-Seok;Lee, Seong-Won
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2010.07a
- /
- pp.432-434
- /
- 2010
움직임 추정(ME)은 동영상 압축에서 영상 화질과 인코더 속도에 대하여 중요한 역할을 하지만, 많은 수의 메모리 접근과 연산량이 발생한다. 기존의 움직임 추정 방법은 현재 프레임의 블록을 참조 프레임의 검색범위 내의 블록과 매칭하여 움직임 차이를 계산하여 움직인 위치를 추정하게 된다. H.264와 같은 최근의 압축 표준에서는 1/4화소 단위까지 움직임 예측을함으로써 영상 데이터 압축의 효율을 높일 수 있으나, 많은 양의 메모리 접근과 연산의 복잡도가 크게 증가하게 된다. 본 논문에서는 메모리 접근 횟수를 감소시키기 위하여 SAR(Search Area Reuse)알고리즘을 사용하여, 참조 프레임의 블록을 현재 프레임의 블록과 매칭하여 움직임 예측하는 방법을 제안한다. 본 논문에서 제안하고 있는 아키텍쳐는 현재프레임의 검색범위 내에 있는 데이타를 재사용함으로서 메모리 액세스를 줄일 수 있으며, 참조프레임의 한 블록당 1/4화소 단위까지의 연산을 한 번만 하게 되므로 메모리 접근 횟수 감소와 함께 연산의 복잡도도 줄일 수 있다.
PDF

Lossless Frame Memory Compression for Effective High Resolution Video Processing (효과적인 고해상도 비디오 처리를 위한 무손실 프레임 메모리 압축 기법)

Kim, Jongho
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.11a
- /
- pp.966-968
- /
- 2021
본 논문에서는 효과적인 고해상도 비디오 데이터의 처리를 위하여 부호화기 내에서 참조 영상을 저장하는 프레임 메모리를 압축하는 방법을 제안한다. 프레임 메모리는 응용분야의 특성상 무손실 압축 및 저 복잡도를 갖는 방법이 요구되는데, 블록 단위의 PCT 를 이용하여 픽셀 사이의 상관도를 제거하고, 적응적 GR 부호기를 이용하여 최종 비트열을 구성하여 압축하는 방법을 제안한다. 다양한 테스트 영상을 대상으로 실험한 결과 제안하는 방법이 기존의 압축 방법에 비해 압축 성능이 우수하면서 실행 시간으로 측정한 복잡도 측면에서 유사한 성능을 나타냄을 확인하였다. 압축 성능과 복잡도의 두가지 측면을 종합적으로 판단한 결과 제안하는 방법이 기존의 방법에 비해 충분히 경쟁력이 있음을 알 수 있다.
https://doi.org/10.3745/PKIPS.y2021m11a.966 인용 PDF

Design and Evaluation of Cache Structure for Semi-packed Instruction (부분 압축 명령어를 위한 캐쉬 구조의 설계 및 평가)

Hong, Won-Gi;Lee, Seung-Yeop;Kim, Sin-Deok
- Journal of KIISE:Computer Systems and Theory
- /
- v.28 no.5
- /
- pp.245-258
- /
- 2001
VLIW에서는 프로그램 코드를 병렬화 하는 작업이 모두 컴파일러에 의해서만 이루어진다. 따라서 병렬로 수행될 연산어들을 명시적으로 나타내 주어야 하며, 이를 위한 명령어 인코딩 방식으로 전개 인코딩 방식과 압축 인코딩 방식이 사용되어 왔다. 각 인코딩 방식들은 명령어의 적재 및 검색을 위해 서로 다른 캐쉬 구조를 필요로 하는데, 전개 인코딩 방식으로 비압축 캐쉬를 압축 인코딩 방식으로 압축 캐쉬를 사용하고 있다. 그러나 이들은 각각 무효 연산어로 인한 메모리 활용 효율 저하와 복원 과정으로 인한 명령어 인출 오버헤드의 증가라는 문제점을 안고 있다. 본 논문에서는 부분적으로 명령어 길이를 일정하게 유지하는 부분 압축 인코딩을 사용해 메모리 활용 효율을 높이는 동시에 명령어 인출 오버헤드를 줄일 수 있는 분할 캐쉬 구조를 제안한다. 각 캐쉬 구조를 구현하는데 필요한 칩 영역을 계산하여, 분할 캐쉬가 비교적 비용 효율적인 캐쉬 구조임을 확인하였다. 모의 실험을 통한 메모리 활용 효율 측정 결과 하드웨어 비용의 증가를 고려하더라도 분할 캐쉬는 비압축 캐쉬에 비해 최고 약 3배의 메모리 활용 효율을 얻을 수 있었다. 각 캐쉬 구조를 일차 캐쉬로 하는 VLIW 시스템들의 성능 측정 결과는 TCSC(블록 집중형 분할 캐쉬)를 사용한 시스템이 비용 대비 성능 면에서 가장 우수한 것으로 나타났다.
PDF

Compression-Based Volume Rendering on Distributed Memory Parallel Computers (분산 메모리 구조를 갖는 병렬 컴퓨터 상에서의 압축 기반 볼륨 렌더링)

Koo, Gee-Bum;Park, Sang-Hun;Song, Dong-Sub;Ihm, In-Sung
- Journal of KIISE:Computing Practices and Letters
- /
- v.6 no.5
- /
- pp.457-467
- /
- 2000
본 논문에서는 분산 메모리 구조를 갖는 병렬 컴퓨터 상에서 방대한 크기를 갖는 볼륨 데이터의 효과적인 가시화를 위한 병렬 광선 투사법을 제안한다. 데이터의 압축을 기반으로 하는 본 기법은 다른 프로세서의 메모리로부터 데이터를 읽기보다는 자신의 지역 메모리에 존재하는 압축된 데이터를 빠르게 복원함으로써 병렬 렌더링 성능을 향상시키는 것을 목표로 한다. 본 기법은 객체-순서와 영상-순서 탐색 알고리즘 모두의 정점을 이용하여 성능을 향상시켰다. 즉, 블록 단위의 최대-최소 팔진트리의 탐색과 각 픽셀의 불투명도 값을 동적으로 유지하는 실시간 사진트리를 응용함으로써 객체-공간과 영상-공간 각각의 응집성을 이용하였다. 본 논문에서 제안하는 압축 기반 병렬 볼륨 렌더링 방법은 렌더링 수행 중 발생하는 프로세서간의 통신을 최소화하도록 구현되었는데, 이러한 특징은 프로세서 사이의 상당히 높은 데이터 통신 비용을 감수하여야 하는 PC 및 워크스테이션의 클러스터와 같은 더욱 실용적인 분산 환경에서 매우 유용하다. 본 논문에서는 Cray T3E 병렬 컴퓨터 상에서 Visible Man 데이터를 이용하여 실험을 수행하였다.
PDF

A full-Hardwired Low-Power MPEG4@SP Video Encoder for Mobile Applications (모바일 향 저전력 동영상 압축을 위한 고집적 MPEG4@SP 동영상 압축기)

Shin, Sun Young;Park, Hyun Sang
- Journal of Broadcast Engineering
- /
- v.10 no.3
- /
- pp.392-400
- /
- 2005
Highly integrated MPEG-4@SP video compression engine, VideoCore, is proposed for mobile application. The primary components of video compression require the high memory bandwidth since they access the external memory frequently. They include motion estimation, motion compensation, quantization, discrete cosine transform, variable length coding, and so on. The motion estimation processor adopted in VideoCore utilizes the small-size local memories such that the video compression system accesses external memory as less frequently as possible. The entire video compression system is divided into two distinct sub-systems: the integer-unit motion estimation part and the others, and both operate concurrently in a pipelined architecture. Thus the VideoCore enables the real-time high-quality video compression with a relatively low operation frequency.
PDF KSCI

Search Result 320, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)