• Title/Summary/Keyword: 메모리 계층

Search Result 260, Processing Time 0.023 seconds

Study on the Performance Evaluation and Analysis of Mobile Cache Memory

  • Lee, Sangmin;Kim, Jongwan;Kim, Ji Young;Oh, Dukshin
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.6
    • /
    • pp.99-107
    • /
    • 2020
  • In this paper, we analyze the characteristics of mobile cache, which is used to improve the data access speed when executing applications on mobile devices, and verify the importance of mobile cache through a cache data access experiment. The mobile device market has grown at a fast pace over the past decade; however, battery limitations and size, price considerations restrict the usage of fast hardware. Thus, their performance are supplemented by using a memory buffer structure such as the cache memory. The analysis mainly focuses on cache size, hierarchical structure of cache, cache replacement policy, and the effect these features has on mobile performance. For the experimental data, we applied a data set from a microprocessor system study, originally used to test the cache performance. In the experimental results, the average data access speed on a mobile device showed a performance improvement of up to 10 times with the presence of cache memory than without. Accordingly, the cache memory was helpful for the performance improvement of a mobile device when the specifications were identical.

A Speed Enhancement Technique for Splatting Using Hierarchical Data Structure (영상공간에서의 계층구조를 사용한 스플래팅의 속도 향상기법)

  • Lee, Rae Kyoung;Ihm, Insung
    • Journal of the Korea Computer Graphics Society
    • /
    • v.4 no.2
    • /
    • pp.33-45
    • /
    • 1998
  • 볼륨 가시화(volume visualization)는 3차원 볼륨 데이터로부터 의미 있는 가시적 정보를 추출하도록 도와주는 연구분야이다. 볼륨 렌더링(volume rendering)은 볼륨 데이터로부터 영상(image)을 얻는 기술을 말하는데, 이러한 렌더링 기법 중 물체공간(object space)에 기반한 스플래팅(splatting) 기법은 볼륨 데이터에 존재하는 응집성(coherence)의 이점을 이용할 수 있는 팔진트리(octree)나 피라미드(pyramid)와 같은 계층구조를 적용하기 쉽다. 본 논문에서는 볼륨 데이터에 팔진트리를 적용한 기존의 스플래팅 기법에 영상공간(image space)에서의 응집성의 이점을 이용하기 위한 계층구조로 4진트리(quadtree)와 범위트리(range tree)를 적용하는 새로운 스플래팅 기법을 제안한다. 이 기법은 볼륨 데이터내의 불투명한 복셀(voxel)들에 의해 가려지는 복셀들에 대한 방문을 가능한 한 피함으로써 전체적인 스플래팅의 속도를 향상시킨다. 이 기법은 잘 알려진 팔진트리, 4진트리 그리고 범위트리를 사용함으로써 그 구현이 쉽고, 추가적으로 많은 메모리를 사용하지 않으면서도 렌더링의 속도를 효율적으로 향상시킬 수 있는 기법이다.

  • PDF

Design of a Network Model for Road Using an Embedded DBMS (임베디드 DBMS를 이용한 네트워크 도로망 모델의 설계)

  • Kim, Y.J.;Kim, S.H.;Moon, K.G.;Park, S.H.
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2009.04a
    • /
    • pp.273-274
    • /
    • 2009
  • 도로네트워크 데이터는 교통 정보, 경로 안내서비스 등 실시간 정보제공을 위해 차량 항법용 데이터에서 가장 핵심적인 영역에 해당하며 효율적인 관리와 유지가 필수적이다. 기존 파일 기반 시스템인 미디어 포맷(KIWI, GDF 등)에서는 콤팩트한 데이터 구성으로 읽기 위주의 빠른 매체 접근 등에 좋은 이점이 있지만, 최근 모바일 시스템 환경에 DBMS를 활용한 위치 기반 서비스(LBS)에 대한 관심이 증가 하고 있다. 이에 본 연구에서는 임베디드 DBMS를 이용하여 네트워크의 계층성을 지원하는 데이터 모델과 이를 활용한 탐색 알고리듬을 설계하고 프로토타입 시스템을 구현하였다. 특히 대규모 도로망의 원거리 탐색을 대상으로 메모리 구성과 탐색 시간 측면에서 일반 영역 탐색방법과 계층 탐색방법의 검색 결과를 비교하여 계층 탐색 방법의 효율성을 검증하였다.

  • PDF

A Study on Lightweight Transport Protocol to support Sleepy node in IoT (IoT 환경에서 sleepy node 지원을 위한 경량화 전송 프로토콜 연구)

  • Youn, JooSang;Hong, Yong-Geun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.10a
    • /
    • pp.936-938
    • /
    • 2013
  • 본 논문에서는 IoT 전송 계층 요구 사항 및 문제점을 기술하고 이를 해결하기 위한 전송 계층 프로토콜을 제안한다. 우선, IoT 환경을 구성하는 디바이스의 경우 물리적으로 많은 제한 조건을 가진 constrained node로 정의된다. 여기서 constrained node는 메모리 크기 및 컴퓨팅 파워가 부족한 노드로 정의된다. 따라서 기존 전송 계층 프로토콜을 그대로 탑재할 수 없다. 더불어 IoT 서비스 특징 중 데이터 전송과 관련된 내용을 보면 데이터 사이즈는 작고, 자주 데이터를 발생 시키지 않는다. 따라서 IoT 디바이스에서 발생하는 데이터는 신뢰적 전송 서비스가 요구된다. 따라서 본 논문에서는 오버헤드가 적은 전송 서비스를 제공하는 전송 프로토콜을 제안하며 더불어 이 프로토콜은 sleepy node를 인지하고 이를 지원하는 IoT 전송 프로토콜이다.

  • PDF

Compression of CNN Using Low-Rank Approximation and CP Decomposition Methods (저계수행렬 근사 및 CP 분해 기법을 이용한 CNN 압축)

  • Moon, Hyeon-Cheol;Moon, Gi-Hwa;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.133-135
    • /
    • 2020
  • 최근 CNN(Convolutional Neural Network)은 영상 분류, 객체 인식 등 다양한 비전 분야에서 우수한 성능을 보여주고 있으나, CNN 모델의 계산량 및 메모리가 매우 커짐에 따라 모바일 또는 IoT(lnternet of Things) 장치와 같은 저전력 환경에 적용되기에는 제한이 따른다. 따라서, CNN 모델의 임무 성능을 유지하연서 네트워크 모델을 압축하는 기법들이 연구되고 있다. 본 논문에서는 행렬 분해 기술인 저계수행렬 근사(Low-rank approximation)와 CP(Canonical Polyadic) 분해 기법을 결합하여 CNN 모델을 압축하는 기법을 제안한다. 제안하는 기법은 계층의 유형에 상관없이 하나의 행렬분해 기법만을 적용하는 기존의 기법과 달리 압축 성능을 높이기 위하여 CNN의 계층 타입에 따라 두 가지 분해 기법을 선택적으로 적용한다. 제안기법의 성능검증을 위하여 영상 분류 CNN 모델인 VGG-16, ResNet50, 그리고 MobileNetV2 모델 압축에 적용하였고, 모델의 계층 유형에 따라 두 가지의 분해 기법을 선택적으로 적용함으로써 저계수행렬 근사 기법만 적용한 경우 보다 1.5~12.1 배의 동일한 압축율에서 분류 성능이 향상됨을 확인하였다.

  • PDF

Synchronous Segmented Bus Architecture for Multitasking on Multimedia System (멀티미디어용 다중작업이 가능한 동기 세그먼트 구조)

  • Jun Chi-Hoon;Yeon Gyu-Sung;Hwang Tae-Jin;Wee Jae-Kyung
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2004.11a
    • /
    • pp.299-302
    • /
    • 2004
  • 본 논문은 OCP(Open Core Protocol)에 호환되는 파이프라인 구조를 가진 시스템 버스와 MPEG 시스템에 적합한 메모리 버스를 갖는 계층 구조를 가지는 새로운 동기 세그먼트 버스를 제안한다. 이 구조는 MPEG 시스템의 모바일 제품에 사용되는 영상 데이터 처리를 위한 메모리 인터페이스에 기반을 둔 버스 구조와 Multi-master와 Multi-slave를 사용하여 고성능의 다중 처리를 위한 양방향 다중 버스 구조(bi-direction multiple bus architecture)를 가진다. 효율적인 데이터 처리를 위하여 파이프라인 stage와 결합된 Master와 Slave의 주소번지가 latency를 결정하며, 시스템의 특성에 따라서 IP 코어를 배치하였다. 제안된 버스는 저 전력 구현을 위하여 세그먼트 버스 구조를 가지고, 멀티미디어 SoC 시스템의 성능 저하 없이 다중 작업이 가능한 구조를 갖는다. Wirability를 고려하여 양방향 구조를 채택하였고, Testablility를 위하여 단방향(uni-direction) 구조와 대체 가능하다. 또한, Local arbiter의 수정만으로 Master의 추가가 가능한 확장 구조를 가진다. Latency를 줄이기 위하여 직접 제어 방식과 단순한 구조의 Central arbiter로 구현되었다.

  • PDF

An Integrated Hierarchical Temporal Memory Network for Multi-interval Prediction of Data Streams (데이터 스트림의 다중-간격 예측을 위한 통합된 계층형 시간적 메모리 네트워크)

  • Diao, Jian-Hua;Bae, Sun-Gap;Sim, Myung-Sun;Bae, Jong-Min;Kang, Hyun-Syug
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.7
    • /
    • pp.558-567
    • /
    • 2010
  • There is a large body of ongoing research to develop efficient prediction methods for data streams. These methods provide single prediction with a fixed time interval. It is necessary to develop a method for multi-interval prediction (MIP) because different prediction results may be obtained based on different intervals in many cases. In this paper, we propose a solution for MIP based on the Hierarchical Temporal Memory (HTM) model. In order to solve the problem of MIP with HTM, we present an Integrated Hierarchical Temporal Memory (IHTM) network by introducing a new node type Zeta1LastNode to the original HTM network. Using the hierarchical characteristic of the IHTM network, different levels in the network learn and model the features of a data stream with different intervals and generate prediction results for different intervals. Performance evaluation shows that the IHTM is efficient in the memory and time consumption compared with the original HTM network in MIP.

An Efficient Index Buffer Management Scheme for a B+ tree on Flash Memory (플래시 메모리상에 B+트리를 위한 효율적인 색인 버퍼 관리 정책)

  • Lee, Hyun-Seob;Joo, Young-Do;Lee, Dong-Ho
    • The KIPS Transactions:PartD
    • /
    • v.14D no.7
    • /
    • pp.719-726
    • /
    • 2007
  • Recently, NAND flash memory has been used for a storage device in various mobile computing devices such as MP3 players, mobile phones and laptops because of its shock-resistant, low-power consumption, and none-volatile properties. However, due to the very distinct characteristics of flash memory, disk based systems and applications may result in severe performance degradation when directly adopting them on flash memory storage systems. Especially, when a B-tree is constructed, intensive overwrite operations may be caused by record inserting, deleting, and its reorganizing, This could result in severe performance degradation on NAND flash memory. In this paper, we propose an efficient buffer management scheme, called IBSF, which eliminates redundant index units in the index buffer and then delays the time that the index buffer is filled up. Consequently, IBSF significantly reduces the number of write operations to a flash memory when constructing a B-tree. We also show that IBSF yields a better performance on a flash memory by comparing it to the related technique called BFTL through various experiments.

Applying In-Page Logging to SQLite DBMS (SQLite DBMS에 IPL 기법 응용)

  • Na, Gap-Joo;Kim, Sang-Woo;Kim, Jae-Myung;Lee, Sang-Won
    • Journal of KIISE:Databases
    • /
    • v.35 no.5
    • /
    • pp.400-410
    • /
    • 2008
  • Flash memory has been widely used in mobile devices, such as mobile phone and digital camera. Recently flash SSD(Solid State Disk), having same interface of the disk drive, is replacing the hard disk of some laptop computers. However, flash memory still cannot be considered as the storage of database systems. The FTL(Flash Translation Layer) of commercial flash SSD, making flash memory operate exactly same as a hard disk, shows poor performance on the workload of databases with many random overwrites. Recently In-Page Logging(IPL) approach was proposed to solve this problem. In this paper, we implement IPL approach on SQLite, a popular open source embedded DBMS, and evaluate its performance. It improves the performance by up to 30 factors for update queries.

Flash Translation Layer for the Multi-channel and Multi-way Solid State Disk (다중-채널 및 다중-웨이반도체 디스크를 위한 플래시 변환 계층)

  • Park, Hyun-Chul;Shin, Dong-Kun
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.9
    • /
    • pp.685-689
    • /
    • 2009
  • Flash memory has several features such as low~power consumption and fast access so that there has been various research on using flash memory as new storage. Especially the Solid State Disk which is composed of flash memory chips has recently replaced the hard disk. At present, SSD adopts the multi-channel and multi-way architecture to exploit advantages of parallel access. In this architecture, data are written on SSD in a unit of a superblock which is composed of multiple blocks in which some blocks are put together. This paper proposes two schemes of selecting, segmenting and re-composing victim superblocks to optimize concurrent processing when a buffer flush occurs. The experimental results show that 35% of superblock- based write operations is reduced by selecting victims and additional 9% by composition of superblock.