• 제목/요약/키워드: cache effectiveness

검색결과 33건 처리시간 0.023초

4-Way 캐쉬의 선택된 Element를 이용한 향상된 동적 분기 예측기 구현 (An Improved Dynamic Branch Predictor by Selective Access of a Specific Element in 4-Way Cache)

  • 황인성;황선영
    • 한국통신학회논문지
    • /
    • 제38A권12호
    • /
    • pp.1094-1101
    • /
    • 2013
  • 본 논문은 4-Way 캐쉬의 선택된 element만을 사용하여 어플리케이션 수행 사이클을 줄인 향상된 동적 분기 예측기를 제안한다. 제안된 동적 분기 예측기는 분기명령어가 페치되면 MRU 버퍼를 참조하여 4-Way 캐쉬의 선택된 element에서 타깃 주소를 얻으므로, 모든 element에 접근하는 기존의 동적 분기 예측기보다 제한된 전력하에서 BTAC entry 수를 증가시킬 수 있어 분기 예측 성공률과 어플리케이션의 수행속도가 상당히 향상된다. 제안된 동적 분기 예측기의 효율성을 SMDL 시스템에 의해 생성된 코어가 벤치마크 어플리케이션을 수행하여 검증한다. 실험결과 동적 분기 예측기가 없는 코어에 비해 생성된 코어의 어플리케이션 수행 사이클은 평균 10.1% 감소하고 어플리케이션의 전력소모는 7.4% 증가한다. 기존 동적 분기 예측기를 사용하는 코어에 비해 수행 사이클은 평균 4.1% 줄어든다.

CCN에서 실시간 콘텐츠 인기도 기반 캐시 정책 (A Real-time Content Popularity-Based Cache Policy in Content Centric Network)

  • 서민근;권태욱
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1095-1102
    • /
    • 2023
  • CCN(: Content Centric Network)은 기존 네트워크 구조를 개선하기 위해 등장한 네트워크로, 주소 대신 콘텐츠 이름에 기반하여 통신한다. 캐시를 활용하여 트래픽을 분산시키고, 중간노드에서 콘텐츠를 전송함으로써 응답시간 감소 효과를 가져오고 있다. 본 논문에서는 CCN 환경에서 제한된 CS 공간을 효율적으로 활용할 수 있도록 인기도를 고려한 캐시 정책을 제안한다. 어떤 콘텐츠에 우선순위를 두어 저장하고 방출할지를 결정하는지에 따라 CCN의 성능이 크게 달라질 수 있다. 가장 효율적인 캐시 교체를 위해 생성자 인기도, 생성자 거리, 콘텐츠 히트수를 기반으로 콘텐츠 인기도를 계산해 우선순위를 정하는 실시간 콘텐츠 인기도 기반 효율적인 캐시 교체정책을 제안하였으며, 새로운 정책의 효율성을 실험을 통해 입증하였다.

동적 분기 예측을 지원하는 임베디드 코어 자동 생성 시스템의 설계와 구현 (Design and Implementation of an Automatic Embedded Core Generation System Using Advanced Dynamic Branch Prediction)

  • 이현철;황선영
    • 한국통신학회논문지
    • /
    • 제38B권1호
    • /
    • pp.10-17
    • /
    • 2013
  • 본 논문은 분기 예측을 지원하는 임베디드 코어 자동 생성 시스템을 제안한다. 제안된 시스템은 동적 분기 예측모듈에 히스토리/분기방향 flag가 추가된 BTAC(Branch Target Address Cache)를 포함하여 타겟 어플리케이션의 수행 속도를 향상 시킬 수 있도록 하였다. 시뮬레이션으로부터 해당 어플리케이션의 분기 정보를 추출하고 이를 토대로 BHT(Branch History Table)와 BTAC의 entry를 결정한다. 제안된 분기 예측의 효율성을 검증하기 위해서 동적 분기 예측 모듈을 포함하는 ARM9TDMI 코어를 SMDL로 기술하고 코어를 생성하였다. 실험 결과는 entry의 수에 따라 면적은 60%까지 증가하였고 어플리케이션의 수행 사이클과 BTAC의 miss rate는 평균 1.7%, 9.6%씩 감소하였다.

Enhancing Location Privacy through P2P Network and Caching in Anonymizer

  • Liu, Peiqian;Xie, Shangchen;Shen, Zihao;Wang, Hui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1653-1670
    • /
    • 2022
  • The fear that location privacy may be compromised greatly hinders the development of location-based service. Accordingly, some schemes based on the distributed architecture in peer-to-peer network for location privacy protection are proposed. Most of them assume that mobile terminals are mutually trusted, but this does not conform to realistic scenes, and they cannot make requirements for the level of location privacy protection. Therefore, this paper proposes a scheme for location attribute-based security authentication and private sharing data group, so that they trust each other in peer-to-peer network and the trusted but curious mobile terminal cannot access the initiator's query request. A new identifier is designed to allow mobile terminals to customize the protection strength. In addition, the caching mechanism is introduced considering the cache capacity, and a cache replacement policy based on deep reinforcement learning is proposed to reduce communications with location-based service server for achieving location privacy protection. Experiments show the effectiveness and efficiency of the proposed scheme.

J-tree : 사용자의 검색패턴을 이용한 대용량 데이타를 위한 효율적인 색인 (J-Tree: An Efficient Index using User Searching Patterns for Large Scale Data)

  • 장수민;서광석;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.44-49
    • /
    • 2009
  • 최근에 휴대용 단말기들의 발전으로, 대용량 데이타에 대한 다양한 검색 서비스들이 휴대용 단말기에 제공되고 있다. 정보 검색을 위한 대부분 응용프로그램들은 대용량 데이타를 검색하기 위하여 B-tree나 R-tree와 같은 색인을 사용한다. 그러나 전체 데이타의 매우 적은 부분이 사용자에 의하여 접근된다. 또한, 각 데이타에 대한 접근 빈도수들은 다양하다. 그러나 B-tree나 R-tree와 같은 색인들은 편향적 접근 패턴의 특성을 고려하지 않는다. 그리고 캐쉬는 빠른 접근을 위해서 반복적으로 접근되는 데이타를 메모리에 저장한다. 그러나 캐쉬에서 사용하는 메모리의 크기는 제한적이다. 본 논문에서는 사용자의 검색패턴들을 고려한 디스크 기반의 새로운 색인구조, J-tree를 제안한다. 제안된 색인은 모든 데이터에 대한 일정한 검색속도를 보장하는 균형트리이다. 그리고 자주 접근된 데이타에 대해서는 빠른 검색속도를 제공한다. 성능평가는 다양한 실험환경에서 제안된 색인의 효율성을 보여준다.

저전력 NAND 플래시 메모리를 위한 필터 버퍼의 효율성 분석 (Analysis on the Effectiveness of the Filter Buffer for Low Power NAND Flash Memory)

  • 정보성;이정훈
    • 대한임베디드공학회논문지
    • /
    • 제7권4호
    • /
    • pp.201-207
    • /
    • 2012
  • Currently, NAND Flash memory has been widely used in consumer storage devices due to its non-volatility, stability, economical feasibility, low power usage, durability, and high density. However, a high capacity of NAND flash memory causes the high power consumption and the low performance. In the convention memory research, a hierarchical filter mechanism can archive an effective performance improvement in terms of the power consumption. In order to attain the best filter structure for NAND flash memory, we selected a direct-mapped filter, a victim filter, a fully associative filter and a 4-way set associative filter for comparison in the performance analysis. According to the results of the simulation, the fully associative filter buffer with a 128byte fetching size can obtain the bet performance compared to another filter structures, and it can reduce the energy*delay product(EDP) by about 93% compared to the conventional NAND Flash memory.

Doughnut: 효율적인 지역성 및 캐슁을 사용하는 향상된 P2P Pastry 오버레이 네트워크 (Doughnut: An improved P2P Pastry Overlay Network with Efficient Locality and Caching)

  • 김명원;곽후근;정규식
    • 정보처리학회논문지C
    • /
    • 제16C권2호
    • /
    • pp.245-256
    • /
    • 2009
  • Pastry 오버레이 네트워크는 분산 해쉬 테이블(DHT : Distributed Hash Table)을 사용하는 구조적(Structured) P2P이다. Pastry에서는 노드들 사이의 메시지 수를 줄이기 위해 각각 공간적 지역성과 캐슁을 이용한 Rosary와 LAR이 제안되었다. Rosary는 Inter-Pastry와 Intra-Pastry로 구성된다. Rosary에서 루트 노드는 각 Intra-Pastry를 대표하는 노드가 할당되고 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이러한 구조로 인해 Rosary는 다음과 같은 단점을 가진다. 첫째는 루트 노드의 실패 시 고장 방지 능력(Fault Tolerance)에 약하다는 점이고, 둘째는 루트 노드를 사용하기 때문에 라우팅 홉 카운트가 기존 Structured P2P에 비해 증가한다는 점이다. 마지막으로 셋째는 통신 부하가 특정 지역에 집중한다는 점이다. LAR의 경우 캐슁이 Intra-Pastry내의 노드들 사이에 골고루 분포되지 않고 Intra-Pastry내의 특정 노드들에 의해서만 사용되어지는 단점을 가진다. 본 논문에서는 Rosary와 LAR의 문제점을 해결한 Doughnut이라 불리는 개선된 Pastry를 제안한다. Doughnut은 지역적 특성에 따라 노드들을 구분한 Inter-Pastry와 Intra-Pastry로 구성되고, 모든 노드들은 Inter-Pastry와 Intra-Pastry 라우팅을 책임진다. 이것은 모든 노드들이 기존의 루트 노드의 역할을 수행함을 의미한다. 이러한 방법은 고장 방지 능력이 감소하는 문제, 라우팅 홉 카운트가 증가하는 문제 및 통신 부하가 균일하게 분포하지 않는 문제를 해결한다. 또한 Doughnut은 지역적으로(Intra-Pastry) 캐쉬의 균일한 분포를 보장하고, 지역안의 캐쉬 콘텐츠는 다른 지역에서도 사용될 수 있기 때문에 효율적으로 캐쉬를 사용할 수 있다. 제안된 알고리즘은 시뮬레이터를 통해 구현되었고, 실험 결과는 기존 방법에 비해 제안된 방법이 효과적임을 보여준다.

P2P 통신 병용 DASH 시스템의 피어 부하 분산 방안 연구 (A Peer Load Balancing Method for P2P-assisted DASH Systems)

  • 서주호;김용한
    • 방송공학회논문지
    • /
    • 제25권1호
    • /
    • pp.94-104
    • /
    • 2020
  • 현재 유무선 인터넷을 통한 미디어 소비는 대부분 ISO/IEC MPEG(Moving Picture Experts Group)에 의해 표준화된 미디어 스트리밍 방식인 DASH(Dynamic Adaptive Streaming over HTTP) 또는 이와 유사한 형태의 적응형 미디어 스트리밍(adaptive media streaming) 기술에 의해 시행되고 있다. 이들은 모두 ISP(Internet Service Provider)가 웹서비스를 원활하게 제공하기 위해 충분히 설치할 수밖에 없는 HTTP 캐시(cache)에 크게 의존한다. 결과적으로 미디어 스트리밍 사용자 증가에 따라 CDN(Contents Delivery Network) 사업자의 서버 증설 부담 대신 ISP의 HTTP 캐시 증설 부담이 커지게 되었다. 이로 인해, ISP들은 이러한 HTTP 증설 비용을 보전하기 위해 CDN 사업자에게 미디어 트래픽 비용을 부과하게 되었다. 최근 이러한 비용을 줄이고자 P2P(Peer-to-Peer) 통신을 함께 사용하는(P2P-assisted) DASH 방식이 제안되었다. 또한 이러한 P2P 통신 병용 DASH 시스템의 효율을 극대화하여 CDN 사업자의 비용을 최대한 절감시키는 피어 선택 알고리듬도 연구되었다. 그러나 이 알고리듬은 선택된 피어에게 부담을 집중시키는 경향이 있다. 본 논문에서는 피어의 부담을 여러 피어들에게 분산시키면서도 CDN 사업자의 비용 절감 수준을 적절하게 유지하는 새로운 피어 선택 알고리듬을 제안하고, 이를 WebRTC(Web Real-Time Communication) 표준 API를 활용한 웹기반 스트리밍 시스템에 구현한 후, 실험을 통해 제안한 알고리듬의 효용성을 검증하였다.

멀티 코어 시스템에서 통신 프로세스의 동적 스케줄링 (Dynamic Scheduling of Network Processes for Multi-Core Systems)

  • 장혜천;진현욱;김학영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.968-972
    • /
    • 2009
  • 멀티 코어 프로세서는 현재 많은 고성능 서버에 적용되어 사용되고 있다. 최근 이들 서버는 점차 높은 네트워크 대역폭 활용을 요구하고 있다. 이러한 요구를 만족시키기 위해서는 멀티 코어를 효율적으로 활용하여 네트워크 처리율을 향상시키는 방안이 필요하다. 그러나 현재 운영체제들은 멀티 코어 시스템을 멀티 프로세서 환경과 거의 동일하게 다루고 있으며 아직 멀티 코어의 고유 특성을 고려한 성능 최적화 시도는 미흡한 상태이다. 이러한 문제를 해결하기 위해서 본 논문에서는 멀티 코어의 특성을 최대한으로 고려하여 프로세스 스케줄링을 결정함으로써 통신 성능을 향상시키는 방안에 대해서 연구한다. 제안되는 프로세스 스케줄링은 멀티 코어 프로세서의 캐쉬 구조, 프로세스의 통신 집중도, 그리고 각 코어의 부하를 기반으로 해당 프로세스에게 최적의 코어를 결정하고 스케줄링한다. 제안된 기법은 리눅스 커널에 구현되었으며 측정 결과는 최신 리눅스 커널의 네트워크 처리율을 20%까지 향상시켰으며 프로세서 자원은 55% 더 절약할 수 있음을 보인다.

PC향 SSD의 성능 분석을 위한 트랜잭션 수준 시뮬레이터 (A Transaction Level Simulator for Performance Analysis of Solid-State Disk (SSD) in PC Environment)

  • 김동;방관후;하승환;정성우;정의영
    • 대한전자공학회논문지SD
    • /
    • 제45권12호
    • /
    • pp.57-64
    • /
    • 2008
  • 본 연구는 전송 수준 모델링 기법을 이용하여 SSD가 장착된 PC 시스템의 성능 분석 및 구조 탐색을 위한 시스템 수준 환경 구축을 제안한다. 구축된 시뮬레이션 환경은 SSD가 장착된 PC 시스템의 관점에서 다양한 구조적 변화에 대한 정량적인 성능 분석을 제공할 뿐만 아니라, 기존의 레지스터 전송 수준 모델링 기법보다 매우 빠른 시뮬레이션 속도를 제공한다. 구축된 시뮬레이터의 유용성을 보이기 위하여, PC 수준의 구조 탐색과 SSD 수준의 구조 탐색을 수행하였다. 특히 SSD 수준의 구조 탐색에서는 캐시 버퍼에서 저장된 데이터의 캐시 적중률에 따른 성능 변화와 NAND 플래시 메모리의 성능 변화가 전체 시스템 성능에 미치는 영향을 분석하였다. 이러한 실험 결과는 제안된 시뮬레이터가 PC 환경하에서 SSD 및 PC 구조의 성능 분석 및 구조 개선에 효율적으로 활용될 수 있음을 보여주었다.