• 제목/요약/키워드: 캐시 성능

검색결과 407건 처리시간 0.028초

FPGA 기반 실시간 영상 워핑을 위한 영상 캐시 (Image Cache for FPGA-based Real-time Image Warping)

  • 최용준;류정래
    • 전자공학회논문지
    • /
    • 제53권6호
    • /
    • pp.91-100
    • /
    • 2016
  • FPGA 기반 실시간 영상 워핑 시스템에서는 영상 픽셀 정보의 빠른 읽기와 메모리 접근 횟수의 감소를 위하여 영상 캐시를 활용하지만, 일반 컴퓨터 시스템의 캐시 알고리즘은 캐시 부적중(cache miss)에 의한 시간 지연과 복잡한 온라인(on-line) 연산 구조로 인하여 실시간 성능 구현에 어려움이 있다. 본 논문에서는 FPGA 기반 실시간 영상 워핑을 위한 단순한 구조의 영상 캐시 알고리즘을 제안한다. 영상 워핑에서의 픽셀 데이터 접근 순서는 워핑에 적용할 2D 좌표변환 관계에 의하여 결정되며 매 영상 프레임에서 반복되는 특성이 있다. 따라서, 캐시 로드(cache load)에 관한 사항을 오프라인(off-line)에서 미리 프로그램함으로써 캐시 부적중 상황이 발생하지 않음을 보장할 수 있고, 그 결과 온라인에서의 연산이 감소하여 캐시 컨트롤러의 구조가 단순해진다. FPGA를 활용한 전체 시스템 구조를 제시하고, 실험을 통하여 제안하는 영상 캐시 알고리즘의 정확성과 타당성을 확인한다.

캐시를 고려한 T-트리 인덱스 구조 (Cache Sensitive T-tree Index Structure)

  • 이익훈;김현철;허재녕;이상구;심준호;장준호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.12-23
    • /
    • 2005
  • 지난 10년간 CPU의 속도는 메모리의 속도에 비해 급속한 속도로 발전하였다 그 결과 데이터 베이스 시스템을 포함한 다른 컴퓨터 응용분야에서 메모리의 접근이 병목현상을 일으키게 되었다. 메모리의 접근 속도를 줄이기 위해 캐시 메모리가 도입되었다 하지만 캐시 메모리는 원하는 데이타가 캐시에 옮겨져 있어야 메모리 접근 속도를 줄일 수 있다. 때문에 응용프로그램에서 데이타를 어떤 순서로 액세스 하느냐에 따라 캐시의 활용도가 달라지고 응용프로그램의 성능이 달라지게 된다. 이 시점에서 현재 컴퓨터에서 B+-트리가 T-트리보다 더 빠르다는 사실이 알려졌다. B+-트리가 T-트리보다 캐시를 더 효율적으로 사용하기 때문이다. 또한 B+-트리를 개선하여 캐시를 더욱 효율적으로 사용하는 CSB+-트리(Cache Sensitive B+-tree)가 제안되기도 하였다 본 논문의 목표는 T-트리가 캐시를 효율적으로 사용하도록 새로운 T-트리 구조를 개발하는 것이다. CSB+-트리와 같이 시스템의 L2 캐시를 최대한 활용하며 기존 T-트리가 가지는 장점을 가지는 새로운 CST-트리(Cache Sensitive T-트리)를 설계 개발하고, 실험을 통해 기타 다른 인덱스 구조에 비교하여 CST-트리의 우수성을 보인다.

모바일 P2P 환경에서 객체 크기 기반의 협력적인 캐시 교체 정책 (Cooperative Cache Replacement Policy based on Object Size in Mobile P2P Environment)

  • 박교성;송진우;양성봉
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.1135-1138
    • /
    • 2006
  • 최근 모바일 환경에서의 P2P 협력적인 캐싱 기술에 대한 연구가 활발히 이루어지고 있다. 모바일 P2P 협력적인 캐싱이란 객체를 요청한 피어의 전파 범위 안에 있는 다른 피어들을 찾아 원하는 데이터가 있는지 살펴본 후 원하는 데이터가 주변 피어에 없을 때에만 서버에 요청을 보내는 방식으로 데이터 탐색 성능 개선과 제한된 피어의 저장 공간을 효율적으로 이용할 수 있는 장점이 있다. 본 논문에서는 모바일 P2P 네트워크 환경에서 이동성을 가진 피어의 저장 공간을 효과적으로 이용하기 위한 객체 크기 기반 P2P 협력적인 캐시 교체 정책을 제안하고자 한다. 가까운 위치 좌표를 가진 피어들을 하나의 그룹으로 묶은 그룹 기반의 모델링 환경에서 객체의 크기에 따른 캐시 교체 정책을 실제 웹 로그 트레이스에 적용하여 실험하였다. 실험 결과, 제안하는 교체 정책이 기존의 교체 정책들과 비교하여 더 우수한 성능을 보였다.

  • PDF

DMA를 사용한 페이지 Zeroing을 통한 Linux 기반 시스템의 사용자 응답성 향상 기법 (User Interactivity Improving Mechanism in Linux-based Systems by Using Page Zeroing with DMA)

  • 양석우;김정호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.351-354
    • /
    • 2018
  • 데스크탑과 모바일 기기가 고성능화됨에 따라 다양한 분야에서 고사양 응용들이 출시되고 있다. 이러한 응용들의 응답성은 사용자 경험을 결정하는 중요한 요소들 중 하나이다. 측정에 따르면 고사양 응용들 중 하나인 웹 브라우저의 응답시간에서 페이지 zeroing에 소요되는 시간이 적지 않은 비중을 차지한다. 또한 페이지 zeroing이 발생시키는 캐시 오염에 의해 추가적인 성능저하가 발생한다. 본 논문은 페이지 zeroing에 소요되는 시간을 단축하고, zeroing에 의한 캐시 오염으로 인해 발생하는 시스템의 성능저하를 방지하기 위한 기법을 제안한다. 제안된 기법은 사용자 응답시간이 아닌 구간에서 페이지들을 DMA를 사용하여 캐시를 거치지 않고 zeroing하여 보관해 두었다가 페이지 할당 요청시 선 zeroing 된 페이지들을 응용에게 제공한다. 이를 Linux 커널 4.17이 탑재된 데스크탑 환경에서 구현하였고 실험을 통해 확인한 결과 응답시간이 평균 20% 단축됨을 확인하였다.

  • PDF

캐시 교체 정책에 따른 성능 및 면적 비교 연구 (A Study on Performance and Area Comparison according to cache replacement policy)

  • 조상원;박현진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1127-1128
    • /
    • 2023
  • 캐시는 현대 컴퓨터 시스템에서 중요한 성능 개선 요소 중 하나로, 효율적인 데이터 저장 및 액세스를 보장한다. 교체 정책은 캐시의 한정된 용량 내에서 어떤 데이터를 보관하고 어떤 데이터를 대체할지 결정하는 데 중요한 역할을 한다. 이 논문은 Pseudo LRU 와 LRU 교체 정책을 대상으로 cache 에서의 throughput 과 gate count 를 각각 비교한다. LRU 방식을 적용한 cache 와 Pseudo LRU 방식을 적용한 cache 는 Locality 0 과 100 에서 0.001GB/s 미만의 차이를 보이며 각각 0.095GB/s, 0.211GB/s 로 동일했으며 Gate Count 는 각각 134,516 과 130,016 으로 4500 의 감소 효과가 있었다.

다중코어 시스템의 메쉬구조 상호연결망이 성능에 미치는 영향 (The Effect of Mesh Interconnection Network on the Performance of Manycore System.)

  • 김한이;김영환;서태원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.116-119
    • /
    • 2011
  • 다중코어(Many-Core) 시스템은 많은 코어들이 상호연결망을 통해서 연결되어있는 시스템으로, 단일코어나 멀티코어 시스템에 비해 보다 많은 병렬 컴퓨팅 자원을 지원한다. Amdahl 의 법칙에 의하면 병렬화되어 처리하는 부분은 이론적으로 프로세서의 개수에 비례하게 가속화 될 수 있지만, 상호연결망에서의 전송 지연을 비롯한 많은 요인에 의해서 성능의 가속화가 저해된다. 특히 캐시 일관성 규약(Cache Coherence Protocol)을 지원하는 대부분의 다중코어 시스템에서는 병렬화를 함에 있어서 캐시 미스로 인해 발생하는 데이터의 전송 지연이 성능에 많은 영향을 미칠 수 있다. 따라서 효과적인 병렬 프로그램을 위해서는 캐시 구조에 대한 이해를 바탕으로 상호연결망에 대한 연구가 필요하다. 본 논문에서는 메쉬(Mesh) 구조의 64 코어 다중코어 시스템인 TilePro64 를 이용하여 상호연결망의 데이터 전송 지연에 따른 프로그램 성능의 민감도를 측정하였다. 결과적으로 코어간 거리(Hop)가 늘어날수록 작업의 수행시간이 평균적으로 4.27%씩 선형적으로 증가하는 관계가 있는 것으로 나타났다.

콘텐츠 중심 네트워크에서 성능 향상을 위한 인기도 기반 캐시 교체 기법 (Popularity Based Cache Replacement Scheme to Enhance Performance in Content Centric Networks)

  • 우태희;박흥순;김호길
    • 한국통신학회논문지
    • /
    • 제40권11호
    • /
    • pp.2151-2159
    • /
    • 2015
  • 콘텐츠 중심 네트워크(CCN)는 기존의 IP 방식과는 다른 새로운 네트워킹 패러다임으로써 데이터를 찾는데 필요한 라우팅 정보를 콘텐츠 이름에서 찾는 방식이다. CCN은 노드마다 콘텐츠를 저장할 수 있는 캐시를 가지고 있어서 반복적인 콘텐츠 요청에 효율적으로 처리할 수 있다. 본 논문은 콘텐츠의 인기도를 활용한 캐시 교체 기법을 제안하여 기존의 기법보다 캐시의 히트율을 향상시켰고, 이에 따라 서버의 부하 및 Round Trip Time(RTT) 시간이 감소하여 성능이 향상됨을 증명하였다.

MMDB에서 캐시 친화를 고려한 최적의 레코드 저장노드 크기 (Optimal Size of Record Storage Node in MMDB Considering Cache-consciousness)

  • 김경석;이익훈;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.217-219
    • /
    • 2004
  • MMDB에서 성능에 가장 근 영향을 미치는 부분은 로깅. 체크포인트, 락이다. 기존 연구는 이것들의 성능에 많은 초점을 맞추었으며, 이는 레코드 저장노드 크기에 관한 연구도 마찬가지다. 하지만 초고성능을 요하는 최신 MMDB 응용에서는 성능 조건을 충족시키기 위해 로깅, 체크포인트, 락을 포기하고 기본적인 레코드 저장구조 기능만으로 MMDB를 운용하기도 한다. 이 경우 레코드 저장구조 성능이 중요하게 된다. 이 논문에서는 실험을 통해 최적의 레코드 저장구조 성능을 보이는 레코드 저장노드 크기를 구한다. 그리고 실험 결과를 CPU 캐시 친화 관점에서 분석한다. 최종적으로는 MMDB 시스템 전체 성능의 최적화 관점에서, 실험 결과 얻어진 레코드 저장노드 크기를 검토한다.

  • PDF

장기간 접속 단절된 이동 클라이언트를 위한 효과적 캐시 유지 기법 (An Efficient Cache Maintenance Scheme for Long Disconnected Mobile Clients)

  • 박광진;송문배;강상원;황종선
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.276-284
    • /
    • 2005
  • 접근 빈도가 높은 데이타를 클라이언트의 캐시에 저장하여 사용하는 것은 한정된 무선 대역폭을 사용하는 이동 컴퓨팅 환경에서 매우 중요한 이슈이다. 그러나 클라이언트의 접속 단절이 빈번하게 발생하는 무선환경에서 캐시 데이타의 일관성을 보장해주기 위해서는 적지 않은 노력이 필요하다. 최근에는 캐시 데이타의 일관성 검사를 위하여 서버의 주기적인 무효화보고(Invalidation Report, IR) 기법을 이용한 연구가 활발하게 진행되고 있다. 하지만 클라이언트가 오랜 접속 단절이 발생할 경우 모든 캐시 데이타를 버려야 하므로, 성능에 큰 장점을 얻을 수 없게 된다 이에 본 논문에서는 이동 컴퓨팅 환경에서 빈번한 접속 단절로 인하여 오랫동안 무효화 보고를 받지 못하더라도 유효한 캐시 데이타를 최대한 유지시킬 수 있는 기법들을 제안한다. 먼저 클라이언트가 접속 단절 후 첫 재접속이 되었을 경우. 자신의 접속 단절 시간을 전송하도록 하여 서버가 동적으로 IR에 포함될 이전 일정 주기를 결정하도록 하였다. 이에 반하여 두 번째 기법에서는 서버가 특정 기간 동안의 IR 정보를 저장하도록 하여, 오랜 접속 단절 후에도 클라이언트가 직접 캐시 데이타의 일관성 검사를 요청할 수 있도록 하였다. 제안한 기법에 의해 현저히 줄어드는 클라이언트의 캐시 손실률과 그에 따른 업링크 수의 감소, 그리고 질의에 대한 응답시간의 감소로 인한 시스템 성능 향상은 시뮬레이션을 통해 확인된다.

칩의 크기가 제한된 단일칩 프로세서를 위한 레벨 1 캐시구조 (A Level One Cache Organization for Chip-Size Limited Single Processor)

  • 주영관;김석일
    • 정보처리학회논문지A
    • /
    • 제12A권2호
    • /
    • pp.127-136
    • /
    • 2005
  • 이 논문에서는 단일 칩 프로세서에서 제한된 공간의 레벨 1 캐시를 구성하고 있는 선인출 캐시 $L_P$와 요구인출 캐시 $L_1$의 합이 일정한 때, $L_1$$L_P$의 크기의 적정한 비율을 실험을 통하여 분석하였다. 실험 결과, $L_1$$L_P$의 합이 16KB일 경우에는 $L_1$을 12KB, $L_P$를 4KB로 구성하고 $L_P$의 선인출 기법과 캐시교체정책은 각각 OBL과 FEO을 적용시키는 레벨 1 캐시 구조가 가장 성능이 우수함을 보였다. 또한 이 분석은 $L_1$$L_P$의 합이 32KB 이상인 경우에는 $L_P$의 선인출 기법으로는 동적필터 기법을 사용하는 것이 유리함을 보였고 32KB의 공간이 가용한 경우에는 $L_1$을 28KB, $L_P$를 4KB로, 64KB가 가용한 경우에는 $L_1$을 48KB, $L_P$를 16KB로 레벨 1 캐시를 분할하는 것이 가장 좋은 성능을 발휘함을 보였다.