• 제목/요약/키워드: Idle Cache

검색결과 18건 처리시간 0.024초

작은 크기의 Warp 스케쥴러 기반 SIMT구조 고성능 모바일 GPGPU 설계 (Design of a High-Performance Mobile GPGPU with SIMT Architecture based on a Small-size Warp Scheduler)

  • 이광엽
    • 전기전자학회논문지
    • /
    • 제25권3호
    • /
    • pp.479-484
    • /
    • 2021
  • 본 논문은 SIMT구조의 GPGPU에서 적은 core수로 고성능을 달성하기 위한 구조를 제안하고 설계하였다. 모바일기기에 적용하기 위한 GPGPU는 소모전력대비 성능을 높이기 위한 구조가 필수적이다. 소모전력을 줄이기 위해서 core수가 줄어든 대신 성능을 높이기 위해 thread를 관리하기 위한 warp scheduler의 size를 4로 하여 일반적인 GPGPU의 32 보다 크게 줄였다. Warp size를 적게 되면 pipeline의 idle cycle수를 줄일 수 있고 cache 메모리 접근시 miss penalty를 줄이기 위한 memory latency 적용이 효율적이다. 설계된 GPGPU는 부동소수점 연산을 포함하는 테스트 프로그램으로 연산 성능을 측정하고 28nm CMOS공정으로 소비전력을 측정하여 전력당 성능지수로 104.5GFlops/Watt를 얻었다. 본 논문의 결과는 Nvidia의 Tegra K1과 비교하였을 때 약 4배 우수한 전력당 성능지수를 보였다.

하이브리드 하드디스크를 위한 효율적인 선반입 기법 (Effecient Prefetching Scheme for Hybrid Hard Disk)

  • 김정원
    • 한국전자통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.665-671
    • /
    • 2011
  • 하이브리드 하드디스크(Hybrid hard disk drive: H-HDD)가 SSD(Solid state drive)에 비해 경쟁력을 갖기 위해서는 저전력, 읽기 속도가 핵심 요소이다. 본 연구에서는 H-HDD에 장착되어 있는 비휘발성 메모리에 디스크 블록을 선반입하여 저전력과 응답시간을 향상시킬 수 있는 기법을 제안한다. 제안하는 기법의 핵심은 시스템파일이나 자주 사용되는 파일은 파일단위로 캐싱하고 나머지는 블록단위로 선반입한다. 선반입은 디스크 큐를 서비스하고 남은 여유 시간에 우선순위가 높은 블록부터 실행되며 이때 사용되는 우선순위는 시간적, 지역적 지역성을 동시에 고려하여 결정된다. 실험 결과 제안 기법은 기존 기법에 비해 전력소모가 낮고 응답시간이 향상되었음을 확인하였다.

멀티 홉 무선 애드혹 네트워크에서 P2P 응용을 위한 이웃 캐싱 (Neighbor Caching for P2P Applications in MUlti-hop Wireless Ad Hoc Networks)

  • 조준호;오승택;김재명;이형호;이준원
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권5호
    • /
    • pp.631-640
    • /
    • 2003
  • 애드혹 네트워크 상의 노드들이 서로의 분산된 데이타를 주고받는 P2P 응용은 멀티 홈 무선 통신의 오버헤드로 인하여 효율성이 떨어진다. 이것을 극복하기 위해서 본 논문은 이웃 캐싱(neighbor caching) 기법을 제안하고, 이 방법이 노드들의 독립적인 캐싱 방법보다 효율적이라는 것을 보이고 있다. 이웃 캐싱 기법은 쉬고 있는 이웃 노드의 저장 공간을 잠시 빌려 씀으로써 캐싱 공간을 확대하고 먼 거리에서 데이타를 가져오는 멀티 홉 무선 통신의 단점을 극복하는 방법이다. 모의 실험의 결과에 따르면 이웃 캐싱은 망의 크기가 커질 때, 노드들의 쉬는 시간이 길 때, 그리고 노드들의 캐시 크기가 작을 때 좋은 성능을 나타낸다. 이와 함께 본 논문에서는 이웃 캐싱을 할 때 로드들 중에서 최적의 이웃 노드를 선별해 내는 우선순위에 근거한 예측기법(ranking based prediction)을 제안하였다. 우선순위에 근거한 예측 기법을 통해 데이타가 가장 오랫동안 보관될 가능성이 높은 이웃 노드를 선별해내고 우선순위가 낮은 데이타를 이웃 캐싱 하지 않을 수 있어서 이웃 캐싱의 효율성을 높일 수 있다. 모의 실험을 통해 이 방법이 노드들의 상황에 따라 이웃 캐싱의 횟수를 적절히 조절하여 성능향상을 가져올 뿐만 아니라 노드들이 분주한 상황에서도 이웃 캐싱이 유연하게 동작하도록 하는 것을 알 수 있다.

모바일 그리드 컴퓨팅에서 효율적인 자원 확보와 이동성 관리 기법 (Effective resource selection and mobility management scheme in mobile grid computing)

  • 이대원
    • 컴퓨터교육학회논문지
    • /
    • 제13권1호
    • /
    • pp.53-64
    • /
    • 2010
  • 본 논문에서는 모바일 그리드 환경에서 안정적인 자원을 선택하고 활용하는 자원 관리 방법을 제안한다. 모바일 그리드에서 이동 기기를 작업 처리에 이용하고자 하는 연구들이 많이 이루어지고는 있지만 모바일 장치의 불규칙한 이동성, 서비스 탐색, 자원 공유, 기기의 다양성, 제한적인 배터리 용량 등의 제약으로 인하여 기존 유선 그리드 환경에서의 작업 처리에 비해 신뢰성이 매우 낮다. 이러한 문제점을 해결하기 위하여 다양한 연구가 진행되었고 대표적으로 프록시 기반 모바일 그리드 구조와 에이전트 기반 모바일 그리드 구조를 들 수 있다. 본 논문에서는 IP 페이징을 프록시 기반 모바일 그리드 구조에 적용하여 보다 쉽게 유휴 자원 탐색과 그리드 자원 정보를 관리하고자 한다. 그리고 모바일 기기의 작업 관리를 위하여 SIP(Session Initiation Protocol)를 이용하여 지속적으로 모바일 기기의 이동성을 관리하고 페이징 캐쉬를 이용하여 모바일 기기의 자원 변화와 배터리 용량을 관리하여 자원 예약을 통해 진행 중인 작업의 이주를 허용하고자 한다. 시뮬레이션을 통하여 제안하는 모바일 그리드 구조가 효율적이고 안정적임을 보여준다.

  • PDF

칩 멀티 프로세서의 공유 버스를 이용한 유휴 캐시 활용 기법 (Idle Cache Exploiting Techniques for Shared Bus-based Chip Multi-processors)

  • 강석빈;김주환;곽종욱;장성태;전주식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.877-880
    • /
    • 2009
  • 반도체 집적도의 향상과 제한된 프로세서 설계 능력으로 인한 칩 멀티 프로세서의 도입은 최근 수 년 동안 급속히 이루어졌으나, 다수의 프로세싱 코어를 효율적으로 사용하기 위한 기법은 부족한 실정이다. 칩 멀티 프로세서 상에서 실제 작업을 수행하지 않는 유휴 코어의 발생은 불가피하며, 이 때 코어가 소유한 자원들은 낭비될 수 밖에 없다. 기존의 연구들은 이렇게 낭비되는 자원 중에서 캐시의 효율적 관리를 위해 공유 캐시 형태로 캐시를 구성하였으나, 전체 캐시 관리에 따른 많은 오버헤드를 수반하였다. 본 논문에서는 이러한 유휴 캐시의 발생이 불가피함을 인지하고 그것을 칩 내 메모리 공간으로써 활용하여 칩 멀티 프로세서 전체의 성능을 향상시키는 기법을 제안한다. 이를 위해 ARM 코어 기반의 칩 멀티프로세서 시뮬레이터 환경을 구성하여 제안된 기법을 검증한다. 실험 결과 본 논문에서 소개된 기법은 4-코어 및 16 코어 기반 칩 멀티 프로세서 환경에서 각각 17%와 8%의 IPC 향상을 가져왔다.

휴대장치를 위한 응용프로그램 특성에 따른 적응형 전력관리 기법 (An Application-Specific and Adaptive Power Management Technique for Portable Systems)

  • 이강웅;이재진;신현식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권8호
    • /
    • pp.367-376
    • /
    • 2007
  • 본 논문은 dynamic voltage scaling (DVS)를 지원하는 휴대장치를 대상으로 하여 응용프로그램 특성에 따라 실행 중에 전력관리 기법이 다르게 적용되는 적응형 전력관리 기법에 대하여 소개한다. 본 논문의 전력관리 기법은 멀티태스킹 시스템에서 실행되는 soft real-time 프로그램의 memory subsystem 과 프로세서의 실행 시간(run time) 및 유휴 시간(idle time)을 고려하여 프로그램 실행 중에 최적의 DVS가 적용될 수 있도록 하여 전력을 관리한다. 세부적인 전력 및 실행시간 프로파일 정보를 이용할 수 있도록 adaptive power manager(APM)를 개발하여 운영체제에 연동시켰고, Post-pass 최적화기는 APM을 위한 적응형 API를 프로그램의 실행이미지에 삽입하여 실행 중 DVS가 적용되는 코드영역을 표시한다. APM은 프로그램 실행 중에 cache miss 수 등을 측정하는 CPU의 pertormance counter들을 관찰한다. Performance counter들의 값을 바탕으로 CPU와 memory 중심의 코드 영역을 구분하여 프로세서의 유휴 시간에 대한 분석을 수행하고, 표시된 코드영역들에 대한 최적정 전압과 동작 클락을 결정하여 시스템에 반영한다. 제안하는 기법의 효과를 보이기 위하여 Intel의 XScale 프로세서 상에서 동작하는 Windows CE에 본 기법을 구현하였고, 실험을 통하여 본 논문에서 제시하는 기법이 영상이나 음성 데이타를 해독하는 프로그램과 같이 정기적으로 비슷한 일을 수행하는 프로그램에서 효과적임을 알 수 있었다. 실험 결과 본 기법으로 유휴시간에 프로세서를 저전력모드로 바꾸는 기존의 고전적인 전력 관리 기법보다 전체 시스템 전력 소모를 9% 더 절약할 수 있었다. 위성영상과 DEM 개발기술이 87% 이상의 점수를 받아 가장 시장성 및 활용성이 높은 기술로 평가되었으며, 초다분광영상에 대한 기술은 70%를 겨우 넘는 수준에서 평가가 되었다. 멀티센서 공간영상정보 통합처리 기술 개발은 다목적 실용위성의 보유, 국가 NGIS 사업의 결과물이 상당히 축척이 되어 있고, 라이다(LiDAR) 기술의 도입을 위한 환경이 조성되었기에 다른 국가에 비해 멀티센서 기술의 적용과 산업화가 가시화 될 수 있을 것으로 기대된다. 그러나 멀티센서 자료의 수급이 용이하지 못하고, 법 제도적인 한계, 시장의 성숙도가 기대이하라는 점 등의 한계를 노정하고 있다.a var. sieboldii 3. Pinus densiflora, Q. aliena, Q. acutissima, P. thunbergii, Q. acuta 4. Carpinus laxiflora, Camellia japonicas. C. tschonoskii community의 5개 그룹으로 나타났다. 하류의 부착돌말류는 상대적으로 양호한 수질을 가지고 있는 정점 1에서 다양한 생물상을, 탄천의 영향을 받는 정점 2는 상대적으로 수질이 악화되어 호오염성 종들이 높은 분포를 나타내고 있었다. 또한 부착돌말류 중 Cymbella minuta는 다른 부착돌말류에 비해 강한 오염지표성을 나타내고 있었다.p=0.000, $4.76{\pm}3.31$ vs $1.29{\pm}0.92$, p=0.000). 골전이 병소의 발생부위는 척추골이 가장 많았으며, 골반골, 늑골, 두개골, 흉골, 견갑골, 대퇴골, 쇄골, 상완골 순서였다. 두개골 전이병소에 SUVmax가 가장 높은 값을 나타내었으며, 늑골의 SUVrel가 가장 높은 값을 나타내었다. 경화성 골전이 병소가 다른 형태의 골전이

OMTP BONDI 기반 모바일 웹 위젯 리소스의 효율적 운용 및 구동 성능 개선 기법 연구 (An Effective Employment and Execution Performance Improvement Method of Mobile Web Widget Resources Based on the OMTP BONDI)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.153-170
    • /
    • 2011
  • OMTP (Open Mobile Terminal Platform)는 사용자 지향의 모바일 서비스와 데이터 비즈니스의 성장을 목적으로 이동통신 사업자에 의해서 만들어진 국제 포럼이다. BONDI는 OMTP에서 만든 브라우저 기반의 애플리케이션 혹은 위셋이 무선 단말기의 기능을 보안적인 방법으로 접근하게 하는 모바일 웹 런타임 플랫폼이다. 이는 HTML, JavaScript, CSS, AJAX등 웹 표준 기술로 작성된 애플리케이션이 이동 단말기 내부기능에 접근 할 수 있음을 의미한다. BONDI는 웹 run-time 환경에서 단순 네트워크 애플리케이션의 한계를 벗어나 단말 내부의 리소스를 표준안을 통해 접근하게 하기 때문에 OS, 플랫폼에 상관없는 애플리케이션 및 위셋 개발이 가능하다. 웹 브라우저에서 실행되는 위셋은 네트워크 환경에 영향을 받을 수 있으며, 위셋 및 애플리케이션이 무거워 질수록 위셋의 실행속도가 느려질 수 있다는 단점이 있지만 단말기 내부의 네이티브 애플리케이션에 비해 빠르게 웹 리소스를 사용할 수 있고, 사용자가 접근하기 간편한 인터페이스 때문에 꾸준히 사용될 전망이다. 본 논문에서는 OMTP BONDI 웹 위셋 리소스를 효율적으로 운용하고 관리하기 위한 기법을 제안하고 구동 성능 평가 실험을 통하여 개선 결과를 제시 하였다. 실험은 BONDI 위셋 구동시 사용을 위한 해당 모듈만 로드할 수 있도록 하여 위셋 엔진에서 실행 시 로드되는 모듈 로딩속도를 향상시켜 전체 동작 시간을 개선하고자 하는 목적으로 진행되었다. 이를 위해 BONDI 위셋의 실행속도를 빠르게 할 수 있는 Widget Resource List를 재정의 하고 Widget Cache를 사용하였으며 기존 사용 위셋을 삭제한 후에도 관리할 수 있는 Widget Box를 고안하여 일시적으로 사용하지 않는 위셋을 보관 할 수 있도록 하였다.

효율적인 인터넷 대역폭 사용을 위한 웹 프리페칭 기법 (Web Prefetching Scheme for Efficient Internet Bandwidth Usage)

  • 김숙향;홍원기
    • 한국정보과학회논문지:정보통신
    • /
    • 제27권3호
    • /
    • pp.301-314
    • /
    • 2000
  • World Wide Web(이하 웹)은 저렴한 가격과 다양하고 흥미 있는 정보를 쉽고 간편하게 찾아볼 수 있다는 장점으로 웹의 사용자는 하루가 다르게 증가되고 있으며 웹의 사용자의 증가와 함께 웹을 통해 전달되는 데이터 즉, 웹 문서, 그림, 멀티미디어 데이터 등의 크기 또한 빠르게 증가되고 있다. 웹 트래픽을 위한 네트워크 대역폭의 사용량을 살펴보면 사용자들의 요청이 많은 peak periods에는 대부분의 대역폭을 사용하고 있고, off-peak periods에는 사용하지 않는 대역폭이 존재한다. 지금까지 네트워크의 대역폭 소비량을 감소시키고, 검색 지연시간을 줄이기 위해 많은 연구가 이루어졌고 그 해결방안 중 하나가 웹 캐싱이다. 그러나, 웹 캐싱을 사용하더라도 peak periods 동안에는 네트워크 대역폭의 사용량을 감소시키기에는 한계가 있으며 off-peak periods에 여유 있는 네트워크 대역폭을 효율적으로 사용할 수 업사. 본 논문에서는 네트워크 대역폭을 균형 있게 사용하기 위해 캐싱 서버(SQUID)를 기반으로 하는 웹 프리페칭(Web prefetching)기법을 제안한다. 24시간 동안의 웹 사용 상황을 분석하여, 가장 많이 사용되면서 다음 24시간 내에 유효기간을 초과하는 웹 객체를 프리페칭하는 방법을 사용한다. 제안된 웹 프리페칭 기법은 peak periods 동안 요청되리라 예상되는 웹 객체를 off-peak periods 동안 남는 대역폭을 이용하여 미리 캐싱 서버에 가져다 놓은 방법으로써 많은 디스크 용량을 요구하지 않으면서도 캐시 객체 히트율을 높일 수 있다. 또한 사용자들의 웹 접근 패턴을 기반으로 하기 때문에 프리페칭된 웹 객체에 대하여 높은 객체 히트율을 보인다. 본 논문에서 소개한 기법의 유효성 시뮬레이션을 통해서 증명하였다. 시뮬레이션 결과는 본 논문에서 제안된 프리페칭 기법이 효율적으로 peak bandwidth를 줄일 수 있다는 것을 나타낸다.

  • PDF