• 제목/요약/키워드: Global Cache

검색결과 31건 처리시간 0.032초

중첩 NEMO 환경에서 트리 기반 라우트 최적화 기법 (Tree based Route Optimization in Nested NEMO Environment)

  • 임형진;정태명
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-19
    • /
    • 2008
  • 이 논문은 인터넷으로 중첩 NEMO 네트워크가 연결될 때 최적화가 요구되는 두 가지 연결성을 고려하고 있다. 하나는 인터넷과 중첩 NEMO 네트워크 사이의 연결이고, 다른 하나는 중첩 NEMO 네트워크 내부의 MR간의 연결성이다. 이러한 연결성은 IPv6에 기반하고 있으며, 중첩 NEMO 네트워크는 NEMO를 인식하는 AR(Access Router)에 의해 구성될 수 있다. 특히 이 논문은 중첩 NEMO의 토폴로지 특성을 나타내는 트리 기반한 토폴로지 정보를 포함하고, 트리 구조를 가지는 주소 체계를 제안한다. 이 제안은 기존에 대표적인 RO(Route Optimization) 제안들과 비교할 때, MR 홈 네트워크로의 BU(Binding Update) 성능은 가장 효율적인 접근과 비슷하였고, 내부라우팅 효율은 가장 효율적으로 나타났다.

  • PDF

스누핑 프로토콜을 사용하는 NUMA 시스템의 계층적 링 구조로의 확장 (Hierarchical Ring Extension of NUMA Systems using Snooping Protocol)

  • 성현중;김형호;장성태;전주식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1305-1317
    • /
    • 1999
  • NUMA 구조는 원격 메모리에 대한 접근이 불가피한 구조적 특성 때문에 상호 연결망이 성능을 좌우하는 큰 변수가 된다. 기존에 대중적으로 사용되던 버스는 물리적 확장성 및 대역폭에서 대규모 시스템을 구성하는 데 한계를 보인다. 이를 대체하는 고속의 지점간 링크를 사용한 링 구조는 버스가 가지는 확장성 및 대역폭의 한계라는 단점을 개선하였으나, 많은 클러스터가 연결되는 경우에는 전송 지연시간이 증가하는 문제점을 가지고 있다. 본 논문에서는 스누핑 프로토콜이 적용된 링 구조에서 클러스터 개수 증가에 따른 지연시간 증가의 문제점을 보완하기 위해 계층적 링 구조로의 확장을 제안하고, 이 구조에 효과적인 캐쉬 일관성 프로토콜을 설계하였다. 전역 링과 지역 링을 연결하는 브리지는 캐쉬 프로토콜을 관리하며 이 프로토콜에 의해 지역 링의 부하를 줄일 수 있도록 트랜잭션을 필터링하는 역할도 담당함으로써 시스템의 성능을 향상시킨다. probability-driven 시뮬레이터를 통해 계층적 링 구조가 시스템의 성능 및 링 이용률에 미치는 영향을 알아본다. Abstract Since NUMA architecture has to access remote memory, interconnection network performance determines performance of NUMA architecture. Bus, which has been used as popular interconnection network of NUMA, has a limit to build a large-scale system because of limited physical scalability and bandwidth. Ring interconnection network, composed of high-speed point-to-point link, made up for bus's defects of scalability and bandwidth. But, it also has problem of increasing delay as the number of clusters is increased. In this paper, we propose a hierarchical expansion of snoop-based ring architecture in order to overcome ring's defects of increasing delay. And we also design an efficient cache coherence protocol adopted to this architecture. Bridge, which connects local ring and global ring, maintains cache coherence protocol and does snoop-filtering which reduces local ring and cluster bus utilization. Therefore bridge can improve performance of this system. We analyze effects of hierarchical architecture on the performance of system and utilization of point-to-point links using probability-driven simulator.

Development for a Simple Client-based Distributed Web Caching System

  • Park, Jong-Ho;Chong, Kil-To
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.2131-2136
    • /
    • 2003
  • Since the number of user-requests increases dramatically on the Internet, the servers and networks can be swamped unexpectedly without any prior notice. Therefore, the end-users are waiting or refused for the responses of the contents from the originating servers. To solve this problem, it has been considered that a distributed web caching system efficiently utilizes structural elements of the network. Because a distributed web caching system uses the caches that are close to end-users on the network, it transmits the contents to users faster than the original network system. This paper proposes a simple client-based distributed web caching system(2HRCS) that client can directly perform object allocation and load balancing without an additional DNS for load balancing in CARP (Cache Array Routing Protocol) and GHS (Global Hosting System) that are the recent distributed web caching system protocol. The proposed system reduces the cost of setup and operation by removing DNS that needs to balance the load in the existing system. The system has clients with consistent hashing method, so it extends its environment to other distributed web caching system that has caches of different capacity. A distributed web caching system is composed and tested to evaluate the performance. As a result, it shows superior performance to consistent hashing system. Because this system can keep performance of the existing system and reduce costs, it has the advantage of constructing medium or small scale CDN (Contents Delivery Network).

  • PDF

A Comparative QSPR Study of Alkanes with the Help of Computational Chemistry

  • Kumar, Srivastava Hemant
    • Bulletin of the Korean Chemical Society
    • /
    • 제30권1호
    • /
    • pp.67-76
    • /
    • 2009
  • The development of a variety of methods like AM1, PM3, PM5 and DFT now allows the calculation of atomic and molecular properties with high precision as well as the treatment of large molecules with predictive power. In this paper, these methods have been used to calculate a number of quantum chemical descriptors (like Klopman atomic softness in terms of $E_n^{\ddag}\;and\;E_m^{\ddag}$, chemical hardness, global softness, electronegativity, chemical potential, electrophilicity index, heat of formation, total energy etc.) for 75 alkanes to predict their boiling point values. The 3D modeling, geometry optimization and semiempirical & DFT calculations of all the alkanes have been made with the help of CAChe software. The calculated quantum chemical descriptors have been correlated with observed boiling point by using multiple linear regression (MLR) analysis. The predicted values of boiling point are very close to the observed values. The values of correlation coefficient ($r^2$) and cross validation coefficient ($r_{cv}^2$) also indicates the generated QSPR models are valuable and the comparison of all the methods indicate that the DFT method is most reliable while the addition of Klopman atomic softness $E_n^{\ddag}$ in DFT method improves the result and provides best correlation.

내장형 시스템을 위한 저전력 2-레벨 캐쉬 메모리의 설계 (Low-Power 2-level Cache Architectures for Embedded System)

  • 이종민;김순태;김경아;박수호;김용호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.806-809
    • /
    • 2008
  • 온칩(on-chip) 캐쉬는 외부 메모리로의 접근을 감소시키는 중요한 역할을 한다. 본 연구에서는 내장형 시스템에 맞추어 설계된 2-레벨 캐쉬 메모리 구조를 제안하고자 한다. 레벨1(L1) 캐쉬의 구성으로 작은 크기, 직접사상(direct-mapped) 그리고 바로쓰기(write-through)를 채용한다. 대조적으로 레벨2(L2) 캐쉬는 일반적인 캐쉬 크기와 집합연관(Set-associativity) 그리고 나중쓰기(write-back) 정책을 채용한다. 결과적으로 L1캐쉬는 한 사이클 이내에 접근될 수 있고 L2캐쉬는 전체 캐쉬의 미스율(global miss rate)을 낮추는데 효과적이다. 두 캐쉬 계층간 바로쓰기(write-thorough) 정책에서 오는 빈번한 L2 캐쉬 접근으로 인한 에너지 소비를 줄이기 위해 본 연구에서는 One-way 접근 기법을 제안하였다. 본 연구에서 제안한 2-레벨 캐쉬 메모리 구조는 평균적으로 26%의 성능향상과 43%의 에너지 소비 그리고 77%의 에너지-지연 곱에서 이득을 보여주었다.

클라우드 시스템에서 해양수치모델 성능 최적화 (Performance Optimization of Numerical Ocean Modeling on Cloud Systems)

  • 정광욱;조양기;탁용진
    • 한국해양학회지:바다
    • /
    • 제27권3호
    • /
    • pp.127-143
    • /
    • 2022
  • 최근 클라우드 컴퓨팅 환경에서 해양수치모델 실험을 수행하는 많은 연구가 활발하게 진행되고 있다. 클라우드 컴퓨팅 환경은 대규모 자원이 필요한 해양수치모델을 구현하는데 매우 효과적인 수단이 될 수 있다. 정보처리 기술의 발달로 클라우드 컴퓨팅 시스템은 가상화와 원격 고속 네트워크, 직접 메모리 액세스와 같은 수치모델의 병렬처리에 필요한 다양한 기술과 환경을 제공한다. 이러한 새로운 기능은 클라우드 컴퓨팅 시스템에서 해양수치모델링 실험을 용이하게 한다. 많은 과학자들과 엔지니어들은 해양수치모델 실험에 있어서 가까운 미래에 클라우드 컴퓨팅이 주류가 될 것으로 기대하고 있다. 해양수치모델링을 위한 클라우드 컴퓨팅의 처리성능 분석은 수치모델의 수행 시간과 리소스 활용량을 최소화하는 데 도움이 될 수 있으므로 최적의 시스템을 적용하는 데 필수적이다. 특히 모델 격자 내 다양한 변수들이 다차원 배열 구조로 되어 있기 때문에 대량의 입출력을 처리하는 해양수치모델의 구조는 캐시메모리의 효과가 크며, 대량의 자료가 이동하는 통신 특성으로 인해서 네트워크의 속도가 중요하다. 최근에 주요한 컴퓨팅환경으로 자리잡고 있는 클라우드 환경이 이러한 해양수치모델을 수행하기에 적합한지 실험을 통해서 검토할 필요가 있다. 본 연구에서는 상용 클라우드 시스템에서 해양수치모델로 대표적인 Regional Ocean Modeling System (ROMS)와 더불어 다른 해양모델의 클라우드 환경으로 전환에도 도움이 될 수 있게 병렬처리 시스템의 성능을 측정할 수 있는 표준 벤치마킹 소프트웨어 패키지인 High Performance Linpack을 활용하여 초당 부동소수점 연산횟수 처리능력과 및 STREAM 벤치마크를 활용하여 다중 노드들로 구성된 수치모델용 클러스터의 메모리처리성능을 평가하고 비교하였다. 이러한 평가내용은 클라우드 환경에서 해양수치모델을 어떻게 수행할 것인가에 대해 중요한 정보를 제공할 수 있다. 가상화 기반 상용 클라우드에서 얻은 실제 성능 자료와 구성 설정 분석을 통해 가상화 기반 클라우드 시스템에서 해양수치모델의 다양한 격자 크기에 대한 컴퓨터 리소스의 효율성을 평가했다. 본 연구를 통해서 캐시 계층과 용량이 큰 메모리를 사용하는 HPC 클러스터가 ROMS의 성능에 매우 중요하다는 것을 발견했다. 수치모델링의 실행 시간을 줄이기 위해 코어 수를 늘리는 것은 작은 격자 보다 큰 격자 모델에서 더 효과적이다. 이러한 처리 성능 분석 결과는 클라우드 컴퓨팅 시스템에서 해양수치모델을 효율적으로 구축하는 데 중요한 자료로 이용될 것이다.

OMTP BONDI 기반 모바일 웹 위젯 리소스의 효율적 운용 및 구동 성능 개선 기법 연구 (An Effective Employment and Execution Performance Improvement Method of Mobile Web Widget Resources Based on the OMTP BONDI)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.153-170
    • /
    • 2011
  • OMTP (Open Mobile Terminal Platform)는 사용자 지향의 모바일 서비스와 데이터 비즈니스의 성장을 목적으로 이동통신 사업자에 의해서 만들어진 국제 포럼이다. BONDI는 OMTP에서 만든 브라우저 기반의 애플리케이션 혹은 위셋이 무선 단말기의 기능을 보안적인 방법으로 접근하게 하는 모바일 웹 런타임 플랫폼이다. 이는 HTML, JavaScript, CSS, AJAX등 웹 표준 기술로 작성된 애플리케이션이 이동 단말기 내부기능에 접근 할 수 있음을 의미한다. BONDI는 웹 run-time 환경에서 단순 네트워크 애플리케이션의 한계를 벗어나 단말 내부의 리소스를 표준안을 통해 접근하게 하기 때문에 OS, 플랫폼에 상관없는 애플리케이션 및 위셋 개발이 가능하다. 웹 브라우저에서 실행되는 위셋은 네트워크 환경에 영향을 받을 수 있으며, 위셋 및 애플리케이션이 무거워 질수록 위셋의 실행속도가 느려질 수 있다는 단점이 있지만 단말기 내부의 네이티브 애플리케이션에 비해 빠르게 웹 리소스를 사용할 수 있고, 사용자가 접근하기 간편한 인터페이스 때문에 꾸준히 사용될 전망이다. 본 논문에서는 OMTP BONDI 웹 위셋 리소스를 효율적으로 운용하고 관리하기 위한 기법을 제안하고 구동 성능 평가 실험을 통하여 개선 결과를 제시 하였다. 실험은 BONDI 위셋 구동시 사용을 위한 해당 모듈만 로드할 수 있도록 하여 위셋 엔진에서 실행 시 로드되는 모듈 로딩속도를 향상시켜 전체 동작 시간을 개선하고자 하는 목적으로 진행되었다. 이를 위해 BONDI 위셋의 실행속도를 빠르게 할 수 있는 Widget Resource List를 재정의 하고 Widget Cache를 사용하였으며 기존 사용 위셋을 삭제한 후에도 관리할 수 있는 Widget Box를 고안하여 일시적으로 사용하지 않는 위셋을 보관 할 수 있도록 하였다.

다중 TMS320C31 DSP를 사용한 3-D 비젼센서 Implementation (A 3-D Vision Sensor Implementation on Multiple DSPs TMS320C31)

  • V.옥센핸들러;A.벤스하이르;P.미셰;이상국
    • 센서학회지
    • /
    • 제7권2호
    • /
    • pp.124-130
    • /
    • 1998
  • 독립적인 로보트나 자동차 제어 응용을 위하여 고속 3-D 비젼시스템들은 매우 중요하다. 이 논문은 다음과 같은 세가지 과정으로 구성되는 stereo vision process 개발에 대하여 논술한다 : 왼쪽과 오른쪽 이미지의 edges 추출, matching coresponding edges와 3-D map의 계산. 이 process는 VME 150/40 Imaging Technology vision system에서 이루어졌다. 이것은 display, acqusition, 4Mbytes image frame memory와 세 개의 연산 카드로 구성되는 modular system이다. 40 MHz로 작동하는 프로그래머불 연산 모듈은 $64{\times}32$ bit instruction cache와 두개의 $1024{\times}32$ bit RAM을 가진 TMS320C31 DSP에 기초를 두고 있다. 그것들은 각각 512 Kbyte static RAM, 4 Mbyte image memory, 1 Mbyte flash EEPROM과 하나의 직렬 포트로 구성되어있다. 모듈간의 데이터 전송과 교환은 8 bit globalvideo bus와 세 개의 local configurable pipeline 8 bit video bus에 의하여 이루어졌고, system management를 위하여 VME bus가 쓰였다. 두 개의 DSP는 왼쪽 및 오른쪽 이미지 edges 검출을 위하여 쓰였고 마지막 processor는 matching process와 3-D 연산에 사용되었다. $512{\times}512$픽셀 이미지에서 이 센서는 scene complexity에 따라 1Hz정도의 조밀한 3-D map을 생성했다. 특수목적의 multiprocessor card들을 사용하면 결과를 향상시킬 수 있을 것이다.

  • PDF

Mode Change 환경을 위한 개선된 동적 퀀텀 크기 Pfair 스케줄링 (An Improved Dynamic Quantum-Size Pfair Scheduling for the Mode Change Environments)

  • 차성덕;김인국
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권3호
    • /
    • pp.279-288
    • /
    • 2007
  • 최근 다중프로세서 실시간 시스템 환경에서 최적인 Pfair 스케줄링(PF) 알고리즘[1]이 Baruah 등에 의해 제안되었고, 이를 기반으로 하는 몇 가지 스케줄링 알고리즘들이 제안되었는데 이들은 모두 고정된 퀀텀 크기를 가정하고 있다. 전역 스케줄링 기법인 Pfair 기반 스케줄링 알고리즘에서 퀀텀 크기는 태스크 교환과 캐시 재적재와 같은 스케줄링 오버헤드에 직접적인 영향을 미치게 된다. 이에 따라 태스크 집합에 대한 최적 퀀텀 크기를 결정하기 위한 방법이 제안되었으며[2], 모든 태스크들의 주기와 실행 요구 시간이 $e\;{\leq}\;p/3+1$의 성질을 만족하는 제한적 특성의 태스크 집합에 대해서 보다 효율적으로 최적 퀀텀 크기를 결정할 수 있는 방법[3]이 제안된 바 있다. 그런데 이들 방법에서는 최적의 퀀텀 크기를 결정하기 위해 반복적으로 프로세서의 이용률을 계산하였다. 본 논문에서는 이러한 제한적 특성의 태스크 집합에 대해서 프로세서 이용률 계산을 반복적으로 수행하지 않고 상수 시간에 최적 퀀텀 크기를 결정할 수 있는 보다 효율적인 방법을 제안한다.

  • PDF

세트 연관 캐쉬를 사용한 2단계 적응적 분기 예측 (2-Level Adaptive Branch Prediction Based on Set-Associative Cache)

  • 심원
    • 정보처리학회논문지A
    • /
    • 제9A권4호
    • /
    • pp.497-502
    • /
    • 2002
  • 조건부 분기 명령어는 분기 벌칙을 야기함으로써 명령어 수준의 병렬도 향상에 제약을 가한다. 고성능 슈퍼스칼라 프로세서의 등장으로 인해, 정확한 분기 예측의 중요성은 더욱 높아지고, 이를 위해 동적 분기 예측의 일종인 2단계 적응적 분기 예측(2-level adaptive branch prediction) 방식이 개발되었다. 그러나 2단계 적응적 분기 예측이 상당히 높은 예측 정확도를 보여주고 있음에도 불구하고, 정확도에 따른 비용이 기하급수적으로 증가하는 등의 문제점을 가지고 있다. 본 논문에서는 2단계 적응적 분기 예측의 이러한 문제점을 개선하기 위하여 세트 연관 캐쉬를 이용한 캐쉬 상관 분기 예측기(cached correlated branch predictor)를 제안하고, 기존의 방식에 비해 예측의 정확도는 증가하고, 비용은 줄어든 것을 시뮬레이션을 통하여 확인한다. 세트 연관 예측기의 경우 전역과 지역 방식의 가장 좋은 예측 실패율은 각각 5.99%, 6.28%이며, 이는 종래의 2단계 적응적 분기 예측 방식에서의 가장 좋은 결과인 9.23%, 7.35%에 비해 각각 54%, 17% 향상된 결과이다.