• 제목/요약/키워드: Code cache

검색결과 30건 처리시간 0.024초

목적 코드에서 LNOP 코드가 제거됨에 따른 SVLIW 구조의 성능 향상 (Performance Improvement of SVLIW Architectures by Removing LNOPs from An Object Code)

  • 정보윤;전중남;김석일
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2269-2279
    • /
    • 1997
  • SVLIW (Superscalar VLIW) 프로세서는 실시간에 긴 명령어를 스케줄하는 VLIW 프로세서의 일종으로 인출되어 실행될 긴 명령어가 사용할 자원과 앞서 인출되어 수행중인 긴 명령어가 사용하는 자원간에 충돌이 발생하면 인출하여 실행하려는 긴 명령어를 수행하지 않고 NOP으로만으로 구성된 긴 명령어(LNOP: Long NOP word)를 할당하여 긴 명령어간의 충돌로 인한 계산의 오류를 피한다. 따라서 SVLIW 프로세서에서는 목적 코드 내에서 LNOP을 제거할 수 있다. 본 논문에서는 목적 코드에서 LNOP이 제거됨에 따라 캐쉬 적중률이 얼마나 향상되는지를 분석하고 이로 인하여 예상되는 성능 향상을 연구하였다. 여러 가지의 벤치 마크 프로그램에 대한 모의 실험 결과, SVLIW 프로세서 구조는 기존의 VLIW 프로세서 구조에 비하여 성능이 5%이상 향상됨이 확인될 수 있었다.

  • PDF

액티브 네트워크 환경에서 실행 코드 교체를 위한 ANC 캐싱 기법 (ANC Caching Technique for Replacement of Execution Code on Active Network Environment)

  • 장창복;이무훈;조성훈;최의인
    • 한국통신학회논문지
    • /
    • 제30권9B호
    • /
    • pp.610-618
    • /
    • 2005
  • 인터넷과 컴퓨터의 성능이 발달함에 따라 사용자들은 네트워크를 통해 많은 정보를 얻고 있다. 이에 따라 네트워크를 이용하는 사용자의 요구도 다양해지고 빠르게 증가하고 있다. 하지만 이러한 다양한 사용자 요구를 현재의 네트워크에서 수용하기에는 많은 시간이 걸리기 때문에, 액티브 네트워크와 같은 기술들이 연구되고 있다. 이런 액티브 네트워크 환경에서 액티브 노드는 이전 네트워크에서처럼 단순하게 패킷을 전달하는 기능뿐 만아니라 사용자의 실행 코드를 저장하고, 처리할 수 있는 기능을 가지고 있다. 따라서 액티브 노드에 전달된 패킷을 실행하기 위해서는 각 패킷을 처리하는데 필요한 실행 코드가 요구되고, 이러한 실행 코드가 실행하려는 액티브 노드 내에 존재하지 않을 경우 이전 액티브 노드나 코드 서버에 요청함으로써 얻을 수 있다. 하지만 이러한 실행 코드를 바로 액티브 노드에서 실행하지 않고, 이전 액티브 노드나 코드 서버에서 가져오게 되면 실행코드가 전달될 때까지의 시간지연이 발생하므로 네트워크의 트래픽 증가와 실행 시간 증가를 가져올 수 있다. 따라서 사용되었던 실행 코드를 액티브 노드의 캐시에 저장하여 코드의 실행 속도를 증가시키고 이전 액티브 노드로의 코드 요청 횟수를 감소시킬 필요가 있다. 따라서 본 논문에서는 액티브 노드 상에 실행 코드를 효율적으로 캐싱함으로써 실행코드 요청의 횟수를 줄이고, 코드 실행 시간을 감소시킬 수 있는 ANC(Active Network Cache) 캐싱 기법을 제안 하였다. 본 논문에서 제안한 캐싱 기법은 이전 노드로부터 실행 코드의 요청을 줄임으로써 코드의 실행시간을 단축시키고, 네트워크의 트래픽을 감소시킬 수 있다.널길이를 가진 완전공핍 C-MOSFET는 stained Si SGOI 구조로 제작하여야 함을 확인 했다되었으며, 이는 치근관 감염이 여러 세균에 의해 발병 및 진행된다는 기존의 연구 결과와 동일함을 알 수 있었다. 또한 본 연구 결과 분리 동정된 균주들은 치근관질환과 이와 관련된 세균간의 역학조사에 중요한 자원으로 이용될 수 있을 것으로 생각된다.의 중심 이동률은 6 mm 지점에서 H군이 R군에 비해 유의하게 컸지만 다른 모든 위치에서는 차이가 없었다(p < 0.05). 본 실험결과를 토대로 할 때, 각 평가 항목에서 측정 위치에 따라 약간씩 차이가 있었으나, 중심 이동률은 대부분의 위치에서 유의한 차이가 없었다. 따라서 만곡 근관을 성형시에는 세 가지 방법 중 어느 것이 더 유용하다고 보기 어렵다고 판단된다.야 하겠다. 안정 생산을 위한 재식거리는 $12{\times}11$ cm라고 생각되어 진다. 갖거나 기능기를 가짐으로써 독특한 물성을 지니는 신규의 MCL-PHAs 개발에 유용할 수 있음을 보여준다.X>와 올리고당 $20\~25\%$를 첨가하여 제조한 curd yoghurt는 저장성과 관능적인 면에서 우수한 상품적 가치가 인정되는 새로운 기능성 신제품의 개발에 기여할 수 있을 것으로 사료되었다. 여자의 경우 0.8이상이 되어서 심혈관계 질환의 위험 범위에 속하는 수준이었다. 삼두근의 두겹 두께는 남녀 각각 $20.2\pm8.58cm,\;22.2\pm4.40mm$으로 남녀간에 유의한 차이는 없었다. 조사대상자의 식습관 상태는 전체 대상자의 $84.4\%$가 대부분이 하루 세끼

SAN 환경의 대용량 클러스터 파일 시스템을 위한 광역 버퍼 관리기의 설계 (Design of Global Buffer Manager in SAN-based Cluster File Systems)

  • 이규웅
    • 한국정보통신학회논문지
    • /
    • 제15권11호
    • /
    • pp.2404-2410
    • /
    • 2011
  • 본 논문은 SAN 기반의 클러스터 파일 시스템 $SANique^{TM}$의 설계 고려사항을 설명하고 특히 대규모의 호스트들이 연결된 상황에서 광역 버퍼 관리기의 데이터 공유 문제점을 기술하고 클러스터 환경에서 확장성과 가용성을 제공하기 위한 광역 버퍼 관리 기법을 제시한다. 제안하는 광역 버퍼 관리 기법은 $SANique^{TM}$ 시스템의 로크 관리기에서 관리되는 로크 정보를 활용하여 부가적인 통신 및 시간소요 없이 효율적인 데이터 공유를 제공하는 방법을 제시하였다. 또한 대규모 클러스터 환경에 적용 가능한 광역버퍼 관리기법의 의사코드 및 데이터 공유 예제를 통하여 본 방법의 효율성을 보였다.

Scratch-Pad Memory를 위한 코드 변환 기법 (Code Transformation Techniques for Scratch-Pad Memory)

  • 문대경;이재진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.577-579
    • /
    • 2004
  • 전원을 전적으로 배터리에 의존하는 모바일 임베디드 시스템은 배터리 용량의 한계 때문에 효율적인 에너지의 사용이 매우 중요하다. 특히 memory subsystem은 전체 system에서 소모되는 에너지에서 큰 비중을 차지한다. 이 논문은 성능 면에서 cache의 대안이 되고, cache보다 간단한 구조 때문에 전력소모가 훨씬 적은 on-chip scratch-pad memory(SPM)를 효율적으로 이용할 수 있는 소스 코드 변환 방법 및 SPM 관리방법을 제안한다. 각 함수 단위로 코드 변환을 하며, 어떤 변수를 SPM에 할당하기 위한 소스코드 변환을 했을 때, 소스코드 분석만으로 알 수 있는 변수의 정적인 참조 횟수를 가중치로 고려하여, 코드 변환 후 메모리 참조에 의한 실행 시간과 에너지 소모를 계산하고 이를 바탕으로 SPM에 할당한 변수를 결정한 다음 실제 그 코드 변환을 적용한다. 제안된 코드 변환은 컴파일러에 의해 자동화 될 수 있다. 10개의 임베디드 벤치마크 프로그램을 이용하여 본 논문에서 제안하는 방법의 성능 평가를 한 결과, 실행 시간은 평균 23% 향상되고 에너지 소모는 평균 49% 감소함을 알 수 있다.

  • PDF

압축블록의 압축률 분포를 고려해 설계한 내장캐시 및 주 메모리 압축시스템 (An On-chip Cache and Main Memory Compression System Optimized by Considering the Compression rate Distribution of Compressed Blocks)

  • 임근수;이장수;홍인표;김지홍;김신덕;이용석;고건
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권1_2호
    • /
    • pp.125-134
    • /
    • 2004
  • 최근에 프로세서-메모리간 성능격차 문제를 완화하기 위하여 내장캐시의 접근실패율을 낮추고 메모리 대역폭을 확장하는 내장캐시 압축시스템이 제안되었다. 내장캐시 압축시스템은 데이타를 압축해 저장함으로써 내장캐시의 실질적 저장공간을 확장하고, 메모리 버스에서 데이타를 압축해 전송함으로써 실질적 메모리 대역폭을 확장한다. 본 논문에서는 이와 같은 내장캐시 압축시스템을 확장해 기존의 주 메모리 압축시스템과 병합해 설계한 이종 메모리 압축시스템을 제안한다. 주 메모리의 기억공간을 효율적으로 확장하고, 내장캐시의 접근실패율을 낮추고, 메모리 대역폭을 확장하고, 압축캐시의 복원시간을 줄이고, 설계 복잡도를 낮추기 위하여 몇 가지 새로운 기법들을 제시한다. 제안하는 시스템과 비교대상 시스템의 성능은 슈퍼스칼라 구조의 마이크로프로세서 시뮬레이터를 수정하여 실행기반 시뮬레이션을 통해 검증한다. 본 논문에서 사용한 실험방법은 기존의 트레이스기반 시뮬레이션과 비교해 보다 높은 정확도를 갖는다. 실험결과 주 메모리 확장에 따른 이득을 고려하지 않은 경우에 제안하는 시스템은 일반 메모리시스템에 비하여 수행시간을 내장캐시의 크기에 따라 최대 4-23%가량 단축한다. 제안하는 시스템의 데이타 메모리와 코드 메모리의 확장비율은 각각 57-120%와 27-36%이다.

최신 마이크로프로세서상에서 LU-SGS 코드의 국소화 작성 (Localized Composition of LU-SGS Code on Latest Microprocessors)

  • 최정열
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2001년도 춘계 학술대회논문집
    • /
    • pp.45-50
    • /
    • 2001
  • An approach of composing a performance optimized computational code is suggested for latest microprocessors. The approach named as localization is a concept of minimizing the access to system's main memory and maximizing the utilization of second level cache that is common to all the latest computer system. The localized compositions of LU-SGS scheme for fluid dynamics were made in three different levels and tested on three different microprocessor architectures most widely used in these days. The test results of localization concept showed a remarkable performance, that is the showing gain up to 4.5 times faster solution than the baseline algorithm $450\%$ for producing an exactly the same solution.

  • PDF

웹 프록시 캐쉬에 대한 운영체제 지원 성능의 측정과 분석 (Measurement and Analysis on Operating System Supports for Web Proxy Cache)

  • 백윤철;추연준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.450-456
    • /
    • 2002
  • 오픈 소스 웹 관련 소프트웨어는 주로 UNIX 기반 운영체제 상에서 작동하며, 사용하는 운영체제에 따라 웹 시스템 전체의 성능에 영향을 미칠 수 있다. 본 논문에서는 운영체제가 웹 서비스를 얼마나 잘 지원하는 가를 분석하기 위해 소스 코드 수준의 시간 측정 도구를 만들고, 오픈 소스 웹 프록시 캐쉬 소프트웨어인 Squid가 요청하는 운영체제 시스템 호출의 수행 시간을 측정하였다. Squid는 2.4.STABLE1을 사용하였으며, 기반 운영체제로는 역시 오픈 소스인 Linux 2.4.2와 Solaris 8을 사용하여 시스템 서비스 성능 차이를 비교하였다. 이 결과 전체적으로 Squid를 지원하는 데에는 Linux 2.4.2가Solaris 8보다 나은 것으로 나타났다. 실험 결과는 오픈 소스 소프트웨어를 이용하여 웹 서비스를 구축하는 경우, 소프트웨어 선택을 위한 판단 자료로 사용될 수 있고, 웹 관련 소프트웨어를 지원하는 운영체제 서비스의 성능 개선을 위한 자료로도 유용하게 사용될 수 있다.

재구성이 가능한 범용 DSM-CC 아키텍처와 사용자 선호도 기반의 캐시 관리 전략 (A Reconfigurable, General-purpose DSM-CC Architecture and User Preference-based Cache Management Strategy)

  • 장진호;고상원;김정선
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.89-98
    • /
    • 2010
  • GEM(Globally Executable MHP) 기반의 MHP(Multimedia Home Platform), OCAP(OpenCable Application Platform), ACAP(Advanced Common Application Platform) 등은 현재 디지털 방송의 대표적인 미들웨어이다. 이러한 미들웨어에 사용된 MPEG-2와 DSM-CC(Digital Storage Media-Command and Control) 프로토콜 표준은 많은 부분이 유사하다는 특징을 가지고 있지만 각 DTV 미들웨어가 필요로 하는 정보와 데이터 구조가 조금씩 차이가 있다. 이는 결과적으로 미들웨어간의 비호환성을 야기한다. 본 논문에서는 다양한 미들웨어 표준을 모두 지원할 수 있는 통합 DTV 미들웨어를 개발하기 위한 노력의 일환으로써, 재구성이 가능한 범용 DSM-CC 아키텍처를 제안한다. 첫째, 모든 GEM 기반의 미들웨어가 공통적으로 필요로 하는 DSM-CC 컴포넌트를 정의하였다. 둘째, 각 미들웨어가 필요로 하는 정보와 데이터 구조를 XML 형태로 정의하여 별도의 수정 없이 정적, 혹은 동적으로 특정 미들웨어에 맞추어 적용할 수 있도록 하였다. 또한, 셋탑박스의 전체적인 성능과 연관성이 높은 어플리케이션 응답시간과 DSM-CC 모듈의 사용빈도를 향상시키기 위해 사용자의 선호도를 고려한 캐시 관리 전략을 제안하고, 제안된 캐시 관리 전략이 응답시간을 줄이는데 효과적임을 실험을 통해서 확인하였다.

LEON3 기반 임베디드 시스템을 위한 디버깅 도구 개발 (Development of Debugging Tool for LEON3-based Embedded Systems)

  • 류상문
    • 제어로봇시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.474-479
    • /
    • 2014
  • LEON3 is a 32-bit synthesizable processor based on the SPARC V8. It can be connected to AMBA 2.0 bus and has a 7- stage pipeline, IEEE-754 FPU and 256[KB] cache. It can be easily implemented using FPGA and used for a SoC design. DSU which comes with LEON3 can be used to control and monitor the operation of LEON3. And DSU makes it easy to set a debugging environment for the development of both hardware and software for an embedded systems based on LEON3. This paper presents the summary of the debugging tool for LEON3 based embedded systems. The debugging tool can initialize the target hardware, find out how the target hardware is configured, load application code to a specified memory space and run that application code. To provide users a debugging environment, it can set breakpoints and control the operation of LEON3 correspondingly. And function call trace is one of key functions of the debugging tool.

메모리 상주 DBMS 기반의 OLTP 응용을 위한 다중프로세서 시스템 캐쉬 성능 분석 (Cache Performance Analysis of Multiprocessor Systems for OLTP Applications based on a Memory-Resident DBMS)

  • 정용화;한우종;윤석한;박진원;이강우;김양우
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권4호
    • /
    • pp.383-392
    • /
    • 2000
  • 다중프로세서 시스템에 대한 대부분의 기존 연구는 과학계산용 응용을 중심으로 수행되어 왔으며, 또 다른 응용 분야인 상용 응용을 이용한 연구는 아직까지 초보 단계에 머물고 있는 실정이다. 이는 상용 DBMS의 소스 프로그램을 액세스하기가 쉽지 않으며, POSTGRES와 같은 공개된 소스 프로그램을 액세스 할 수 있더라도 컴퓨터 구조 설계자가 수십만 라인의 그 소스 프로그램을 이해하여 의미있는 성능분석을 수행하기는 사실상 불가능하기 때문이다. 본 연구에서는 상용 응용을 이용하여 다중프로세서 시스템을 분석하기 위하여, SQL로 작성된 병렬 프로그램을 아키텍처 시뮬레이터 상에서 수행할 수 있는 EZDB라는 병렬 DBMS를 자체 개발하였다. EZDB가 POSTGRES와 다른점은 그 목적이 다중프로세서 시스템에서 상용 응용을 수행시키고 그 성능을 쉽게 분석할 수 있다는 점이다. EZDB의 유용함을 확인하기 위해, 본 논문에서는 다중프로세서 시스템에서 TPC-B 작업부하를 수행시켰을 때의 캐쉬 성능을 분석한다. 구축된 작업부하를 기반으로 프로그램 구동 시뮬레이션을 수행한 결과, 상용 응용에서 데이터 구조의 공유 특성이 매우 특별하며 국부성 및 작업 세트가 과학계산 응용의 경우와 매우 상이함을 확인하였다.

  • PDF