• 제목/요약/키워드: 직접 메모리 접근 방식

검색결과 9건 처리시간 0.019초

OpenRISC 코어의 성능향상을 위한 캐쉬 구조 설계 (Cache Architecture Design for the Performance Improvement of OpenRISC Core)

  • 정홍균;류광기
    • 대한전자공학회논문지SD
    • /
    • 제46권1호
    • /
    • pp.68-75
    • /
    • 2009
  • 최근 마이크로프로세서의 성능이 빠르게 향상됨에 따라 주 메모리의 접근 시간이 증가하고 있어 캐쉬의 필요성이 증대되고 있다. 직접사상 캐쉬는 주 메모리의 각각의 블록이 하나의 캐쉬 라인에 사상되는 구조로서 사상되는 규칙이 간단하지만 서로 다른 블록이 하나의 캐쉬 라인에 사상될 경우 블록의 충돌에 의한 접근 실패율이 집합연관 캐쉬에 비해 높아진다. 본 논문에서는 OpenRISC 코어의 직접사상의 단점을 개선하기 위해 사원 집합연관 캐쉬 구조를 제시한다. 제시한 캐쉬는 주 메모리의 네 개의 블록이 하나의 캐쉬 라인에 사상되는 구조로서 직접사상 캐쉬에 비해 접근 실패율이 감소한다. 또한 라인 교체 방식으로 Pseudo-LRU 방식을 채택하여 LRU 정보를 저장하는 비트 수를 감소시켰다. FPGA 에뮬레이션을 이용하여 사원 집합연관 캐쉬를 포함한 OpenRISC 코어를 검증하였고, 테스트 프로그램을 이용하여 성능을 측정한 결과, 사원 집합연관 캐쉬를 포함한 OpenRISC 코어의 성능이 기존의 OpenRISC 코어의 성능에 비해 약 50% 향상되었고, 미스율은 15%이상 감소하였다.

인피니밴드기반 저장장치에서의 iSER(iSCSI Extension for RDMA) 성능평가 (Performance Evaluation of iSER on Storage system using Infiniband fabric)

  • 김영환;손재기;정혜동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.148-150
    • /
    • 2013
  • 최근 TCP/IP에서 세션을 통하여 노드들 간의 통신을 연결하는 방식에서 현재는 하나의 채널을 통해 고속의 I/O가 가능하도록 하는 인피니밴드 같은 기술이 많이 연구되고 있다. 인피니밴드는 프로세싱 노드와 입출력 장치 사이의 통신, 프로세스간 통신에 대한 산업 표준이 되고 있고 프로세싱 노드와 입출력 장치를 연결하기 위해 스위치 기반의 상호 연결은 전통적인 버스 입출력을 대체하는 새로운 입출력 방식이다. 또한 인피니밴드에서는 현재 이슈가 되고 있는 RDMA 방식을 이용해 원격지 서버들간에 직접 메모리 접근 방식을 통해 CPU와 OS의 로드를 최소화하고 있다. 본 논문에서는 인피니밴드 네트워크를 이용하는 저장장치 접근 프로토콜인 iSER(iSCSI Extension RDMA Protocol)와 기존 이더넷망에서 사용되는 iSCSI(Internet SCSI) 프로토콜을 이용하여 서버와 저장장치 간의 IOPS 와 초당 데이터 전송량에 대한 성능을 평가한다. 우리는 성능평가를 위해 Intel에서 제공하는 저장장치 I/O 성능평가 도구인 IO meter를 이용했다.

H.264 Encoder용 Direct Memory Access (DMA) 제어기 설계 (A Design of Direct Memory Access (DMA) Controller For H.264 Encoder)

  • 송인근
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.445-452
    • /
    • 2010
  • 본 논문에서는 Full 하드웨어 기반 베이스라인 프로파일 레벨 3 규격 H.264 인코더 코덱에서 사용할 수 있는 Direct Memory Access (DMA) 제어기를 설계하였다. 설계한 모듈은 CMOS Image Sensor(CIS)로부터 영상을 입력 받아 메모리에 저장한 후 인코더 코덱 모듈의 동작에 맞춰 원영상과 참조영상을 각각 한 매크로블록씩 메모리로부터 읽어서 공급하거나 저장하며, DMA 제어기의 한 매크로블록씩 처리하는데 478 cycle을 소요한다. 설계한 구조를 검증하기 위해 JM 9.4와 호환되는 Reference Encoder C를 개발하였으며, Encoder C로부터 Test Vector를 추출하여 설계한 회로를 검증하였다. 제안한 DMAC 제어기의 Cycle은 Xilinx MIG를 사용한 Cycle 보다 40%의 감소를 나타내었다.

고속의 채널기반네트웍에서 SDP프로토콜성능평가 (A Performance Evaluation for SDP(Socket Direct Protocol) in Channelbased Network)

  • 김영환;박창원;전기만
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2004년도 하계학술대회
    • /
    • pp.137-141
    • /
    • 2004
  • 네트워크 사용자의 급속한 증가로 네트워크 내의 부하를 감당하기에는 많은 어려움을 가져왔다. 이와 같은 이유로 기존의 TCP/IP에서 세션을 통하여 노드들 간의 통신을 연결하는 방식에서 현재는 하나의 채널을 통해 고속의 I/O가 가능하도록 하는 기술이 많이 연구되고 있다. 그 대표적인 것으로 인피니밴드가 있다. 인피니밴드는 프로세싱 노드와 입출력 장치 사이의 통신, 프로세스간 통신에 대한 산업 표준이 되고 있고 프로세싱 노드와 입출력 장치를 연결하기 위해 스위치 기반의 상호 연결은 전통적인 버스 입출력을 대체하는 새로운 입출력 방식이 사용된다. 또한 인피니밴드에서는 현재 많은 이슈가 되고 있는 RDMA 방식을 이용해 원격지 서버들 간에 직접 메모리 접근 방식을 통해 CPU와 OS의 로드를 최소화하고 있다. 본 논문에서는 RDMA를 적용한 새로운 채널 기반 네트웍의 프로토콜인 SDP(Socket Direct Protocol)를 구현하여 SDP_STREAM의 패킷 처리량에 대한 성능을 평가한다. 그리고 이에 대한 성능 평가를 위해서 Netperf 툴을 이용했다. 특히 Zero-Copy방식을 사용하지 않는 일반적인 소켓 API을 이용한 TCP_STREAM과 Zero-Copy방식을 이용한 SDP_STREAM의 패킷 처리량을 비교했으며 성능 평가 결과는 기존의 TCP_STREAM 패킷 처리량에 비해 약 3배 이상 향상된 결과를 나타냈다.

  • PDF

모바일 게임, 현실과 만나다 (Mobile game meet Reality)

  • 박준원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.215-220
    • /
    • 2006
  • 오늘날 우리는 모바일 기기의 눈부신 성장과 보급으로 인해 누구나 손쉽게 모바일 게임을 즐길 수 있게 되었다. 많은 게임 제작 업체들은 모바일 게임개발에 총력을 기울이고 있고, 단말기 제조업체들 역시 게임 전용폰을 출시하는 등 모바일 게임에 대한 호응이 고조되고 있는 상황이다. 이는 모바일 게임이 시간과 공간적 개념을 뛰어넘는 이동성(Mobility)이라는 큰 장점을 가지고 있기 때문이다. 그러나 이러한 장점에도 불구하고 현재까지 모바일 게임의 컨텐츠는 기존의 다른 게임에 비해 그다지 큰 차별성을 가지고 있지 않다. 고스톱이나 단순한 퍼즐게임 등이 호응을 얻고 있기는 하지만 '이동성' 이라는 큰 장점을 살리기 위해서는 거 적극적이고 새로운 개념의 접근이 필요하기 때문이다. 더구나 요즘은 PSP 와 같은 막강한 휴대용 게임기가 등장하면서 휴대폰에서 즐기는 모바일 게임은 작은 화면이나 낮은 메모리 등의 한계로 인해 점점 더 그 자리를 내어주고 있는 실정이다. 그렇다면 '이동성'을 적극적으로 활용할 수 있는 모바일 개임 제작에 대한 새로운 접근방식은 어떻게 이루어져야 할까? 이를 위한 효과적인 방법으로 본 논문에서는 게임의 무대를 우리가 살고 있는 '현실-Reality'로 옮겨 올 것을 제안한다. 그렇게 되면 게이머는 모바일 기기가 가진 제약에서 벗어나 그 자신이 직접 현실세계를 배경으로 한 게임캐릭터가 되고, 물리적 이동에 따라 게임이 진행되는 전혀 새로운 방식의 모바일 게임을 경험할 수 있게 될 것이다. 현재 국내외적으로 이러한 실험적 시도가 조금씩 이루어지고 있기는 하지만 아직 호응은 그리 높지 않다. 그리하여 본 논문에서는 그러한 사례들을 조망하고 가장 효과적인 방법을 국내의 현실에 적합하게 적용할 새로운 모바일 게임의 방식을 제안하고자 한다. 연구사례로 제안 할 모바일 게임은 인터넷 미니홈피, GPS, 멀티미디어 메시지, 카메라 폰, 전자상거래의 기능을 통합하여 활용하는 'Dice Adventure Meeting'이라는 이름의 모바일 미팅 게임이며, 게임의 구체적인 시나리오를 살펴보면서 현실을 배경으로 한 새로운 모바일 개임의 제작에 대한 접근방법을 제시하고자 한다.

  • PDF

모바일 멀티미디어의 효율적 처리를 위한 재구성형 병렬 프로세서의 구조 (A Reconfigurable Parallel Processor for Efficient Processing of Mobile Multimedia)

  • 유세훈;김기철;양일석;노태문
    • 대한전자공학회논문지SD
    • /
    • 제44권10호
    • /
    • pp.23-32
    • /
    • 2007
  • 본 논문에서는 3D 그래픽스(graphics), H.264/H.263/MPEG-4 같은 동영상 코덱, JPEG 혹은 JPEG2000 같은 정지영상 코덱, MP3 같은 오디오 코덱 등 다양한 멀티미디어 관련 기술을 효율적으로 구현하기 위한 재구성형 병렬 프로세서 구조가 제안된다. 제안된 구조는 메모리와 프로세서를 직접 연결하여 메모리 접근 시간과 소비전력를 감소시키고, 3D 그래픽스 처리 과정중 기하 단계의 부동소수점 연산을 지원한다. 또한 분할 SIMD(partitioned SIMD) 방식을 사용하여 하드웨어 비용을 줄이고, 명령어(instruction)의 조건부 실행(conditional execution)을 지원하여 알고리듬 개발이 용이하다.

자바 객체의 스택 저장 가능성 판별을 위한 정적 분석 기법 (Escape Analysis for Stack Allocation in Java)

  • 조은선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.840-848
    • /
    • 2004
  • 자바에서 사용이 끝난 객체의 수집(garbage collection)은 프로그래머의 메모리 관리 부담을 덜어준다는 장점이 있다. 그러나, 수행 속도에 영향을 미치게 되므로 정적 분석 기법을 사용하여 이를 극복하는 기법이 제안되어왔다. 이 중 하나인 스택 저장 기법은, 힙메모리 대신 메소드 스택에 저장될 수 있는 객체들을 수행 전에 분석하여 파악해두는 방식을 따른다. 본 논문에서는 메소드의 호출/반환에 대해 직접 분석하여 자신을 생성한 메소드의 반환 후에도 접근될 소지가 있는 객체들을 판별하는 정적 분석 기법을 제시한다. 이로써 객체와 변수의 지정(assignment) 관계 분석을 기준으로 하는 기존의 스택 저장 기법들에서 간과되었던 객체들 중에서도 스택에 저장할 수 있는 대상을 발견할 수 있도록 한다.

임베디드 RISC 코어의 성능 및 전력 개선 (Performance and Power Consumption Improvement of Embedded RISC Core)

  • 정홍균;류광기
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.453-461
    • /
    • 2010
  • 본 논문에서는 임베디드 RISC 코어의 성능 및 전력 소모 개선을 위해 동적 분기예측 구조, 4원 집합연관 캐쉬 구조, ODC 연산을 이용한 클록 게이팅 기법을 제시한다. 동적 분기 예측 구조는 분기 명령에 대해 다음에 실행될 명령에 대한 예측 주소를 저장하는 BTB (Branch Target Buffer)를 사용한다. 4원 집합연관 캐쉬는 네 개의 메모리 블록을 한 개의 캐쉬 블록에 사상되는 구조로서 직접사상 캐쉬에 비해 접근 실패율이 낮고 라인 교체 방식으로 Pseudo-LRU 방식을 채택하여 LRU 정보를 저장하는 비트 수를 감소시킨다. ODC를 이용한 클록게이팅 기법은 논리합성 개념인 무관조건의 입출력 ODC 조건을 찾아 클록 게이팅 로직을 삽입함으로써 동적 소비전력을 줄인다. 제시한 구조들을 임베디드 RISC 코어인 OpenRISC 코어에 적용하여 성능을 측정한 결과, 기존 OpenRISC 코어 대비 실행시간이 약 29% 향상 되었고, Chartered $0.18{\mu}m$ 라이브러리를 이용하여 동적 전력을 측정한 결과, 기존 OpenRISC 코어 대비 소비전력이 16% 이상 감소하였다.

웹 문서 경량화에 의한 모바일용 콘텐츠 변환 시스템 (Contents Conversion System for Mobile Devices using Light-Weight Web Document)

  • 김정희;권훈;곽호영
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.13-22
    • /
    • 2005
  • 본 논문은 유선용으로 작성된 웹 문서를 모바일용 단말기에서 서비스가 가능하도록 유선 콘텐츠를 모바일 콘텐츠로 변환하는데 목적을 두고 있다. 유선 콘텐츠는 일반적으로 Pop-Up광고창, 불필요한 이미지, 유용하지 못한 링크들로 꾸며져 있어서 유선 환경에 비해 낮은 대역폭, 메모리, 스크린 크기를 갖고 있는 모바일 단말기상에 프리젠테이션이 어려울 뿐만 아니라 모바일 사용자들에게 직접 콘텐츠에 접근하는 것을 혼란스럽게 하고 있다. 그러므로 유선 웹 문서로부터 유용하고 적절한 콘텐츠를 추출하고 이를 모바일 단말기의 특성에 맞춤식으로 제공하는 요구가 대두되고 있다. 따라서 본 논문은 WAP 2,0과 여기에 채용된 콘텐츠 생성 언어인 XHTML Basic을 기반으로 한 콘텐츠 변환 시스템을 제안하였다. 제안된 시스템의 콘텐츠 변환 방식은 유선 웹 문서를 경량화한 후, 기존의 변환 방식인 필터 방식 변환 규칙을 적용하였다. 그리고 적용된 변환 규칙은 수정과 삭제가 쉽게 처리될 수 있도록 XHTML Basic의 모듈단위 기반을 사용하였으며, 또한 변환의 확장성 및 문서의 유효성을 유지하기 위하여 변환 규칙은 XSLT 기술의 XSL 문서 내에 정의하였다. 또한 WAP 1,X의 Legacy한 서비스와의 연동을 위해 CC/PP 프로파일 및 단말기 헤더 정보를 분석하는 모듈을 갖도록 시스템을 구성하였다.

  • PDF