• 제목/요약/키워드: Distributed Shared Memory

검색결과 91건 처리시간 0.02초

초고속 통신망에서 QoS를 보장하는 다자간 실시간 통신에 관한 연구 (Study on Multi-party Real-Time Communication with Guaranteed QoS in Information SuperHighway)

  • 임선화;김문회
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.2943-2953
    • /
    • 1998
  • 통신망이 급진적으로 고속화함으로 인해 응용 범위도 다양해지고 있으며 하나 이상의 통신 스테이션들이 참여하는 다자간 통신을 사용한느 응용 분야들도 증가하고 있다. 본 논문에서는 다중전송을 위한 서버를 두 가지 방식(중앙집중 다중전송 서버 방식과 분산 다중전송 서버 방식)으로 설계하고 구현하였다. 이 두 방식은 모두 세 가지의 동작으로 나뉘어진다; 노드의 참가/삭제 동작, 서버에게 그룹명과 메시지 전송 동작, 그리고 노드가 메시지를 일고 공유 메모리를 클리어하는 동작, 구현을 토대로 이 두 다중전송 서버 방식을 복잡성, 확장성, 효율성, 실시간성 측면에서 비교하였다. 그 결과로서 메시지를 중앙집중방식으로 보낼 때보다 분산 방식으로 전송하는 것이 메시지 전송에 대한 평균 전송시간이 짧음을 알 수 있었다. 마지막으로 다중전송 시 QoS를 보장하기 위한 다자간 실시간 통신 방식을 설계하였다.

  • PDF

ARINC 653 멀티코어 기반 그래픽스 렌더링 엔진 분산처리방안 연구 (The Study of Distributed Processing for Graphics Rendering Engine Based on ARINC 653 Multi-Core System)

  • 정무경
    • 항공우주시스템공학회지
    • /
    • 제13권5호
    • /
    • pp.1-8
    • /
    • 2019
  • 최근 항공기 운용 장비는 시스템 수 및 무게, 전력 소비량 플랫폼 중복성을 줄이기 위해 기존 연합형(Federated) 구조에서 멀티코어를 이용한 모듈형(Integrated Modular) 구조로 변화하고 있다. 이러한 변화로 다수의 기능을 하나의 모듈에 통합함에 따라 디스플레이 장치를 통해 조종사에게 제공해야할 정보량이 증가하게 되었으며, 이로 인해 시스템 운용주기 내에 처리해야할 그래픽양이 증가하게 되었다. 본 논문에서는 멀티코어 시스템을 운용하기 위한 AMP(Asymmetric Multi-Processing) 방식의 파티셔닝 운용 시스템(Partition Operating System)에서 항공기 시스템의 운용주기 내에 보다 많은 그래픽을 처리하기 위해 단일코어로 처리되는 기존의 그래픽스 렌더링 엔진 구조를 멀티코어로 분산하여 처리할 수 있는 그래픽스 렌더링 엔진 분산처리방안을 제시한다.

재구성 가능한 라스트 레벨 캐쉬 구조를 위한 코어 인지 캐쉬 교체 기법 (Core-aware Cache Replacement Policy for Reconfigurable Last Level Cache)

  • 손동오;최홍준;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권11호
    • /
    • pp.1-12
    • /
    • 2013
  • 멀티코어 프로세서에서 라스트 레벨 캐쉬는 코어와 메모리의 속도 차이를 줄여주는 역할을 하는 중요한 하드웨어 자원이다. 때문에 라스트 레벨 캐쉬의 효율적인 관리는 프로세서의 성능에 큰 영향을 미친다. 라스트 레벨 캐쉬를 구성하는 공유/비공유 캐쉬는 코어들이 공유하는 데이터와 각 코어의 독립된 데이터를 각각 적재한다. 최근 많은 연구를 통해 라스트 레벨 캐쉬 관리기법이 연구되었지만 주로 공유 캐쉬에 대한 연구만 이뤄지고 있으며 라스트 레벨 캐쉬의 비공유 캐쉬에 대한 연구는 아직 미약하다. 라스트 레벨 캐쉬의 비공유 캐쉬는 각 코어에 동일한 영역이 할당되기 때문에 코어별 작업량이 다를 경우 캐쉬 관리가 효과적이지 않다. 본 논문에서는 라스트 레벨 캐쉬 중 비공유 캐쉬의 효율적인 관리를 위해 코어 인지 캐쉬 교체 기법을 제안한다. 제안된 코어 인지 캐쉬 교체 기법은 비공유 캐쉬를 동적으로 재구성함으로써, 라스트 레벨 캐쉬의 적중률을 향상시킨다. 또한, 우리는 캐쉬 교체 기법의 성능 향상을 위해 2비트 포화 카운터를 적용하였다. 실험 결과 기존의 교체 기법과 비교하여 9.23%의 적중률 향상과 12.85%의 라스트 레벨 캐쉬 접근 시간 감소의 효과가 있었다.

DA구조 이용 가산기 수를 감소한 2-D DCT/IDCT 프로세서 설계 (2-D DCT/IDCT Processor Design Reducing Adders in DA Architecture)

  • 정동윤;서해준;배현덕;조태원
    • 대한전자공학회논문지SD
    • /
    • 제43권3호
    • /
    • pp.48-58
    • /
    • 2006
  • 본 논문은 가산기 기반 DA(Distributed Arithmetic: 분산 산술연산)구조로서 ROM과 같은 일반적인 메모리가 사용되지 않는 8x8의 2차원 DCT(Discrete Cosine Transform)/IDCT(Inverse DCT) 프로세서를 제안 설계하였다. 제안된 논문은 DCT와 IDCT의 계수 행렬에서 하드웨어를 줄이기 위해 계수 행렬의 홀수 부분을 공유하였고, 2차원 DCT/IDCT 프로세서의 계수 연산을 위해 단지 29개의 가산기만을 사용하였다. 이는 8x8 1차원 DCT NEDA(NEw DA)구조에서의 가산기 수 보다 48.6%를 감소 시켰다. 또한, 기존의 전치메모리와는 다른 새로운 전치네트워크 구조를 제안하였다. 제안된 전치네트워크 구조에서는 전치메모리 블록 대신 하드웨어를 줄이기 위해 레지스터 형태의 새로운 레지스터 블록 전치네트워크 형태를 제안하였다. 제안된 전치네트워크 블록은 64개의 레지스터를 사용하며, 이는 일반적인 메모리를 사용하는 기존의 전치메모리 구조에 사용된 트랜지스터 수 보다 18%가 감소하였다. 또한 처리율 향상을 위해 새롭게 적용되고 있는 방식으로, 입력 데이터에 대해 매 클럭 주기마다 8개의 화소데이터를 받아서 8개의 화소데이터를 처리하도록 하여 출력하는 비트 병렬화 구조로 설계하였다.

워크스테이션 클러스터 상에서 분산공유메모리 인터페이스로 배열 데이터의 공유를 지원하는 Java 패키지의 설계와 구현 (Design and Implementation of a Java Package for Sharing Array Data by the DSM Interface on a Cluster of Workstations)

  • 임혜정;김명
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.355-365
    • /
    • 1999
  • 본 연구에서는 배열 데이터를 여러 호스트 상에 분산시켜 생성하고 편리하게 공유할 수 있도록 하는 Java 패키지인 JPAS (Java Package for Array Sharing)를 설계하고 구현하였다. JPAS는 순수 Java로 구현되어 이식성이 뛰어나고, Java RMI를 이용하여 분산공유메모리 모델과 같이 위치 독립적인 접근 인터페이스로 배열 데이터를 공유할 수 있도록 한다. JPAS는 네트원 오버헤드로 인한 성능 저하를 막기 위해서, 프로그래머 가 알고 있는 애플리케이션의 특성을 공유 데이터 사용시에 반영할 수 있도록 한다. 또한, 데이터의 일관성을 유지하기 위해서, JPAS의 모든배열 데이터들은 값을 갱신 할수 있는 메소드틀을 갖는다. 실제로, 병렬프로그램들을 작성하여 워크스테이션 클러스터 상에서 실행시켜 본 결과, JPAS가 비교적 우수한 성능의 병렬 프로그래밍 도구임을 보였다.

  • PDF

인터랙티브 타일드 디스플레이 응용프로그램 개발을 위한 프레임워크 (A Framework for Constructing Interactive Tiled Display Applications)

  • 조용주;김석환
    • 한국정보통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.37-44
    • /
    • 2009
  • 본 논문에서는 인터랙티브 디지털 정보 디스플레이용 응용프로그램 개발을 도와주도록 설계된 iTDF(Interactive Tiled Display Framework)라는 타일드 디스플레이 프레임워크에 대해서 설명한다. 이 프레임워크는 고해상도 타일드 디스플레이 환경에서 여러 개의 3차원 인터랙티브 그래픽 콘텐츠를 동시에 실행시키고 사용자와의 인터랙션이 가능하도록 해준다. 이를 위해, iTDF에서는 네트워크로 묶인 여러 대의 컴퓨터를 활용해서 다수의 인터랙티브 그래픽 프로그램들을 실행시킬 수 있도록 하고, 윈도우의 위치나 크기 조정, 컴퓨터 간의 렌더링 동기화, 분산 공유 메모리, 통합 입력 인터 페이스 등을 분산 시스템에서 지원한다. 본 논문은 먼저 iTDF의 요구사항에 대해서 분석하고, 그 내용을 지원할 수 있는 프레임워크의 설계와 구현에 대해서 설명한다. 그리고 기존의 데스크탑용 응용프로그램들을 iTDF를 활용해서 다시 개발하며, 유용성과 사용성에 대해 고찰한다.

클러스터 컴퓨팅 환경에서 병렬루프 처리를 위한 재구성 가능한 부하 및 성능 균형 방법 (A Reconfigurable Load and Performance Balancing Scheme for Parallel Loops in a Clustered Computing Environment)

  • 김태형
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.49-56
    • /
    • 2004
  • 부하 불균형은 병렬처리에 있어서 좋은 성능을 얻기 위한 주요한 방해 요소 중의 하나이다. 전역(全域) 부하균형 기법은 하나의 응용에서 발생된 병렬 태스크를 취급하는데 적절하지 않다. 동적 루프 스케줄링 기법은 공유 메모리 멀티프로세서 병렬구조에서 병렬 루프의 부하균형에 효과적인 것으로 알려져있다. 하지만 이 기법의 중앙집중적 특성은 워크스테이션 클러스터 환경에서 프로세서 수가 상대적으로 많지 않은 경우에도 병목현상을 일으킬 수 있는 요인이 된다. 워크스테이션 클러스터 환경에서의 통신 오버헤드는 공유 메모리 멀티프로세서 병렬 구조와 비교할 때 수십배의 차이가 생기기 때문이다. 더구나 병렬 루프에서 발생하는 단위 태스크가 불규칙적인 작업량을 갖는 경우에는 기본 루프 스케줄링 기법의 단점을 보완한 개선된 방법들을 적용할 수가 없다. 본 논문에서는 이러한 불규칙적인 작업량을 갖는 병렬루프를 서로 다른 성능을 갖는 워크스테이션들의 네트워크 환경에서 효율적으로 부하를 분배하기 위한 재구성 가능한 분산 부하 균형 기법을 제시한다. 이러한 재구성 가능한 기법은 전통적인 부하균형 방법과 함께 성능균형을 가능하게 함으로써 전체수행시간을 최소화할 수 있음을 보였다.

내장형 GPU 환경에서 CPU-GPU 간의 공유 캐시에서의 캐시 분할 방식의 필요성 (The Need of Cache Partitioning on Shared Cache of Integrated Graphics Processor between CPU and GPU)

  • 성한울;엄현상;염헌영
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.507-512
    • /
    • 2014
  • 최근 전력의 한계 때문에 많은 트랜지스터를 모두 이용할 수 없는 '다크실리콘' 문제가 발생했다. 이 문제를 효율적으로 해결하기 위하여 CPU(Central processing unit)와 GPU(Graphic processing unit)를 함께 사용하여 분산처리하기 시작했다. 최근에는 CPU(Central processing unit)와 GPU(Graphic processing unit)가 메모리와 Last Level Cache를 공유하는 내장형 GPU 프로세서(Integrated graphic processing unit processor)가 등장했다. 하지만 CPU 프로세스와 GPU 프로세스가 LLC(Last level cache)로 접근하기 위한 어떠한 규칙이 없기 때문에, 동시에 CPU 프로세스와 GPU 프로세스 수행될 때 LLC(Last level cache)를 차지하기 위한 경쟁이 일어나 성능 저하가 발생한다. 본 논문에서는 캐시 접근 빈도가 큰 여러 개의 프로세스들이 수행됨에 따라 캐시 오염이 발생한 상황에서 GPU 프로세스의 성능 보장을 위하여 GPU 프로세스만을 위한 고정된 Last Level Cache 공간을 주는 캐시 분할방식이 필요함을 증명하고 캐시를 분할하기 위한 페이지 컬러링 기법을 소개하고 디자인한다.

적응적 중복 객체 알고리즘을 이용한 객체 복제본 관리 연구 (The Study of the Object Replication Management using Adaptive Duplication Object Algorithm)

  • 박종선;장용철;오수열
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.51-59
    • /
    • 2003
  • 분산 객체 복제 시스템에서 노드들이 공유하는 객체는 동일 내용을 복수 노드에 위치시키는 것이 효율적이다. 노드들은 시스템에 접근시 접근 정보를 자신의 지역 캐시에 저장해 두었다가 필요시에 인출해서 사용한다. 그러나 시간이 지나감에 따라 다른 노드들에 의해서 데이터의 갱신이 이루어지기 때문에 일관성 문제가 발생한다. 따라서 시스템의 일관성 유지를 통해 성능 및 가용성을 높이기 위해서는 객체를 효율적으로 관리하는 메커니즘이 필요하다. 본 논문에서는 공유 메모리 환경에서 일관성 유지를 위해 객체 관리시 기존의 중복 기법에서 사용하는 일관성 비용 외에 부가 비용이 없이도 제한적으로 병렬 수행의 효과를 얻으며, 또한 중복 기법에서 가장 큰 오버헤드로 알려진 일관성 유지비용을 최소화시키기 위하여 이 비용을 결정하는 가장 핵심적인 요소인 객체 복제본의 수와 위치 그리고 각 객체 사이의 상관도를 고려하여 객체를 효율적으로 관리하고, 전체 수행 시간을 개선시키는 적응적 중복 객체 관리 메커니즘을 연구한다.

  • PDF

병렬 프로그램의 적응형 실행 기법 (Adaptive Execution Techniques for Parallel Programs)

  • 이재진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권8호
    • /
    • pp.421-431
    • /
    • 2004
  • 본 논문은 병렬 프로그램을 실행할 때 계산량이 작은 병렬 루프를 병렬로 실행하는 경우에 생기는 프로그램의 성능 저하를 피하기 위하여, 컴파일 시나 실행 시에 성능 예측 모델을 이용하여 병렬 루프의 성능을 예측한 다음 적응형 실행 기법을 이용하여 병렬 프로그램을 실행하는 방법을 소개한다. 성능예측 알고리즘과 적응형 실행 알고리즘은 컴파일러 전처리기에 구현이 되었으며, 이 전처리기는 병렬 루프가 실행되는 방식을 컴파일 시나 실행 시에 결정하는 코드를 원래의 병렬 프로그램에 삽입한다. Fortran77로 씌어진 다섯 개의 대표적인 과학 수치계산 병렬 벤치마크 프로그램을 32개의 프로세서로 구성된 분산 공유 메모리 병렬 컴퓨터(SGI Origin2000)에 실행하여 본 논문에서 제안한 방법의 성능 평가를 하였을 때, 제안한 기법을 적응한 경우가 32, 16, 8, 및 4개의 프로세서에서 원래의 병렬 프로그램 보다 각각 26%, 20%, 16%, 및 10% 빨리 실행되었다. 이중 한 프로그램은 원래 병렬 프로그램 보다 32개 프로세서에서 두 배 이상 빠르게 실행되었다.