• 제목/요약/키워드: 고성능 컴퓨팅 시스템

검색결과 172건 처리시간 0.029초

멀티 코어 시스템에서 통신 프로세스의 동적 스케줄링 (Dynamic Scheduling of Network Processes for Multi-Core Systems)

  • 장혜천;진현욱;김학영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.968-972
    • /
    • 2009
  • 멀티 코어 프로세서는 현재 많은 고성능 서버에 적용되어 사용되고 있다. 최근 이들 서버는 점차 높은 네트워크 대역폭 활용을 요구하고 있다. 이러한 요구를 만족시키기 위해서는 멀티 코어를 효율적으로 활용하여 네트워크 처리율을 향상시키는 방안이 필요하다. 그러나 현재 운영체제들은 멀티 코어 시스템을 멀티 프로세서 환경과 거의 동일하게 다루고 있으며 아직 멀티 코어의 고유 특성을 고려한 성능 최적화 시도는 미흡한 상태이다. 이러한 문제를 해결하기 위해서 본 논문에서는 멀티 코어의 특성을 최대한으로 고려하여 프로세스 스케줄링을 결정함으로써 통신 성능을 향상시키는 방안에 대해서 연구한다. 제안되는 프로세스 스케줄링은 멀티 코어 프로세서의 캐쉬 구조, 프로세스의 통신 집중도, 그리고 각 코어의 부하를 기반으로 해당 프로세스에게 최적의 코어를 결정하고 스케줄링한다. 제안된 기법은 리눅스 커널에 구현되었으며 측정 결과는 최신 리눅스 커널의 네트워크 처리율을 20%까지 향상시켰으며 프로세서 자원은 55% 더 절약할 수 있음을 보인다.

PARSEC을 이용한 TILE-Gx36 다중코어 프로세서의 성능 평가 및 분석 (Performance evaluation and analysis of TILE-Gx36 many-core processor with PARSEC benchmark)

  • 이보선;김한이;유헌창;서태원
    • 컴퓨터교육학회논문지
    • /
    • 제17권1호
    • /
    • pp.107-115
    • /
    • 2014
  • 본 논문은 다중코어의 성능을 평가하고 분석하기 위해 TILE-Gx36(Gx36) 다중코어 프로세서를 사례로 연구하였다. Gx36의 성능 평가는 비교적 최신 병렬 벤치마크인 PARSEC을 이용하였고, 성능 분석을 돕기 위한 비교 시스템으로 인텔의 Core i7 (i7)과 Atom을 사용하였다. 실험결과 2의 제곱으로 동시에 수행 가능한 스레드를 발생시켰을 때, Gx36은 i7보다 평균 2.73배 낮은 성능을 보였으며, Atom보다는 평균 1.93배 높은 성능을 보였다. Gx36은 비교 프로세서보다 상대적으로 큰 Last-Level Cache(LLC)를 갖고 있음에도 불구하고, 가장 많은 LLC miss를 발생시켰다. 이는 Gx36이 기대치 이하의 성능을 보이는 주된 이유로 판단되며, DDC가 일반적 고성능 컴퓨팅을 위한 캐시구조로 적절하지 않음을 보여준다. 다중코어 시스템의 실측을 통한 성능평가는 향후 다중코어 구조개선 및 올바른 방향 설정을 위한 객관적인 자료를 제공한다.

  • PDF

계산과학 시뮬레이션을 위한 웹 인터페이스 자동 생성 시스템 개발 (EDISON Platform to Supporting Education and Integration Research in Computational Science)

  • 진두석;이종숙;조금원;정재유;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.799-801
    • /
    • 2011
  • 컴퓨터 시뮬레이션을 이용한 계산과학 응용분야 연구에서는 대용량 컴퓨팅 자원 및 고성능 네트워크 기반의 사이버 인프라스트럭처를 활용하여 복잡한 공학문제를 수치적 모델링과 대규모 계산을 통해 해결한다. 최근에는 이러한 계산과학 시뮬레이션 수행을 다수 사용자들이 언제 어디서나 쉽게 접근하여 사용할 수 있도록 해주는 웹기반 시뮬레이션 수행 환경의 필요성이 요구되고 있다. 그러나 화학, 물리, 구조, 등 계산과학 응용분야의 연구자들이 웹기반 시뮬레이션 수행 환경에서 동작하는 시뮬레이션 도구를 직접 개발하기 위해서는 추가적으로 복잡하고 다양한 IT기술들을 습득하기 위한 많은 시간과 노력이 소요된다. 따라서, 본 논문에서는 응용분야 연구자들이 핵심 알고리즘 연구에만 집중할 수 있도록 웹기반 시뮬레이션 수행을 위한 웹 인터페이스 자동 생성 시스템을 제공한다.

  • PDF

이동 데이타베이스 시스템에서 데이타의 위치와 영역 특성을 고려한 캐쉬 교체 기법 (Cache Replacement Strategies considering Location and Region Properties of Data in Mobile Database Systems)

  • 김호숙;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.53-63
    • /
    • 2000
  • 최근 저가의 무선 통신 기술의 발달과 고성능 이동 컴퓨팅 장비의 보급에 따라 이동 컴퓨팅 시장은 점차로 확대되는 추세에 있다. 이동 컴퓨팅 환경에서의 제한된 대역폭, 잦은 단절과 배터리 제한 등의 제약성에 효율적으로 대처하기 위하여 여러 방법이 제안되었고, 특히 지구국에서 전송된 데이타 중 향후 사용 가능성이 높은 데이타를 캐쉬에 저장하고 이용하는 캐쉬 기법에 대한 많은 연구가 이루어지고 있다. 그러나 기존의 캐쉬 교체 기법들은 사용자의 이동성과 데이타의 공간 속성에 의한 특성을 고려하지 못하고 있기 때문에 그 효율성에서 한계를 가지고 있다. 본 논문은 이동 호스트의 위치 변화에 따라 이동 호스트의 캐쉬 내에 저장된 데이타의 가치와 의미가 변경되는 것을 보인다. 또한 지리(geographic) 데이타의 공간적 위치(location)와 지리 데이타가 영향을 미치는 공간적 범위 즉 영역 (region)을 데이타의 공간 속성 (spatial attributes)으로 정의하고, 시간에 따른 사용자의 이동성과 데이타의 공간 속성을 효과적으로 지원하는 새로운 캐쉬 교체 방법들을 제안하였다. 기존의 방법과 본 논문에서 제안한 캐쉬 교체 방법의 비교를 통하여 이동 호스트의 위치와 연관된 질의에 대한 성능 평가를 수행한 결과, 본 논문에서 제안한 캐쉬 교체 방법에 의한 캐쉬 적중률의 향상을 입증하였다. 또한 데이타 밀집도에 따라 캐쉬 교체 방법들의 성능이 변화함을 밝히고 이를 이용하여 이동 호스트가 지나가는 대상 지역의 데이타 밀집도에 따라 서로 다른 캐쉬 교체 방법의 선택이 필요함을 제시 하였다.

  • PDF

SCST를 이용한 All Flash Array 스토리지 가상화 (All Flash Array Storage Virtualisation using SCST)

  • 허희성;메히디;이광수;김덕환
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권10호
    • /
    • pp.525-533
    • /
    • 2014
  • SCST(The generic SCSI target subsystem for Linux)는 개발자가 SCSI 타겟 스토리지를 구성할 수 있게 하는 오픈소스 소프트웨어이며, 스토리지 네트워크 구성을 위해 iSCSI, FC, SRP 등의 다양한 SCSI 네트워크 프로토콜을 지원한다. 본 논문에서는 SCST를 이용한 스토리지 가상화 방법을 제안하고 고성능 스토리지인 All Flash Array를 4Gb 파이버 채널, 10Gb 이더넷, 40Gb 인피니밴드를 통해 가상화하며, 가상화된 All Flash Array의 성능을 고찰한다. 실험 결과 40Gb 인피니밴드를 통해 가상화된 All Flash Array가 세 경우 중 가장 높은 성능을 보였다. 40Gb 인피니밴드를 통해 가상화된 All Flash Array는 SCSI 타겟 시스템에 연결된 All Flash Array에 비해 순차/임의 읽기의 경우에 각각 78%, 79%의 성능을 보였으며, 순차/임의쓰기의 경우에는 83%, 88%의 성능을 보임을 확인하였다.

스마트폰과 웨어러블 가속도 센서를 혼합 처리한 실시간 행위 및 자세인지 기법 (Real-time Activity and Posture Recognition with Combined Acceleration Sensor Data from Smartphone and Wearable Device)

  • 이호성;이승룡
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.586-597
    • /
    • 2014
  • 최근 고성능 센서가 집적된 스마트폰과 웨어러블 디바이스 기술이 부각됨에 따라 이와 같은 플랫폼을 활용한 차세대 모바일 컴퓨팅 기술이 크게 주목받고 있다. 기존 행위인지는 지속적인 움직임에 따른 고유 패턴을 포착하는 반면, 자세인지는 급격한 순간 변화나 신체 방향의 변화를 포착하는 방법으로 접근되어 왔다. 그러나 이 두 가지의 패턴을 함께 고려하고 실제 활용 가능한 수준의 성능 확보와 그 시스템에 대한 연구는 다소 부족한 실정이다. 이에 본 논문에서는 최근 부각되는 스마트폰과 웨어러블 디바이스의 센서 데이터를 함께 고려하고 각각이 갖는 장점을 혼합한 사용자 행위 및 자세인지 기법과 스마트폰 플랫폼을 기반으로 실제 환경에서의 그 활용 방법을 제안한다. 스마트폰과 웨어러블 센서 데이터를 함께 운용하기 위한 전처리 방법을 설계하고 고유 진동 패턴과 수직, 수평 방향 패턴 특징을 혼합적으로 활용하여 인지 모델을 구축하였다. 이 과정에서 자전거 타기와 빠르게, 천천히 걷기, 뛰기와 같이 보다 다양한 행위와 서기, 앉기, 누워있기와 같은 자세 패턴을 고려하였다. 실험 결과 제안하는 기법의 성능과 타당성을 입증하였고 실제 환경에서의 적용을 통해 그 활용 가능성을 보였다.

클러스터 기반 WSN에서 캐시 필터링을 이용한 에너지 효율적인 질의처리 기법 (An Energy Efficient Query Processing Mechanism using Cache Filtering in Cluster-based Wireless Sensor Networks)

  • 이광원;황윤철;오염덕
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권8호
    • /
    • pp.149-156
    • /
    • 2010
  • 센서네트워크에 사용되는 최신의 센서노드 기술은 많은 데이터 저장능력과 빠른 처리능력을 제공함으로써 다양한 응용분야에서 좀 더 효율적인 네트워크 환경을 구성할 수 있게 되었다. 그리고 네트워크 구축 환경도 트리 기반에서 클러스터 기반으로 변환 되었다. 그러나 기존 트리 기반의 센서네트워크에서 사용되던 질의처리 방법은 클러스터 기반의 네트워크에서는 효율성이 떨어진다. 따라서 클러스터 기반 네트워크에서 효율적으로 질의를 처리하는 새로운 방법이 필요하다. 그래서 본 논문에서는 클러스터 기반의 센서네트워크에서 데이터 속성 분류를 통한 필터링을 이용하여 에너지를 효율적으로 사용하는 질의 처리 기법을 제안한다. 제안 기법은 클러스터 기반의 네트워크 장점을 최대한 활용하여 질의 처리에 드는 에너지를 줄이고 좀 더 지능적으로 질의를 분배하도록 설계 하였다. 그리고 MATLab을 이용하여 제안된 기법이 에너지 효율성 측면에서 우수함을 입증하였다 본 논문에서는 고성능 컴퓨팅 시스템의 성능 향상을 위한 효율적인 동적 작업부하 균등화 정책을 제안한다.

SCAM 기상모델의 성능향상을 위한 PGI Compiler의 OpenACC 활용 (Performance Improvement of SCAM Climate Model using PGI Compiler with OpenACC)

  • 이창현;강보경;정성욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권3호
    • /
    • pp.189-197
    • /
    • 2022
  • 고성능 컴퓨팅 기술이 발달하고 수치 모델 방식이 고도화됨에 따라 더욱 우수한 기상예보를 진행할 수 있게 되었다. 본 논문에서는 SCAM 기상 모델에 대하여 컴파일 시간을 제외한 모델 수행시간에 대한 성능 향상을 끌어내는 것이 목적이다. 따라서, 기존의 Intel Fortran Compiler를 이용하여 수행된 모델을 PGI Fortran Compiler로 변경하였다. 이를 위해 시스템 환경 변수 재설정, 컴파일 옵션 조정, 관련 의존성 SW 및 라이브러리 설치 그리고 소스 코드를 수정하였다. 또한, 본 논문에서 제안한 PGI Compile with OpenACC 방법을 제시하고 적용하였다. 그 결과 러닝 시간의 경우 기존 Intel에서 PGI로 컴파일러가 변경되면, 러닝 시간의 경우 6.08%의 성능 향상이 되었으며, OpenACC를 추가로 적용할 경우, 기존 대비 43.05%의 성능 향상을 보여준다. 이는 본 논문에서 제안한 SCAM모델에서 PGI Compile with OpenACC 방법이 우수한 성능을 보여줄 수 있음을 입증한다.

RPC 기반 GPU 가상화 환경에서 가상머신의 GPGPU 작업 성능 향상을 위한 GPU 메모리 관리 기법 (GPU Memory Management Technique to Improve the Performance of GPGPU Task of Virtual Machines in RPC-Based GPU Virtualization Environments)

  • 강지훈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권5호
    • /
    • pp.123-136
    • /
    • 2021
  • RPC(Remote Procedure Call) 기반 GPU(Graphics Processing Unit) 가상화 기술은 다수의 사용자 가상머신에게 GPU를 공유하기 위한 기술 중 하나이다. 하지만 클라우드 환경에서 일반적인 GPU는 CPU나 메모리와는 다르게 가상머신의 자원 사용량을 제한할 수 있는 자원 격리(Isolation) 기술을 제공하지 않는다. 특히 RPC 기반 가상화 환경에서는 각 가상머신에서 실행되는 GPU 작업은 멀티 프로세스 형태로 수행되기 때문에 자원격리 기술의 부재는 자원 경쟁으로 인한 성능 저하 문제를 발생시킨다. 그리고 GPU 메모리 경쟁은 가상머신들의 자원 요구량이 많을수록 성능저하를 가속화하고 가상머신 사이의 균등한 성능을 보장하지 못하기 때문에 공평성이 저하되는 문제를 발생시킨다. 본 논문에서는 RPC 기반 GPU 가상화 환경에서 사용자 가상머신들의 GPU 메모리 요구량이 가용 GPU 메모리 용량을 초과했을 때 발생하는 자원 경쟁으로 인한 성능 저하 문제 분석하고 이를 해결하기 위한 GPU 메모리 관리 기법을 제안한다. 또한, 실험을 통해 본 논문에서 제안한 GPU 메모리 관리 기법이 GPGPU 작업의 성능을 향상시킬 수 있다는 것을 보여준다.

기계식 쿨링 기법에 따른 고성능 멀티코어 프로세서의 냉각 효율성 분석 (Analysis on the Cooling Efficiency of High-Performance Multicore Processors according to Cooling Methods)

  • 강승구;최홍준;안진우;박재형;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.1-11
    • /
    • 2011
  • 사용자들의 높은 요구 사항을 만족시키는 컴퓨팅 시스템을 개발하기 위해 프로세서의 성능을 향상시키기 위한 연구는 지속적으로 진행되어 왔다. 공정 기술 발달을 비롯한 다양한 기술 발전을 통하여 프로세서의 성능은 비약적으로 발전하였으나 그 이면에는 새로운 문제들이 발생하게 되었다. 그 중에서, 최근 들어 주된 문제점 중 하나로 인식되고 있는 열섬 현상은 칩의 신뢰성에 심각한 영향을 미치기 때문에 프로세서 설계 시 성능, 전력 효율성과 함께 반드시 고려되어야 한다. 과거에는 기계적인 냉각 기법으로 프로세서의 온도를 효과적으로 제어할 수 있었지만, 최근에는 프로세서의 성능이 높아져 발생되는 온도가 높아 냉각 비용이 급속히 증가하고 있다. 이로 인해, 최근의 온도 제어 연구는 기계적인 냉각 기법보다는 구조적 기법을 통한 온도 제어에 더욱 집중되는 추세를 보이고 있다. 하지만, 구조적 기법을 통해 온도를 제어하는 방안은 프로세서의 온도를 낮추는 데에는 효율적이지만 이를 위해 성능을 희생한다는 단점이 존재한다. 따라서, 기계적 냉각 기법을 통해 프로세서의 온도를 효율적으로 제어할 수 있다면, 성능 저하가 발생되는 구조적 기법을 통한 온도 제어기법의 사용 빈도가 줄어 그 만큼 성능이 향상될 수 있을 것으로 기대된다. 본 논문에서는 고성능 멀티코어 프로세서에서 발생하는 온도를 기계적인 냉각 기법이 얼마나 효율적으로 제어할 수 있는지를 상세하게 분석해 보고자 한다. 공랭식 냉각기와 수랭식 냉각기를 이용하여 다양한 실험을 수행한 결과, 공랭식 냉각기와 비교하여 수랭식 냉각기가 온도를 효과적으로 제어하는 반면에 전력 소모가 더 많음을 확인할 수 있다. 특히, 1W의 전력을 통해 낮출 수 있는 온도를 분석해 보면 공랭식에 비해서 수랭식이 더 효율적임을 알 수 있으며, 수랭식 냉각기의 경우에는 냉각 단계가 냉각 효율은 오히려 감소하게 됨을 확인할 수 있다. 실험 결과를 바탕으로 온도에 따라 적절하게 기계적 냉각 기법을 활용한다면 프로세서의 온도를 더욱 효과적으로 제어할 수 있을 것으로 기대된다.