• 제목/요약/키워드: 고성능 컴퓨팅

검색결과 291건 처리시간 0.023초

Zero-copy 기술을 이용한 PVM의 성능 개선 (Performance Improvement for PVM by Zero-copy Mechanism)

  • 임성택;심재홍;최경희;정기현;김재훈;문성근
    • 한국통신학회논문지
    • /
    • 제25권5B호
    • /
    • pp.899-912
    • /
    • 2000
  • PVM(Parallel Virtual Machine)은 네트워크 상에 분산되어 있는 여러 시스템들을 투명하게 활용하여 사용자에 고성능 병렬 컴퓨팅을 지원하는 단일 가상 시스템(single virtual system)으로 인식되게 하는 middle-ware 소프트웨어이다. 초고속 통신망을 기반으로 하는 PVM에서는 임의의 태스크로부터 하나의 메시지를 전송하기 위해 세 번의 메시지 복사가 필요하며, 이는 PVM의 성능 저하를 가져오는 주요 원인이 된다. 이러한 문제점을 개선하기 위해 이 논문에서는 zero-copy PVM 통신 모델을 제안한다. 제안된 모델은 PVM 태스크, PVM 데몬, 네트워크 인터페이스 보드 등에 의해 동시 접근이 가능한 전역 공유 메모리(global shared memory)를 이용하며, 초고속 통신망을 기반으로 하고 있다. 이 모델에서 PVM 태스크는 전송하고자 하는 메시지를 전역 공유 메모리에 저장하고, 메시지를 보낼 준비가 되었음을 PVM 데몬에게 알리며, 데몬은 해당 메시지를 커널을 통하지 않고 바로 초고속 통신망으로 전송함으로써, 메시지의 메모리 복사 횟수를 감소 시킨다. 실험 결과 두 시스템간의 메시지 왕복 시간은 제안된 모델을 사용함으로써 현저히 줄어 들었음을 확인하였다.

  • PDF

야간도로 시인성에 대한 공간적 평가를 위한 자료관리체계 연구 (A Study on Data Management Systems for Spatial Assessments of Road Visibilities at Night)

  • 우희숙;권광석;김병국;윤천주;김영록
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.107-115
    • /
    • 2014
  • 야간도로 노면 밝기는 운전자가 도로 상 장애물을 인지하고 안전하게 운행하는데 있어 매우 중요한 요소이다. 본 연구에서는 정량적인 야간도로 시인성을 평가에 필요한 야간 도로 노면 영상정보 수집 및 처리용 모바일 체계를 제시하였다. 야간 도로 노면에서 수집되는 영상정보를 효율적으로 변환하고 야간도로 시인성에 대한 공간적인 분포를 파악할 수 있는 선형자료를 구축하였다. 이를 위해 저전력 컴퓨팅기술, 개방형 영상처리 기술, GPU 기반 가속 기술 및 도큐멘트데이터베이스 기술 등을 적용하였고 RGB영상으로부터 YUV색상체계로 변환하고 밝기에 해당하는 요소만 추출하여 공간정보와 통합하였다. 그 결과 고성능 안드로이드 단말기를 이용하여 도로밝기 자료를 취득하고 제안한 프로토타입으로 야간도로 시인성에 대한 공간적인 평가를 위한 자료 구축의 공간적 분포를 파악할 수 있었다.

계산과학 분야의 교육 및 융합연구 지원을 위한 EDISON 플랫폼 (EDISON Platform to Supporting Education and Integration Research in Computational Science)

  • 진두석;정영진;정회경
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.176-182
    • /
    • 2012
  • 최근에는 응용과학 분야의 교육 및 연구에 실제 실험이 아닌 슈퍼컴퓨터 및 고성능 네트워크 기반의 사이버 인프라에서 과학적 가정에 의해 복잡한 공학문제를 수치적 모델링과 컴퓨터 시뮬레이션을 통해 해결하는 계산과학을 이용하는 기법들의 필요성이 증대되고 있다. 본 논문에서는 컴퓨팅 시뮬레이션 기법을 활용한 실험 체험형 교육의 일환으로, 이공계 교수, 학생, 연구자, 산업체 인력 등이 사이버 인프라스트럭처 기반으로 시뮬레이션 SW를 활용한 교육 및 융합연구를 지원하는 EDISON 플랫폼을 제시한다. EDISON 플랫폼은 사용자들에게 보다 쉽고, 편하고, 효과적인 서비스 제공을 위해 3계층(EDISON 응용 프레임워크, EDISON 미들웨어, EDISON 인프라 자원)으로 구성되고 5개 분야(열유체, 화학, 물리, 구조동역학, 전산설계) 문제해결 환경을 위한 교육 연구용 웹 포털 서비스를 제공한다.

통합메모리를 이용한 임베디드 환경에서의 딥러닝 프레임워크 성능 개선과 평가 (Performance Enhancement and Evaluation of a Deep Learning Framework on Embedded Systems using Unified Memory)

  • 이민학;강우철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권7호
    • /
    • pp.417-423
    • /
    • 2017
  • 최근, 딥러닝을 사용 가능한 임베디드 디바이스가 상용화됨에 따라 임베디드 시스템 영역에서도 딥러닝 활용에 대한 다양한 연구가 진행되고 있다. 그러나 임베디드 시스템을 고성능 PC 환경과 비교하면 상대적으로 저사양의 CPU/GPU 프로세서와 메모리를 탑재하고 있으므로 딥러닝 기술의 적용에 있어서 많은 제약이 있다. 본 논문에서는 다양한 최신 딥러닝 네트워크들을 임베디드 디바이스에 적용했을때의 성능을 시간과 전력이라는 관점에서 실험적으로 평가한다. 또한, 호스트 CPU와 GPU 디바이스간의 메모리를 공유하는 임베디드 시스템들의 아키텍처적인 특성을 이용하여 메모리 복사를 줄임으로써 실시간 성능과 저전력성을 높이는 방법을 제시한다. 제안된 방법은 대표적인 공개 딥러닝 프레임워크인 Caffe를 수정하여 구현되었으며, 임베디드 GPU를 탑재한 NVIDIA Jetson TK1에서 성능평가 되었다. 실험결과, 대부분의 딥러닝 네트워크에서 뚜렷한 성능향상을 관찰할 수 있었다. 특히, 메모리 사용량이 높은 AlexNet에서 약 33%의 이미지 인식 속도 단축과 50%의 소비 전력량 감소를 관찰할 수 있었다.

멀티 코어 시스템에서 통신 프로세스의 동적 스케줄링 (Dynamic Scheduling of Network Processes for Multi-Core Systems)

  • 장혜천;진현욱;김학영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.968-972
    • /
    • 2009
  • 멀티 코어 프로세서는 현재 많은 고성능 서버에 적용되어 사용되고 있다. 최근 이들 서버는 점차 높은 네트워크 대역폭 활용을 요구하고 있다. 이러한 요구를 만족시키기 위해서는 멀티 코어를 효율적으로 활용하여 네트워크 처리율을 향상시키는 방안이 필요하다. 그러나 현재 운영체제들은 멀티 코어 시스템을 멀티 프로세서 환경과 거의 동일하게 다루고 있으며 아직 멀티 코어의 고유 특성을 고려한 성능 최적화 시도는 미흡한 상태이다. 이러한 문제를 해결하기 위해서 본 논문에서는 멀티 코어의 특성을 최대한으로 고려하여 프로세스 스케줄링을 결정함으로써 통신 성능을 향상시키는 방안에 대해서 연구한다. 제안되는 프로세스 스케줄링은 멀티 코어 프로세서의 캐쉬 구조, 프로세스의 통신 집중도, 그리고 각 코어의 부하를 기반으로 해당 프로세스에게 최적의 코어를 결정하고 스케줄링한다. 제안된 기법은 리눅스 커널에 구현되었으며 측정 결과는 최신 리눅스 커널의 네트워크 처리율을 20%까지 향상시켰으며 프로세서 자원은 55% 더 절약할 수 있음을 보인다.

파워 효율이 높은 모바일 IoT 단말 개발을 위한 소프트웨어 공학 원칙 (Software Engineering Principles for the Development of Power-Efficient Mobile IoT Devices)

  • 이혜선;이강복;방효찬
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권12호
    • /
    • pp.762-767
    • /
    • 2015
  • 다양한 사물이 유무선 네트워크를 통해 연결되어 정보를 수집, 처리, 교환/공유하는 사물인터넷(IoT) 환경에서 대표적인 역할을 하는 것이 스마트폰, 태블릿과 같은 모바일 IoT 단말이다. 이 단말은 고성능 어플리케이션 서비스를 제공하기 위해 파워 소비량이 많은 편이지만 전원을 상시 공급할 수 없기 때문에 효율적으로 파워를 관리하는 것이 중요하다. 모바일 IoT 단말의 파워 소비에는 어플리케이션 프로세서(AP), AP 내/외부 하드웨어 모듈, 운영체제, 모바일 IoT 플랫폼, 어플리케이션 등 다양한 요소가 복잡하게 얽혀 있다. 따라서 파워 효율이 높은 모바일 IoT 단말을 개발하기 위해서는 이 관계를 체계적으로 파악하고 이를 바탕으로 파워 관리를 할 수 있도록 하는 방법이 필요하다. 이를 해결하기 위해 본 논문에서는 파워 효율이 높은 모바일 IoT 단말 개발을 위한 소프트웨어 공학적 원칙을 소개한다. 제안하는 원칙은 스마트폰의 카메라 서비스 파워 관리 개발에 적용하여 검증하였다.

실시간 탐지정보 제공을 위한 무인기 플랫폼 기반 실시간 LiDAR 데이터 처리구조 (Unmanned Aircraft Platform Based Real-time LiDAR Data Processing Architecture for Real-time Detection Information)

  • 엄준호;이야수;오상윤
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권12호
    • /
    • pp.745-750
    • /
    • 2015
  • LiDAR 기술은 실제와 유사한 수준의 3차원 영상 정보를 제공하는 센싱 기술로, 다양한 분야에서 활용되고 있다. 이 기술을 실제 활용하기 위해서는 복잡하고, 방대한 데이터 처리가 요구되며, 이에 급변하는 상황에서 빠른 대응이 필요한 군사 작전에서의 활용은 제한적이다. 본 논문에서는 무인기 플랫폼 기반의 실시간 LiDAR 데이터 처리구조를 제안하여 LiDAR 데이터 처리를 위해 무인기-고성능 데이터 처리영역 간 병렬처리와 오프로딩을 통해 실시간 수준의 탐지 정보를 제공하도록 제안한다. 또한, 제안 구조의 적용 가능성 검증을 위해 기존 처리 방식과 무인기 플랫폼의 처리환경과 유사한 ARM 클러스터에서의 병렬 처리 방식에서 실제 LiDAR 데이터의 보간 처리를 통해 처리시간, 용량을 확인하는 실험을 수행하였고, 기존 방식과 유사하거나 양호한 결과를 확인하였다. 향후 제안 구조를 기반으로 실시간성 보장이 요구되는 무인 침투자 감시 등 군사 작전에 활용될 수 있을 것이다.

클라우드 스토리지 최적화를 위한 고속 캐싱 및 대용량 파일 전송 기법 (A Scheme on High-Performance Caching and High-Capacity File Transmission for Cloud Storage Optimization)

  • 김태훈;김정한;엄영익
    • 한국통신학회논문지
    • /
    • 제37권8C호
    • /
    • pp.670-679
    • /
    • 2012
  • 최근 클라우드 컴퓨팅 환경의 보급과 함께 스토리지의 데이터양이 급증함에 따라 그에 따른 스토리지 저장 비용이 빠르게 증가하고 있다. 더불어, 사용자들의 다양한 서비스 및 데이터 요청으로 클라우드 스토리지의 부하 또한 급증하고 있다. 이러한 문제를 해결하기 위해 분산 파일 시스템을 통한 저비용 고성능 스토리지 환경을 제공하고자 하는 기존의 연구가 있었으나, 이에는 데이터 병렬처리, 임의위치 접근처리, 빈번한 작은 워크로드 접근처리 등의 취약점이 존재한다. 최근에는 캐싱 기술을 이용하여 이를 개선하려는 연구가 주목받고 있다. 본 논문에서는 분산 파일 시스템 환경에서 병렬 캐싱, 분산 캐싱과 공유 자원을 고려한 데이터 병렬 전송방법을 제공하는 CHPC(Cloud storage High-Performance Caching) 구조를 제안하며, 또한 이를 기존의 방법들과 비교 평가하여 스토리지 부하를 최적화하는 방법을 제시한다. 더불어, 제안 기법이 기존 클라우드 시스템에 비하여 스토리지 서버의 디스크 입출력 감소, 서버로 데이터의 요청이 집중되어 발생하는 병목현상 방지, 각 클라이언트의 중복되는 페이지 캐시 제거, 데이터 전송률 향상의 장점을 가짐을 보인다.

PC 기반 회전익기/전장품 HILS 환경 개발

  • 최형식;박무혁;남기욱;안이기
    • 항공우주기술
    • /
    • 제3권2호
    • /
    • pp.238-247
    • /
    • 2004
  • 실시간 시뮬레이션 및 HILS(Hardware In the Loop Simulation)는 항공기 설계 및 개발에 있어서 개발기간의 단축과 비용절감 측면에서 필수적이며 컴퓨팅 기술의 발달로 그 중요성이 더욱 부각되고 있다. 복잡한 운동모델과 실시간 시뮬레이션에 대한 요구사항을 충족시키기 위하여 분산처리에 의한 시뮬레이션이 요구되며 실시간 컴퓨터 환경 내에서 시뮬레이션 소프트웨어를 개발해야 하므로 개발 및 디버그, 유지보수가 매우 어렵다. 특히 실시간, 무 교착상태의 고성능 분산코드를 작성하는 경우는 더욱 그러하다. 본 연구에서 구축하는 회전익기 HILS 환경은 이러한 어려움을 상당부분 처리함으로써 사용자가 직접 코드를 손대지 않고 HILS 및 시뮬레이션을 수행할 수 있도록 상용화된 부품과 개발된 최신 툴을 이용하여 구성하였다. Matlab/Simulink 환경에서 개발된 회전익기 비행시뮬레이션 소프트웨어를 기준으로 하여 HILS 환경 및 MILS(Man In the Loop) 환경이 추가되어 조종사의 직접 입력에 대한 반응을 실제 하드웨어에 피드백 하는 MILS-HILS 통합 환경을 구축하였다. 개발기간의 단축 및 유지보수의 편의를 위하여 RT-Lab을 사용하여 실시간 코드를 생성하고 타켓컴퓨터에 다운로드 하는 방식으로 실시간 시뮬레이션이 가능하다.

  • PDF

PARSEC을 이용한 TILE-Gx36 다중코어 프로세서의 성능 평가 및 분석 (Performance evaluation and analysis of TILE-Gx36 many-core processor with PARSEC benchmark)

  • 이보선;김한이;유헌창;서태원
    • 컴퓨터교육학회논문지
    • /
    • 제17권1호
    • /
    • pp.107-115
    • /
    • 2014
  • 본 논문은 다중코어의 성능을 평가하고 분석하기 위해 TILE-Gx36(Gx36) 다중코어 프로세서를 사례로 연구하였다. Gx36의 성능 평가는 비교적 최신 병렬 벤치마크인 PARSEC을 이용하였고, 성능 분석을 돕기 위한 비교 시스템으로 인텔의 Core i7 (i7)과 Atom을 사용하였다. 실험결과 2의 제곱으로 동시에 수행 가능한 스레드를 발생시켰을 때, Gx36은 i7보다 평균 2.73배 낮은 성능을 보였으며, Atom보다는 평균 1.93배 높은 성능을 보였다. Gx36은 비교 프로세서보다 상대적으로 큰 Last-Level Cache(LLC)를 갖고 있음에도 불구하고, 가장 많은 LLC miss를 발생시켰다. 이는 Gx36이 기대치 이하의 성능을 보이는 주된 이유로 판단되며, DDC가 일반적 고성능 컴퓨팅을 위한 캐시구조로 적절하지 않음을 보여준다. 다중코어 시스템의 실측을 통한 성능평가는 향후 다중코어 구조개선 및 올바른 방향 설정을 위한 객관적인 자료를 제공한다.

  • PDF