• 제목/요약/키워드: distributed supercomputing

검색결과 28건 처리시간 0.025초

선도화합물 탐색을 위한 고효율가상탐색 프로그램 개발 (Developing Virtual Screening Program for Lead Identification)

  • Nam, Ky-Youb;Cho, Yong-Kee;Lee, Chang-Joon;Shin, Jae-Hong;Choi, Jung-Won;Gil, Joon-Min;Park, Hark-Soo;Hwang, Il-Sun;No, Kyoung-Tai
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.181-190
    • /
    • 2004
  • The docking and in silico ligand screening procedures can select small sets of lead -like candidates from large libraries of either commercially or synthetically available compounds; however, the vast number of such molecules make the potential size of this task enormous. To accelerate the discovery of drugs to inhibit several targets, we have exploited massively distributed computing to screen compound libraries virtually. The Korea@HOME project was launched in Feb. 2002, and one year later, more than 1200 PC's have been recruited. This has created a 31 -gigaflop machine that has already provided more than 1400 hours of CPU time. It has all owed databases of millions of compounds to be screened against protein targets in a matter of days. Now, the virtual screening software suitable for distributed environments is developed by BMD. It has been evaluated in terms of the accuracy of the scoring function and the search algorithm for the correct binding mode.

  • PDF

대규모 과학응용을 위한 효율적인 분산 슈퍼컴퓨팅 자원관리 기술 연구 (Effective Distributed Supercomputing Resource Management for Large Scale Scientific Applications)

  • 노승우;김직수;김상완;김서영;황순욱
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.573-579
    • /
    • 2015
  • 국가 슈퍼컴퓨팅 인프라는 국내 여러 지역에 분산된 슈퍼컴퓨팅 클러스터들로 이루어져 있으며, 본 연구팀에서는 이러한 이기종의 지리적으로 분산된 클러스터들을 대규모 과학 응용 연구자들에게 효율적으로 제공하기 위해 대규모 계산처리 시스템인 HTCaaS(High-Throughput Computing as a Service)를 자체 개발하였다. 본 논문에서는 이러한 대규모 계산처리 시스템(HTCaaS)을 활용하여 각 계산 자원을 동적으로 관리하는 방법에 대해서 논의하고, 신약재창출이라는 실제 과학 응용을 통해 그 효율성을 검증한다. 특히 유효 자원 식별을 위한 대기시간 및 성공률 개념을 이용한 동적 계산 자원 관리 기술을 적용함으로써 자원 활용률과 정확성, 신뢰성, 편의성이 향상될 수 있으며, 그 결과 전체적인 작업 시간의 단축과 작업 처리량도 향상될 수 있음을 확인할 수 있었다.

초고전압 투과전자현미경의 원격제어 및 데이터 획득 시스템 (Remote Access and Data Acquisition System for High Voltage Electron Microscopy)

  • 안영헌;강지선;정현준;김형석;정형수;한혁;정종만;구중억;이상동;이지수;조금원;김윤중;염헌영
    • Applied Microscopy
    • /
    • 제36권1호
    • /
    • pp.7-16
    • /
    • 2006
  • 가속전압 1.3MV의 초고전압투과전자현미경의 원격제어 시스템을 개발하였다. 초고전압투과전자현미경의 운영을 위한 필수적인 기능, 즉 stage조정, 시편의 tilting, TV카메라 선택과 영상 저장 등을 원격 운영시스템에 그대로 적용하였다. 특히 이 시스템은 간단한 웹 접속만으로 goniometer를 완벽하고 정밀하게 제어할 수 있으며 고해상도 디지털카메라를 제어할 수 있는 특징을 가지고 있다. 일체의 현미경 제어 신호 및 교신은 글로리아드 망을 통하여 이루어지도록 하였다. 이는 HVEM원격 운영시스템을 이용하여 국내는 물론 국제적인 공동 연구를 수행할 수 있는 가상 실험실 구축을 실현할 수 있음을 시사한다.

인메모리 기반 딥러닝 기술을 위한 분산 프레임워크에 관한 연구 (A Study on In-memory based Distributed Frameworks for Deep Learning)

  • 조혜영;유정록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.45-46
    • /
    • 2016
  • 최근 GPU를 비롯한 하드웨어의 성능이 급격이 증가하면서 인공지능, 딥러닝 기술에 대한 관심이 높아지고 있다. 또한 데이터가 더욱 방대해 지면서 대용량 데이터를 처리하고 위한 딥러닝 분산 프레임워크에 대한 필요성이 제기되고 있다. 이에 본 논문에서는 대규모의 분산 환경에서 딥러닝 고속 처리를 위한 분산 프레임워크를 비교 분석하였다. 특히 최근 주목받고 있는 인메모리 기반 분산 프레임워크인 Spark, SparkNet, HeteroSpark의 특징을 비교 분석하였다.

분산 컴퓨팅 기술을 이용한 고해상도 강수량 예측 (High Resolution Rainfall Prediction Using Distributed Computing Technology)

  • 윤준원;송의성
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권1호
    • /
    • pp.51-57
    • /
    • 2016
  • 분산컴퓨팅은 네트워크로 연결된 여러 컴퓨터들의 연산 능력을 이용하여 거대 계산 문제를 해결하려는 분산처리 모델이다. 인터넷에 연결된 수많은 컴퓨팅 자원들의 참여를 통해 대규모의 계산이 필요한 기상, 바이오, 천문학, 암호학 등과 같은 다양한 분야의 어플리케이션 들을 병렬로 처리할 수 있다. 본 논문에서는 기상 분야의 고해상도 강수량 예측 어플리케이션 수행을 위해 인터넷 분산컴퓨팅 모델을 구성하여 성능을 분석하였다. 한반도의 강수량 예측을 위해서 중규모 예측 모형인 QPM(Quantitative Precipitation Model)을 적용하였으며 이 모형은 한반도의 지형을 격자 간격 27km로 나누고 각 격자의 특성인 고도, 기온, 강수, 강도 습도 등을 기반으로 강수량을 예측하게 된다. 그러나 QPM의 격자 간격에 따른 분석은 모형 구축에 많은 시간이 소요 되고 한번에 수행되어야 할 계산량이 많아 효율성이 저하된다. 따라서 이 모형을 기반으로 하여 3km 간격의 상세 지형을 반영하는 모형으로 소규모 지형 효과를 표현함으로써 상세 지역에서의 강수량 산출과 지형에 따른 강수량의 분포 파악이 용이해지며 계산 효율성을 개선시킬 수 있다. 이렇게 상세지역으로 세분화 된 모형은 병렬처리가 필요하며 계산노드의 수가 많아질수록 그 효율은 선형적으로 증가된다. 이 모형은 $20{\times}20$의 아격자 도메인의 분산된 단위작업들로 나뉘어 분산되고 네트워크로 연결된 컴퓨팅 자원에서 수행되게 된다.

정책 기반 Grid Accounting System 설계 (Design of Grid Accounting System based on Policy)

  • 장경익;허영선;황호전;김법균;곽의종;장행진;안동언;정성종
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.115-118
    • /
    • 2002
  • This paper designs Accounting structure for local users to policy base in Grid environment that integrate distributed Supercomputing resources geographically. Policy base virtual user Accounting system controls unnecessary increase of discrete Computing each local Accounting information. Also, This paper described method to manage do resources of each local system to policy base and presented way to process expense cost when used resources.

  • PDF

시스템 결함 분석을 위한 이벤트 로그 연관성에 관한 연구 (Correlation Analysis of Event Logs for System Fault Detection)

  • 박주원;김은혜;염재근;김성호
    • 산업경영시스템학회지
    • /
    • 제39권2호
    • /
    • pp.129-137
    • /
    • 2016
  • To identify the cause of the error and maintain the health of system, an administrator usually analyzes event log data since it contains useful information to infer the cause of the error. However, because today's systems are huge and complex, it is almost impossible for administrators to manually analyze event log files to identify the cause of an error. In particular, as OpenStack, which is being widely used as cloud management system, operates with various service modules being linked to multiple servers, it is hard to access each node and analyze event log messages for each service module in the case of an error. For this, in this paper, we propose a novel message-based log analysis method that enables the administrator to find the cause of an error quickly. Specifically, the proposed method 1) consolidates event log data generated from system level and application service level, 2) clusters the consolidated data based on messages, and 3) analyzes interrelations among message groups in order to promptly identify the cause of a system error. This study has great significance in the following three aspects. First, the root cause of the error can be identified by collecting event logs of both system level and application service level and analyzing interrelations among the logs. Second, administrators do not need to classify messages for training since unsupervised learning of event log messages is applied. Third, using Dynamic Time Warping, an algorithm for measuring similarity of dynamic patterns over time increases accuracy of analysis on patterns generated from distributed system in which time synchronization is not exactly consistent.

고속 네트웍 기반의 분산병렬시스템에서의 성능 향상 분석 모델 (Speedup Analysis Model for High Speed Network based Distributed Parallel Systems)

  • 김화성
    • 한국통신학회논문지
    • /
    • 제26권12C호
    • /
    • pp.218-224
    • /
    • 2001
  • 분산병렬처리의 목적은 다양한 내재 병렬 형태의 특징을 갖는 연산 집약적 문제를 고속 네트웍으로 연결되어진 다수의 고성능 및 병렬 컴퓨터들의 각기 다른 능력을 최대한 이용하여 해결함에 있다. 본 논문에서는 분산병렬시스템을 이용하는 경우의 성능 향상 분석을 위해 일반적인 그래프 표현 방법을 포함하는 계산 모델을 제안하고 프로그램의 수행을 위한 스케쥴링 시에 성능 향상이 어떠한 요인에 의해 달성되는지를 분석한다. 제안된 표현 방법은 동기종 및 이기종 시스템 모두에 적용되어질 수 있다. 분산병렬 시스템에서 스케줄링을 통하여 더 많은 속도향상을 얻기 위해서는 태스크와 병렬 컴퓨터간의 병렬특성의 일치가 주의 질게 다루어져야 하며 태스크의 이동으로 인한 통신 오버 헤드가 최소화 되어야 한다.

  • PDF

Shared Memory Model over a Switchless PCIe NTB Interconnect Network

  • Lim, Seung-Ho;Cha, Kwangho
    • Journal of Information Processing Systems
    • /
    • 제18권1호
    • /
    • pp.159-172
    • /
    • 2022
  • The role of the interconnect network, which connects computing nodes to each other, is important in high-performance computing (HPC) systems. In recent years, the peripheral component interconnect express (PCIe) has become a promising interface as an interconnection network for high-performance and cost-effective HPC systems having the features of non-transparent bridge (NTB) technologies. OpenSHMEM is a programming model for distributed shared memory that supports a partitioned global address space (PGAS). Currently, little work has been done to develop the OpenSHMEM library for PCIe-interconnected HPC systems. This paper introduces a prototype implementation of the OpenSHMEM library through a switchless interconnect network using PCIe NTB to provide a PGAS programming model. In particular, multi-interrupt, multi-thread-based data transfer over the OpenSHMEM shared memory model is applied at the implementation level to reduce the latency and increase the throughput of the switchless ring network system. The implemented OpenSHMEM programming model over the PCIe NTB switchless interconnection network provides a feasible, cost-effective HPC system with a PGAS programming model.

대용량 데이터의 분산/병렬 가시화를 위한 응용 독립적 가시화 프로토콜 (Application Independent Network Protocol for Distributed and Parallel Visualization)

  • 김민아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.126-129
    • /
    • 2011
  • 대용량 데이터의 분산/병렬 가시화를 위해서는 가시화 클라이언트와 서버 사이의 프로토콜이 필요하다. 기존 가시화 도구들은 개발 도구에 특화된 프로토콜을 사용하고 있으며, 이 때문에 클라이언트와 서버는 매우 tightly-coupled 되어 있다. 본 논문에서는 응용에 독립적인 분산/병렬 가시화를 위한 가시화 프로토콜을 설계하고 구현한다. 또한, 시변환 데이터의 효율적 가시화를 위해 animation을 구현할 수 있는 프리미티브를 설계하고 status machine으로 병렬 전송된 데이터들 간의 동기화를 구현한다. 이러한 응용 독립적 가시화 프로토콜을 도입함으로써 가시화는 병렬 분산 가시화를 수행하는 그리드의 서비스나 슈퍼컴퓨팅의 서비스로 확장될 수 있을 것이다.