• 제목/요약/키워드: high-performance computing (HPC)

검색결과 64건 처리시간 0.028초

High-performance computing for SARS-CoV-2 RNAs clustering: a data science-based genomics approach

  • Oujja, Anas;Abid, Mohamed Riduan;Boumhidi, Jaouad;Bourhnane, Safae;Mourhir, Asmaa;Merchant, Fatima;Benhaddou, Driss
    • Genomics & Informatics
    • /
    • 제19권4호
    • /
    • pp.49.1-49.11
    • /
    • 2021
  • Nowadays, Genomic data constitutes one of the fastest growing datasets in the world. As of 2025, it is supposed to become the fourth largest source of Big Data, and thus mandating adequate high-performance computing (HPC) platform for processing. With the latest unprecedented and unpredictable mutations in severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2), the research community is in crucial need for ICT tools to process SARS-CoV-2 RNA data, e.g., by classifying it (i.e., clustering) and thus assisting in tracking virus mutations and predict future ones. In this paper, we are presenting an HPC-based SARS-CoV-2 RNAs clustering tool. We are adopting a data science approach, from data collection, through analysis, to visualization. In the analysis step, we present how our clustering approach leverages on HPC and the longest common subsequence (LCS) algorithm. The approach uses the Hadoop MapReduce programming paradigm and adapts the LCS algorithm in order to efficiently compute the length of the LCS for each pair of SARS-CoV-2 RNA sequences. The latter are extracted from the U.S. National Center for Biotechnology Information (NCBI) Virus repository. The computed LCS lengths are used to measure the dissimilarities between RNA sequences in order to work out existing clusters. In addition to that, we present a comparative study of the LCS algorithm performance based on variable workloads and different numbers of Hadoop worker nodes.

고성능 컴퓨팅을 위한 인터커넥션 네트워크 기술 동향 (The Technology Trend of Interconnection Network for High Performance Computing)

  • 조혜영;전태준;한지용
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.9-15
    • /
    • 2017
  • 반도체 집적 기술의 발전으로 중앙처리장치 및 저장장치가 소형화되고 성능이 빠르게 발전되면서 고성능 컴퓨팅(High Performance Computing) 분야에서 인터커넥션 네트워크가 전체 시스템의 성능을 결정하는데 더욱 중요한 요소가 되고 있다. 본 논문에서는 고성능컴퓨팅 분야에서 사용되는 인터커넥션 네트워크 기술 동향을 분석하였다. 2017년 6월 기준 슈퍼컴퓨터 Top 500에서 가장 많이 사용하고 있는 인터커텍트는 인피니밴드이다. 최근 이더넷은 40/100Gbps 기가비트 이더넷 기술의 등장으로 인피니밴드 다음으로 높은 점유율을 보이고 있다. 지연(latency) 성능이 인피니밴드에 비해 떨어지는 기가비트 이더넷은 비용 대비 효율을 중시하는 중형급 데이터 센터에서 선호하고 있다. 또한 고성능을 요구하는 최상위 HPC 시스템들은 기존의 이더넷, 인피니밴드 기술에서 벗어나, 자체적인 인터커넥트 네트워크를 도입하여 시스템의 성능을 극대화 하는 노력을 하고 있다. 향후 고성능 인터커넥트 분야는 전기 신호기반 데이터 통신에서 한 단계 도약하여, 빛으로 데이터를 주고받는 실리콘 반도체 기반 광송수신 기술이 활용될 것으로 예상된다.

NISN HPC 서비스 환경에서 2016년 사이버 공격 탐지 데이터 분석 (An Analysis of the 2016 Cyber Attack Detection Data in NISN HPC Service Environment)

  • 이재국;김성준;홍태영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.190-191
    • /
    • 2017
  • 정보통신기술(ICT)의 발전으로 원격지에서 고속으로 HPC(High Performance Computing) 서비스를 이용할 수 있게 되었지만, HPC 서비스 환경을 대상으로 하는 사이버 공격도 끊이지 않고 발생하고 있다. 본 논문에서는 슈퍼컴퓨터 4호기 서비스 환경에서 탐지/차단된 사이버 공격 증가 추이를 살펴보고, 2016년 사이버 공격 탐지 데이터와 슈퍼컴퓨팅서비스 네트워크 내부로 유입된 트래픽 데이터를 분석하여 급격히 증가한 공격지 IP 주소의 분포 및 특징을 확인한다.

3D 패키징을 위한 Scallop-free TSV와 Cu Pillar 및 하이브리드 본딩 (Scallop-free TSV, Copper Pillar and Hybrid Bonding for 3D Packaging)

  • 장예진;정재필
    • 마이크로전자및패키징학회지
    • /
    • 제29권4호
    • /
    • pp.1-8
    • /
    • 2022
  • TSV 기술을 포함한 고밀도, 고집적 패키징 기술은 IoT, 6G/5G 통신, HPC (high-performance computing)등 여러 분야에서 중요한 기술로 여겨지고 있다. 2차원에서 고집적화를 달성하는 것은 물리적 한계에 도달하게 되었으며, 따라서 3D 패키징 기술을 위하여 다양한 연구들이 진행되고 있다. 본 고에서는 scallop의 형성 원인과 영향, 매끈한 측벽을 만들기 위한 scallop-free 에칭 기술, TSV 표면의 Cu bonding에 대해서 자세히 조사하였다. 이러한 기술들은 고품질 TSV 형성 및 3D 패키징 기술에 영향을 줄 것으로 예상한다.

계산과학 시뮬레이션을 위한 HPC 작업 관리 프레임워크의 설계 및 구현 (Design and Implementation of HPC Job Management Framework for Computational Scientific Simulation)

  • 유정록;김한기;변희정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.554-557
    • /
    • 2016
  • 최근, 슈퍼컴퓨터 시스템은 교육, 의료, 국방 등은 물론 계산과학 시뮬레이션까지 다양한 분야에서 활용되고 있다. 특히, 슈퍼컴퓨터, 클라우드 등 이종의 계산 자원을 연동하는 시뮬레이션 환경은 시간, 공간적 한계를 극복하는 차세대 연구 환경으로서 다양한 응용 분야에서 큰 각광을 받고 있다. 그러나 기존의 이종 슈퍼컴퓨팅 환경은 API(Application Programming Interface)의 부재로 터미널 접근을 통해 계산 작업을 수행하는 단조로운 형태를 띠고 있으며, 이는 이종 컴퓨팅 자원의 접근성 및 활용성을 저해하는 주요 요소이다. 이러한 문제점을 해결하고, 슈퍼컴퓨팅 서비스의 다양성을 확보하기 위해, 본 논문에서는 계산과학 시뮬레이션을 위한 웹 기반 HPC (High Performance Computing) 작업 관리 프레임워크의 설계 및 구현에 대해 기술한다. 제안한 프레임워크는 슈퍼컴퓨터, 클라우드, 그리드 등의 다양한 이기종 자원을 활용하여 시뮬레이션 계산 작업을 수행할 수 있도록 플러그-인 기반 표준 인터페이스 및 번들 플러그-인을 제공하며, 플러그-인 관리자를 통해 손쉽게 자원 확장이 가능하다. 또한 시뮬레이션 작업의 생성, 제출, 제어, 상태 모니터링 등의 전주기적인 작업 라이프사이클 관리를 위해 HTTP 표준 방식의 RESTful endpoints들을 제공한다.

  • PDF

복합재난 대응을 위한 HPC 기반 시스템 설계 (The Design of A HPC based System For Responding Complex Disaster)

  • 강경우;강윤희
    • Journal of Platform Technology
    • /
    • 제6권4호
    • /
    • pp.49-58
    • /
    • 2018
  • 복합재난은 과거 보다 더 많은 피해 및 손실을 발생시킨다. 예상치 못한 결과를 발생 시킬 수 있기 때문에 항상 대비되어야 한다. 특히 원자력발전소와 같은 시설에서의 사고는 기후상황에 따라 큰 문제를 야기 시킬 수 있기 때문에 문제 발생에 따른 다양한 상황을 가정하고 모의실험을 통해 연구가 선행되어야 한다. 본 연구에서는 복합재난 대응을 위한 시스템을 설계하고 이 시스템 연구를 위해 필요한 요소기술들을 정의해 보았다. 기본적으로 고성능 컴퓨팅과 대용량 데이터를 기반으로 하는 계층적 구조의 시스템을 구성하였다. 시스템 개발을 위해 융합분야에서 미들웨어 연구 만 아니라 응용분야 연구, 데이터 연구, 의사결정지원 서비스 연구가 필요하다.

클라우드 시스템에서 해양수치모델 성능 최적화 (Performance Optimization of Numerical Ocean Modeling on Cloud Systems)

  • 정광욱;조양기;탁용진
    • 한국해양학회지:바다
    • /
    • 제27권3호
    • /
    • pp.127-143
    • /
    • 2022
  • 최근 클라우드 컴퓨팅 환경에서 해양수치모델 실험을 수행하는 많은 연구가 활발하게 진행되고 있다. 클라우드 컴퓨팅 환경은 대규모 자원이 필요한 해양수치모델을 구현하는데 매우 효과적인 수단이 될 수 있다. 정보처리 기술의 발달로 클라우드 컴퓨팅 시스템은 가상화와 원격 고속 네트워크, 직접 메모리 액세스와 같은 수치모델의 병렬처리에 필요한 다양한 기술과 환경을 제공한다. 이러한 새로운 기능은 클라우드 컴퓨팅 시스템에서 해양수치모델링 실험을 용이하게 한다. 많은 과학자들과 엔지니어들은 해양수치모델 실험에 있어서 가까운 미래에 클라우드 컴퓨팅이 주류가 될 것으로 기대하고 있다. 해양수치모델링을 위한 클라우드 컴퓨팅의 처리성능 분석은 수치모델의 수행 시간과 리소스 활용량을 최소화하는 데 도움이 될 수 있으므로 최적의 시스템을 적용하는 데 필수적이다. 특히 모델 격자 내 다양한 변수들이 다차원 배열 구조로 되어 있기 때문에 대량의 입출력을 처리하는 해양수치모델의 구조는 캐시메모리의 효과가 크며, 대량의 자료가 이동하는 통신 특성으로 인해서 네트워크의 속도가 중요하다. 최근에 주요한 컴퓨팅환경으로 자리잡고 있는 클라우드 환경이 이러한 해양수치모델을 수행하기에 적합한지 실험을 통해서 검토할 필요가 있다. 본 연구에서는 상용 클라우드 시스템에서 해양수치모델로 대표적인 Regional Ocean Modeling System (ROMS)와 더불어 다른 해양모델의 클라우드 환경으로 전환에도 도움이 될 수 있게 병렬처리 시스템의 성능을 측정할 수 있는 표준 벤치마킹 소프트웨어 패키지인 High Performance Linpack을 활용하여 초당 부동소수점 연산횟수 처리능력과 및 STREAM 벤치마크를 활용하여 다중 노드들로 구성된 수치모델용 클러스터의 메모리처리성능을 평가하고 비교하였다. 이러한 평가내용은 클라우드 환경에서 해양수치모델을 어떻게 수행할 것인가에 대해 중요한 정보를 제공할 수 있다. 가상화 기반 상용 클라우드에서 얻은 실제 성능 자료와 구성 설정 분석을 통해 가상화 기반 클라우드 시스템에서 해양수치모델의 다양한 격자 크기에 대한 컴퓨터 리소스의 효율성을 평가했다. 본 연구를 통해서 캐시 계층과 용량이 큰 메모리를 사용하는 HPC 클러스터가 ROMS의 성능에 매우 중요하다는 것을 발견했다. 수치모델링의 실행 시간을 줄이기 위해 코어 수를 늘리는 것은 작은 격자 보다 큰 격자 모델에서 더 효과적이다. 이러한 처리 성능 분석 결과는 클라우드 컴퓨팅 시스템에서 해양수치모델을 효율적으로 구축하는 데 중요한 자료로 이용될 것이다.

계산과학분야의 고성능컴퓨팅 교육 개선을 위한 탐색적 연구 (A Study on the Improvement of High Performance Computing Education in Computational Science)

  • 윤희준;안성진
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.21-31
    • /
    • 2018
  • 계산과학분야에서 고성능컴퓨팅(HPC)을 활용하기 위해서는 프로그래밍, 알고리즘, 자료구조 등 컴퓨터과학의 지식들과 기술들을 배워야 한다. 본 논문에서는 계산과학분야의 IT교육현황 조사와 설문조사를 통해 고성능컴퓨팅 교육을 개선시키기 위한 정책 방향을 제안하는데 있다. 이를 위해 국내 대학의 물리학, 화학, 생명과학, 지구과학분야의 전공과목 중에서 IT관련 과목 현황과 사용자들의 국내 고성능컴퓨팅 교육에 대한 인식을 조사하였다. 그 결과 계산과학분야의 IT과 목비율은 응용 전공과목에 비해 매우 낮았다. 대학의 교육 요구도는 높게 나왔지만, 대학의 교육 제공 수준은 제일 낮게 나왔다. 또한 대부분의 사용자들은 독학으로 필요한 지식과 기술들을 습득한 것으로 조사되었다. 즉 대학의 역할이 가장 시급하고 중요하며 전문기관과 온라인교육의 역할도 중요하다고 확인하였다.

FDS를 이용한 소화모형 화재거동의 시뮬레이션 (Simulation of Wood Crib Burning Behaviors by Using FDS)

  • 권성필;윤헌주;김형권;라용운;사공성호;신동일
    • 한국화재소방학회:학술대회논문집
    • /
    • 한국화재소방학회 2008년도 추계학술논문발표회 논문집
    • /
    • pp.76-79
    • /
    • 2008
  • In this work wood crib burning behaviors have been simulated by using the FDS(Fire Dynamic Simulator) program. Wood cribs are regularly stacked arrays of wood sticks, and available for the performance rating of fire-extinguishers. On the basis of an angle iron supporter 26 layers of wood sticks have been stacked up. Each layer consists of 5 or 6 wood sticks which are placed in parallel, with a constant distance, and in alternating rows. They are laid between the horizontally adjacent sticks at the before last layer. The wood crib is ignited instantaneously by an amount of burning gasoline below. A comprehensive simulation of such a practical sophisticated combustion is still too difficult to realize with any currently available computer, although the performance of modern processors is getting better everyday. We could carry it out here through parallel computing on the HPC(High Performance Computing) cluster as the feasible alternative. At last the validation has been executed by means of temperature distribution data measured by the thermal video camera.

  • PDF

멀티-코어 서버의 성능 분석 및 특성화 (Performance Analysis and Characterization of Multi-Core Servers)

  • 이명호;강준석
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.259-268
    • /
    • 2008
  • 멀티-코어 프로세서는 최근 마이크로프로세서 시장의 주류 제품으로 자리 잡았다. 이러한 멀티-코어 프로세서를 기반으로 하는 서버들은 고성능 컴퓨팅 분야와 상용 응용 프로그램 분야에서 그 사용 범위를 넓혀가고 있다. 멀티-코어 프로세서는 높아진 병렬성으로 인하여 응용 프로그램의 성능도 한 단계 더 높여줄 것으로 기대된다. 하지만, 칩 내부의 여러 코어들이 공유 자원들을 사용하면서 발생하는 경쟁과 충돌이 성능에 병목으로 작용하기도 한다. 그러므로 멀티-코어 서버 상에서 높은 성능과 확장성을 얻기 위해서는 공유 자원의 사용을 최적화 하는 것이 필수적이다. 본 논문에서는 코어들 간의 공유 자원 사용에서 발생하는 긍정적/부정적인 효과들이 실제 응용 프로그램의 성능에 어떻게 반영되는지 실험을 통하여 분석해 본다. 또한 이러한 분석을 통하여 멀티-코어 서버의 성능을 특성화한다.