• 제목/요약/키워드: 슈퍼컴퓨터

검색결과 321건 처리시간 0.03초

전산유체역학 병렬해석을 위한 클러스터 네트웍 장치 성능분석 (Performance Analysis of Cluster Network Interfaces for Parallel Computing of Computational Fluid Dynamics)

  • 이보성;홍정우;이동호;이상산
    • 한국항공우주학회지
    • /
    • 제31권5호
    • /
    • pp.37-43
    • /
    • 2003
  • 전산유체역학분야에서의 효율적인 해석을 위해서 병렬처리기법이 널리 사용되고 있다. 병렬처리기법과 함께 최근에는 저가의 리눅스 클러스터 컴퓨터들이 기존의 슈퍼컴퓨터들을 대체하는 추세이다. 리눅스 클러스터 컴퓨터에서 수행되는 해석프로그램의 성능은 클러스터 시스템의 프로세서 성능 뿐 아니라 클러스터 시스템에서 사용되는 네트웍 장비의 성능에 크게 영향을 받는다. 본 연구에서는 미리넷2000, 기가비트 이더넷, 패스트 이더넷 등 네트웍 장비에 따라서 클러스터 시스템의 성능이 어떻게 달라지는지를 Netpipe, LINPACK, NAS NPB, 그리고 MIPNS2D Navier-Stokes 해석프로그램을 사용하여 비교하였다. 이러한 연구결과를 바탕으로 전산유체역학 분야에서 사용될 고성능 저비용 리눅스 클러스터 시스템을 구축하는 방법을 제시하고자 하였다.

YOLOv4 네트워크를 이용한 자동운전 데이터 분할이 검출성능에 미치는 영향 (Influence of Self-driving Data Set Partition on Detection Performance Using YOLOv4 Network)

  • 왕욱비;진락;이추담;손진구;정석용;송정영
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.157-165
    • /
    • 2020
  • 뉴-럴 네트워크와 자동운전 데이터 셋을 개발하는 목표중의 하나가 데이터 셋을 분할함에 따라서 움직이는 물체를 검출하는 성능을 개선하는 방법이 있다. 다크넷 (DarkNet) 프레임 워크에 있어서, YOLOv4 네트워크는 Udacity 데이터 셋에서 훈련하는 셋과 검증 셋으로 사용되었다. Udacity 데이터 셋의 7개 비율에 따라서 이 데이터 셋은 훈련 셋, 검증 셋, 테스트 셋을 포함한 3개의 부분 셋으로 나누어진다. K-means++ 알고리즘은 7개 그룹에서 개체 Box 차원 군집화를 수행하기 위해 사용되었다. 훈련을 위한 YOLOv4 네트워크의 슈퍼 파라메타를 조절하여 7개 그룹들에 대하여 최적 모델 파라메타가 각각 구해졌다. 이 모델 파라메타는 각각 7 개 테스트 셋 데이터에 비교하고 검출에 사용되었다. 실험결과에서 YOLOv4 네트워크는 Udacity 데이터 셋에서 트럭, 자동차, 행인으로 표현되는 움직이는 물체에 대하여 대/중/소 물체 검출을 할수 있음을 보여 주었다. 훈련 셋과 검증 셋, 테스트 셋의 비율이 7 ; 1.5 ; 1.5 일 때 최적의 모델 파라메타로서 가장 높은 검출 성능이었다. 그 결과값은, mAP50가 80.89%, mAP75가 47.08%에 달하고, 검출 속도는 10.56 FPS에 달한다.

병렬 GPU를 이용한 분자 도킹 시스템 (Molecular Docking System using Parallel GPU)

  • 박성준
    • 한국콘텐츠학회논문지
    • /
    • 제8권12호
    • /
    • pp.441-448
    • /
    • 2008
  • 분자 도킹 실험은 일반적으로 계산 량이 매우 많아 슈퍼 컴퓨팅 파워를 요구하는 실험이다. 따라서 시간이 많이 소요되기 때문에 일반적으로 CPU가 탑재된 컴퓨터를 여러 대 묶어서 사용하는 분산 환경 혹은 그리드 환경에서 실험을 수행하고 있다. 이와 같은 실험 환경은 시간적, 공간적 제약성이 많아 일반적으로 과학자들이 접근하기가 어렵다. 그래서 근래에는 많은 CPU를 사용하기 보다는 월등히 성능이 높은 GPU를 병렬 화하여 과학 분야에 계산하는 연구가 매우 활발히 이루어지고 있는 추세이다. CUDA는 병렬 GPU 프로그래밍을 가능하게 하는 공개 기술이다. 본 논문에서는 이러한 CUDA 기술을 사용하여 분자 도킹 실험을 할 수 있는 시스템을 제안한다. 또한, 분자 도킹 실험에 있어서 중요한 에너지 최소화 계산을 병렬 화하는 알고리즘을 제안한다. 이와 같은 실험을 검증하기 위해 본 논문에서는 일반적인 CPU에서 분자 도킹 실험 시간과 본 논문에서 제안한 병렬 CPU 기반의 분자 도킹 시간을 비교 분석 하였다.

유가금속(有價金屬) 회수(回收)를 위한 PCB 스크랩의 건식처리기술(乾式處理技術) (Pyro-metallurgical Treatment of used OA Parts for the Recovery of Valuable Metals)

  • 신동엽;이상동;정현부;유병돈;한정환;정진기
    • 자원리싸이클링
    • /
    • 제17권2호
    • /
    • pp.46-54
    • /
    • 2008
  • 폐 컴퓨터나 OA기기 중 PCB (Printed Circuit Board)에는 귀금속을 포함한 많은 양의 금속성분이 함유되어 있으며, 본 연구에서는 이들을 분리회수하기 위한 건식처리 기술을 검토하였다. 폐 컴퓨터로부터 얻은 PCB 스크랩을 산화처리한 시료에 대해 정량분석을 실시하고, 함유된 산화물 종류에 대하여 적합한 슬래그계를 선정하여 유가금속을 분리회수하기 위한 산화물 성분의 슬래그화를 시도하였다. 용융작업을 위해 슈퍼칸탈 회전로를 사용하였으며, 이때 도가니 회전이 금속의 회수율에 미치는 영향을 조사하였다.

R/C 쌍곡 냉각탑의 극한 거동 (Ultimate Behavior of Reinforced Concrete Hyperbolic Cooling Tower)

  • 민창식;김생빈
    • 대한토목학회논문집
    • /
    • 제12권4호
    • /
    • pp.59-70
    • /
    • 1992
  • 풍하중(風荷重)을 받는 쌍곡 냉각탑의 비탄성(非彈性), 비선형(非線型) 극한(極限) 거동(擧動)을 Cray Y-MP 슈퍼 컴퓨터에 개발(開發)한 유한요소(有限要素)컴퓨터 프로그램으로 연구(研究)하였다. 유한요소 망(mesh)을 각각 잘게 잘라서 3모델을 만들고, 이 모델들을 이용하여 탄성과 비탄성 해석으로 유한요소 망의 수렴관계(mesh convergence)를 연구하였다. 연구결과 유한요소의 크기가 냉각탑의 극한거동을 예측하는데 매우 중요한 역할을 하고있음을 볼 수 있었다. 비록 쌍곡 냉각탑이 풍하중(風荷重)에 대해서 막응력(膜應力)(membrane stress)으로 저항하나, 본 연구(研究) 결과(結果) 휨응력(應力)(bending stress)도 냉각탑의 파괴와 거동(擧動)에 매우 중요한 역할을 하고 있음을 알아 내었다. 해석(解析)한 냉각탑은 형성값(Shape factor)이 1.48에 이르렀고, 이는 냉각탑의 자오선 응력(meridional stress)이 원둘레방향으로 상당히 재분배 되고 있음을 보여주는 것이다. 이러한 재분배에 대한 사실은 배치된 철근의 항복이 바람방향 자오선으로부터 $30^{\circ}C$에 까지 나타난 것으로 더욱더 뚜렷하였다. 현재의 탄성해석을 이용하는 냉각탑 설계(設計) 방법은 안전(安全)측에 있음을 보여 주었으며, 1보다 큰 형상값을 설계시에 활용하기 위해서는 더욱더 많은 연구가 선행되어야 할 것이다.

  • PDF

멀티코어 및 고성능 플래시 SSD 환경에서 저널링 파일 시스템의 성능 평가 및 최적화 (Performance Evaluation and Optimization of Journaling File Systems with Multicores and High-Performance Flash SSDs)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제18권4호
    • /
    • pp.178-185
    • /
    • 2018
  • 최근 클라우드 컴퓨팅, 슈퍼컴퓨팅, 기업용 스토리지/데이터베이스 등의 분야에서 멀티코어 CPU와 고성능 플래시 메모리 기반 저장 장치(플래시 SSD)를 장착한 컴퓨더 시스템에 대한 수요가 크게 증가하고 있다. 이러한 고성능 시스템에서 구동되고 있는 대표적인 운영체제 파일 시스템인 저널링 파일 시스템은 저장장치의 입출력 성능을 최대로 활용하고 있지 못하다. 본 논문에서는 고성능 플래시 SSD와 멀티코어 CPU기반의 컴퓨터 시스템에서 리녹스 운영체제의 EXT4 저널링 파일 시스템의 성능을 평가하고 분석하고자 한다. 성능 평가에 사용된 72-코어 컴퓨터 시스템은 인텔의 고성능 NVMe 기반 플래시 SSD를 장착하고 있으며 이 장치의 연속 읽기/쓰기 성능은 2800/1900 MB/s 이다. 실험 결과는 EXT4 파일 시스템의 체크포인팅 연산이 성능상의 큰 오버헤드임을 보여준다. 이 결과를 바탕으로 체크포인팅을 여러 쓰레드가 수행할 수 있는 최적화 기법을 제안하였고, 최적화된 EXT4 파일 시스템은 기존 EXT4 파일 시스템 대비 최대 92%의 성능 향상을 보여준다.

WBAN 기반의 GTS 채널 이용률 향상기법 제안 (A Proposal for Improving Techniques of GTS Utilization Based on WBAN)

  • 박주희;정원수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권10호
    • /
    • pp.73-81
    • /
    • 2011
  • WBAN(Wireless Body Area Network) 기술은 인체 내부 및 외부에 부착한 센서 노드를 무선으로 연결하여 통신할 수 있는 근거리 무선 통신 기술로서 IEEE 802.15.6 TG BAN을 중심으로 물리 계층, 데이터 링크 계층, 네트워크 계층 및 응용 계층 등에서 표준화가 진행되고 있다. WBAN은 응용서비스의 종류에 따라 의료용과 비의료용으로 나눌 수 있다. 의료용 응용서비스의 경우데이터 전송 특징이 주기적이고 전송률이 상이한 의료용 센서를 사용하기 때문에 데이터 전송시 QoS를 보장하기 위하여 GTS 전송방식을 사용한다. 본 논문에서는 WBAN 환경에 적합한 MAC 프로토콜을 제안하였다. 첫 번째 WBAN 기반의 슈퍼프레임 구조와 프리미티브를 제안하였다. 두 번째 WFQ(Weighted Fair Queuing)기반의 GTS 채널 이용률 향상 알고리즘을 제안하였다. 제안한 스케줄링 방식은 i-Game(라운드로빈 스케줄링 방식)과 비교하여 채널 이용률을 향상시키는 것을 알 수 있다.

계산 그리드를 위한 퍼지로직 기반의 그리드 작업 스케줄링 모델 (Fuzzy Logic-based Grid Job Scheduling Model for omputational Grid)

  • 박량재;장성호;조규철;이종식
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.49-56
    • /
    • 2007
  • 계산 그리드 컴퓨팅은 수많은 컴퓨팅 자원들을 이용하여, 슈퍼 컴퓨팅이나 이전의 분산 컴퓨팅으로 해결 할 수 없는 대용량의 연산 문제를 해결한다. 계산 그리드 컴퓨팅 환경에서의 자원은 이 기종으로 구성되어, 효율적인 작업 처리를 위해서는 스케줄링 기법이 필요하다. 본 논문에서는 계산 그리드에서 효율적인 작업 스케줄링을 위하여 퍼지로직 기반의 그리드 작업 스케줄링 모델을 제안한다. 퍼지로직 기반의 그리드 작업 스케줄링 모델은 퍼지로직을 이용하여 자원의 효율성을 평가하며, 평가된 기반으로 그룹을 구성하여 작업을 할당하는 모델이다. 우리는 DEVS 모델링 & 시뮬레이션 환경에서 시뮬레이션 모델을 구성하고 Random 스케줄링과 MCT 스케줄링 모델과의 비교 실험을 통하여 제안된 퍼지로직 기반의 그리드 작업 스케줄링 모델이 작업완료시간, 작업손실, 통신량을 개선함으로써 더욱 더 안정적이고 빠른 작업 처리 서비스를 그리드 사용자에게 제공할 수 있다는 사실을 증명하였다.

  • PDF

WBAN 환경에서 Weighted Fair Queuing 기반의 GTS 타임 슬롯 할당 알고리즘 (Algorithm of GTS Time Slots Allocation Based on Weighted Fair Queuing in Environments of WBAN)

  • 김경목;정원수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.45-56
    • /
    • 2011
  • WBAN은 사람이 착용하는 옷이나 인체 내부 혹은 외부에 있는 여러 장치들을 상호 연결하여 통신할 수 있는 근거리 무선통신 기술이다. WBAN은 기술 적용 분야에 따라 의료용과 비의료용으로 구분할 수 있으며, 주기적인 특성을 가진 의료용 데이터의 경우 GTS 방식을 사용해서 데이터를 전송하여 QoS를 보장한다. 본 논문에서는 WBAN 슈퍼프레임 구조에서 GTS 방식으로 데이터를 전송시 부족한 GTS 타임 슬롯을 해결하는 알고리즘을 제안한다. 코디네이터는 디바이스의 데이터 전송률에 따라 GTS 타임 슬롯을 가변적으로 할당하며, GTS의 개수가 부족하면 GTS 타임 슬롯을 공유하여 사용하도록 할당한다. 제안한 기법의 성능평가를 위해 지연한도와 처리량을 비교하였다. 즉, WBAN 환경에 적합한 WFQ(Weighted Fair Queuing) 스케줄링을 적용하여 상이한 데이터 전송률을 지원하면서 GTS를 할당하는 방법을 제안하였고, 라운드로빈(Round Robin) 스케줄링 방법과 비교하여 처리량은 증가하면서 최대 지연이 감소함을 알 수 있다.

CNN을 이용한 Quad Tree 기반 2D Smoke Super-resolution (Quad Tree Based 2D Smoke Super-resolution with CNN)

  • 홍병선;박지혁;최명진;김창헌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권3호
    • /
    • pp.105-113
    • /
    • 2019
  • 물리 기반 유체 시뮬레이션은 고해상도 연산을 위해 많은 시간이 필요하다. 이 문제를 해결하기 위해 저해상도 유체 시뮬레이션의 한계를 딥 러닝으로 보완하는 연구들이 있으며, 그중에서는 저해상도의 시뮬레이션 데이터를 고해상도로 변환해주는 Super-resolution 분야가 있다. 하지만 기존 기법들은 전체 데이터 공간에서 밀도 데이터가 없는 부분까지 연산하므로 전체 시뮬레이션 속도 면에서 효율성이 떨어지며, 입력 해상도가 큰 경우에는 GPU 메모리가 부족해 연산할 수 없는 경우가 발생할 수 있다. 본 연구에서는 공간 분할 법 중 하나인 쿼드 트리를 활용하여 시뮬레이션 공간을 분할 및 분류하여 Super-resolution 하는 기법을 제안한다. 본 기법은 필요 공간만 Super-resolution 하므로 전체 시뮬레이션 가속화가 가능하고, 입력 데이터를 분할 연산하므로 GPU 메모리 문제를 해결할 수 있게 된다.