• 제목/요약/키워드: 고성능 컴퓨팅 시스템

검색결과 172건 처리시간 0.031초

U.K. 지구시스템모델 UM의 리눅스 클러스터 설치와 성능 평가 (An Installation and Model Assessment of the UM, U.K. Earth System Model, in a Linux Cluster)

  • 윤대옥;송형규;박성수
    • 한국지구과학회지
    • /
    • 제43권6호
    • /
    • pp.691-711
    • /
    • 2022
  • 지구 대기에 영향을 주는 거의 모든 인간활동과 자연현상을 수치적으로 담아내는 지구시스템모델은 기후 위기의 시대에 활용될 가장 진보한 과학적 도구이다. 특히 우리나라 기상청이 도입한 지구시스템모델인 Unified Model (UM)은 지구 대기 연구의 과학적 도구로써 매우 활용성이 높다. 하지만 UM은 수치 적분과 자료 저장에 방대한 자원이 필요하여 개별 연구자들은 최근까지도 기상청 슈퍼컴퓨터에만 UM을 가동하는 상황이다. 외부와 차단된 기상청 슈퍼컴퓨터만을 이용하여 모델 연구를 수행하는 것은 UM을 이용한 모형 개선과 수치 실험의 원활한 수행에 있어 효율성이 떨어진다. 본 연구는 이러한 한계점을 극복할 수 있도록 개별 연구자가 보유한 고성능 병렬 컴퓨터(리눅스 클러스터) 에서 최신 버전 UM을 원활하게 설치하여 활용할 수 있도록 UM 시스템 환경 구축 과정과 UM 모델 설치 과정을 구체적으로 제시하였다. 또한 UM이 성공적으로 설치된 리눅스 클러스터 상에서 N96L85과 N48L70의 두 가지 모형 해상도에 대하여 UM 가동 성능을 평가하였다. 256코어를 사용하였을 때, 수평으로 1.875° ×1.25° (위도×경도)와 수직으로 약 85 km까지 85층 해상도를 가진 N96L85 해상도에 대한 UM의 AMIP과 CMIP 타입 한 달 적분 실험은 각각 169분과 205분이 소요되었다. 저해상도인 3.75° ×2.5° 와 70층 N48L70 해상도에 대해 AMIP 한달 적분은 252코어를 사용하여 33분이 소요되는 적분 성능을 보였다. 또한 적분을 위해 사용된 코어의 개수에 비례하여 적분 성능이 향상되었다. 성능 평가 외에 29년 간의 장기 적분을 수행하여 과거 지상 2-m 온도와 강수 강도를 ERA5 재분석자료와 비교하였고, 해상도에 따른 차이도 정성적으로 살펴보았다. 재분석자료와 비교할 때, 공간 분포가 유사하였고, 해상도와 대기-해양 접합에 따라 모의 결과에서 차이가 나타났다. 본 연구를 통해 슈퍼컴퓨터가 아닌 개별 연구자의 고성능 리눅스 클러스터 상에서도 UM이 성공적으로 구동됨을 확인하였다.

슈퍼컴퓨터 최적 실행 지원을 위한 하드웨어 성능 카운터 기반 프로파일링 기법의 확장성 연구 (A Study on Scalability of Profiling Method Based on Hardware Performance Counter for Optimal Execution of Supercomputer)

  • 최지은;박근철;노승우;박찬열
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권10호
    • /
    • pp.221-230
    • /
    • 2020
  • 한정된 자원을 여러 사용자에게 공유해야하는 슈퍼컴퓨터와 같은 시스템은 응용프로그램의 실행을 최적화하는 방안이 필요하다. 이를 위해 시스템 관리자가 수행할 응용프로그램에 대한 사전 정보를 파악하는 것이 유용하다. 대부분의 고성능 컴퓨팅 시스템 운영에 있어 작업을 실행할 때 사용자로부터 실행 기간, 자원 요구사항들에 대한 정보를 제공 받거나 시스템 사용 통계 값을 사용하여 필요한 정보를 생성하는 등의 프로파일링 기술을 바탕으로 시스템 활용률을 높이는데 활용하고 있다. 본 논문의 선행연구에서는 하드웨어 성능 카운터를 이용하여 소스코드에 대한 별도의 이해 없이 응용프로그램 특성분석을 실행하고, 이 결과를 바탕으로 작업 스케줄링 알고리즘을 최적화하는 기술을 개발한 바 있다. 본 논문에서는 슈퍼컴퓨터 최적 실행지원을 위한 프로파일링 테스트베드 클러스터를 구축하고 구축한 클러스터 환경에서 하드웨어 성능 카운터를 기반으로 응용프로그램의 특성을 분석하는 프로파일링 기법의 확장성을 실험하였다. 이를 통해 응용프로그램의 문제크기를 축소하거나 프로파일링에 사용되는 노드수를 최소화하여도 개발한 하드웨어 성능 카운터 기반의 프로파일링 기법이 확장성 있게 동작하여 실제 스케줄링 최적화시에 활용될 수 있음을 보이고자 한다. 실험을 통해 프로파일링에 사용되는 노드의 수를 1/4로 줄여도 전체 노드를 사용한 프로파일링 대비 응용프로그램의 실행 시간이 1.08% 증가할 뿐 스케줄링 최적화 성능은 순차실행 대비 최대 37% 향상되었다. 또한 응용프로그램의 문제크기를 축소하여 프로파일링한 결과 프로파일링 데이터 수집 단계의 시간적 비용을 1/4배 이상 낮추면서 최대 35% 성능 향상 효과를 얻었다.

맥락 정보와 물리적 속성 부여가 가능한 모바일 증강 현실 콘텐츠 조작 방법 (A Contextual Information and Physics-based Mobile Augmented Reality Contents Manipulation Method)

  • 홍동표;이정규;채창훈;이종원;고광희;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.526-530
    • /
    • 2009
  • 본 논문에서는 맥락 정보와 물리적 속성 부여가 가능한 모바일 증강 현실 콘텐츠 조작 방법을 제안한다. 유비쿼터스 컴퓨팅 개념의 확산과 더불어 센서와 모바일 장치의 급속한 발전은 고성능 PC에서만 가능했던 증강 현실 시스템들이 모바일 장치에서도 동작 가능하게 되었다. 또한, 최근에는 다양한 센서 정보를 활용하여 보다 현실 공간이나 사용자의 정보를 증강 현실 콘텐츠에 반영하는 증강 현실 시스템들이 소개되고 있다. 특히, 일반 사용자들이 모바일 장치를 이용하여 보다 사실적인 증강 현실 콘텐츠를 손쉽게 저작하기 위해서는 모바일 장치의 제한적인 사용자 인터페이스를 극대화하고, 센서 정보를 이용하여 사용자와 환경의 맥락 정보를 활용할 수 있는 방법이 요구된다. 따라서 제안된 방법은 모바일 증강 현실 저작 시스템에 있어서 콘텐츠 조작에 필요한 시각적 큐(cue)를 제공하여 사용자가 모바일 장치의 터치 스크린을 통해서 증강된 콘텐츠를 자유롭게 조작할 수 있도록 한다. 뿐만 아니라, 센서정보를 콘텐츠의 속성에 부여할 수 있도록 하여 사용자가 직접 센서 조작을 통해서 증강된 콘텐츠를 직접 조작하거나 환경 정보가 증강된 콘텐츠에 반영될 수 있도록 한다. 그리고 증강된 콘텐츠들 간의 사실적인 충돌을 위해서, 물리 속성 부여가 가능한 물리 콘텐츠 로더(physics contents loader)를 구현하고, 증강 현실 공간과 물리 공간 간의 좌표 일치를 통해서 증강된 콘테츠들 간의 물리 충돌이 가능하도록 한다. 제안된 방법의 유용함을 검증하기위해서 모바일 장치와 센서를 이용한 모바일 증강 현실 저작 시스템을 구현하였다. 따라서 제안된 방법은 향후 모바일 증강 현실 저작 시스템에 요구되는 맥락 정보와 물리 속성 부여가 가능한 콘텐츠 조작 방법으로 기대된다.

  • PDF

고성능 플래시 메모리 솔리드 스테이트 디스크 (A High Performance Flash Memory Solid State Disk)

  • 윤진혁;남이현;성윤제;김홍석;민상렬;조유근
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권4호
    • /
    • pp.378-388
    • /
    • 2008
  • 플래시 메모리는 전력 소모가 작고 충격과 진동에 강하며 크기가 작다는 특성 때문에 최근 노트북이나 UMPC(Ultra Mobile PC)와 같은 이동 컴퓨팅 시스템에서 하드디스크를 대체할 대용량 저장 매체로서 주목 받고 있다. 플래시 메모리에 기반한 저장 장치는 일반적으로 랜덤 읽기 성능이나 순차 읽기, 순차 쓰기 성능이 매우 좋은데 비해, 덮어쓰기가 불가능한 플래시 메모리의 물리적인 제약으로 인하여 소량의 랜덤 쓰기 성능은 떨어진다. 본 논문은 이 문제를 해결하기 위한 두 가지 중요한 특징을 갖는 SSD(Solid State Disk) 아키텍처를 제안하였다. 첫 번째로 비휘발성 이면서도 SRAM과 동일한 인터페이스로 덮어쓰기가 가능한 작은 크기의 FRAM(Ferroelectric RAM)을 NAND 플래시 메모리와 함께 사용하여 소량 쓰기 오버헤드를 최소화하였다. 두 번째, 호스트 쓰기 요청들도 소량 랜덤 쓰기와 대량 순차 쓰기로 분류하여 각각에 대해 최적의 쓰기 버퍼 관리 방법을 적용하였다. 평가 보드 상에서 SSD 프로토타입을 구현하고 PC 사용 환경의 워크로드에 기반한 벤치마크를 이용하여 성능을 평가해 본 결과 랜덤 패턴을 보이는 워크로드에서는 하드디스크나 기존의 상용 SSD들에 비해 처리율(throughput) 측면에서 3배 이상의 성능을 보였다.

Gird를 이용한 e-사이언스 전자현미경 볼륨 랜더링 시스템 (Volume Rendering System of e-Science Electron Microscopy using Grid)

  • 정원구;정종만;이호;최상수;;;;;;;;권희석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.560-564
    • /
    • 2007
  • 한국기초과학지원연구원(KBSI, Korea Basic Science Institute)에서는 국내 유일의 초고전압투과전자현미경(HVEM, High Voltage Electron Microscopy)을 비롯하여 3 대의 일반 전자현미경을 보유하고 있다. 전자현미경을 통하여 관찰된 이미지는 각 단계별로 tilting 되어 저장된 이미지로서 관찰자에게 보다 나은 관찰 환경의 구성을 위해 3D로의 reconstruction은 필수 과정이라고 할 수 있겠다. 이 과정 중 카메라 중심에서 벋어난 부분의 왜곡을 warping 기법을 통하여 최대한 감소시킨다. 이런 이미지 전처리 과정과 이를 바탕으로 3D로의 reconstruction과정은 고성능 컴퓨터의 수반을 기본으로 하는데 이 과정을 다수의 grid node PC들이 빠른 시간에 분담하여 처리하게 된다. Grid node PC들의 역할은 소유자가 서로 다른 다양한 컴퓨팅 자원의 효과적인 공유를 목적으로 하며, 시스템의 구축에 필요한 역할 스케줄링, 자원 관리, 보안, 성능 측정 및 상태 모니터링 등의 문제를 해결하기 위한 사용되고 있다. 일반 개인이 사용하기 힘들었던 고성능 PC의 역할을 Grid node PC들이 수행하고 이 기반위에 워핑 기법을 통한 이미지 전처리는 보다 실제 관찰 대상에 가까운 형태로의 재구성이 가능할 수 있는 바탕이 된다. 워핑 전처리를 통한 Grid node PC기반의 전자현미경 볼륨 랜더링 시스템의 구축은 관찰자에게 보다 편리하며 빠른 실험 환경을 제공하여 줄 수 있고, 이해하기 쉽고 실제 모습에 가까운 형태의 실험 결과물을 접할 수 있게 된다.

  • PDF

클러스터 기반 컨테이너 환경에서 실시간 GPU 작업 모니터링 및 컨테이너 배치를 위한 노드 리스트 관리기법 (Real-Time GPU Task Monitoring and Node List Management Techniques for Container Deployment in a Cluster-Based Container Environment)

  • 강지훈;길준민
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권11호
    • /
    • pp.381-394
    • /
    • 2022
  • 최근 인터넷 기반 서비스는 데이터의 개인화 및 맞춤화로 인해 사용자의 상황이나 요구사항에 따라 즉시 처리해야 하는 실시간 AI 추론 및 데이터 분석과 같은 실시간 처리에 대한 요구사항이 증가하고 있다. 실시간 작업은 각 작업이 시작되고 결과를 반환하기까지의 데드라인이 정해져 있으며, 데드라인의 보장은 서비스의 품질과 직접적으로 연결된다. 하지만, 기존 컨테이너 시스템에서는 컨테이너에서 실행되는 작업의 데드라인을 할당하고 관리하기 위한 기능이 제공되지 않기 때문에 실시간 작업을 운용하는데 제한적이다. 또한, AI 추론 및 데이터 분석과 같은 작업은 GPU(Graphic Processing Unit)를 기본적으로 사용하는데, 일반적으로 GPU 자원은 컨테이너 사이에 성능 격리가 제공되지 않기 때문에 서로 성능 영향을 미치며, 노드의 자원 사용량만으로는 각 컨테이너의 데드라인 보장률이나 새로운 실시간 컨테이너의 배치 여부를 결정할 수 없다. 따라서, 본 논문에서는 컨테이너에서 실행되는 GPU 작업의 실시간 처리를 지원하기 위해 컨테이너의 데드라인 및 실시간 GPU 작업의 실행 상태를 추적하고 관리하기 위한 모니터링 기법과 클러스터 환경에서 실시간 GPU 작업을 실행하는 컨테이너가 데드라인을 보장할 수 있도록 적절한 노드에 배치하기 위한 노드 리스트 관리기법을 제안한다. 또한, 실험을 통해 제안하는 기법이 시스템에 매우 작은 영향을 미친다는 것을 증명한다.

플래시 메모리상에서 시스템 소프트웨어의 효율적인 버퍼 페이지 교체 기법 (An Efficient Buffer Page Replacement Strategy for System Software on Flash Memory)

  • 박종민;박동주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권2호
    • /
    • pp.133-140
    • /
    • 2007
  • 플래시 메모리는 오늘날 다양한 형태로 우리 생활의 일부를 차지하고 있다. 이동식 저장매체, 유비쿼터스 컴퓨팅 환경과 휴대전화기, MP3플레이어, 개인정보단말기(PDA) 등의 모바일 제품 등에 광범위하게 사용되고 있다. 이처럼 많은 분야에서 사용되는 주된 이유는 플래시 메모리가 저전력, 비휘발성, 고성능, 물리적 안정성, 휴대성 등의 장점을 갖기 때문이다. 더불어 최근에는 기가바이트급 플래시 메모리도 개발되어 하드디스크의 자리를 대체할 수 있는 상황에 이르렀다. 하지만, 플래시 메모리는 하드디스크와 달리 이미 데이타가 기록된 섹터에 대해 덮어쓰기가 되지 않는다는 특성을 갖고 있다. 데이타를 덮어쓰기 위해서는 해당 섹터가 포함된 블록을 지우고(소거) 쓰기 작업을 수행해야 한다. 이로 인해 플래시 메모리의 데이타 읽기/쓰기/소거에 비용이 하드 디스크와 같이 동일한 것이 아니라 각각 다르다[1][5][6]. 이러한 특성이 고려되지 않은 기존의 OS, DBMS 등과 같은 시스템 소프트웨어에서 사용되는 교체 기법은 플래시 메모리 상에서 비효율성을 가질 수 있다. 그러므로 플래시 메모리상에서는 플래시 메모리의 특성을 고려한 효율적인 버퍼 교체 기법이 필요하다. 본 논문에서는 플래시 메모리의 특성을 고려한 버퍼 페이지 교체기법을 제안하며, 제안된 기법과 기존 기법들과의 성능 평가를 수행한다. 지프분포와 실제 워크로드를 사용한 성능평가는 플래시 메모리의 특성을 고려한 버퍼 페이지 교체 기법의 필요성을 입증한다.

FAST :플래시 메모리 FTL을 위한 완전연관섹터변환에 기반한 로그 버퍼 기법 (FAST : A Log Buffer Scheme with Fully Associative Sector Translation for Efficient FTL in Flash Memory)

  • 박동주;최원경;이상원
    • 정보처리학회논문지A
    • /
    • 제12A권3호
    • /
    • pp.205-214
    • /
    • 2005
  • 플래시 메모리가 개인 정보 도구, 유비쿼터스 컴퓨팅 환경, 모바일 제품, 가전 제품 등에 급속한 속도로 활용되고 있다. 플래시 메모리는, 이러한 환경에 저장매체로서 사용되기에 적합한 성질들 - 즉 저전력, 비휘발성, 고성능, 물리적인 안정성, 그리고 휴대성 등 - 을 갖고 있다. 그런데 하드디스크와 달리, 이미 데이터가 기록된 블록에 대해 덮어쓰기가 되지 않는다는 약점을 갖고 있다. 덮어쓰기를 위해서는 해당 블록을 지우고 쓰기 작업을 수행해야 한다. 이와 같은 성질은 플래시 메모리의 쓰기 성능을 매우 저하시킬 수 있다. 이와 같은 문제점을 해결하기 위해 플래시 메모리에는 FTL(Flash Translation Layer)라는 시스템 소프트웨어 모듈을 갖고 있다. 현재까지 많은 FTL 기법들이 제안되었는데, 그 중에서 대표적인 기법으로 로그블록 기법이 있다. 이 기법은 한정된 수의 로그블록을 쓰기 버퍼로 이용함으로써 쓰기에 따른 소거 연산을 줄임으로써 성능을 높인다. 그런데 이 기법은 로그블록의 활용률이 낮다는 것이 단점이다. 이러한 단점은 각 로그블록에 쓰여질 수 있는 섹터들이 블록 단위로 연관(Block Associative Sector Translation - BAST)되기 때문이다. 본 논문에서는 한정된 수의 로그블록들의 활용률을 높이기 위해 임의쓰기(random overwrite) 패턴을 보이는 섹터들을 전체 로그블록들에 완전 연관(Fully Associative Sector Translation - FAST)시킴으로써 활용률을 높이는 FAST 기법을 제안한다. 본 논문의 기여사항을 다음과 같다. 1) BAST 기법의 단점과 그 이유를 밝히고, 2) FAST 기법의 동기, 기본 개념, 그리고 동작원리를 설명하고, 3) 성능평가를 통해 FAST 기법의 우수성을 보인다.

유휴 멀티 e-Science 그리드 자원 공유를 위한 통합 자원 접근 제어 (An Integrated Access Control for Sharing of E-Science Grid Resources)

  • 정임영;정은진;염헌영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권9_10호
    • /
    • pp.452-465
    • /
    • 2008
  • 본 논문은 e-Science 그리드 자원 공유를 위한 가볍고 솔기없는 통합 자원 접근제어를 제안한다. 그리드 컴퓨팅에 기반한 e-Science는 고가의 과학 실험 장비를 포함하는 그리드 자원을 원격조정하고 이로부터 얻은 데이타를 고성능 컴퓨터를 통해 처리하는 총체적인 도메인을 구성하여 과학자들의 연구를 돕는다. 그런데, 많은 사용자들이 그리드 자원을 이용할 때, 사용자가 소속된 e-Science 그리드에서 자원이 부족할 경우, 원하는 자원을 이용하기 위해 기다리거나 자원이용을 포기할 수 있다. 이런 경우, 적절한 보상 하에 타 그리드의 유휴 자원을 이용할 수 있으면 자원제공자와 사용자 모두에게 도움이 될 수 있다. 그런데, e-Science 그리드는 개개 그리드 단위로 특정 과학응용을 연구하는 과학자들의 사용편의를 위해, 가상 조직(Virtual Organization-VO)에 특화된 자원 접근정책이 운영되고 있기 때문에, 자원의 공유가 결코 쉬운 문제가 아니다. 본 논문은 e-Science 그리드 사용자가 복수 개 타 그리드의 공유자원을 이용할 때, 전체 그리드 차원의 자원접근정책 통합을 위한 선협정(Service Level Agreement-SLA)이 필요 없어 가볍고, 사용자가 소속 그리드의 자원을 이용하는 것과 같은 과정으로 추가적인 등록이 필요하지 않아 솔기없는 새로운 통합 자원 접근 제어를 제안한다.

오디세우스/IR: 정보 검색 기능과 밀결합된 고성능 객체 관계형 DBMS (Odysseus/m: a High-Performance ORDBMS Tightly-Coupled with IR Features)

  • 황규영;이민재;이재길;김민수;한욱신
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.209-215
    • /
    • 2005
  • 상용 ORDBMS 개발사들은 자신의 DBMS에 사용자 정의 타입과 사용자 정의 함수를 추가하는 확장 방법을 제공하고 있다. 이러한 확장은 상위 레벨 인터페이스를 사용하여 이루어진다. 이러한 기법을 소결합(loose-coupling)이라 부른다. 소결합의 장점은 구현하기 쉽다는 것이나, 높은 성능이 요구되는 대용량 데이타베이스에서 새로운 데이타 타입과 연산을 추가하기에는 적합하지 않다. 본 논문에서는, 이러한 요구 조건.을 충족하기 위해 밀결합(tight-coupling)이라는 개념을 사용하는 것을 제안한다. 밀결합에서 새로운 데이타 타입과 연산은 DBMS의 엔진 내부에 통합된다. 따라서, 새로운 데이타 타입과 연산이 높은 성능으로 일관성 있게 제공된다. 이 밀결합 아키텍처는 정보 검색 기능과 공간 데이타베이스 기능을 한국과학기술원/첨단정보기술연구센터에서 개발 중인 객체 관계형 DBMS 오디세우스/IR에 통합하기 위해 사용되고 있다. 본 논문에서는, 오디세우스/1R을 소개하고 오디세우스/IR과 밀결합된 정보 검색 기능(미국 특허 등록)을 설명한다. 다음으로, 오디세우스/1R을 사용한 단일 시스템(non-parallel) 설정에서 2,000만건의 웹 페이지를 관리할 수 있는 웹 검색 엔진을 보인다.