• 제목/요약/키워드: Computations Execution

검색결과 33건 처리시간 0.025초

3차원 날개 공력설계를 위한 네트워크 분산 설계최적화 (A Network-Distributed Design Optimization Approach for Aerodynamic Design of a 3-D Wing)

  • 조창열;이상경
    • 한국항공우주학회지
    • /
    • 제32권10호
    • /
    • pp.12-19
    • /
    • 2004
  • 3차원 날개의 공력형상 설계최적화를 위한 설계최적화 시스템을 미래의 다분야 설계최적화 프레임워크의 일환으로 개발하였다. 이 설계최적화 시스템은 형상설계, 격자생성, 공력해석, 최적화의 4가지 모듈로 구성되어있다. 모두 상용패키지를 배경으로 개발하였으며 내장된 스크립트와 저널링 기능을 사용하여 배치 모드에서 자동적으로 실행되도록 프로그램 하였다. Visual Basic 프로그램을 사용하여 네 모듈을 통합하여 자동화된 설계기능을 갖도록 하였다. 특히 계산시간이 많이 소요되는 공력해석을 위하여 네트워크 통신을 이용한 분산 환경을 구현하였다. 공력해석은 일반적인 영역분할방식의 병렬처리 대신에 전역최적화 기법인 반응표면법과 연계하여 분산처리 시켰다. 개발한 공력설계 시스템의 검증을 위하여 간단한 항력최소화 문제에 적용하였으며 그 결과 상당히 향상된 설계 효율성과 적절한 설계 결과를 보여주었다.

슈퍼컴퓨팅환경에서의 대규모 계산 작업 처리 기술 연구 (HTCaaS(High Throughput Computing as a Service) in Supercomputing Environment)

  • 김석규;김직수;김상완;노승우;김서영;황순욱
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.8-17
    • /
    • 2014
  • 슈퍼컴퓨팅 자원들은 주로 MPI와 같은 메시지 교환 인터페이스에 기반한 통신 집적도가 높은 고성능 컴퓨팅(HPC: High Performance Computing) 응용 분야를 지원하는데 활용되어 왔다. 반면에, 대규모 계산처리 컴퓨팅(HTC: High Throughput Computing) 방식의 패러다임은 주로 계산 집적도가 높고(상대적으로 적은 I/O 연산), 독립적인(작업들 간의 통신이 적음) 많은 수의 작업을 처리하는 것을 요구하고 있다. 국내에서도 고에너지 물리, 신약개발, 핵물리와 같은 연구 분야를 중심으로 대규모 컴퓨팅 자원을 요구하는 계산처리에 대한 수요가 증가하고 있다. 본 논문에서는 이러한 HTC 과학 응용들에 대한 효율적인 지원을 국가차원의 슈퍼컴퓨팅 분산 환경에서 제공하기 위해 연구/개발되어진 대규모 계산처리 서비스(HTCaaS: High Throughput Computing as a Service)의 전체 구조 및 구성 요소, 실행 시나리오 및 실제 응용 적용 사례 등에 대해 서술한다.

최적화된 CUDA 소프트웨어 제작을 위한 프로그래밍 기법 분석 (Analysis of Programming Techniques for Creating Optimized CUDA Software)

  • 김성수;김동헌;우상규;임인성
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.775-787
    • /
    • 2010
  • GPU(Graphics Processing Unit)는 범용 CPU와는 달리 다수코어 스트리밍 프로세서(manycore streaming processor) 형태로 특화되어 발전되어 왔으며, 최근 뛰어난 병렬 처리 연산 능력으로 인하여 점차 많은 영역에서 CPU의 역할을 대체하고 있다. 이러한 추세에 따라 최근 NVIDIA 사에서는 GPGPU(General Purpose GPU) 아키텍처인 CUDA(Compute Unified Device Architecture)를 발표하여 보다 유연한 GPU 프로그래밍 환경을 제공하고 있다. 일반적으로 CUDA API를 사용한 프로그래밍 작업시 GPU의 계산구조에 관한 여러 가지 요소들에 대한 특성을 정확히 파악해야 효율적인 병렬 소프트웨어를 개발할 수 있다. 본 논문에서는 다양한 실험과 시행착오를 통하여 획득한 CUDA 프로그래밍에 관한 최적화 기법에 대하여 설명하고, 그러한 방법들이 프로그램 수행의 효율에 어떠한 영향을 미치는지 알아본다. 특히 특정 예제 문제에 대하여 효과적인 계층 구조 메모리의 접근과 코어 활성화 비율(occupancy), 지연 감춤(latency hiding) 등과 같이 성능에 영향을 미치는 몇 가지 규칙을 실험을 통해 분석해봄으로써, 향후 CUDA를 기반으로 하는 효과적인 병렬 프로그래밍에 유용하게 활용할 수 있는 구체적인 방안을 제시한다.

효율적인 전자문서 관리를 위한 난수 재배열 기반의 키 관리 방법을 이용한 암호화 기법에 관한 연구 (A Study on the Encrypted Scheme Using Key Management Method Based on the Random Number Rearrangement for the Effective E-Document Management)

  • 김태욱;성경상;김정재;민병묵;오해석
    • 정보처리학회논문지C
    • /
    • 제16C권5호
    • /
    • pp.575-582
    • /
    • 2009
  • 전자문서의 많은 이점이 있음에도 불구하고 무단 유출, 파괴, 분실, 훼손의 위험이 상존하고 있다. 불법위조, 변조, 멸실로 부터 전자문서를 보호하기 위한 기술들이 절실히 요구되고 있다. 전자문서를 대상으로 하는 다양한 보안 기술들이 개발되어 있으나, 대부분 위 변조 및 부인 방지에 치중되어 있다. 본 논문에서는 기존 전자문서 관리시스템에 적용하고 있는 암호화 기술의 문제점을 제시하고, 전자문서 보호를 위한 암호화 알고리즘의 효율적 적용 방안을 통해 문제를 개선하고자 한다. 논문에서 제안하는 난수 재배열 방법을 이용한 키 관리 방안을 적용한 암호화 방식과 기존 전자문서 암호화 시스템과의 비교법에 의한 성능평가를 위해 중요 요소들을 비교 평가 수행하였으며, 안정성과 효율성 두 가지 측면에서 개선된 결과를 얻을 수 있었다.

Symbolic computation and differential quadrature method - A boon to engineering analysis

  • Rajasekaran, S.
    • Structural Engineering and Mechanics
    • /
    • 제27권6호
    • /
    • pp.713-739
    • /
    • 2007
  • Nowadays computers can perform symbolic computations in addition to mere number crunching operations for which they were originally designed. Symbolic computation opens up exciting possibilities in Structural Mechanics and engineering. Classical areas have been increasingly neglected due to the advent of computers as well as general purpose finite element software. But now, classical analysis has reemerged as an attractive computer option due to the capabilities of symbolic computation. The repetitive cycles of simultaneous - equation sets required by the finite element technique can be eliminated by solving a single set in symbolic form, thus generating a truly closed-form solution. This consequently saves in data preparation, storage and execution time. The power of Symbolic computation is demonstrated by six examples by applying symbolic computation 1) to solve coupled shear wall 2) to generate beam element matrices 3) to find the natural frequency of a shear frame using transfer matrix method 4) to find the stresses of a plate subjected to in-plane loading using Levy's approach 5) to draw the influence surface for deflection of an isotropic plate simply supported on all sides 6) to get dynamic equilibrium equations from Lagrange equation. This paper also presents yet another computationally efficient and accurate numerical method which is based on the concept of derivative of a function expressed as a weighted linear sum of the function values at all the mesh points. Again this method is applied to solve the problems of 1) coupled shear wall 2) lateral buckling of thin-walled beams due to moment gradient 3) buckling of a column and 4) static and buckling analysis of circular plates of uniform or non-uniform thickness. The numerical results obtained are compared with those available in existing literature in order to verify their accuracy.

퍼지 그래프 기반의 수직 분할 알고리즘 (A Vertical Partitioning Algorithm based on Fuzzy Graph)

  • 손진현;최경훈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.315-323
    • /
    • 2001
  • 사용자의 질의 요청을 보다 빨리 지원하고 시스템 전체 처리량을 증가시키기 위한 하나의 방법으로 데이터 스키마의 수직 분할 문제가 많이 연구되어 왔다. 수직 분할의 대표적인 응 용 예로는 중앙 집중 시스템에서의 파일 분할, 분산 데이터베이스에서의 데이터 분산, 메모 리 계층사이의 데이터 분할 등이 있다. 일반적으로 수직 분할 알고리즘은 모든 유용한 단편 들의 생성과 임의 분할 지원 등의 두가지 기능을 효율적으로 지원할 수 있어야 한다. 그러 나, 기존의 제안된 방법들은 대부분 첫 번째 기능에 중점을 두고 있어 임의 분할 기능을 지 원하는데 많은 제한이 있다. 그리고 수직 분할 알고리즘에서 데이터 속성들이 포함될 단편 을 결정할 때 기본적으로 모호성 문제를 가지고 있기 때문에 이에 대한 효과적인 처리가 필 요하다. 본 논문에서는 퍼지 이론에 기반한 효율적인 수직 $\alpha$-분할 알고리즘을 제안한다. 이 방법은 퍼지 그래프 이론을 바탕으로 수직 분할에서의 모호성 문제를 해결하여 복잡한 수학적 계산 없이 모든 유용한 단편들을 생성할 수 있다. 또한, 범용 임의 분할 기능도 효과 적으로 지원할 수 있다.

  • PDF

분산 슈퍼컴퓨팅 기술에 기반한 신약재창출 시뮬레이션 사례 연구 (A Case Study of Drug Repositioning Simulation based on Distributed Supercomputing Technology)

  • 김직수;노승우;이민호;김서영;김상완;황순욱
    • 정보과학회 논문지
    • /
    • 제42권1호
    • /
    • pp.15-22
    • /
    • 2015
  • 본 논문에서는 대규모의 계산 작업을 고성능으로 처리해야 하는 신약재창출 시뮬레이션 분야에 분산 슈퍼컴퓨팅 기술을 적용한 사례에 대해 논의하고자 한다. 신약재창출이란 기존에 알려진 약물의 새로운 적응증을 규명하는 것을 의미하며, 이러한 신약재창출은 비교적 짧은 수행시간을 갖는 대규모의 도킹(docking) 연산들을 고성능으로 처리해야한다는 점에서 Many-Task Computing (MTC) 성격을 지니고 있다. 이러한 MTC 응용들의 대표 사례로서 신약재창출 시뮬레이션을 분산 슈퍼컴퓨팅 환경 기반의 HTCaaS 시스템에 적용하였으며, 이를 통해 효율적인 작업 배포, 동적인 자원 할당 및 로드 밸런싱, 안정성 및 다양한 자원들의 효율적인 통합 등이 이러한 과학 응용들을 지원하는 데 있어 필수적인 기능임을 확인할 수 있었다.

암호화된 체크포인트를 이용한 결함 허용성을 가지는 이동 에이전트의 이주 기법 설계 (Design of Fault-tolerant MA Migration Scheme based on Encrypted Checkpoints)

  • 김구수;엄영익
    • 정보보호학회논문지
    • /
    • 제13권6호
    • /
    • pp.77-84
    • /
    • 2003
  • 이동 에이전트는 네트워크에서 사용자를 대신하여 특정 작업을 수행하면서, 자율적으로 한 노드에서 다른 노드로 이주할 수 있는 프로그램이다. 본 연구에서는 이동 에이전트가 여러 노드들을 이주하면서 실행하다가 비정상적인 종료 상황이 발생했을 때 이전 사이트에 저장한 이동 에이전트의 체크포인트를 이용해서 이동 에이전트를 안전하게 복원하고 실행을 재개할 수 있는 기법을 제안한다. 체크포인트의 보안을 위해 이동 에이전트의 공개키를 이용하여 체크 포인트를 암호화하여 저장하고, 복원 시에는 홈 플랫폼에서 이동 에이전트의 비밀키를 이용해서 이동 에이전트를 복원한다. 홈 플랫폼이 이동 에이전트를 복원하기 위해서 체크포인트를 수신하였을 때 이 체크포인트가 올바른 체크포인트인지 확인하기 위해서 메시지 다이제스트를 이용하며, 이동 에이전트가 체크포인트를 만들 때 생성한 메시지 다이제스트와 복원 시에 만든 메시지 다이제스트를 비교함으로써 홈 플랫폼은 수신한 이동 에이전트의 체크포인트의 정확성을 확인할 수 있게 된다.

Resolving Memory Bottlenecks in Hardware Accelerators with Data Prefetch

  • Hyein Lee;Jinoo Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.1-12
    • /
    • 2024
  • 최근 다양한 분야에서 딥러닝이 사용되면서, 더 빠르고 정확한 결과를 내는 딥러닝이 더욱 중요해졌다. 이를 위해서는 많은 양의 저장 공간이 필요하고, 대용량 연산을 진행해야 한다. 이에 따라 여러 연구는 빠르고 정확하게 연산 처리가 가능한 하드웨어 가속기를 이용한다. 하지만 하드웨어 가속기는 CPU와 하드웨어 사이를 이동하면서 병목현상이 발생하게 된다. 따라서 본 논문에서는 하드웨어 가속기의 병목현상을 효율적으로 줄일 수 있는 데이터 프리패치 전략을 제안한다. 데이터 프리패치 전략의 핵심 아이디어는 Matrix Multiplication Unit(MMU)가 연산을 진행하는 동안 다음 연산에 필요한 데이터를 예측하여 로컬 메모리로 올려 병목현상을 줄인다. 또한, 이 전략은 듀얼 버퍼를 이용하여 읽고 쓰는 두 가지 동작을 동시에 진행하여 처리율을 높인다. 이를 통해 데이터 전송의 지연시간 및 실행 시간을 감소시킨다. 시뮬레이션을 통해 듀얼 버퍼를 이용한 병렬 프로세싱과 데이터 프리패치를 이용한 메모리 간 병목현상을 최대한 감소시켜 하드웨어 가속기의 성능이 24% 향상함을 알 수 있다.

워크 그룹 구성 변화에 따른 GPU 기반 천 시뮬레이션의 성능 분석 (The Performance Analysis of GPU-based Cloth simulation according to the Change of Work Group Configuration)

  • 최영환;홍민;이승현;최유주
    • 인터넷정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.29-36
    • /
    • 2017
  • 오늘날 3D 다이내믹 시뮬레이션은 많은 산업들과 밀접한 관계를 가지고 있다. 과거에는 자동차 충돌, 건축물 분야에서 주로 사용되었으나 최근에는 영화나 게임 분야에도 물리 시뮬레이션이 중요한 역할을 하고 있다. 일반적으로 3D 물체를 사실적으로 표현하기 위해서는 많은 수학적 연산이 필요하기 때문에 기존의 CPU 기반의 응용 프로그램들은 이러한 많은 연산량을 실시간으로 처리하는데 무리가 있다. 최근 그래픽 하드웨어의 발전과 아키텍쳐의 개선으로 GPU는 기존의 렌더링 연산뿐만 아니라 범용 목적의 연산 기능을 제공하고 있고 이러한 GPU를 활용하는 연구가 활발히 진행되고 있다. 본 논문에서는 GPU를 이용한 천 시뮬레이션 수행시 수행 성능을 최적화하기 위하여, GPU 셰이더의 실행 환경 변화에 따른 천 시뮬레이션 알고리즘의 수행 성능의 변화를 분석하였다. GPU를 이용한 천 시뮬레이션은 GLSL 4.3의 Compute shader를 사용하여 스프링 중심 알고리즘과 노드 중심 알고리즘을 PC기반으로 구현하였고, GLSL Compute shader의 다양한 워크 그룹 (Work Group) 크기와 차원 분배에 따른 연산 속도의 변화를 비교 분석하였다. 실험은 5,000 프레임까지 10회 반복 수행하여 FPS(Frame Per Second)의 평균을 구하여 진행하였다. 실행결과, 노드 중심의 알고리즘이 오히려 스프링 중심의 알고리즘 보다 빠른 수행속도를 보여 주었다.