• 제목/요약/키워드: General purpose computing

검색결과 160건 처리시간 0.026초

고 정밀 항공우주 유동해석 및 설계를 위한 공력계산 툴 (Essential Computational Tools for High-Fidelity Aerodynamic Simulation and Design)

  • 김종암
    • 유체기계공업학회:학술대회논문집
    • /
    • 유체기계공업학회 2006년 제4회 한국유체공학학술대회 논문집
    • /
    • pp.33-36
    • /
    • 2006
  • As the computing environment is rapidly improved, the interests of CFD are gradually focused on large-scale computation over complex geometry. Keeping pace with the trend, essential computational tools to obtain solutions of complex aerospace flow analysis and design problems are examined. An accurate and efficient flow analysis and design codes for large-scale aerospace problem are presented in this work. With regard to original numerical schemes for flow analysis, high-fidelity flux schemes such as RoeM, AUSMPW+ and higher order interpolation schemes such as MLP (Multi-dimensional Limiting Process) are presented. Concerning the grid representation method, a general-purpose basis code which can handle multi-block system and overset grid system simultaneously is constructed. In respect to design optimization, the importance of turbulent sensitivity is investigated. And design tools to predict highly turbulent flows and its sensitivity accurately by fully differentiating turbulent transport equations are presented. Especially, a new sensitivity analysis treatment and geometric representation method to resolve the basic flow characteristics are presented. Exploiting these tools, the capability of the proposed approach to handle complex aerospace simulation and design problems is tested by computing several flow analysis and design problems.

  • PDF

Building a Dynamic Analyzer for CUDA based System.

  • SALAH T. ALSHAMMARI
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.77-84
    • /
    • 2023
  • The utilization of GPUs on general-purpose computers is currently on the rise due to the increase in its programmability and performance requirements. The utility of tools like NVIDIA's CUDA have been designed to allow programmers to code algorithms by using C-like language for the execution process on the graphics processing units GPU. Unfortunately, many of the performance and correctness bugs will happen on parallel programs. The CUDA tool support for the parallel programs has not yet been actualized. The use of a dynamic analyzer to find performance and correctness bugs in CUDA programs facilitates the execution of sophisticated processes, especially in modern computing requirements. Any race conditions bug it will impact of program correctness and the share memory bank conflicts to improve the overall performance. The technique instruments the programs in a way that promotes accessibility of the memory locations accessed by different threads well as to check for any bugs in the code of a program. The instrumented source code will be used initiated directly in the device emulation code of CUDA to send report for the user about all errors. The current degree of automation helps programmers solve subtle bugs in highly complex programs or programs that cannot be analyzed manually.

저전력 모바일 장치를 위한 완전 프로그램 가능형 쉐이더 프로세서 (A Fully Programmable Shader Processor for Low Power Mobile Devices)

  • 정형기;이주석;박태룡;이광엽
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.253-259
    • /
    • 2009
  • 본 논문에서는 전용하드웨어를 사용하지 않는 새로운 구조의 범용 그래픽 쉐이더 프로세서를 제안한다. 최근 모바일 기기에서는 고성능을 유지하면서 저전력의 작은 크기를 가지는 그래픽 프로세서를 요구한다. 제안하는 쉐이더 프로세서는 OpenGL ES 2.0 그래픽 파이프라인 전체를 쉐이더 명령어로 실행할 수 있는 GP-GPU 구조를 갖는다. 프로그램을 구현하여 하나의 프로세서로 모든 그래픽 파이프라인 처리가 가능하기 때문에 Rasterization Unit과 같은 별도의 전용 하드웨어를 필요로 하지 않는다. 따라서 쉐이더 프로세서 하나로 Fully Programmable 3D Graphics Engine 구현이 가능하며 기존 쉐이더 프로세서에 비해 하드웨어 크기를 60% 줄였다.

  • PDF

CUDA를 이용한 FDTD 알고리즘의 병렬처리 (Parallel Computation of FDTD algorithm using CUDA)

  • 이호영;박종현;김준성
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.82-87
    • /
    • 2010
  • CPU를 능가하는 GPU의 연산능력 향상으로 범용 계산에 그래픽 프로세서를 사용하는 GP-GPU연구가 활발히 전개되고 있으며, 그 응용분야가 확대되고 있다. 본 논문에서는 전자기학 관련 분야에서 널리 사용되는 FDTD 알고리즘을 nVIDIA에서 제공하는 소프트웨어 플랫폼인 CUDA를 사용하여 구현한다. FDTD 알고리즘의 주요 연산과정을 병렬화하고, 그래픽 카드 내각기 다른 메모리의 사용에 따라 최적화하며, 단일 프로세서에서 FDTD 알고리즘을 실행시킨 경우와 비교하여 그 성능 향상 정도를 측정한다. 실험결과 단일 프로세서로 구현하였을 때에 비해 실행시간이 45배까지 향상됨을 확인할 수 있었다.

범용 응용프로그램 실행 시 하드웨어 구성과 분기 처리 기법에 따른 GPU 성능 분석 (Analysis of Impact of Correlation Between Hardware Configuration and Branch Handling Methods Executing General Purpose Applications)

  • 최홍준;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.9-21
    • /
    • 2013
  • GPU의 연산 능력과 유연성이 강화됨에 따라, GPU는 그래픽 응용프로그램뿐만 아니라 범용 응용프로그램도 수행한다. 특히, GPU 회사들이 제공하는 API를 활용함으로써 프로그래머들은 보다 쉽게 GPGPU 응용프로그램을 작성할 수 있다. 하지만 대부분의 범용 응용프로그램은 분기 명령어를 많이 포함하고 있기 때문에, 범용 응용프로그램을 수행하는 경우 GPU의 연산 자원을 충분히 활용할 수 없다. 분기 명령어를 처리하기 위해서 다양한 워프 생성 기법들이 제안되었다. GPU 구조에서는 높은 연산 자원 활용률을 보이는 워프 생성기법이 우수한 성능을 보일 것으로 예상된다. 하지만 예상과는 달리, 실험 결과에 따르면 높은 연산 자원 활용률을 보이는 워프 생성 기법의 성능이 상대적으로 낮은 연산 자원 활용률을 보이는 워프 생성 기법의 성능보다 낮게 나타난다. 높은 연산 자원 활용률을 보이는 워프 생성 기법에서 유발한 많은 메모리 요구로 인한 심각한 메모리 병목 현상이 원인으로 분석된다. 그러므로 적절한 하드웨어 지원이 없는 경우, 높은 연산자원 활용률이 반드시 우수한 성능을 보장한다고 할 수 없다. 이러한 이유로, 본 논문에서는 하드웨어 자원과 워프 생성 기법사이의 상관관계에 대한 상세한 분석을 수행하고자 한다. 본 논문의 분석 결과는 분기 명령어에 의해 발생된 GPU의 성능 저하 문제를 해결하고자 할 때 중요한 가이드라인이 될 것이다.

M&S 지원을 위한 HEMOS-Cloud 서비스의 경제적 효과 (Economic Impact of HEMOS-Cloud Services for M&S Support)

  • 정대용;서동우;황재순;박성욱;김명일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.261-268
    • /
    • 2021
  • 클라우드 컴퓨팅은 서비스 사용자 요구에 따라 컴퓨팅 자원을 임대하여 사용하는 컴퓨팅 패러다임이다. 클라우드 컴퓨팅에서 컴퓨팅 자원은 사용자의 서비스 수요에 따라 컴퓨팅 자원을 확장 또는 축소가 가능하여 전체 서비스 비용 절감 효과를 가질 수 있다. 그리고, M&S (Modeling and Simulation) 기술은 컴퓨팅 자원과 CAE 소프트웨어를 통해 엔지니어링 분석 작업 결과를 얻어, 실제 실험 결과가 없이 제품의 상태를 시뮬레이션을 수행하여 분석하는 방법이다. M&S 기술은 FEA(Finite Element Analysis), CFD(Computational Fluid Dynamics), MBD(Multibody Dynamics) 및 최적화 분야에서 활용된다. M&S 통한 작업 절차는 전처리, 해석, 후처리 단계로 구분된다. CAE 소트프웨어를 통한 3D 모델링 작업인 전/후처리는 GPU 연산이 집약적이며, 3D 모델 해석은 CPU 또는 GPU 연산이 요구된다. 일반적인 개인 데스크톱에서 복잡한 3D 모델을 해석하는 시간이 많이 소요된다. 결과적으로, M&S를 원활하게 수행하기 위해서는 고성능 컴퓨팅 자원이 요구된다. 이 문제를 해결하기 위해 우리는 통합 클라우드 및 클러스터 컴퓨팅 환경인 HEMOS-Cloud 서비스를 제안한다. 제안한 클라우드 기반 방식에서는 M&S에 필요한 전/후처리 및 솔버 작업을 원활하게 수행할 수 있도록 구성했다. 이 시스템에서 전/후처리는 VDI(Virtual Desktop Infrastructure)에서 수행되고 해석은 클러스터 환경에서 수행된다. 각 용도에 맞게 서로 다른 환경에서 분리하여 컴퓨팅 자원 간에 간섭을 최소화했다. HEMOS-Cloud 서비스는 기업 또는 학교에서 M&S의 경험이 필요로 하는 사용자에게 CAE 소프트웨어와 컴퓨팅 자원을 제공한다. 본 논문에서는 HEMOS-Cloud 서비스의 경제적 파급효과를 산업연관분석을 활용하여 분석했다. 전문가의 의견을 반영하여 조정된 계수를 통한 분석 결과는 생산유발효과 74억원, 부가가치유발효과 41억원, 취업자유발효과 10억원당 50명으로 분석되었다.

웹정보시스템(WIS) 사용지원 서비스의 품질결정요인에 관한 연구 (A Study on the Quality Determinant Factors of User-Support Service under Web-based Information System)

  • 정상철;임형수
    • 정보기술응용연구
    • /
    • 제2권1호
    • /
    • pp.25-53
    • /
    • 2000
  • Parasuraman, Zaithmal, 그리고 Berry에 의하여 개념화된 서비스의 결정 요인인 신뢰성, 반응성, 보장성, 공감성, 유형성의 차원이 WIS환경에서 적합한지 분석한 결과 측정척도로서 SERVQUAL을 사용할 경우 반응성과 보장성, 공감성과 유형성, 신뢰성의 3개 요인으로 사용되어 질 수 있으며, SERVPERF를 사용할 경우 5개 요인이 사용되어질 수 있었다. 품질결정요인 중 신뢰성과 유형성이 유의하게 서비스 품질에 영향을 미치는 것으로 나타났다. 컴퓨터 사용환경이 더욱 분산된 형태를 띠는 WIS환경에서는 사용자 지원서비스를 위하여 공식적 정보센터뿐만 아니라 비공식적 정보센터를 효율적으로 활용해야 할 것이다.

  • PDF

Enhancing GPU Performance by Efficient Hardware-Based and Hybrid L1 Data Cache Bypassing

  • Huangfu, Yijie;Zhang, Wei
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.69-77
    • /
    • 2017
  • Recent GPUs have adopted cache memory to benefit general-purpose GPU (GPGPU) programs. However, unlike CPU programs, GPGPU programs typically have considerably less temporal/spatial locality. Moreover, the L1 data cache is used by many threads that access a data size typically considerably larger than the L1 cache, making it critical to bypass L1 data cache intelligently to enhance GPU cache performance. In this paper, we examine GPU cache access behavior and propose a simple hardware-based GPU cache bypassing method that can be applied to GPU applications without recompiling programs. Moreover, we introduce a hybrid method that integrates static profiling information and hardware-based bypassing to further enhance performance. Our experimental results reveal that hardware-based cache bypassing can boost performance for most benchmarks, and the hybrid method can achieve performance comparable to state-of-the-art compiler-based bypassing with considerably less profiling cost.

고유벡터 법을 이용한 최적 의사결정에 관한 연구 (On the Opimal Decision Making using the Eigenvector Methods)

  • 정순석
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2006년도 춘계공동학술대회
    • /
    • pp.123-131
    • /
    • 2006
  • Multi-criteria decision making is deducing the relative importance in the criterion of decision making and each alternative which is able to making a variety of choices measures the preferred degree in the series of low-raking criterions. Moreover, this is possible by synthesizing them systematically. In general, a fundamental problem decision maker solve for multi-criteria decision making is evaluating a set of activities which are considered as the target logically, and this kind of work is evaluated and synthesized by various criterions of the value which a chain of activities usually hold in common. In this paper, we are the eigenvector methods in weights calculating. For the purpose of making optimal decision, the data of five different car models are used. For computing, we used Visual Numerica Version 1.0 software package.

  • PDF

차량 탑재용 카메라를 이용한 실시간 차량 번호판 인식 기법 (Real-time Vehicle License Plate Recognition Method using Vehicle-loaded Camera)

  • 장재건
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.147-158
    • /
    • 2005
  • 나날이 심각해지는 교통문제에서 차량에 대한 정보를 이용하여 교통흐름을 개선해 줄 뿐만 아니라, 교통위반 차량을 효율적으로 적발할 수 있다. 차량 번호판은 차량정보를 인식하는데 중요하게 사용될 수 있다. 본 논문에서는 이동식 형태인 차량에 탑재한 카메라를 이용하여 촬영한 영상에서 차량의 번호판을 인식하는 새로운 기법을 제안한다. 여러 단계의 영상처리 과정과 인식 과정을 거쳐서 실시간에 처리할 수 있는 시스템으로 일반 차량뿐 아니라 특장차에 대한 인식도 가능하게 한다. 제안한 기법을 이용한 실제적 환경에서의 영상과 인식에 대한 결과가 실험결과에서 보여진다.

  • PDF