통합 검색 | Korea Science

통합 메모리를 사용하는 NVIDIA 파스칼 GPU에서의 CPU 메모리와 GPU 메모리 간 데이터 통신 분석 (Evaluation of the Data Migration between CPU Memory and GPU Memory for a NVIDIA Pascal GPU Using Unified Memory)

신필규;홍성수
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
- /
- pp.7-10
- /
- 2018
통합 메모리는 CPU 메모리와 GPU 메모리 간의 데이터 통신을 개발자에게 투명하게 내재적으로 수행하는 소프트웨어 런타임 환경으로 개발자에게 CPU 메모리와 GPU 메모리가 통합된 하나의 메모리로 보이게 해준다. 통합 메모리는 장점에도 불구하고 아직 널리 사용되지 못하고 있는데 그 이유는 내재적으로 수행되는 데이터 통신의 오버헤드가 큰 것으로 알려져 있기 때문이다. 하지만 이 데이터 통신이 구체적으로 어떻게 이루어지고 오버헤드는 어떻게 발생하는지 분석한 연구는 아직 존재하지 않는다. 우리는 NVIDIA 사의 최신 GPU 마이크로아키텍처 중 하나인 파스칼을 사용하는 GPU를 대상으로 하여, 통합 메모리를 사용할 시 데이터 통신이 이루어지는 조건과 GPU 응용의 수행시간에 데이터 통신이 끼치는 영향을 실험을 통해 분석한다. 실험 결과 통합 메모리의 오버헤드는 두 가지 원인 때문에 발생한다. 첫째, 통합 메모리를 사용하면 CPU 또는 GPU가 데이터에 접근할 때마다 이 데이터는 CPU 또는 GPU 메모리로 옮겨지고 옮겨진 데이터는 제거된다. 따라서 재사용할 데이터도 제거되어 추가적인 데이터 통신이 발생하고, 이 데이터 통신의 지연시간은 GPU 응용의 수행시간에 더해진다. 둘째, 통합 메모리를 사용하면 데이터 통신과 커널들이 서로 다른 스트림에 할당되어도 동시에 수행되지 못한다. 따라서 GPU 응용의 수행시간은 동시에 수행되던 데이터 통신과 커널의 수행시간만큼 증가한다.
PDF

CPU와 GPU의 혼합 병렬 계산에 대한 성능 분석 (Performance Analysis on Parallel Processing of a Hybrid of a CPU and a GPU)

황근창;김영태
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2016년도 춘계학술발표대회
- /
- pp.59-60
- /
- 2016
본 논문에서는 고성능 병렬 계산 장치로 주목받고 있는 GPU를 CPU와 동시에 병렬로 사용한 계산 성능을 분석하였다. 성능 분석을 위하여 원주율(${\pi}$)을 적분으로 계산하는 CUDA 프로그램을 사용하였으며, 전체 계산을 GPU 대비 CPU 계산 부분으로 할당하여 성능을 분석하였다.
https://doi.org/10.3745/PKIPS.y2016m04a.59 인용 PDF

CPU와 GPU 간의 병목현상 해결에 관한 연구 (A Study of solving the bottleneck between CPU and GPU)

이진호;조한진
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
- /
- pp.3-4
- /
- 2020
본 논문에서는 컴퓨팅 시스템에서 발생 할 수 있는, CPU와 GPU 간의 병목현상을 개선방안으로 통신 방식에 대해 비교 분석하였다. CPU와 GPU 간에 발생할 수 있는 병목현상의 해결방법으로, 두 구성 요소 간의 성능 구성 외의 통신방식을 개선 방법으로 PCIe와 NVLink를 비교하고, 성능 극대화 방안을 모색한다. NVLink 연결 방식의 통신 방식을 변경하였을 때 성능을 비교해 봄으로써 병목현상 해소 및 성능 향상에 우수한 결과를 낼 수 있다.
PDF

컴퓨터 CPU 냉각용 라디에이터의 열성능에 관한 연구 (A Study on the Thermal Performance of Radiator for Computer CPU Cooling)

차동안;권오경;최미진;윤재호
- 대한설비공학회:학술대회논문집
- /
- 대한설비공학회 2007년도 동계학술발표대회 논문집
- /
- pp.258-263
- /
- 2007
The performance of louver-finned flat-tube radiators for computer CPU liquid cooling were experimentally investigated. In this study, 5 samples of louver-finned flat-tube radiators with different width size (19mm, 24mm), tube hole (1, 9) and pass number (1, 2, 5) were tested in a wind tunnel. The experiments were conducted under the different air velocity ranging from 1 to 5 m/s. The water flow rate through a pass was 1.7 LPM. Inlet temperatures of air and water were $20^{\circ}C$ and $30^{\circ}C$ respectively. The results showed that the best performance in the 24mm sample considering pressure drop and heat transfer coefficient.
PDF

OpenCV 내장 CPU 및 GPU 함수를 이용한 DNN 추론 시간 복잡도 분석 (Performance Analysis of DNN inference using OpenCV Built in CPU and GPU Functions)

박천수
- 반도체디스플레이기술학회지
- /
- 제21권1호
- /
- pp.75-78
- /
- 2022
Deep Neural Networks (DNN) has become an essential data processing architecture for the implementation of multiple computer vision tasks. Recently, DNN-based algorithms achieve much higher recognition accuracy than traditional algorithms based on shallow learning. However, training and inference DNNs require huge computational capabilities than daily usage purposes of computers. Moreover, with increased size and depth of DNNs, CPUs may be unsatisfactory since they use serial processing by default. GPUs are the solution that come up with greater speed compared to CPUs because of their Parallel Processing/Computation nature. In this paper, we analyze the inference time complexity of DNNs using well-known computer vision library, OpenCV. We measure and analyze inference time complexity for three cases, CPU, GPU-Float32, and GPU-Float16.
PDF KSCI

Heterogeneous 코어 환경에서 Singularity 컨테이너의 Cgroup 정책에 따른 HPC 작업의 성능 분석 (A Performance Analysis of HPC Task According to Cgroup Policies of Singularity Container in Heterogeneous Cores Environment)

김명준;송충건;정광식;유헌창
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- pp.81-84
- /
- 2023
최근의 인텔의 새로운 CPU 아키텍처의 도입으로 Singularity 컨테이너 내에서 cgroup 설정으로 인해 특정 작업의 성능에 영향을 초래할 수 있다. 특히 Singularity 컨테이너에서 HPC(고성능 컴퓨팅) 작업은 cgroup 정책에 의해 작업 효율이 달라질 수 있고 아직 새로운 CPU 환경에서의 HPC 작업에 대한 연구가 충분치 않다. 따라서, 본 논문은 Singularity 컨테이너 생성 시 새로운 CPU 아키텍처에 설계된 CPU 코어 유형별 cgroup 지정이 HPC 응용을 포함하여 다양한 유형의 작업 성능에 미치는 영향을 비교 분석하였고, 이를 통해 HPC 사용자에게 가이드라인을 제공하는 것이 목적이다.
https://doi.org/10.3745/PKIPS.y2023m11a.81 인용 PDF

효율적인 유체 시뮬레이션을 위한 투영 단계에서의 멀티 코어 프로세서와 그래픽 프로세서의 병렬처리 (Parallel Processing of Multi-Core Processor and GPUs in Projection Step for Efficient Fluid Simulation)

김선태;정휘룡;홍정모
- 한국콘텐츠학회논문지
- /
- 제13권6호
- /
- pp.48-54
- /
- 2013
최근 영화나 CF등에 사용되는 컴퓨터 그래픽스(Computer Graphics, 이하 CG)분야의 유체 시뮬레이션에서는 CPU와 GPU를 혼합하여 사용하는 기술들이 소개되고 있다. 본 논문에서는 유체 시뮬레이션 수행을 위한 투영 단계에서 멀티쓰레드를 이용하여 기존의 CPU와 GPU 간의 작업을 순차적으로 수행하던 방식을 개선하여 CPU와 GPU 간의 작업을 병렬처리 방법을 제시하였다. 제시된 방법을 통해 많은 계산량을 필요로 하는 유체시뮬레이션의 효율성을 높일 수 있었다.
https://doi.org/10.5392/JKCA.2013.13.06.048 인용 PDF KSCI

VHDL을 이용한 Parwan CPU의 Modeling과 Design (A study on the Modeling and design of Parwan CPU using a VHDL)

박두열
- 한국컴퓨터정보학회논문지
- /
- 제7권2호
- /
- pp.19-33
- /
- 2002
본 연구에서는 Parwan CPU를 VHDL을 이용하여 Behavioral Leve에서 기술하고 Dataflow LEVEL에서 상호 연결하여 기술하였고, Test-bench 방식을 이용하여 프로세서의 동작을 확인하기 위해 시뮬레이션 하였다. 제시된 방식은 설계의 정보교환이 용이하고 동작의 표현이 정확하고 간결하였으며, 설계의 문서화가 용이하며, 구성된 프로세서의 동작을 확인하기가 용이하였다. VHD교의 Behavioral 기술은 설계자에게 설계된 시스템을 확인할 때 많은 도움을 주었으며. Dataflow 기술은 설계의 버스연결과 레지스터 구조를 확인할 때 유용하게 사용할 수 있었다.
PDF

CPU 스케줄링을 학습하는 운영체제 시뮬레이션 프로그램의 설계 및 구현 (Design and Implementation of Simulation Program for CPU Scheduling Operating Systems)

정성균;이상곤
- 한국멀티미디어학회논문지
- /
- 제14권3호
- /
- pp.449-461
- /
- 2011
컴퓨터 운영체제는 과거에는 대학에서만 배우는 과목이었으나, 컴퓨터가 점점 보편화되면서 고등학교와 중학교에서도 운영체제의 교육이 실시되고 있다. 학교에서 이루어지는 컴퓨터 교육을 살펴보면 컴퓨터에 대한 기본 원리와 핵심 철학은 이론 수업만으로 진행되고 있다. 이론 수업은 학습 매체의 활용 부족으로 때로 중요한 부분을 지나치거나 학습자가 흥미를 느끼지 못해 수업이 자칫 어려운 공부로 인식될 위험이 있다. 이러한 교육 환경에서 학습자에게 이론 수업에 추가로 다양한 매체를 활용해서 학습에 대한 이해를 돕고 수업 흥미를 유도해서 과목에 대한 이해를 높이는 연구가 필요한 실정이다. 본 논문에서는 프로그램을 구현하여 운영체제의 이론 중 CPU 스케줄링에 대해서 다양한 예를 진행 과정과 함께 시뮬레이션 하고 그 결과를 표시하는 프로그램을 개발하였다. 본 연구를 통해 개발된 프로그램을 이용하여 학습자를 교육하면 수업에 대한 흥미를 높일 수 있고 컴퓨터 교과의 이론적인 부분을 보강할 수 있다. 또한 다양한 프로그래밍 환경에서의 각 알고리즘(FCFS, SJFS, PS, RR)끼리의 비교 분석도 가능함을 입증한다.
https://doi.org/10.9717/kmms.2011.14.3.449 인용 PDF KSCI

안드로이드 CPU 거버너의 전력 소비 및 실시간 성능 평가 (Evaluating Power Consumption and Real-time Performance of Android CPU Governors)

탁성우
- 한국정보통신학회논문지
- /
- 제20권12호
- /
- pp.2401-2409
- /
- 2016
안드로이드 CPU 거버너는 CPU 주파수를 낮추어 CPU 공급 전압을 감소시키는 DVFS (Dynamic Voltage Frequency Scaling) 기반 전력 관리 기법을 사용한다. 그러나 CPU 주파수의 감소는 태스크의 실행 속도 지연을 유발한다. 이로 인해 태스크의 응답 시간 및 마감 시한 초과율이 증가하여 태스크가 제공하는 서비스의 품질 하락이 발생한다. 이에 본 논문에서는 다양한 안드로이드 CPU 거버너들을 전력 소비와 태스크의 응답성 및 마감 시한 측면에서 분석하였다.
https://doi.org/10.6109/jkiice.2016.20.12.2401 인용 PDF KSCI

검색결과 758건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)