Search | Korea Science

GPU-Based Acceleration of Quantum-Inspired Evolutionary Algorithm (GPU를 이용한 Quantum-Inspired Evolutionary Algorithm 가속)

Ryoo, Ji-Hyun;Park, Han-Min;Choi, Ki-Young
- Journal of the Institute of Electronics Engineers of Korea SD
- /
- v.49 no.8
- /
- pp.1-9
- /
- 2012
Quantum-Inspired Evolutionary Algorithm(QEA) contains sufficient data-level parallelism to be naturally accelerated on GPUs. For an efficient reduction of execution time, however, careful task-mapping should be done to properly reflect the characteristics of CPU and GPU. Furthermore, when deciding which part of the application should run on GPU, we need to consider the data transfer between CPU and GPU memory spaces as well as the data-level parallelism. In addition, the usage of zero-copy host memory, proper choice of the execution configuration, and thread organization considering memory coalescing is important to further reduce the execution time. With all these techniques, we could run QEA 3.69 times faster on average in comparison with the multi-threading CPU for the case of 0-1 knapsack problem with 30,000 items.
PDF KSCI

Development of a Prototype for Hybrid TCP/IP Offload Engine (Hybrid TCP/IP Offload Engine의 프로토타입 개발)

Jang Hankook;Park Jong-Hoon;Chung Sang-Hwa
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.11a
- /
- pp.1000-1002
- /
- 2005
TOE(TCP/IP Offload Engine)은 호스트 CPU가 아닌 네트워크 어댑터 상에서 TCP/IP 프로토콜을 처리하여 호스트 CPU의 부하를 줄이는 기술이다. TOE의 구현 방안으로는 임베디드 프로세서를 사용하여 TCP/IP를 처리하는 소프트웨어적인 구현 방법과 TCP/IP의 모든 기능을 하드웨어로 구현하는 접근 방법이 제안되어왔다. 본 논문에서는 하드웨어적인 접근 방법과 소프트웨어적인 접근 방법을 결합한 Hybrid TOE 구조를 개발하기 위해 FPGA와 ARM 프로세서에 기반한 프로토타입을 개발하였다. Hybrid TOE는 많은 작업 부하로 인하여 임베디드 프로세서 상에서 성능을 확보하기 어려운 기능들은 하드웨어로 구현하고, 연결 설정과 같이 통신의 성능에 큰 영향을 끼치지 않는 기능들은 임베디드 프로세서 상에서 소프트웨어로 처리한다. 또한 본 논문에서는 실험을 통해 Hybrid TOE 프로토타입이 호스트 CPU 상에 발생하는 부하를 줄임을 입증하고, 하드웨어 구현을 통해 통신의 성능을 향상시킬 수 있음을 보였다.
PDF

Performance Analysis on Next-Generation Web Browser at Multicore CPU and GPU (멀티 코어와 GPU가 차세대 웹 브라우저의 성능에 미치는 영향 분석)

Hong, Gyeong-Hwan;Kim, Dae-Ho;Shin, Dong-Kun
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06a
- /
- pp.355-357
- /
- 2012
차세대 웹 브라우저는 멀티 쓰레드(multi-thread) 구조로 되어 있으며 HTML5와 WebGL을 기반으로 화려한 그래픽을 구사하기 때문에, 멀티 코어(multi-core) CPU와 GPU의 성능이 웹 브라우저의 성능에 큰 영향을 미치고 있다. 본 논문은 오픈 소스 웹 브라우저인 크로미엄(Chromium) 상에서 프로세서의 성능 변화에 따라 웹 브라우저에서 실행되는 웹 어플리케이션의 성능이 어떤 양상으로 변화하는지와 이 변화에 웹 브라우저의 각 동작이 얼마나 기여하는지를 비교 분석하였다. 그 결과 CPU 코어의 수가 렌더링 성능에 큰 영향을 주며, GPU의 성능은 WebGL의 성능을 크게 좌우함을 알 수 있었다.

Quantitative Analysis on Performance and Power Consumption of GPU varying to Frequency (GPU의 성능과 소비전력에 대한 동작 주파수의 영향 분석)

Joo, Se-Yoon;Choi, Hong-Jun;Kim, Cheol-Hong
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06a
- /
- pp.203-205
- /
- 2012
최근 컴퓨터 시스템에서는 동작 주파수 증가에 따른 전력 소모량과 높은 온도문제로 인해 CPU의 성능에만 의존할 수는 없는 상황이다. 이에 따라 GPU 병렬처리 연산능력을 CPU의 범용 데이터 처리에 이용하는 기술에 대한 관심이 높아지고 있다. 하지만 CPU와 GPU의 모든 자원을 활용하기에는 이에 따른 높은 온도와 전력 상승이 문제가 된다. 따라서 본 논문에서는 GPU의 전력효율과 성능 측면에서 최적이 되는 동작 주파수에 대한 분석을 수행하고자 한다. GPU를 활용하는 API인 CUDA를 이용하여 GPU의 동작 주파수 변화에 따른 성능 변화, 전력 변화 그리고 Energy Delay에 대해서 분석한다. 실험을 통한 분석 결과 동작 주파수의 증가에 따라 성능은 최대 30%이상 증가했고, 전력소모량은 최대 약18%의 증가를 보여주었다. 또한 Energy Delay도 최대 21% 향상되는 것을 확인할 수 있었다.

Analysis on the interrupt coalescence effect in cluster file systems for scientific computation (과학계산용 클러스터 파일시스템에서의 인터럽트 통합효과 분석)

Park, Seok-Jung;Woo, Joon;Lee, Jae-Kook;Kim, Hyong-Shik
- Proceedings of the Korean Information Science Society Conference
- /
- 2008.06d
- /
- pp.105-109
- /
- 2008
클러스터 파일시스템은 근거리 또는 원거리에 있는 클러스터 시스템 간에 연구데이터 공유 뿐 아니라, 실시간 계산을 위한 데이터 저장 공간으로 사용되는 네트워크 기반의 파일시스템이다. 고도의 과학계산을 처리할 때 계산노드들은 네트워크를 통해 연결된 클러스터 파일시스템으로부터 대용량의 데이터를 송수신하는 과정에서 CPU의 부하가 생기게 되고 이러한 문제는 계산노드로 하여금 과학계산의 속도를 저하시키는 요인이 된다. 본 논문에서는 패킷 송수신으로 인한 CPU 부하를 줄이고 이를 통하여 계산 성능을 향상시킬 목적으로 계산노드에서 수신하는 패킷들에 대해 인터럽트를 통합할 때 CPU 사용률에 미치는 영향을 분석하였다.
PDF

A Partitioning Method of Balancing CPU Utilization of Servers in DVE (분산 가상 환경에서 균등 부하 분산을 위한 CPU 사용률 기반 파티션 분할)

Won, Dong-Kee;An, Dong-Un;Chung, Seung-Jong
- Proceedings of the IEEK Conference
- /
- 2008.06a
- /
- pp.777-778
- /
- 2008
The partitioning problem is one of efficient issues on designing an excellent DVE. A brilliant partitioning method is related with assigning several avatars into the suitable servers with well balancing the growing requirement of bandwidth and computational resources in DVE. In this paper, a new method LCAA is proposed. The LCAA is a new partitioning method that balancing the CPU utilization of servers in DVE especially.
PDF

Heat Transfer and Fluid Flow Evaluation of Radiator for Computer Cooling (컴퓨터용 라디에이터의 열전달 및 유동특성 평가)

Cha, Dong-An;Kwon, Oh-Kyung;Yun, Jae-Ho;Oh, Myung-Do
- Proceedings of the SAREK Conference
- /
- 2009.06a
- /
- pp.1153-1158
- /
- 2009
The performance of louver-finned flat-tube and fin & tube radiators for computer CPU liquid cooling were experimentally investigated. In this study, 7 samples of radiators with different shape and pass number (1, 2, 10) were tested in a wind tunnel. The experiments were conducted under the different air velocity range from 1 to 4 m/s. The water flow rate through a pass was 1.2 LPM. Inlet temperatures of air and water were $20^{\circ}C$ and $30^{\circ}C$ respectively. It was found that the best performance was observed in the louver-finned flat-tube sample considering pressure drop and heat transfer coefficient.
PDF

Program Relocation Schemes for Enhancing Memory Test Coverage on 64-bit Computing Environment (64비트 환경에서 메모리 테스트 영역 확장을 위한 프로그램 재배치 기법)

Park Hanju;Park Heekwon;Choi Jongmoo;Lee Joonhee
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.07a
- /
- pp.841-843
- /
- 2005
최근 64비트 CPU의 시장 출시가 활발해지고 있으며, 메모리 모듈 또한 대용화가 이루어지고 있다. 이에 대용량 메모리를 64비트 CPU 플랫폼에서 효과적으로 테스트하는 방법을 개발할 필요성이 대두되고 있다. 본 논문에서는 x86-64 기반 리눅스 2.6.11 커널에서 물리 메모리의 테스트 영역을 확장하는 기법을 제안한다. 제안된 기법에는 응용이나 커널에서 물리 메모리에 대한 직접 접근, 프로그램을 사용자가 원하는 물리 메모리로 배치, 프로그램의 동적 재배치 등의 방법을 통해 테스트 영역을 확장 한다. 현재 64 비트 CPU를 지원하는 OS는 리눅스와 윈도우즈 64비트 에디션 등이 있다. 기존 리눅스 커널을 그대로 사용하였을 때 프로그램 등이 이미 사용 중인 물리 메모리에 대해서는 메모리 테스트를 수행 할 수 없었으나, 각 프로그램들을 물리 메모리에서 재배치하여, 원하는 곳의 메모리를 테스트 할 수 있도록 커널 수정을 통하여 구현하였다.
PDF

VANET에서 CPU 성능을 보장하는 핸드오버 인증프로토콜

Cho, Shin-Young;Kim, Seung-Hwan;Lim, Hun-Jung;Chung, Tai-Myoung
- Proceedings of the Korea Information Processing Society Conference
- /
- 2010.04a
- /
- pp.664-667
- /
- 2010
VANET에서 빠른 핸드오버를 위한 Fast MIPv6를 사용하는데 있어 Mobile Node이 다음 Access Router로 이동함에 따라 새로운 주소를 생성하고 이전주소를 새로운 주소로 교환하는 과정인 Fast Binding Update가 안전하게 수행하기 위해 핸드오버 인증 프로토콜이 사용된다. 본 논문에서는 핸드오버 인증 프로토콜 중 Kempf가 제안한 SEND기반의 핸드오버 인증 프로토콜이 Sybil 공격 및 DoS 공격에 보안상 취약하므로 생기는 CPU 성능 저하 문제를 인증과정을 수행하기 전에 Access Router의 주소 리스트를 사용하여 완화시키는 방법을 제안한다. 그로 인해 CPU 성능의 효율성을 보장하도록 한다.
https://doi.org/10.3745/PKIPS.y2010m04a.664 인용 PDF

CSR Sparse Matrix Vector Multiplication Using Zero Copy (Zero Copy를 이용한 CSR 희소행렬 연산)

Yoon, SangHyeuk;Jeon, Dayun;Park, Neungsoo
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.05a
- /
- pp.45-47
- /
- 2021
APU(Accelerated Processing Unit)는 CPU와 GPU가 통합되어있는 프로세서이며 같은 메모리 공간을 사용한다. CPU와 GPU가 분리되어있는 기존 이종 컴퓨팅 환경에서는 GPU가 작업을 처리하기 위해 CPU에서 GPU로 메모리 복사가 이루어졌지만, APU는 같은 메모리 공간을 사용하므로 메모리 복사 없이 가상주소 할당으로 같은 물리 주소에 접근할 수 있으며 이를 Zero Copy라 한다. Zero Copy 성능을 테스트하기 위해 희소행렬 연산을 사용하였으며 기존 메모리 복사대비 크기가 큰 데이터는 약 4.67배, 크기가 작은 데이터는 약 6.27배 빨랐다.
https://doi.org/10.3745/PKIPS.y2021m05a.45 인용 PDF

Search Result 762, Processing Time 0.035 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)