통합 검색 | Korea Science

GPU가 장착된 PC를 위한 혼합 정렬 알고리즘 설계 (Designing Hybrid Sorting Algorithm for PC with GPU)

권오영
- 한국항행학회논문지
- /
- 제15권2호
- /
- pp.281-286
- /
- 2011
데이터 정렬은 현대 사회에 존재하는 수많은 디지털 데이터에 대한 중요한 가공 작업 중의 하나이지만, 데이터가 방대할수록 정렬 과정 자체도 많은 연산시간을 소비한다. 본 논문에서 데이터 배열을 분할하여 PC에 있는 CPU와 GPU에서 각각 동시에 정렬을 수행하는 혼합 정렬 알고리즘을 제안하였다. 각 장치의 처리 성능을 바탕으로 가장 효율적인 배열의 분할 범위를 결정하고 각각 분할된 영역을 CPU와 GPU에서 동시에 정렬함으로써 전체 정렬 시간을 단축시켰다. 실험결과에서 알 수 있듯 혼합 정렬이 GPU만 활용한 정렬보다 8%이상 정렬 수행 속도를 향상시켰다.
https://doi.org/10.12673/jant.2011.15.2.281 인용 PDF KSCI

이중 CPU PC에서 병렬 계산을 위한 Matlab 행렬 연산 라이브러리의 구현 및 성능 측정 (An implementation and performance measurement of Matlab matrix operation library for parallel computing on dual CPU PC)

김철민;이정훈
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
- /
- pp.871-873
- /
- 2001
본 논문에서는 전기 단층 촬영 기법과 같이 많은 양의 데이터에 대해 산술 계산을 수행하는 응용의 수행속도를 개선하기 위하여 이중 CPU PC 상에서 Matlab의 기본연산, 즉 행렬 곱하기, 역행렬 계산, 의사 역행렬 계산 등을 병렬로 수행하는 라이브러리 프로그램을 구현하고 그 성능을 측정한다. 구현된 라이브러리는 행렬의 곱하기, 역행렬 계산, 의사 역행렬 계산 등 기본적인 행렬 연산에 대해 각 CPU에서 수행될 쓰레드를 생성하고 이 쓰레드에 분할 행렬을 인자로 넘겨줌으로써 병렬 계산을 실행하도록 하고 부분 결과를 합성하여 최종적인 결과를 산출하게 된다. 구현된 코드를 수행시켜 속도를 측정한 결과 행렬의 곱하기는 최대 69%, 역행렬은 34.8 %, 의사 역행렬은 52 % 까지 수행시간을 단축시켰다. 이에 의해 전기 단층 촬영 프로그램은 한번의 전류 주입에 대해 영상 복원에 소요되는 시간을 48 %로 감소시켰다.
PDF

CUDA FORTRAN을 이용한 운동파 강우유출모형 (Kinematic Wave Rainfall-Runoff Model Using CUDA FORTRAN)

김보람;김대홍
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2018년도 학술발표회
- /
- pp.271-271
- /
- 2018
그래픽 처리 장치(GPU: Graphic Processing Units)는 그래픽 처리에 특화된 수많은 산술논리연산자 (ALU: Arithmetic Logic Unit)와 이에 관련된 인스트럭션Instruction)으로 인해 중앙 처리 장치(CPU: Central Processing Units) 보다 훨씬 빠른 계산 처리를 수행할 수 있다. 최근에는 FORTRAN에 의해 구현된 많은 수치모형들이 현실적인 모델링 방법의 발달로 인해 더 많은 계산량과 계산시간을 필요로 한다. 이 연구에서는 GPU 상의 범용 계산GPGPU : General-Purpose computing on Graphics Processing Units) 기반 운동파 강우유출모형(Kinematic Wave Rainfall-Runoff Model)이 CUDA(Compute Unified Device Architecture) FORTRAN을 사용하여 구현되었다. CUDA FORTRAN 운동파 강우유출모형의 계산 결과는 검증된 CPU 기반 운동파 강우유출모형의 계산 결과와 비교하여 검증되었으며, 잘 일치함을 보여 주었다. CUDA FORTRAN 운동파 강우유출모형은 CPU 기반 모형에 비해 약 20 배 더 빠른 계산 시간을 보였다. 또한 계산 영역이 커짐에 따라 CPU 버전에 비해 CUDA FORTRAN 버전의 계산 효율이 향상되었다.
PDF

분산컴퓨팅 환경에서의 고가용성 클러스터링 프레임워크 기본설계 연구 (A Study of Basic Design Method for High Availability Clustering Framework under Distributed Computing Environment)

김점구;노시춘
- 융합보안논문지
- /
- 제13권3호
- /
- pp.17-23
- /
- 2013
클러스터링은 상호 의존적 구성에 필요한 구조적인 기술이다. 클러스터링은 가변적 업무부하를 처리하거나, 서비스 연속성을 저해하는 고장 발생 시 운영이 계속되도록 여러대의 컴퓨터시스템 기능을 서로 연결하는 메커니즘이다. 고 가용성 클러스터링 기능은 가능한 오랜시간 서버 시스템이 작동하는데 중점을 둔다. 이 클러스터 는 멀티플 시스템에서 실행되는 노드와 서비스를 중복하여 가지고 있어서 서로가 서로를 추적할 수 있다. Active-Standby 상태의 두 시스템이 있을 경우 활성 서버에 장애가 발생했을 때 모든 서비스가 대기 서버에서 구동돼 서비스가 이루어진다. 이 기능을 절체 또는 스위치오버(switchover)라 한다. 고가용성 클러스터링 기능은 가능한 오랜시간 서버 시스템이 작동하는데 중점을 둔다. 이 클러스터는 멀티플 시스템 에서 실행되는 노드와 서비스를 중복하여 가지고 있어서 서로가 서로를 추적할 수 있다. 한 노드가 장애 발생 시 둘째 노드가 몇초 이내에 고장 난 노드 임무를 수행한다. 고가용성 클러스터링 구조는 효율성 여부가 측정되어야 한다. 시스템 성능은 인프라시스템의 performance, latency, 응답시간(response Time), CPU 부하율(CPU utilization), CPU상의 시스템 프로세스(system process)수로 대표된다.
PDF KSCI

Bit-map 방식에 의한 설계규칙 검사 (A Design Rule checker Based on Bit-Mapping)

어길수;김경태;경종민
- 대한전자공학회논문지
- /
- 제22권2호
- /
- pp.36-43
- /
- 1985
NMOS IC layout에서 직사각형 도형의 갯수에 비례하는 검사시간을 소모하는 설제규칙 검사의 알고리즘의 제안되고 그것에 의한 program이 개발 되었다. 일반적인 설계규칙 검사 algorithm의 시간소모는 0(nlogn) 혹은 0(n**1 . 2)에 비례하는데 반하여 (n은 직사각형 도형의 갯수) 이 논문에서는 pattern의 DF(direct format) data와 bit-map plane을 연관 지음으로써 0(n)에 비례하는 시간소모를 달성 할 수 있었다.
PDF

안드로이드 환경에서의 에너지 절약을 위한 효율적인 CPU 자원 활용 기법 (Efficient CPU Resource Utilization Mechanism on Android Platforms for Conserving Energy)

류준한;권영호;이병호
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2015년도 추계학술대회
- /
- pp.526-529
- /
- 2015
스마트폰 산업이 발전하면서 내부 하드웨어 장치들이 고사양의 장치가 되었고 이전 보다 많은 전력소비를 요구 한다. 그러므로 고용량의 배터리가 필요 하지만 스마트폰의 소형화로 인해 부피가 큰 배터리를 탑재하는 것에 한계가 있다. 리눅스 커널은 이러한 한계점을 소프트웨어 기술로 보완하기 위해 DVFS Mechanism을 제공 한다. DVFS는 동적으로 CPU의 동작주파수를 조정 하여 CPU의 전력소비를 줄이는 Mechanism이다. DVFS에서 기본정책인 ondemand는 up_threshold를 넘을 때 마다 최대 동작주파수를 적용 하여 상당 시간 유지되므로 CPU 자원의 낭비를 초래 한다. 본 논문에서는 이러한 점에 착안하여 계속해서 현재 동작주파수 대비 높은 CPU 이용률을 유지함으로써 CPU자원의 낭비를 막고 에너지를 절약 하는 기법을 제안한다.
PDF

안드로이드에서 SQLite 의 질의처리 성능 분석 (Analyzing Performance of Query Processing in SQLite on Android)

신민철;장용일;이준희;이준수;박상현
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2014년도 춘계학술발표대회
- /
- pp.660-663
- /
- 2014
스마트폰의 등장과 스마트폰의 기능을 풍부하게 만드는 앱이 제공됨에 따라 우리는 유용한 기능을 일상 생활에서 매우 쉽게 사용할 수 있게 되었다. 이러한 앱은 대부분 SQLite 라는 단순한 DBMS 를 통해 데이터를 저장하고 관리한다. 하지만 SQLite 는 임베디드 장치의 DBMS 라는 초기 목표를 위해, 그리고 특허 등의 라이선스 문제로 인해 다소 단순한 시스템으로 설계 되었다. 하지만 처음 목표 했던 임베디드 시스템에 비해 스마트폰의 높은 성능에서는 SQLite 의 단순한 구조가 오히려 성능저하를 일으킨다. 사용자경험의 증가를 위해 SQLite 의 성능을 향상시키는 연구가 필요하며, 이를 위해 SQLite 의 질의 성능을 분석하는 연구가 필요하다. 본 논문에서는 SELECT, DELETE, INSERT, UPDATE 등의 단순 질의의 성능을 실제 스마트폰에서 측정하고, 이를 CPU 연산과 I/O 연산으로 나누어 분석한다. 이러한 분석결과 SQLite 의 SELECT 질의는 CPU 연산에 큰 영향을 받으며 읽기연산은 리눅스 커널에서 제공하는 기능으로 인해 높은 성능을보인다. 다른 질의의 경우 쓰기연산이 포함되어 있으며 전체 질의처리시간에서 80% 에서 95% 정도가 쓰기연산 시간이다. 따라서 효율적인 CPU 연산을 통해 CPU 연산시간을 줄이고 리커버리 시스템과 같은 쓰기연산에 영향을 미치는 모듈에 대한 연구가 필요하다.
https://doi.org/10.3745/PKIPS.y2014m04a.660 인용 PDF

클러스터 컴퓨팅 시스템에서 CPU와 메모리 부하에 기반한 작업 부하 균등화 정책 (Load Balancing Policy Based on CPU and Memory Workload in Cluster Computing System)

박말순;이원주;전창호
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
- /
- pp.385-387
- /
- 2003
본 논문에서는 이질적인 클러스터 컴퓨팅시스템 에서 CPU와 메모리 자원을 효율적으로 사용하는 작업 부하 균등화 정책을 제안한다. 이 정책의 특징은 CPU부하 상태와 수행중인 작업의 메모리 요구량을 고려하여 작업을 동적으로 할당하는 것이다. 먼저 각 노드는 CPU와 메모리 사용량에 따라 과부하 상태가 아니면 작업을 할당받아 수행한다. 그리고 수행중인 작업의 메모리 요구량이 가용 메모리 크기를 초과하여 페이지 폴트가 발생하면 수행 중인 작업을 다른 노드로 이주시킴으로써 메모리 과부하에 따른 페이지 폴트 발생을 줄이고, 작업의 대기 시간과 수행시 간을 단축한다. 본 논문에서는 시뮬레이션을 통하여 제안한 작업부하 균등화 정책이 기존의 CPU 기반정책에 비해 시스템의 성능향상 면에서 유리함을 검증한다.
PDF

VIT: 게스트 운영체제의 실시간성 지원을 위한 타이머 하이퍼콜 (VTF: A Timer Hypercall to Support Real-time of Guest Operating Systems)

박미리;홍철호;유시환;유혁
- 한국정보과학회논문지:시스템및이론
- /
- 제37권1호
- /
- pp.35-42
- /
- 2010
가상화 환경에서는 여러 개의 게스트 운영체제가 자원을 공유하고 있는데 특히 CPU는 시간 분할 방식에 의해 분배 된다. 따라서 각 가상 머신은 모든 물리 시간을 점유하지 못하고, 이는 CPU를 점유하지 못한 시간에 동작해야 하는 태스크 실행이 보장되지 못하는 결과를 야기시킨다. 이와 같은 응답성의 저하는 기존의 서버 가상화에서 치명적인 문제가 되지 않으나 임베디드 시스템에서 동작하는 실시간 태스크 측면에서는 중요하게 다루어 져야 하는 요구사항이 된다. 본 논문에서 우리는 실시간성과 관련된 타이머를 가상 머신 모니터에 등록할 수 있는 하이퍼콜을 제안한다. 이 하이퍼콜을 통하여 등록된 타이머는 만료된 시점에 해당 가상 머신이 실행되게 한다. 따라서 실시간성을 요하는 태스크들이 의도된 시간에 실행 가능하게 하며 다른 가상 머신의 기아 현상을 완화시켜 준다. 이어지는 실험에서는 Xen-Arm에 이를 구현하여 게스트 운영체제인 리눅스에서의 실시간성을 평가한다. 특히 테스트 응용과 Mplayer의 응답성 및 초당 프레임 수를 측정하여 한 개의 게스트 운영체제만이 동작하는 환경에서와 비슷한 실시간성이 지원될 수 있음을 보인다.
PDF KSCI

멀티코어 기반의 임베디드 시스템에서 안드로이드 부팅 속도 향상 방법 (An Improving Method of Android Boot Speed in Multi-core based Embedded System)

최진용;이재흥
- 전기전자학회논문지
- /
- 제17권4호
- /
- pp.564-569
- /
- 2013
현재 임베디드 기기는 멀티코어로 급성장하고 있으며 빠른 부팅 속도를 요구하고 있다. 하지만 기존의 부팅 기술은 하나의 코어만을 사용하고 있다. 따라서 본 논문에서는 분석 도구를 통해 안드로이드 부트 프로세스를 분석후, CPU연산이 많은 곳에 병렬 기법을 적용하는 방법과 멀티 코어의 성능을 최대로 끌어내기 위해 CPU주파수 정책을 변경함으로써 멀티코어 기반에서 안드로이드 부팅 속도 향상 방법에 대해 제안한다. 본 논문의 제안 방법을 듀얼 코어 S5PV310과 쿼드 코어 Exynos4412에 각각 적용시킨 뒤 부팅 완료 시간을 측정하였으며 기존의 방법과 제안 방법의 시간을 비교한 결과 듀얼코어와 쿼드코어에서 각각 약 20.71%, 약 31.34%의 속도 성능향상을 가져왔다.
https://doi.org/10.7471/ikeee.2013.17.4.564 인용 PDF KSCI

검색결과 518건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)