• 제목/요약/키워드: 처리성능

검색결과 15,285건 처리시간 0.039초

이기종 컴퓨팅 환경에서 OpenCL을 이용한 효율적인 병렬처리 (OpenCL-based Efficient Parallel Processing in a Heterogeneous Computing Environment)

  • 김희곤;이성주;정용화;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.111-114
    • /
    • 2013
  • 최근 고성능 컴퓨팅과 모바일 컴퓨팅에서 GPU 등의 성능가속기 사용이 증가함에 따라 성능가속기를 사용한 다양한 병렬처리 방법이 소개되고 있다. 그러나 성능 가속기를 처음 접하거나 성능가속기를 사용한 병렬처리 경험이 적은 사용자의 경우, 이러한 성능가속기를 이용하여 효과적인 병렬처리를 하는 것은 쉽지 않다. 본 논문에서는 성능가속기와 마이크로프로세서를 동시에 사용하여 단순히 성능가속기만을 사용한 병렬처리보다 효율적인 병렬처리 방법을 제안하고, 성능가속기만을 사용하여 얻은 성능과 제안한 방법의 성능을 비교한다. 실험결과, 제안방법은 순차처리와 비교하여 약 40배의 성능 향상을 얻을 수 있었고, 성능가속기만을 사용한 병렬처리 방법보다도 25%의 성능 향상이 가능함을 확인하였다.

라즈베리파이 4 기반 병렬처리 시스템의 성능 평가 (Performance Evaluation on the Parallel Processing System with the Raspberry Pi 4)

  • 한현승;김경하;정승우;장윤석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.6-8
    • /
    • 2022
  • 병렬처리시스템이 설계와 구축에서 가장 중요한 관점 중의 하나는 비용 대비 성능이다. 본 연구에서는 라즈베리파이 4를 클러스터 방식으로 연결하여 병렬처리 시스템을 구축하였을 때, 클러스터의 병렬처리 성능이 다른 병렬처리 시스템과 유사한 확장성과 병렬처리 성능을 보여주는지를 HPL 벤치마크를 통하여 검증하였다. 실험 결과 라즈베리파이 기반의 병렬처리 시스템이 클러스터의 크기에 따른 병렬 확장성이 있고, 다른 병렬처리 시스템들과 유사한 처리 성능을 가질 수 있음을 확인하였으며, 이를 통하여 라즈베리파이와 같은 저가의 처리장치로도 충분한 크기의 클러스터를 구성할 경우 높은 성능을 기대할 수 있음을 알 수 있다.

아파치 스파크 활용 극대화를 위한 성능 최적화 기법 (Performance Optimization Strategies for Fully Utilizing Apache Spark)

  • 명노영;유헌창;최수경
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권1호
    • /
    • pp.9-18
    • /
    • 2018
  • 분산 처리 플랫폼에서 다양한 빅 데이터 처리 어플리케이션들의 수행 성능 향상에 대한 관심이 높아지고 있다. 이에 따라 범용적인 분산 처리 플랫폼인 아파치 스파크에서 어플리케이션들의 처리 성능 최적화에 대한 연구들이 활발하게 진행되고 있다. 스파크에서 데이터 처리 어플리케이션들의 수행 성능을 향상시키기 위해서는 스파크의 분산처리모델인 Directed Acyclic Graph(DAG)에 알맞은 형태로 어플리케이션을 최적화시켜야 하고 어플리케이션의 처리 특징을 고려하여 스파크 시스템 파라미터들을 설정해야 하기 때문에 매우 어렵다. 기존 연구들은 각각의 어플리케이션의 처리 성능에 영향을 주는 하나의 요소에 대한 부분적인 연구를 수행했고, 최종적으로 어플리케이션의 성능개선을 이뤄냈지만 스파크의 전반적인 처리과정을 고려한 성능 최적화를 다루지 않았을 뿐만 아니라 처리성능과 상관관계를 갖는 다양한 요소들의 복합적인 상호작용을 고려하지 못했다. 본 연구에서는 스파크에서 일반적인 데이터 처리 어플리케이션의 수행 과정을 분석하고, 분석된 결과를 토대로 어플리케이션의 처리과정 중 스테이지 내부와 스테이지 사이에서 성능 향상을 위한 처리 전략을 제안한다. 또한 스파크의 시스템 설정 파라미터 중 분산 병렬처리와 밀접한 관계를 갖는 파티션 병렬화에 따른 어플리케이션의 수행성능을 분석하고 적합한 파티셔닝 최적화 기법을 제안한다. 3가지 성능 향상 전략의 실효성을 입증하기 위해 일반적인 데이터 처리 어플리케이션: WordCount, Pagerank, Kmeans에 각각의 방법을 사용했을 때의 성능 향상률을 제시한다. 또한 제안한 3가지 성능 최적화 기법들이 함께 적용될 때 복합적인 성능향상 시너지를 내는지를 확인하기 위해 모든 기법들이 적용됐을 때의 성능 향상률을 제시함으로써 본 연구에서 제시하는 전략들의 실효성을 입증한다.

TPC-C 벤치마크를 이용한 병렬 트랜잭션 처리 시스템의 성능분석기법

  • 김희철;신정훈;이용두;권영직
    • 한국산업정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.79-92
    • /
    • 1998
  • 일반 병렬처리 시스템(General Purpose Multiprocessors) 과는 달리, 병렬 트랜잭션(Transaction)처리 시스템의 성능은 메모리의 계층구조와 입출력 시스템의 구조 등에 크게 영향을 받는 특징을 갖는다. 본 논문은 입출력 노드의 성능 분석에 주안점을 두고 전체 시스템에서의 입출력 노드의 개수, 병렬 디스크의 개수 및 상호연결망(Interconnection Network)과의 접속을 제공하는 스위치의 처리 용량 등의 인수들이 SPAX 병렬 트랜잭션 처리 시스템의 성능에 미치는 영향에 대한 분석 내용을 기술한다. 본 연구에서는 벤치마크로는 병렬 트랜잭션 시스템의 성능 평가에 주로 사용되고 있는 TPC-C 벤치마크를 사용하며 모의 입력(Synthetic workload)을 통한 성능분석을 수행하였다. 본 연구는 입출력 노드에 부하가 많이 걸릴 경우 패킷을 크리에 따라 시스템의 성능에 큰 영향을 미치며, 반면에 입출력노드내의 상호연결망의 접속을 제공하는 XNIF 의 데이터 버퍼 개수의 증가는 시스템의 성능 향상에 전혀 기여를 하지 않음을 보여준다. 이는 시스템의 성능향상을 위해서는 패킷 전송 경로상의 모든 시스템 요소의 성능 향상이 병행되어야 함을 보여준다. 마지막으로는 프로세싱노드와 입출력노드의 처리능력의 균형이 병렬 트랜잭션시스템의 설계에 있어서 매우 중요하다는 점을 보여준다.

시계열 서브시퀀스 매칭에서 발생하는 성능 병목의 효과적인 해결 방안 (Effective Resolving of the Performance Bottleneck in Time-Series Subsequence Matching)

  • 김상욱;오세봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.530-532
    • /
    • 2003
  • 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이터베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭 처리의 성능 병목을 파악하고, 이를 해결함으로써 전체 서브시퀀스 매칭의 성능을 크게 개선하는 방안에 관하여 논의한다. 먼저, 사전 실험을 통하여 후처리 단계가 서브시퀀스 매칭의 성능 병목이며, 후처리 단계의 최적화가 기존의 서브시퀀스 매칭 기법들이 간과한 매우 중요한 이슈임을 지적한다. 이러한 서브시퀀스 매칭의 성능 병목을 해결하기 위하여 후처리 단계를 최적으로 처리할 수 있는 간단하면서도 매우 효과적인 기법을 제안한다. 제안된 기법은 후처리 단계에서 후보 서브시퀀스들이 질의 시퀀스와 실제로 유사한가를 판단하는 순서를 조정함으로써 기존의 후처리 단계의 처리에서 발생하는 많은 디스크 액세스의 중복과 CPU 처리의 중복을 완전히 제거할 수 있다. 실제 데이터와 생성 데이터를 이용한 다양한 실험들을 통하여 제안된 기법의 성능 개선 효과를 정량적으로 검증한다.

  • PDF

TPC-C 벤치마크를 이용한 SPAX 병렬 컴퓨터의 성능분석 (Performance Evaluation of the SPAX Parallel Architecture based on the TPC-C Benchmark)

  • 김희철;신정훈;이용두
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 추계학술대회 발표논문집:21세기를 향한 정보통신 기술의 전망
    • /
    • pp.165-180
    • /
    • 1997
  • 일반 병렬 처리 시스템(General Purpose Multiprocessors)과는 달리, 병렬 트랜잭션(Transaction) 처리 시스템의 성능은 메모리의 계층구조와 입출력 시스템의 구조 등에 크게 영향을 받는 특징을 갖는다. 본 논문은 입출력 노드의 성능 분석에 주안점을 두고 전제 시스템에서의 입출력 노드의 개수, 병렬 디스크의 개수 및 상호연결망(Interconnection Network)과의 접속을 제공하는 스위치의 처리 용량 등의 인수들이 SPAX 병렬 트랜잭션처리 시스템의 미치는 성능의 평가 및 분석에 대한 연구 내용 기술한다. 본 연구에서는 벤치마크로는 병렬 트랜잭션 시스템의 성능 평가에 주로 사용되고 있는 TPC-C 벤치마크를 사용하며 모의 입력(Synthetic workload)을 통한 성능분석을 수행하였다. 본 연구는 입출력노드에 부하가 많이 걸릴 경우 패킷의 크기에 따라 시스템의 성능에 큰 영향을 미치며, 반면에 입출력 노드내의 상호연결망의 접속(Interface)을 제공하는 XNIF의 데이터 버퍼 개수의 증가는 시스템의 성능 향상에 기여를 하지 않음을 보여준다. 이는 시스템의 성능향상을 위해서는 패킷 전송 경로상의 모든 시스템 요소의 성능 향상이 병행되어야 함을 보여준다. 마지막으로 프로세싱노드와 입출력노드의 처리능력의 균형이 병렬 트랜잭션 시스템의 설계에 있어서 매우 중요함을 보여준다.

  • PDF

IP계층에서의 VPN 전송성능에 관한 연구 (Secure VPN Performance in TP Layers)

  • 임형진;정태명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.717-720
    • /
    • 2001
  • 본 논문에서는 IPSec을 리눅스에서 구현하여 AH, ESP 프로토콜 사용시 노드간 성능을 측정하여 네트웍에서의 보안성능대 처리성능에 대하여 분석하였다. IPSec VPN은 노드간 호스트간 정보보호와 안전한 응용에 대하여 IP계층에서 구현된 보호서비스를 이용할 수 있게 하지만 IPSec에서 사용하는 AH와 ESP에서의 인증데이터의 계산 및 비교, 암호화와 복호화에 의하여 IP프로토콜의 처리비용 및 통신에 대한 잠재비용이 증가하게 된다. 이에 각 프로토콜에서 전송데이타 크기의 점진적 변경에 따라 커널에서 IPSec모듈내 처리 시간과 전체 데이터의 처리시간을 측정하여 보았다. 데이터 전송 크기가 증가함에 따라 Non IPSec 전송에 비하여 IPSsec 전송시 처리지연 시간의 차는 증대되었다. 본 논문에서는 이러한 성능차이를 야기하는 인자들을 평가하여 향후 기존 네트웍에 VPN도입시 성능대 보안에서의 정책 결정의 기반이 될 수 있는 분석을 제시하고 있다.

  • PDF

빅데이터 환경에서 메모리 캐싱을 활용한 Presto 아키텍처 제안 (Presto Architecture Proposal Using Memory Caching in Big Data Environment)

  • 황선희;김태원;신민규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.89-92
    • /
    • 2019
  • 빅데이터 환경에서 대화형 분석 질의문을 수행하려는 요구사항이 늘어나면서 데이터 처리속도가 중요한 성능 지표가 되었다. 이에 Presto 는 많은 빅데이터 처리 엔진 중 메모리 기반으로 빠른 질의 처리가 가능하여 널리 사용되어 왔다. 하지만 메모리 처리 엔진인 Presto 도 디스크 기반의 저장소를 사용한 일부 경우에 성능 저하 현상이 보고되었다. 그래서 본 논문은 빅데이터 처리 성능 향상을 위해 Presto Memory Connector 를 사용하여 메모리 캐싱을 활용한 아키텍처를 제안한다. 그 과정에서 캐싱과 비 캐싱 환경에서 성능검증을 위한 데이터 처리 성능 실험을 수행하였고, 그 결과 향상된 성능을 제공할 수 있음을 확인하였다. 이를 통해 빅데이터 분산환경에서 캐싱을 활용하여 Presto 아키텍처를 설계하는데 근거를 제공하고자 한다.

이동 데이터베이스체계에서 거래처리 기법의 성능 (Performance of Transaction Processing Schemes in Mobile Database Systems)

  • 최용구
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.70-79
    • /
    • 1999
  • 이동 데이터베이스 체계에서 거래처리 기법은 정적 조정자에 의한 거래처리와 조정자 이주에 의한 거래처리 기법이 있다. 조정자 이주에 의한 거래처리 기법은 거래서비스 통화채널 변경이 이루어졌을 경우에 새로운 데이터베이스 서버에서 그 거래를 계속 처리해야한다는 조정자 이주 원리를 적용하는 것이고 조정자 정착에 의한 거래처리 기법은 거래서비스 통화채널 변경이 이루어졌을 경우라 할 지라도 그 거래를 시작한 데이터베이스 서버에 의하여 처리해야 한다는 정적 조정자 원리를 적용하는 것이다. 본 논문에서 이동 거래처리 기법들의 공정한 성능 비교연구를 위하여 기법들과 독립적인 성능모델을 개발하였다. 그리고 이동 거래처리 기법의 성능 모델을 자세히 설명하였고 성능평가의 신뢰성을 위하여 얻어진 모의실험 결과를 자세히 설명하였다. 결국, 이동 거래처리 기법들은 데이터베이스 서버에서 거래처리를 위한 메시지 이동을 최소화함으로서 시스템 성능을 향상시킬 수 있다.

  • PDF

가상화 환경에서 GPU 성능의 향상을 위한 장치 가상화 프레임워크 (Device Virtualization Frameworks for Accelerating GPU Performance on Virtual Environments)

  • 주영현;이동우;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.86-87
    • /
    • 2013
  • 최근 가상화 기술에 대한 많은 관심과 연구들로 인해 가상 머신은 물리(Native) 머신에 가까운 성능을 보이며 프로세서 및 메모리 자원을 제공하고 있다. 하지만 GPU 와 같은 그래픽 하드웨어에 대한 장치 가상화는 다른 가상화 기법에 비해 연구가 미흡한 상태로 가상화 환경에서의 영상처리에 걸림돌이 되고 있다. 가상화 환경에서의 영상처리는 기존의 X 윈도우 시스템을 이용하여 영상을 처리하는데, 이는 2D 영상처리에 최적화 되어 있어서 3D 영상을 처리하는데 성능의 한계 보일 뿐만 아니라 가상 머신에서 메모리가 중복으로 복사되면서 낮은 성능 보여주고 있다. 제안하는 장치 가상화 프레임워크는 기존의 메모리의 중복 복사를 제거하면서 성능을 향상 시킬 수 있다. 본 논문에서는 가상화 환경에서 GPU 성능 향상을 위한 장치 가상화 프레임워크를 제안하고 평가를 통해 본 기법의 타당성을 입증한다.