• Title/Summary/Keyword: 멀티코어

Search Result 413, Processing Time 0.027 seconds

Technology Trends of Runtime Systems to Realize High Performance Computing (고성능 컴퓨팅을 실현하는 런타임 시스템 기술 동향)

  • Kim, J.M.;Lee, J.J.;Choi, W.
    • Electronics and Telecommunications Trends
    • /
    • v.27 no.6
    • /
    • pp.124-133
    • /
    • 2012
  • 최근 산업의 발전으로 대규모 문제 해결의 요구가 커지고 사용자가 원하는 서비스를 신속하게 받고자 고성능 컴퓨팅에 대한 요구가 계속해서 증가하고 있다. 이에 따라 멀티코어 및 매니코어와 이종 하드웨어의 혼용 등으로 지속해서 발전하는 새로운 고성능 컴퓨팅을 위한 시스템은 컴퓨팅 패러다임을 바꿀 시스템 소프트웨어의 혁신 요소로 등장하였다. 하드웨어를 활용하여 시스템의 성능을 높이기 위해서는 컴퓨팅 요소 간의 통신을 최소화하여 전력 소모를 줄이고, 메모리 계층 구조 및 지역성을 고려하여 성능을 높이는 것이 필요하다. 특히, 응용의 실행 시에 시스템 자원을 최고로 활용할 수 있게 하여 성능을 높이는 런타임 시스템은 하드웨어 및 운영체제를 변경하지 않고 시스템 자원을 최대한 활용하여 성능 최적화를 이룰 수 있는 기술이다. 따라서 본고에서는 런타임 시스템의 기능과 기술 방향을 파악하여 차세대 런타임 시스템에 필요한 기술 및 연구 분야를 전망하고자 한다.

  • PDF

A Study on GPGPU Performance for the Configurations of Threads (GPGPU에서 쓰레드 구성을 위한 성능에 관한 연구)

  • Kim, Hyun Kyu;Lee, Hyo Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.146-148
    • /
    • 2012
  • 최근 GPGPU를 활용한 병렬처리가 각광을 받고 있는 가운데 GPU의 구조적 특성인 매니코어(many core)기반에서 쓰레드(thread)의 구성이 성능에 얼마나 영향을 미치는지에 관해 수치적 해답을 얻고자 하였다. 이는 멀티코어 (multi core)기반으로 작성된 프로그램을 GPGPU로 변환하는 과정에서 쓰레드의 최대활용도를 빠르게 추측 할 수 있도록 도움을 얻고자 하는데 일차적인 목적이 있다. 현재 GPGPU의 쓰레드 구성은 입력되는 데이터의 양을 고려하여 충분한 테스트를 거쳐 경험적인 최적화 수를 지정해 주워야 한다. 이번 연구를 통해 GPGPU로 변환하는 과정에서 최적의 쓰레드 수구성 방법을 추측 할 수 있으며 더 나아가 동적으로 최적의 수를 구할 수 있도록 하는데 목적이 있다.

A Study on Creative Learning Method Using Intelligent Robot Simulation (지능로봇 시뮬레이션을 이용한 창의적 학습방법 연구)

  • Lee, Yong-Soo;Hong, Seong-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.267-268
    • /
    • 2009
  • 많은 컴퓨터들이 기존의 단일코어 컴퓨터에서 벗어나 멀티코어를 장착한 컴퓨터로 변화하는 과정에서 기존의 단일 스레드 프로그래밍에서 다중처리가 중요해지는 세상이 되었다. 이러한 다중처리는 지능로봇 시뮬레이션 교육에 창의적 학습방법을 아주 잘 지원하고 있다. 지능로봇의 형태나 모형 그리고 센서 융합분야에서 동시처리는 중요한 역할을 하고 있다. 본 논문에서는 다중처리 기반 지능로봇 시뮬레이션 환경을 통해 창의적 학습방법에 관한 연구를 제안한다. 무한한 상상력과 창의성을 발휘하여 지능로봇의 모형 설계부터 직접 인공지능 프로그램까지 구현할 수 있는 방법을 소개한다.

Accelerating 2D DCT in Multi-core and Many-core Environments (멀티코어와 매니코어 환경에서의 2 차원 DCT 가속)

  • Hong, Jin-Gun;Jung, Sung-Wook;Kim, Cheong-Ghil;Burgstaller, Bernd
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.250-253
    • /
    • 2011
  • Chip manufacture nowadays turned their attention from accelerating uniprocessors to integrating multiple cores on a chip. Moreover desktop graphic hardware is now starting to support general purpose computation. Desktop users are able to use multi-core CPU and GPU as a high performance computing resources these days. However exploiting parallel computing resources are still challenging because of lack of higher programming abstraction for parallel programming. The 2-dimensional discrete cosine transform (2D-DCT) algorithms are most computational intensive part of JPEG encoding. There are many fast 2D-DCT algorithms already studied. We implemented several algorithms and estimated its runtime on multi-core CPU and GPU environments. Experiments show that data parallelism can be fully exploited on CPU and GPU architecture. We expect parallelized DCT bring performance benefit towards its applications such as JPEG and MPEG.

A Problem Analysis of Layer-based Methods using Convex Hulls (Convex hull 을 사용하는 layer 기반 방법의 문제점 분석)

  • Lee, Ki-Eun;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1240-1242
    • /
    • 2011
  • 인터넷의 발달로 데이터의 양이 기하급수적으로 증가함에 따라 대용량 데이터를 효율적으로 검색하는 top k 질의 처리의 중요성이 커지고 있다. top k 는 릴레이션에서 가장 높은 (또는 가장 낮은) 스코어를 가지는 k 개의 튜플을 반환하는 방법으로, 스코어는 사용자가 정의한 스코어링 함수를 통해 계산된다. 효율적인 top k 질의 처리를 위해서는 전체 데이터 집합 중 최소한의 서브집합만 읽어서 k 개의 결과를 구할 수 있어야 한다. 이를 위해 기존 연구들은 다양한 방법의 인덱스 생성방법을 제안했다. 본 논문에서는 그 중에서 convex hull 을 사용하여 layer list 를 생성하는 기존 연구를 조사하고 문제점을 도출한다. 기존 연구 문제점 분석은 향후 연구인 스카이라인을 사용하는 top k 질의 처리 연구의 기반이 될 것으로 예상한다.

Incremental Deployment for Multicast Using Extended PIM-SM in the Internet (인터넷에서 확장된 PIM-SM을 통한 점진적인 멀티캐스트 적용방안)

  • 김인경;홍형섭;김상하
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.298-300
    • /
    • 2002
  • 현재 제안되고 있는 멀티캐스트 메커니즘들은 서비스 제공을 위해 경로상의 모든 라우터에서 특정 멀티캐스트 라우팅 프로토콜을 탑재하여야만 한다. 특히, 코어망에 멀티캐스트 라우팅 프로토콜을 탑재하는 경우는 확장성 문제를 야기함으로 현실적으로 많은 어려움이 있다. 따라서, 멀티캐스트를 현재 망에 적용하기 위한 점진적인 구현 방법이 필요하다. 즉, 모든 라우터에서 멀티캐스트 라우팅 프로토콜을 탑재하지 않더라도 서비스가 가능하도록 접근해 나가는 방안이 필요하다. 이를 위하여 본 논문에서는, 멀티캐스트 라우팅 프로토콜의 트리 구성을 위한 제어 메시지의 간단한 확장을 통해서 실제 망에 점진적인 적용을 가능하도록 하는 메커니즘을 제안하고자 한다. 제안된 메커니즘은 PM-SM 프로토콜을 기반으로 점진적인 적용이 가능하다. PIM-SM + 프로토콜은 PM-SM 프로토콜의 제어 측면의 확장과 터널링 메커니즘을 기반으로 한다. 즉, PM-SM이 탑재되지 않은 라우터에서는 유니캐스트 기반 라우팅을 수행하고, PIM-SM이 탑재된 라우터에서는 멀티캐스트 기반 라우팅을 수행한다.

  • PDF

2007 주목할 10대 기술

  • Korean Associaton of Information & Telecommunication
    • 정보화사회
    • /
    • s.184
    • /
    • pp.28-39
    • /
    • 2007
  • IT산업은 항상 끊임없는 '혁신'을 통해서만 성장의 자양분을 얻는다. 기술적 또는 개념적 진보가 없다면 IT산업은 당연히 산업으로서의 존재가치가 없다. 그렇다면 2007년, 한국의 IT시장을 주도할 '10대 핵심 IT기술'들은 어떤 것들일까. 국내 통신 및 네트워크, 솔루션 업계가 가장 관심 있게 지켜보는 IT기술등 중 10개를 선별했다. 10대 IT기술에 포함된 것들 중에는 개념적으로는 10년전부터 출현해 알려져 있지만, 그동안 단순히 개념에 머물렀을 뿐 아직 상용화가 안 된 것들도 일부 포함돼 있다. 참신성보다는 실질적인 의미와 중요성에 무게들 둔 때문이다. 2007년에 주목할 만한 10대 IT기술로는 먼저 'IP 멀티미디어 서브시스템(IMS)이 꼽힌다. 유무선을 비롯한 다양한 네트워크를 자연스럽게 연결해주고 여러 서비스들의 다양한 조합이 가능해 고객맞춤형서비스를 가능하게 하는 '멀티미디어 멀티캐스트 컨트롤(MMC)도 10대 IT기술에 포함됐다. 이와 함께 100Mbps 초고속 인터넷 서비스를 가능하게 하는 ETTH (Ethernet To The Home), 차세대 보안이슈인 네트워크접근제어(NAC), 금융회사나 이동통신회사의 상품개발을 신속하게 지원하는 '프로덕트 팩토리', 하드웨어시스템의 최적화를 보장한 가상화 및 ILM, 컴퓨팅산업을 한 단계 이상 진화시킬 쿼드코어 CPU, 소프트웨어 시장의 새로운 패러다임인 SOA(서비스지향아키텍처), 본격적인 시장 확산이 기대되는 전자태그(RFID), IT거버넌스의 열기로 급부상하고 있는 ITAM(IT자산관리) 등도 올해 주목할 10대 IT기술 반열에 올랐다.

  • PDF

VDI Performance Optimization with Hybrid Parallel Processing in Thick Client System under Heterogeneous Multi-Core Environment (Heterogeneous 멀티 코어 환경의 Thick Client에서 VDI 성능 최적화를 위한 혼합 병렬 처리 기법 연구)

  • Kim, Myeong-Seob;Huh, Eui-Nam
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38B no.3
    • /
    • pp.163-171
    • /
    • 2013
  • Recently, the requirement of processing High Definition (HD) video or 3D application on low, mobile devices has been expanded and content data has been increased as well. It is becoming a major issue in Cloud computing where a Virtual Desktop Infrastructure (VDI) Service needs efficient data processing ability to provide Quality of Experience (QoE) in Cloud computing. In this paper, we propose three kind of Thick-Thin VDI Service which can share and delegate VDI service based on Thick Client using CPU and GPU. Furthermore, we propose and discuss the VDI Service Optimization Method in mixed CPU and GPU Heterogeneous Environment using CPU Parallel Processing OpenMP and GPU Parallel Processing CUDA.

A Study on the Scalability of Multi-core-PC Cluster for Seismic Design of Reinforced-Concrete Structures based on Genetic Algorithm (유전알고리즘 기반 콘크리트 구조물의 최적화 설계를 위한 멀티코어 퍼스널 컴퓨터 클러스터의 확장 가능성 연구)

  • Park, Keunhyoung;Choi, Se Woon;Kim, Yousok;Park, Hyo Seon
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.26 no.4
    • /
    • pp.275-281
    • /
    • 2013
  • In this paper, determination of the scalability of the cluster composed common personal computer was performed when optimization of reinforced concrete structure using genetic algorithm. The goal of this research is watching the potential of multi-core-PC cluster for optimization of seismic design of reinforced-concrete structures. By increasing the number of core-processer of cluster, decreasing of computation time per each generation of genetic algorithm was observed. After classifying the components in singular personal computer, the estimation of the expected bottle-neck phenomenon and comparison with wall-clock time and Amdahl's law equation was performed. So we could obseved the scalability of the cluster appear complex tendency. For separating the bottle-neck phenomenon of physical and algorithm, the different size of population was selected for genetic algorithm cases. When using 64 core-processor, the efficiency of cluster is low as 31.2% compared with Amdahl's law efficiency.

Multiple Signature Comparison of LogTM-SE for Fast Conflict Detection (다중 시그니처 비교를 통한 트랜잭셔널 메모리의 충돌해소 정책의 성능향상)

  • Kim, Deok-Ho;Oh, Doo-Hwan;Ro, Won-W.
    • The KIPS Transactions:PartA
    • /
    • v.18A no.1
    • /
    • pp.19-24
    • /
    • 2011
  • As era of multi-core processors has arrived, transactional memory has been considered as an effective method to achieve easy and fast multi-threaded programming. Various hardware transactional memory systems such as UTM, VTM, FastTM, LogTM, and LogTM-SE, have been introduced in order to implement high-performance multi-core processors. Especially, LogTM-SE has provided study performance with an efficient memory management policy and a practical thread scheduling method through conflict detection based on signatures. However, increasing number of cores on a processor imposes the hardware complexity for signature processing. This causes overall performance degradation due to the heavy workload on signature comparison. In this paper, we propose a new architecture of multiple signature comparison to improve conflict detection of signature based transactional memory systems.