• 제목/요약/키워드: 멀티코어

검색결과 415건 처리시간 0.036초

고성능 컴퓨팅을 실현하는 런타임 시스템 기술 동향 (Technology Trends of Runtime Systems to Realize High Performance Computing)

  • 김진미;이재진;최완
    • 전자통신동향분석
    • /
    • 제27권6호
    • /
    • pp.124-133
    • /
    • 2012
  • 최근 산업의 발전으로 대규모 문제 해결의 요구가 커지고 사용자가 원하는 서비스를 신속하게 받고자 고성능 컴퓨팅에 대한 요구가 계속해서 증가하고 있다. 이에 따라 멀티코어 및 매니코어와 이종 하드웨어의 혼용 등으로 지속해서 발전하는 새로운 고성능 컴퓨팅을 위한 시스템은 컴퓨팅 패러다임을 바꿀 시스템 소프트웨어의 혁신 요소로 등장하였다. 하드웨어를 활용하여 시스템의 성능을 높이기 위해서는 컴퓨팅 요소 간의 통신을 최소화하여 전력 소모를 줄이고, 메모리 계층 구조 및 지역성을 고려하여 성능을 높이는 것이 필요하다. 특히, 응용의 실행 시에 시스템 자원을 최고로 활용할 수 있게 하여 성능을 높이는 런타임 시스템은 하드웨어 및 운영체제를 변경하지 않고 시스템 자원을 최대한 활용하여 성능 최적화를 이룰 수 있는 기술이다. 따라서 본고에서는 런타임 시스템의 기능과 기술 방향을 파악하여 차세대 런타임 시스템에 필요한 기술 및 연구 분야를 전망하고자 한다.

  • PDF

GPGPU에서 쓰레드 구성을 위한 성능에 관한 연구 (A Study on GPGPU Performance for the Configurations of Threads)

  • 김현규;이효종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.146-148
    • /
    • 2012
  • 최근 GPGPU를 활용한 병렬처리가 각광을 받고 있는 가운데 GPU의 구조적 특성인 매니코어(many core)기반에서 쓰레드(thread)의 구성이 성능에 얼마나 영향을 미치는지에 관해 수치적 해답을 얻고자 하였다. 이는 멀티코어 (multi core)기반으로 작성된 프로그램을 GPGPU로 변환하는 과정에서 쓰레드의 최대활용도를 빠르게 추측 할 수 있도록 도움을 얻고자 하는데 일차적인 목적이 있다. 현재 GPGPU의 쓰레드 구성은 입력되는 데이터의 양을 고려하여 충분한 테스트를 거쳐 경험적인 최적화 수를 지정해 주워야 한다. 이번 연구를 통해 GPGPU로 변환하는 과정에서 최적의 쓰레드 수구성 방법을 추측 할 수 있으며 더 나아가 동적으로 최적의 수를 구할 수 있도록 하는데 목적이 있다.

지능로봇 시뮬레이션을 이용한 창의적 학습방법 연구 (A Study on Creative Learning Method Using Intelligent Robot Simulation)

  • 이용수;홍성용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.267-268
    • /
    • 2009
  • 많은 컴퓨터들이 기존의 단일코어 컴퓨터에서 벗어나 멀티코어를 장착한 컴퓨터로 변화하는 과정에서 기존의 단일 스레드 프로그래밍에서 다중처리가 중요해지는 세상이 되었다. 이러한 다중처리는 지능로봇 시뮬레이션 교육에 창의적 학습방법을 아주 잘 지원하고 있다. 지능로봇의 형태나 모형 그리고 센서 융합분야에서 동시처리는 중요한 역할을 하고 있다. 본 논문에서는 다중처리 기반 지능로봇 시뮬레이션 환경을 통해 창의적 학습방법에 관한 연구를 제안한다. 무한한 상상력과 창의성을 발휘하여 지능로봇의 모형 설계부터 직접 인공지능 프로그램까지 구현할 수 있는 방법을 소개한다.

멀티코어와 매니코어 환경에서의 2 차원 DCT 가속 (Accelerating 2D DCT in Multi-core and Many-core Environments)

  • 홍진건;정성욱;김정길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.250-253
    • /
    • 2011
  • Chip manufacture nowadays turned their attention from accelerating uniprocessors to integrating multiple cores on a chip. Moreover desktop graphic hardware is now starting to support general purpose computation. Desktop users are able to use multi-core CPU and GPU as a high performance computing resources these days. However exploiting parallel computing resources are still challenging because of lack of higher programming abstraction for parallel programming. The 2-dimensional discrete cosine transform (2D-DCT) algorithms are most computational intensive part of JPEG encoding. There are many fast 2D-DCT algorithms already studied. We implemented several algorithms and estimated its runtime on multi-core CPU and GPU environments. Experiments show that data parallelism can be fully exploited on CPU and GPU architecture. We expect parallelized DCT bring performance benefit towards its applications such as JPEG and MPEG.

Convex hull 을 사용하는 layer 기반 방법의 문제점 분석 (A Problem Analysis of Layer-based Methods using Convex Hulls)

  • 이기은;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1240-1242
    • /
    • 2011
  • 인터넷의 발달로 데이터의 양이 기하급수적으로 증가함에 따라 대용량 데이터를 효율적으로 검색하는 top k 질의 처리의 중요성이 커지고 있다. top k 는 릴레이션에서 가장 높은 (또는 가장 낮은) 스코어를 가지는 k 개의 튜플을 반환하는 방법으로, 스코어는 사용자가 정의한 스코어링 함수를 통해 계산된다. 효율적인 top k 질의 처리를 위해서는 전체 데이터 집합 중 최소한의 서브집합만 읽어서 k 개의 결과를 구할 수 있어야 한다. 이를 위해 기존 연구들은 다양한 방법의 인덱스 생성방법을 제안했다. 본 논문에서는 그 중에서 convex hull 을 사용하여 layer list 를 생성하는 기존 연구를 조사하고 문제점을 도출한다. 기존 연구 문제점 분석은 향후 연구인 스카이라인을 사용하는 top k 질의 처리 연구의 기반이 될 것으로 예상한다.

인터넷에서 확장된 PIM-SM을 통한 점진적인 멀티캐스트 적용방안 (Incremental Deployment for Multicast Using Extended PIM-SM in the Internet)

  • 김인경;홍형섭;김상하
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.298-300
    • /
    • 2002
  • 현재 제안되고 있는 멀티캐스트 메커니즘들은 서비스 제공을 위해 경로상의 모든 라우터에서 특정 멀티캐스트 라우팅 프로토콜을 탑재하여야만 한다. 특히, 코어망에 멀티캐스트 라우팅 프로토콜을 탑재하는 경우는 확장성 문제를 야기함으로 현실적으로 많은 어려움이 있다. 따라서, 멀티캐스트를 현재 망에 적용하기 위한 점진적인 구현 방법이 필요하다. 즉, 모든 라우터에서 멀티캐스트 라우팅 프로토콜을 탑재하지 않더라도 서비스가 가능하도록 접근해 나가는 방안이 필요하다. 이를 위하여 본 논문에서는, 멀티캐스트 라우팅 프로토콜의 트리 구성을 위한 제어 메시지의 간단한 확장을 통해서 실제 망에 점진적인 적용을 가능하도록 하는 메커니즘을 제안하고자 한다. 제안된 메커니즘은 PM-SM 프로토콜을 기반으로 점진적인 적용이 가능하다. PIM-SM + 프로토콜은 PM-SM 프로토콜의 제어 측면의 확장과 터널링 메커니즘을 기반으로 한다. 즉, PM-SM이 탑재되지 않은 라우터에서는 유니캐스트 기반 라우팅을 수행하고, PIM-SM이 탑재된 라우터에서는 멀티캐스트 기반 라우팅을 수행한다.

  • PDF

2007 주목할 10대 기술

  • 한국정보통신산업협회
    • 정보화사회
    • /
    • 통권184호
    • /
    • pp.28-39
    • /
    • 2007
  • IT산업은 항상 끊임없는 '혁신'을 통해서만 성장의 자양분을 얻는다. 기술적 또는 개념적 진보가 없다면 IT산업은 당연히 산업으로서의 존재가치가 없다. 그렇다면 2007년, 한국의 IT시장을 주도할 '10대 핵심 IT기술'들은 어떤 것들일까. 국내 통신 및 네트워크, 솔루션 업계가 가장 관심 있게 지켜보는 IT기술등 중 10개를 선별했다. 10대 IT기술에 포함된 것들 중에는 개념적으로는 10년전부터 출현해 알려져 있지만, 그동안 단순히 개념에 머물렀을 뿐 아직 상용화가 안 된 것들도 일부 포함돼 있다. 참신성보다는 실질적인 의미와 중요성에 무게들 둔 때문이다. 2007년에 주목할 만한 10대 IT기술로는 먼저 'IP 멀티미디어 서브시스템(IMS)이 꼽힌다. 유무선을 비롯한 다양한 네트워크를 자연스럽게 연결해주고 여러 서비스들의 다양한 조합이 가능해 고객맞춤형서비스를 가능하게 하는 '멀티미디어 멀티캐스트 컨트롤(MMC)도 10대 IT기술에 포함됐다. 이와 함께 100Mbps 초고속 인터넷 서비스를 가능하게 하는 ETTH (Ethernet To The Home), 차세대 보안이슈인 네트워크접근제어(NAC), 금융회사나 이동통신회사의 상품개발을 신속하게 지원하는 '프로덕트 팩토리', 하드웨어시스템의 최적화를 보장한 가상화 및 ILM, 컴퓨팅산업을 한 단계 이상 진화시킬 쿼드코어 CPU, 소프트웨어 시장의 새로운 패러다임인 SOA(서비스지향아키텍처), 본격적인 시장 확산이 기대되는 전자태그(RFID), IT거버넌스의 열기로 급부상하고 있는 ITAM(IT자산관리) 등도 올해 주목할 10대 IT기술 반열에 올랐다.

  • PDF

Heterogeneous 멀티 코어 환경의 Thick Client에서 VDI 성능 최적화를 위한 혼합 병렬 처리 기법 연구 (VDI Performance Optimization with Hybrid Parallel Processing in Thick Client System under Heterogeneous Multi-Core Environment)

  • 김명섭;허의남
    • 한국통신학회논문지
    • /
    • 제38B권3호
    • /
    • pp.163-171
    • /
    • 2013
  • 최근 HD급 동영상이나 3D 어플리케이션과 같은 이전보다 저사양, 모바일 단말에서는 구동하기 힘든 프로그램들에 대한 이용 요구가 확대되면서 처리해야 할 콘텐츠 데이터들이 고용량화 되고 있다. 클라우드 기반의 VDI(Virtual Desktop Infrastructure) 서비스는 이를 처리하기 위해 효율적인 데이터 처리 능력이 필요해졌으며 QoE(Quality of Experience) 보장을 위한 성능 개선 연구가 이슈가 되고 있다. 본 논문에서는 H/W 성능이 향상되어 CPU와 GPU를 탑재한 Thick Client기반의 3가지 Thick-Thin간 VDI 자원 공유 및 위임이 가능한 VDI 서비스에 대해 제안하며, VDI 서비스 성능의 개선을 위해 CPU와 GPU가 혼합된 Heterogeneous 멀티코어 환경에서 CPU와 GPU 병렬 처리 기법인 OpenMP와 CUDA를 활용하여 VDI 서비스 최적화 방안을 제안하고 기존의 VDI와 비교한 성능을 거론한다.

유전알고리즘 기반 콘크리트 구조물의 최적화 설계를 위한 멀티코어 퍼스널 컴퓨터 클러스터의 확장 가능성 연구 (A Study on the Scalability of Multi-core-PC Cluster for Seismic Design of Reinforced-Concrete Structures based on Genetic Algorithm)

  • 박근형;최세운;김유석;박효선
    • 한국전산구조공학회논문집
    • /
    • 제26권4호
    • /
    • pp.275-281
    • /
    • 2013
  • 본 논문에서는 유전알고리즘을 사용하여 철근콘크리트 구조물의 최적 지진설계를 효율적으로 수행하기 위해 클러스터를 사용하는 경우 확장성을 확인하였다. 클러스터를 구성하는 코어프로세서의 개수를 증가시키면서 유전알고리즘의 각 세대에 소요되는 시간의 감소를 관찰하였다. 단일 퍼스널 컴퓨터의 구성을 분류한 후, wall-clock time과 암달의 법칙으로 예상된 값을 비교하여 예상되었던 병목현상을 확인하였다. 이에 클러스터의 확장성에서 복합적인 요인에 의한 경향을 확인할 수 있었다. 병목현상의 물리적인 요인과 알고리즘 측면에서의 요인을 구분하기 위해 유전알고리즘의 개채수를 나누어 실험을 수행하여 결과를 확인하였다.

다중 시그니처 비교를 통한 트랜잭셔널 메모리의 충돌해소 정책의 성능향상 (Multiple Signature Comparison of LogTM-SE for Fast Conflict Detection)

  • 김덕호;오두환;노원우
    • 정보처리학회논문지A
    • /
    • 제18A권1호
    • /
    • pp.19-24
    • /
    • 2011
  • 다중 코어 프로세서가 널리 보급되면서 멀티 쓰레디드 프로그램 상의 동기화를 용이하게 구현할 수 있는 해결 방안으로 트랜잭셔널 메모리가 각광을 받고 있다. 이를 위해 고성능의 하드웨어 트랜잭셔널 메모리에 관한 연구가 활발히 진행되고 있으며, 대표적인 연구결과로 UTM, VTM, FastTM, LogTM, LogTM-SE 등이 소개되었다. 특히, 충돌 감지 정책으로 시그니처를 사용한 LogTM-SE는 효율적인 메모리 관리와 쓰레드 스케쥴링을 통해 고성능의 트랜잭셔널 메모리를 구현하였다. 하지만, 이 방식은 프로세서 내부의 코어 수가 증가하는 것에 비례하여 한 코어가 비교해야 하는 시그니처의 수가 증가하는 문제점을 갖고 있다. 이는 시그니처 처리 과정에서 병목현상을 야기하여 전체 성능을 저해하는 요인이 될 수 있다. 본 논문에서는 시그니처 비교 과정에서 나타날 수 있는 이러한 병목 현상을 개선하여 전체 트랜잭셔널 메모리의 성능 향상을 이루고자 다중 시그니처 비교 방식의 새로운 구조를 제안한다.