• 제목/요약/키워드: 멀티코어 구조

검색결과 136건 처리시간 0.045초

특이치 분해를 위한 최적의 2차원 멀티코어 시스템 탐색 (Exploration of an Optimal Two-Dimensional Multi-Core System for Singular Value Decomposition)

  • 박용훈;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.21-31
    • /
    • 2014
  • 특이치 분해는 다양한 분야의 데이터 집단에서 고유한 특성을 찾는 특징 추출 분야에 많이 활용되고 있다. 하지만 특이치 분해의 복잡 행렬 연산은 많은 연산 시간을 요구한다. 본 논문에서는 특이치 분해의 대표적인 알고리즘인 one-sided block Jacobi를 고속 처리하기 위해 2차원 멀티코어 시스템을 이용하여 효율적으로 병렬 구현하고 성능을 향상시킨다. 또한, one-sided block Jacobi 알고리즘의 다양한 행렬 ($128{\times}128$, $64{\times}64$, $32{\times}32$, $16{\times}16$)을 서로 다른 2차원 PE 구조에 구현하고 성능 및 에너지를 분석함으로써 각 행렬에 대한 최적의 멀티코어 구조를 탐색한다. 더불어 동일한 행렬의 one-sided block Jacobi 알고리즘에 대해 선택된 멀티코어 구조와 상용 고성능 그래픽스 프로세싱 유닛 (GPU)과의 성능 비교를 통해 제안한 2차원 멀티코어 방법의 잠재 가능성을 확인한다.

임베디드 기기를 위한 이기종 멀티코어 프로세서 및 소프트웨어 기술 동향 (Heterogeneous Multi-Core Processor and Software Technology Trend for Embedded Devices)

  • 나갑주;백웅기;정영준
    • 전자통신동향분석
    • /
    • 제28권2호
    • /
    • pp.1-10
    • /
    • 2013
  • 1980년대와 1990년대가 서버와 데스크톱 중심 컴퓨팅의 시대였다고 한다면 2000년대 들어 모바일 분야를 포함하는 임베디드 프로세서 시장이 급격히 확장되며 임베디드 중심 시대로 산업구조가 재편되고 있다. 그리고, 2010년대에는 임베디드 프로세서 시장이 더욱 확대되고 기술도 더불어 발전되고 있는데, 최근 기술을 주도하고 있는 뜨거운 용어 중의 하나가 이기종 멀티코어 컴퓨팅이라 할 수 있다. 시장이 요구하는 고성능 컴퓨팅을 수용하고 임베디드 기기의 특성상 저전력을 실현해야 하는 현실적 문제를 해결하기 위한 이기종 멀티코어 하드웨어가 임베디드 기기에도 적용을 앞다투고 있는 상황이며, 적절한 응용 콘텐츠에 맞춰 이기종 멀티코어 하드웨어를 활용하기 위한 소프트웨어에 대한 관심과 발전도 발 맞춰 진행되고 있다. 이에 본고에서는 임베디드 기기 분야에 한정하여 이기종 멀티코어 하드웨어와 소프트웨어의 기술 동향을 살펴보고자 한다.

  • PDF

멀티미디어 응용을 위한 재구성가능 프로세서 설계 (Design of Reconfigurable Processor for Multimedia Application)

  • 박진국;곽기영;이범근;이두영;정연모
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.609-612
    • /
    • 2002
  • 본 논문은 다양한 멀티미디어 응용을 위한 재구성가능(reconfigurable) 구조의 프로세서 설계에 대해서 연구하였다. 설계된 프로세서는 RISC 코어 프로세서와 코스-그레인(coarse-grain) 구조의 재구성가능 셀들의 배열로 이루어진 처리 유닛으로 구성되었다. 여기서 사용된 RISC 코어 프로세서는 하드웨어 구조를 간단히 하기 위하여 MIPS 명령어들 중에서 사용빈도가 높은 것들만 고려하였으며, 재구성가능 처리를 위한 별도의 명령어를 추가하였다. 본 논문에서 제시한 재구성가능 프로세서는 VHDL로 모델링하여 실행을 검증하였으며, 하드웨어의 유연성을 증가하여 다양한 멀티미디어 응용에 적용함과 아울러 속도향상에 기여함을 볼 수 있었다.

  • PDF

링 연결구조 기반의 멀티코어 프로세서를 위한 캐시 일관성 유지 기법 (An Efficient Cache Coherence Protocol for Multi-Core Processors with Ring Interconnects)

  • 박진영;최린
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권8호
    • /
    • pp.768-772
    • /
    • 2008
  • SOC 기술의 발전과 더불어 최근 여러 개의 프로세서를 단일 칩에 집적한 멀티코어 프로세서가 기존 슈퍼스칼라 프로세서 구조에 비하여 보다 에너지 효율적으로 성능을 증가시키는 방안으로 채택되고 있다. 이에 온 칩 프로세서간 캐시 일관성 유지 문제가 시스템의 안정성과 성능에 큰 영향을 미치는 요소로 부각되고 있다. 본 논문에서는 단 방향 링 연결구조의 노드 순서와 데이타 전달 순서를 이용하여 캐시 일관성 유지 요청의 순서를 결정하는 RING-DATA ORDER를 제안하여 기존 GREEDY-ORDER 방식의 단점인 재 요청을 최소화하고 RING-ORDER의 단점인 토큰 관리의 부담을 없애면서 두 방식의 장점을 모두 가지는 캐시 일관성 유지 기법을 제안한다. RING-DATA ORDER는 기존의 공용 버스에 집중되는 일관성 유지 요청을 단 방향 링을 이용하여 각 노드에 골고루 배분함으로써 유효 대역폭을 높이고 데이타 전송 순서에 기반하여 간단하게 처리 순서를 결정할 수 있으므로 멀티코어에 쉽게 적용 가능한 캐시 일관성 유지 기법이다.

스마트 모바일 장치의 에너지 보존성을 높이기 위한 비대칭 멀티 코어 기반 실시간 태스크 스케쥴링 (Real-time Scheduling on Heterogeneous Multi-core Architecture for Energy Conservation of Smart Mobile Devices)

  • 임성화
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1219-1224
    • /
    • 2018
  • 사물인터넷 (Internet of Things)은 우리의 실생활에서 그 범위가 급격히 커지면서, 스마트 모바일 장치들에 대용량 실시간 데이터를 모바일 환경에서 고속으로 처리 및 전송하기에 적합한 처리능력이 요구되고 있다. 배터리 파워가 중요한 모바일 기기에서 성능과 에너지 보존성을 높이기 위해 big.LITTLE 멀티코어 구조와 같은 비대칭 멀티코어 구조가 널리 사용되고 있다. 에너지 보존성을 높이기 위해서는 에너지 효율이 높은 LITTLE 코어의 활용도를 높여하며, 이룰 위해 본 논문에서는 실시간 태스크를 대상으로 하여 마감 시간을 보장하는 범위 내에서 LITTLE 코어에 우선적으로 할당하는 코어 선택 알고리즘을 제안하다. 또한, 시뮬레이션을 통하여 기존 기법에 비해 마감시간을 보장하면서 에너지 소비량을 줄 있 수 있음을 보였다.

무선 ATM 환경에서의 다중코어기반 멀티캐스트 서비스 방안 연구 ($SM^2$A : A Scalable Multiple Core-Based Tree Multicast Architecture for Wired/Wireless ATM Networks)

  • 김원태;박용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.205-207
    • /
    • 1998
  • 본 논문은 유선망에서의 {{{{ {SM}^{ 2}A }}}} 무선 ATM 망으로 확장한 방안의 소개한다. {{{{ {SM}^{ 2}A }}}}는 기본적으로 양방향성 공유트리방식의 CBT(Core Baeed Tree)구조를 갖는다. 각 지역망(Regional Network))은 하나의 통신그룹단위를 형성하여 자체적인 코어스위치를 보유하고 이들 코어가 공붕망을 통해 연결되므로써 결과적으로 다중코어 구조를 갖는다. 한편, 무선 ATM 망에서 멀티캐스트 서비스를 제공은 유선망에서의 멀티캐스트 서비스제공방식과는 몇가지 점에서 차이를 가지며 보다 복잡하다. 즉, 동적 그룹관리, 멀티캐스트 채널의 재설정문제, 멀리캐스트 가입 호스트의 핸드오프(Handoff) 문제들이 해결되어야 하는데. {{{{ {SM}^{ 2}A }}}}에는 위의 다양한 문제들을 해결하였으며 더불어 인터넷 멀티캐스트 서비스를 무선망에서 수용하기 위한 안정적 데이터 전송 메커니즘도 제안한다.

  • PDF

캐쉬 구성에 따른 3차원 쿼드코어 프로세서의 성능 및 온도 분석 (Analysis on the Performance and Temperature of the 3D Quad-core Processor according to Cache Organization)

  • 손동오;안진우;최홍준;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.1-11
    • /
    • 2012
  • 공정기술이 지속적으로 발달함에 따라 멀티코어 프로세서는 성능 향상이라는 장점과 함께 내부 연결망의 긴 지연 시간, 높은 전력 소모, 그리고 발열 현상 등의 문제점들을 내포하고 있다. 이와 같은 2차원 멀티코어 프로세서의 문제점들을 해결하기 위한 방안 중 하나로 3차원 멀티코어 프로세서 구조가 주목을 받고 있다. 3차원 멀티코어 프로세서는 TSV를 이용하여 수직으로 쌓은 여러 개의 레이어들을 연결함으로써 2차원 멀티코어 프로세서와 비교하여 배선 길이를 크게 줄일 수 있다. 하지만, 3차원 멀티코어 프로세서에서는 여러 개의 코어들이 수직으로 적층되므로 전력밀도가 증가하고, 이로 인해 발열문제가 발생하여 높은 냉각 비용과 함께 신뢰성에 부정적인 영향을 유발한다. 따라서 3차원 멀티코어 프로세서를 설계할 때에는 성능과 함께 온도를 반드시 고려하여야 한다. 본 논문에서는 캐쉬 구성에 따른 3차원 쿼드코어 프로세서의 온도를 상세히 분석하고, 이를 기반으로 발열문제를 해결하기 위해저온도 캐쉬 구성 방식을 제안하고자 한다. 실험결과, 명령어 캐쉬는 최고온도가 임계값보다 낮고 데이터 캐쉬는 많은 웨이를 가지는 구성을 적용할 때 최고온도가 임계값보다 높아짐을 알 수 있다. 또한, 본 논문에서 제안하는 캐쉬구성은 쿼드코어 프로세서를 사용하는 3차원 구조에서 캐쉬의 온도 감소에 효과적일 뿐만 아니라 성능 저하 또한 거의 없음을 알 수 있다.

유무선 환경에서의 확장성을 고려한 다중 코어기반 ATM멀티캐스트 서비스 방안연구 ($SM^2$ : A Sealable Multiple Core-Based Tree Multicast Architecture for Wired/Wireless ATM Networks)

  • 김원태;박용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.441-443
    • /
    • 1998
  • 본 논문은 유무선 환경에서 ATM 멀티캐스트 서비스를 제공하기위한 방안으로서{{{{ { SM}^{2 }A }}}} 를 제안한다. 기존의ATM 멀티캐스트 서비스는 ATM자체의 제약으로 멀티캐스트 서비스가 제한적이며 비효율적이다. 한편, ATM의 중용한 응용으로서 인터넷서비스를 심각하게 고려해야하는데 {{{{ { SM}^{2 }A }}}}는 특히 인터넷 서비스를 제공하는데 적합한 구조를 갖도록 설계되었다.{{{{ { SM}^{2 }A }}}}는 기본적으로 양방향성 공유트리방식인 CBT(Core Based Tree)구조를 갖되 각 지역망 (Regional Network)에서 자체적인 코어스위치( Core Switch)를 보유함으로써 결과적으로 다중 코어 구조를 갖는다. 각 지역망을 잇기 위하여 PNNI 프로토콜을 이용하며 PGL(Peer Group Leader)에 가상 루트(Virtual Root) 및 가상 리프(Virtual Leaf)의 개념을 새로 도입한다. 멀티캐스트 통신의 경우 가장 문제되는 것이 셀끼워넣기(Interleaving)문제인데.{{{{ { SM}^{2 }A }}}}에서는 ITU-T표준 ATC(ATM Transfer Capability)인 ABT/IT(ATM Block Transfer/Immediate Transmission)

  • PDF

3차원 구조 멀티코어 프로세서의 분기 예측 기법에 관한 온도 효율성 분석 (Analysis on the Thermal Efficiency of Branch Prediction Techniques in 3D Multicore Processors)

  • 안진우;최홍준;김종면;김철홍
    • 정보처리학회논문지A
    • /
    • 제19A권2호
    • /
    • pp.77-84
    • /
    • 2012
  • 프로세서의 성능을 효율적으로 증가시키기 위한 기법 중 하나로 명령어 수준의 병렬성을 높이는 추론적 수행(Speculative execution)이 사용되고 있다. 추론적 수행 기법의 효율성을 결정하는 가장 중요한 핵심 요소는 분기 예측기의 정확도이다. 하지만, 높은 예측율을 보장하는 복잡한 구조의 분기 예측기를 최근 주목 받고 있는 3차원 구조 멀티코어 프로세서에 적용하는데 있어서는 발열 현상이 큰 장애요소가 될 것으로 예측된다. 본 논문에서는 3차원 구조 멀티코어 프로세서에서 발생할 수 있는 분기 예측기의 높은 발열 문제를 해결하기 위해 두 가지 기법을 제시하고, 이에 대한 효율성을 상세하게 분석하고자 한다. 첫번째 기법은 분기 예측기의 온도가 임계 온도 이상으로 올라가는 경우 분기 예측기의 동작을 일시적으로 정지시키는 동적 온도 관리 기법이고, 두번째 기법은 3차원 구조 멀티코어 프로세서의 각 층 별로 온도를 고려하여 서로 다른 복잡도를 지닌 분기 예측기를 차등 배치하는 기법이다. 두 가지 기법 중에서 복잡도를 고려한 차등 배치 기법은 평균 $87.69^{\circ}C$의 온도를 나타내는 반면, 동적 온도 관리 기법은 평균 $89.64^{\circ}C$의 온도를 나타내었다. 그리고, 각 층에서 발생하는 온도 변화율을 각 기법에 대하여 비교한 결과, 동적 온도 관리 기법의 온도 변화율은 평균 $17.62^{\circ}C$을 나타내었고 복잡도 차등 배치 기법의 온도 변화율은 평균 $11.17^{\circ}C$을 나타내었다. 이러한 온도 분석을 통하여 3차원 멀티코어 프로세서에서 분기 예측기의 온도를 제어하였을 경우, 복잡도 차등 배치 기법을 적용하는 것이 더 효율적임을 알 수 있다. 성능적인 측면을 분석한 결과, 동적 온도 관리 기법은 해당 기법을 적용하지 않았을 경우보다 평균 27.66%의 성능하락을 나타내었지만, 복잡도 차등 배치 기법은 평균 3.61%의 성능 하락만을 나타내었다.

멀티코어 아키텍처에서 안드로이드 부팅속도 향상 방법 (An Improving Method of Android Boot Time in Multi-core Architecture)

  • 최진용;이재흥;김형규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.75-78
    • /
    • 2013
  • 본 연구에서는 멀티코어 기반의 안드로이드 부팅 최적화 방법을 제안하고 있다. 안드로이드 부팅 구간 중 Zygote란 프로세스 초기화 과정 시 가장 많은 연산을 하고 있었으며 Zygote 내부의 4가지 기능 중 preload구간에서 병렬기법을 적용하였다. preload는 어플리케이션의 구동에 필요한 클래스들과 리소스를 순차적으로 가져오는 함수호출 구조로 이 함수호출 구조를 다른 프로세스로 분리시켜 독립적인 연산을 수행하였다. 제안 방법을 S5PV310 듀얼코어와 Exynos4412 쿼드코어에 적용시켰고 각각 14%와 12%의 성능향상 결과를 보였다.