• 제목/요약/키워드: High-performance processor

검색결과 618건 처리시간 0.028초

PCI Express 기반 OpenSHMEM 초기 설계 및 구현 (Design and Implementation of Initial OpenSHMEM Based on PCI Express)

  • 주영웅;최민
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권3호
    • /
    • pp.105-112
    • /
    • 2017
  • PCI Express는 고속, 저전력 등의 특성으로 인하여 프로세서와 주변 I/O 장치들을 연결하는 업계 표준의 버스 기술이다. PCI Express는 최근 고성능 컴퓨터나 클러스터/클라우드 컴퓨팅 등의 분야에서 시스템 인터커넥션 네트워크로서 그 활용가능성을 검증하고 있는 추세이다. PCI Express가 시스템 인터커넥션 네트워크로서 활용가능하게 된 계기는 PCI Express에 NTB(non-transparent bridge) 기술이 도입되면서부터이다. NTB 기술은 물리적으로 두 PCI Express subsystem을 연결가능하도록 하지만, 필요할 경우 논리적인 격리(isolation)를 제공하는 특징이 있다. 또한, PGAS(partitioned global address space)와 같은 공유 주소 공간(shared address space) 프로그래밍 모델은 최근 멀티코어 프로세서의 보편화로 인하여 병렬컴퓨팅 프레임워크로 각광받고 있다. 따라서, 본 논문에서는 차세대 병렬컴퓨팅 플랫폼을 위하여 PCI Express 환경에서 OpenSHMEM을 구현하기 위한 초기 OpenSHMEM API를 설계 및 구현하였다. 본 연구에서 구현한 15가지 OpenSHMEM API의 정확성을 검증하기 위해서 Github의 openshmem-example 벤치마크의 수행을 통하여 확인하였다. 현재 시중에서는 PCI Express 기반 인터커넥션 네트워크는 가격이 매우 비싸고 아직 일반인이 사용하기 용이하도록 NIC형태로 널리 보급되지 않은 실정이다. 이러한 기술개발 초기단계에서 본 연구는 PCI Express 기반 interconnection network를 RDK(evaluation board) 수준에서 실제로 동작하는 실험환경을 구축하고, 여기에 추가로 최근 각광받는 OpenSHMEM software stack를 자체적으로 구현하였다는 데 의의가 있다.

슈퍼스칼라 프로세서에서 정적 및 동적 분류를 사용한 혼합형 결과 값 예측기 (A Hybrid Value Predictor using Static and Dynamic Classification in Superscalar Processors)

  • 김주익;박홍준;조영일
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권10호
    • /
    • pp.569-578
    • /
    • 2003
  • 데이타 종속성은 명령어 수준 병렬성을 향상시키는데 중요한 장애요소가 되고 있으며, 최근 여러 논문에서 데이타 종속을 제거하기 위하여 결과 값을 예상하는 방법이 연구되고 있다. 혼합형 결과 값 예측기는 여러 예측기의 장점을 이용하여 높은 예상 정확도를 얻을 수 있지만, 동일한 명령어가 여러 개의 예측기 테이블에 중복 엔트리를 갖게되어 높은 하드웨어의 비용을 필요로 한다는 단점이 있다. 본 논문에서는 정적 및 동적 분류 정보를 이용하여 높은 성능을 얻을 수 있는 새로운 혼합형 결과 값 예측기를 제안한다. 제안된 예측기는 반입 단계 동안 정적 분류 정보를 사용하여 적절한 예측기에 할당함으로써 테이블 크기를 효과적으로 감소시켰고 예상정확도를 향상시켰다. 또한 제안된 예측기는 동적 분류를 사용하여“Unknown”유형의 명령어에 가장 적절한 예측방법을 선택하도록 하여 예상 정확도를 더욱 향상시켰다. SimpleScaiar/PISA 툴셋과 SPECint95 벤치마크 프로그램에서 시뮬레이션 한 결과, 정적 분류 정보를 사용하였을 경우 평균 예상 정확도가 85.1%, 정적 및 동적 분류 정보를 모두 사용하였을 경우 87.6%의 평균 예상 정확도를 얻을 수 있었다.

ASR 기법을 적용한 임무지향 교전통제 컴퓨터의 신뢰도 분석 (Reliability Analysis of The Mission-Critical Engagement Control Computer Using Active Sparing Redundancy)

  • 신진범;김상하
    • 정보처리학회논문지A
    • /
    • 제15A권6호
    • /
    • pp.309-316
    • /
    • 2008
  • 대공방어용 임무지향 교전통제 컴퓨터는 장시간 동안 임무의 중단없이 방어 임무를 수행하여야 하며, 복잡한 내장형 임무 소프트웨어를 탑재하는 컴퓨터에는 대공방어 임무의 특성상 확실성과 안정성 및 신뢰성을 보장하여야 한다. 구현된 임무지향 교전통제 컴퓨터에서 임무수행의 확실성과 안정성은 4 장의 프로세서로 구성되는 분산 컴퓨터 아키텍처에 의해 보장되며, 신뢰도는 분산 구조의 컴퓨터에 저비용의 능동 예비 이중화(ASR) 고장감내 기법을 적용하여 보장되도록 하였다. 소프트웨어적인 능동 예비 이중화 고장감내 기법은 높은 신뢰도와 신속한 고장복구 성능을 가지는 교전통제 컴퓨터를 저비용으로 구현하므로 대공방어용 컴퓨터에 매우 적합한 기법이다. 본 논문은 능동 예비 이중화 고장감내 기법의 메커니즘과 성능분석에 대해 기술하고, 교전통제 컴퓨터에 ASR 기법과 하드웨어적인 DMR 및 TMR 고장감내 기법을 적용한 경우의 MTBF, 신뢰도, 가용성 및 저비용성을 비교분석하였다. ASR 기법은 72 시간의 임무 시간에 대하여 TMR과 유사한 임무 신뢰도를 제공하며, 저비용의 구현이 가능하므로 교전통제 임무지향 컴퓨터의 고장감내 기법으로 최적인 것으로 분석되었다.

산업용 임베디드 시스템 플랫폼 개발 (Development of Industrial Embedded System Platform)

  • 김대남;김교선
    • 전자공학회논문지CI
    • /
    • 제47권5호
    • /
    • pp.50-60
    • /
    • 2010
  • 지난 반세기 동안 컴퓨터 시스템의 발전으로 개인용 컴퓨터와 소프트웨어 산업은 유래 없는 호황을 누렸다. 21세기에 들어서는 이러한 흐름이 모바일 기기로 점차 이동하면서 임베디드 시스템 시장이 폭발적으로 증가하였다. 휴대전화, 내비게이션 시스템, PMP 등의 휴대용 멀티미디어 기기들은 시장에 쏟아져 나온 반면에 대부분의 산업용 제어시스템은 여전히 단순제어 시스템에 의존하여 제품이 개발되고 있다. 실제로 이를 첨단 하드웨어와 소프트웨어의 기술로 전환하려고 해도 그 수요가 모바일 시장에 비해 낮아 부품수급이 어렵고 가격이 상승하는 문제를 안고 있으며 기술개발 시 발생하는 많은 비용과 인력은 기업 입장에서는 투자 부담이 될 수밖에 없다. 그러나 미래 고객들에게 제품에 대한 기업 이미지를 끌어올리기 위해서는 고성능 시스템의 하드웨어와 소프트웨어 플랫폼 개발이 반드시 필요하다. 본 논문에서는 이러한 문제점들을 해결하기 위해서 네트워크 임베디드 시스템의 최적화된 하드웨어 플랫폼과 소프트웨어 플랫폼을 개발하였다. 개발된 플랫폼은 멀티미디어 기능을 추가하여 고급형 제품을 위한 플랫폼으로 제작하였다. 멀티미디어 기능을 구현하기 위해서 텔레칩스 사의 멀티미디어 프로세서인 TCC8300을 기반으로 개발하였으며 프로세서 내부의 다양한 병렬하드웨어 기능을 이용함으로써 회로상의 부품의 수를 최소화 하고 성능 향상과 더불어 전력소모량을 최소화하였다. 그리고 소프트웨어의 기술비용(로열티)을 없애기 위해서 오픈소스 기반의 운영체제인 임베디드 리눅스와 오픈소스 기반의 그래픽 라이브러리인 TinyX와 GTK+를 이용하여 GUI(Graphic User Interface)를 구현하였다. 또한 개발된 플랫폼을 이용하여 여러 가지 방식의 YUV2RGB 프레임 변환 실험 및 측정을 통해서 성능 및 프레임별 변환 시에 소모되는 전력량을 계산하였고 플랫폼의 각 부분별 동작에 대한 전력소모량 측정을 통해서 플랫폼 구성 시 필요한 전력과 성능을 예측할 수 있도록 하였다. 응용제품을 개발할 때 주어진 기능 및 성능 그리고 저전력 등의 사양이 구현 가능한지 분석하고 절충할 때 사용할 수 있는 모델식을 개발하였고 이를 활용하여 직접 제작해 봄으로써 신뢰성을 입증하였다. 이 때, 하드웨어 부품들은 휴대폰 생산 시에 사용되는 부품들을 사용함으로써 저가의 부품을 안정적으로 수급하여 대량생산을 용이하게 하였다.

사용자 만족도 향상을 위한 지능형 서비스 선정 방안에 관한 연구 : 클라우드 컴퓨팅 서비스에의 적용 (A Study on the Intelligent Service Selection Reasoning for Enhanced User Satisfaction : Appliance to Cloud Computing Service)

  • 신동천
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.35-51
    • /
    • 2012
  • 클라우드 컴퓨팅은 컴퓨팅 자원에 대해 확장 가능한 요구중심의 서비스를 인터넷상에서 제공하는 인터넷 기반의 컴퓨팅이라 할 수 있다. 이러한 환경에서 서비스 사용자가 만족하는 서비스를 선정하여 제공하는 문제는 인터넷과 모바일 기술의 발전에 따라 향후에 다양하고 수많은 클라우드 서비스가 제공되는 경우 매우 중요한 이슈중의 하나가 된다. 과거 연구의 대부분은 요구사항과 연관된 개념의 유사성을 기반으로 하거나 사용자 요구사항의 다양성이 결여되어 있어 사용자의 만족도 향상에 한계를 보이고 있다. 본 논문에서 제안하는 방안은 서비스 만족도 향상을 위해 속성의 개념 유사성 대신에 서비스 속성의 기능적 포함 관계와 규격 등을 기반으로 구성되는 서비스 속성 그래프(Service Attribute Graph : SAG)를 도입하여 사용한다. 뿐만 아니라, 다양한 사용자 선호도를 반영하고 문자, 숫자, 부울린 등 여러 가지 속성 값 유형들을 고려함으로서 서비스 속성의 다양성을 지원한다. 본 논문의 가장 큰 의미는 다른 연구들과 달리 여러 가지 사용자 선호도를 통합적으로 고려하면서 그래프 기반의 선정 방안을 처음으로 제시하고 있다는 점이다.

확장성 및 실시간성을 고려한 실시간 센서 노드 플랫폼의 설계 및 구현 (Design and Implementation of a Scalable Real-Time Sensor Node Platform)

  • 정경훈;김병훈;이동건;김창수;탁성우
    • 한국통신학회논문지
    • /
    • 제32권8B호
    • /
    • pp.509-520
    • /
    • 2007
  • 본 논문에서는 멀티 태스크 기반의 확장성과 주기 및 비주기 태스크 관리 기법을 효율적으로 제공할 수 있는 실시간 센서 노드 플랫폼을 설계하고 구현하였다. 기존의 센서 네트워크 운영체제는 주기 및 비주기 태스크간의 효율적인 스케줄링 기법을 제공하지 않기 때문에 우선순위가 높은 비주기 태스크의 실행 선점으로 인해 주기 태스크의 마감시한을 보장할 수 없다. 이에 본 논문에서 제안한 주기 및 비주기 태스크 관리 기법은 운영체제 수준에서 주기 태스크의 마감시한 보장과 더불어 비주기 태스크의 평균 응답시간을 최소화할 수 있다. 또한 센서 노드 플랫폼에 용이한 확장성을 제공하기 위하여 멀티 태스크 기반의 동적 컴포넌트 실행 환경이 보장되는 센서 노드 플랫폼을 초경량 8비트 마이크로프로세서인 Atmel사의 Atmega128L이 탑재된 센서 보드에서 구현하였다. 구현된 실시간 센서 노드 플랫폼의 동작을 시험한 결과, 주기 태스크의 마감시한 보장을 제공함과 동시에 향상된 비주기 태스크의 평균 응답시간과 효율적인 시스템의 평균 처리기 이용률을 확인할 수 있었다.

병렬프로세서를 이용한 원전 격납건물의 항공기 충돌해석 (Numerical Analysis of Nuclear-Power Plant Subjected to an Aircraft Impact using Parallel Processor)

  • 송유섭;신상섭;정동호;박대효
    • 한국전산구조공학회논문집
    • /
    • 제24권6호
    • /
    • pp.715-722
    • /
    • 2011
  • 본 논문에서는 항공기 충돌에 의한 원전 격납건물의 거동을 병렬해석을 통해 수행하였다. 지금까지의 원전 격납건물에 대한 항공기 충돌관련 연구는 항공기의 경우, Riera의 충격하중-시간함수를 이상화하여 대상 구조체의 일정영역에 대해 충격하중으로 적용하는 방법을 사용해 왔고 충돌대상 구조체의 경우, 단순 철근콘크리트 벽체나 빌딩에 머물러 왔다. 하지만 본 논문에서는 항공기(Boeing-767, http://www.boeing.com)와 가상의 원전 격납건물을 실제와 유사하게 모델링하여 해석을 수행하였으며, 항공기모델은 충돌평가 가이드인 NEI 07-13(2009)에서 허용하는 Riera의 식에 따른 충돌하중이력곡선과 비교하는 방법으로 검증되었다. 또한, 일반적으로 고속 충돌해석은 짧은 시간동안 두 개 이상의 물체가 접촉하고 동적 대변형을 일으키는 비선형성이 강한 문제로 많은 계산시간이 요구되기 때문에 이를 효과적으로 다루기 위해서는 단일 CPU만으로는 한계가 있다. 따라서 본 논문에서는 해석의 효율성을 향상시키기 위해 자체 구축한 리눅스 클러스터 시스템을 이용하여 Message-Passing MIMD 형태의 병렬해석을 수행하였고 병렬성능에 대한 평가를 위해 무근콘크리트(Plain Concrete, PC), 철근콘크리트(Reinforced Concrete, RC), 내부 Liner Plate를 부착한 철근콘크리트(RC with Containment Liner Plate, CLP), SC구조(Steel-Plate Concrete, SC)등 4가지 경우에 대한 수치해석 효율성이 비교 검토되었다.

신경망의 분석을 통한 방향 정보를 내포하는 분기 예측 기법 (Direction-Embedded Branch Prediction based on the Analysis of Neural Network)

  • 곽종욱;김주환;전주식
    • 전자공학회논문지CI
    • /
    • 제42권1호
    • /
    • pp.9-26
    • /
    • 2005
  • 파이프라인과 슈퍼스칼라 방식 그리고 동적 스케줄링 기법이 일반화된 시스템 구조 하에서, 분기 명령어에 대한 분기 예측 정확도는 프로세서 입장에서 뿐만 아니라 시스템 전체적인 성능에 있어서 큰 영향을 미친다. 이는 분기 예측이 실패했을 경우 잘못된 분기 예측으로 인한 페널티가 발생하기 때문이며, 이러한 페널티는 파이프라인의 길이가 깊어지고 더욱 많은 수의 명령어가 동시에 실행되는 환경일수록 더 큰 값을 가진다. 본 논문에서는 분기 예측의 정확도를 높이기 위해서, 분기 예측과 관련된 신경망을 구축하여 이론 통해 분기 예측에 필요한 각 요소별 가중치의 경향을 분석한다. 그 결과, 높은 가중치를 가지는 구성 요소를 기존의 분기 예측 기법에 추가시킨 새로운 형태의 분기 예측 기법을 제안한다. 제안된 새로운 기법은 실행 구동방식의 시뮬레이터인 Simple Scalar를 통하여 모의실험 되었으며, 실험 결과 본 논문에서 제시한 "분기 명령어의 방향 정보를 내포하는 새로운 기법(direction-gshare)"이 기존의 gshare 기법과 비교하여 동일한 하드웨어 복잡도를 가지면서도 일반적인 Bimodal 기법이나 이단계 적응형 분기 예측 기법 혹은 그의 변형인 gshare 기법에 비하여 분기 예측의 정확도가 최대 4.1%, 평균 1.5% 더 우수한 결과를 보였으며, 최적의 방향 정보 내포량에 대해서는 최대 11.8%, 평균 3.7%의 성능 향상을 보였다.

옵티컬 그리드 환경에서 DAG 계층화를 통한 스케줄링 알고리즘 (Scheduling Algorithm using DAG Leveling in Optical Grid Environment)

  • 윤완오;임현수;송인성;김지원;최상방
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.71-81
    • /
    • 2010
  • 그리드 시스템에서 리스트 스케줄링 기반의 알고리즘을 사용한 태스크 스케줄링은 프로세서의 완전 연결된 환경에서 낮은 시간 복잡도와 높은 효율성을 보여준다. 하지만 기존 알고리즘은 태스크 간의 통신비용 및 옵티컬 그리드 환경에서 통신이 이루어지는 경로인 lightpath의 구성 과정을 충분히 고려하지 않았다. 본 논문에서는 옵티컬 그리드 환경에 최적화 된 방향성 비순환 그래프(Directed Acyclic Graph, DAG)를 계층화하여 태스크의 할당 우선순위를 결정하는 계층화 선택 알고리즘인 LSOG(Leveling Selection in Optical Grid)을 제안한다. 이 알고리즘은 동일한 계층 내 태스크들의 할당 우선순위를 결정할 때 부모 태스크와 통신비용이 가장 큰 태스크를 먼저 수행한 뒤 각각의 네트워크에서 태스크 간의 통신이 이루어지는 가장 짧은 길이의 경로를 고려한다. 이 과정은 옵티컬 그리드 환경에서 링크 리소스 사용을 최적화하여 스케줄링 과정의 통신비용을 개선시킨다. 기존의 알고리즘 중 ELSA (Extended List Scheduling Algorithm)와 SCP (Scheduled Critical Path) 알고리즘을 LSOG 와 비교한 결과 CCR 값의 증가와 네트워크 환경이 원활함에 따라 전체 스케줄링 성능이 향상되는 것을 확인하였다.

1-GFLOPS DSP를 이용한 자기공명영상 스펙트로미터 설계 (Design of MRI Spectrometer Using 1 Giga-FLOPS DSP)

  • 김휴정;고광혁;이상철;정민영;장경섭;이동훈;이흥규;안창범
    • Investigative Magnetic Resonance Imaging
    • /
    • 제7권1호
    • /
    • pp.12-21
    • /
    • 2003
  • 목적 : 기존의 일반적인 스펙트로미터보다 향상된 성능을 가진 새로운 스펙트로미터를 설계 및 제작하였다. 대상 및 방법 : 초당 10억번의 부동 연산 능력을 갖춘 TMS320C6701 DSP를 이용하여 연속적으로 변하는 복잡한 경사자계파형을 실시간으로 계산하여 출력할 수 있고, 선택 단면을 interactive하게 조절할 수 있는 스펙트로미터를 설계, 제작하였다. 설계된 스펙트로미터는 DSP 기반의 디지털 제어부와 파형을 만들고 변조 및 복조를 수행하는 아날로그부로 구성되어 있다 RF 신호의 변조 및 복조는 디지털 기술을 사용하여 정밀도와 안정성을 높였다. 고속 병렬영상을 위하여 하나의 측정 보드당 4채널까지 측정할 수 있도록 하였고, 고속 DSP를 이용하여 빠른 재구성이 가능하도록 하였다. 결과 : 제작된 스펙트로미터를 1.5 테슬라 전신자기공명영상 시스템에 장착하여 다양한 방법으로 성능을 시험하였다. 디지털 변조/복조 방식에서 요하는 정밀한 위상 제어를 확인할 수 있었고, phase array 코일 영상을 통하여 다중 채널 측정시스템의 성능을 검증할 수 있었다. 개발된 스펙트로미터를 기존의 상품화된 스펙트로미터와 비교해 볼때 보다 정밀한 위상 제어가 가능한 것으로 나타났다. 결론 : Interactive하게 영상의 단면을 선택하고, 실시간 계산에 의한 파형출력은 나선주사 심장영상과 같은 첨단의 영상기법에 요구되는 스펙트로미터의 기능이다 또한 다채널 측정시스템도 병렬영상을 위한 필수적인 기능이다. 본 논문에서는 초당 10억번의 부동소수점 연산이 가능한 TMS320C6701 디지털신호처리기를 사용하여 이러한 기능들을 가진 스펙트로미터를 설계, 제작하였다. 디지털 방식의 변조/복조 기술을 채택하여 정밀한 위상제어가 가능하였다. 개발된 스펙트로미터를 FSE, GE, angiography 등 다양한 영상방법에 적용하여 성능을 확인하였으며, 기존의 제품보다 뛰어난 화질의 영상을 얻을 수 있었다.

  • PDF