• 제목/요약/키워드: 수퍼파이프

검색결과 10건 처리시간 0.031초

완전한 파이프라인 방식의 비순차실행 수퍼스칼라 프로세서의 VHDL 설계 (VHDL Design for Out-of-Order Superscalar Processor of A Fully Pipelined Scheme)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.99-105
    • /
    • 2021
  • 오늘날 멀티코어 프로세서, 시스템 반도체, 그래픽처리장치를 막론하고 그것을 구성하는 기본 단위 또는 필수적으로 투입되는 CPU의 기본단위는 수퍼스칼라 프로세서이다. 따라서, 고성능의 비순차실행 수퍼스칼라 프로세서가 채택되어야만 위에서 거론된 시스템의 성능을 극대화할 수 있다. 수퍼스칼라 프로세서는 완전한 파이프라인 방식으로 재배열버퍼와 예약스테이션을 이용하여 명령어를 동적 스케줄링 함으로써, 매 싸이클 당 복수 개의 명령어를 인출, 발행, 실행 및 기록한다. 본 논문에서는 예측실행 기능이 있는 완전한 파이프라인 방식의 비순차실행 수퍼스칼라 프로세서를 VHDL로 설계하고, GHDL로 검증하였다. 모의실험 결과, ARM 명령어로 구성된 프로그램에 대한 연산을 성공적으로 수행할 수 있었다.

프로세스 대수에 기반을 둔 수퍼스칼라 프로세서 프로그램의 시간 분석 (Process Algebraic Approach to Timing Analysis of Superscalar Processor Programs)

  • 유희준;이기흔;최진영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권2호
    • /
    • pp.200-208
    • /
    • 2000
  • 다중 포트를 가진 레지스터의 장점은 읽기 접근에 대해서는 한번에 여러 병령어에서 레지스터를 공유할 수 있다는 것이다. 여기서는 높은 수준에서 이러한 다중 포트 레지스터를 가진 파이프라인 수퍼 스칼라 프로세서에서의 타이밍 특성과 자원 제한을 묘사하기 위한 정형방법을 제시한다. 특히, 파이프 라인 명령어가 순서대로 들어오는 경우에 대해서 먼저 병세하고, 순서에 상관없이 어느 싸이클에 검색 가능한 명령어들 중에서 동시에 실행 가능한 명령어 짝을 찾아 실행시키는 수퍼 스칼라 파이프라인 방식인 비순차(Out-of-Order) 명령어 수퍼 스칼라 방식에서의 타이밍 분석으로 확장하였다. 명령어 명세에는 프로세스 대수(Process Algebra)기반의 정형기법인 ACSR(Algebra of Communicating Shared Resources)을 이용하여 모델링한다.

  • PDF

파이프라인식 비순차실행 수퍼스칼라 프로세서의 FPGA 설계 및 구현 (FPGA Design and Implementation of A Pipelined Out-of-Order Superscalar Processor)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.153-158
    • /
    • 2023
  • 국내에서 시스템반도체 설계의 중요성이 대두되고 있으며, 메모리 반도체 설계 기술과의 균형있는 발전을 도모해야 한다. Xilinx에서 제공하는 Vivado 통합 환경 도구를 이용하여 짧은 시간에 큰 비용을 들이지 않고 프로세서를 Xilinx FPGA 반도체 칩에 구현할 수 있다. 본 논문에서는 레코드 자료구조를 지원하여 효율적으로 디지털 시스템을 설계할 수 있는 VHDL을 이용하여 32 비트 ARM 명령어를 실행할 수 있는 파이프라인식 비순차실행 수퍼스칼라 프로세서를 설계하였다. Vivado에서 광범위한 시뮬레이션을 수행한 후에, Xilinx FPGA로 합성, 구현 및 로직아날라이저로 검증하였다. 그 결과, 파이프라인식 비순차실행 수퍼스칼라 프로세서가 FGPA에서 성공적으로 동작하였다.

수퍼 이상 스테인리스강의 내식성에 미치는 입열의 영향 (The Effect of Heat Input on the Pitting Corrosion Resistance of the Weld of Super Duplex Stainless Steel)

  • 성희준;주정권;이철환;김대순
    • 대한용접접합학회:학술대회논문집
    • /
    • 대한용접접합학회 2004년도 춘계 학술발표대회 개요집
    • /
    • pp.134-135
    • /
    • 2004
  • 해양구조물의 설치 환경 및 제품의 사용환경이 악화됨에 따라서 높은 내식성을 보이는 수퍼 이상 스테인리스강(이하: SDSS)의 사용이 많아지고 있다. 해양 구조물에 사용되는 SDSS는 대부분이 파이프자재로서 내부에서의 접근이 불가능하여 용접은 GTAW로 초층을 용접하여 이면 비드를 형성시키는 One side 용접법이 채택되고 있다. (중략)

  • PDF

64비트 4-way 수퍼스칼라 마이크로프로세서의 효율적인 분기 예측을 수행하는 프리페치 구조 (A Prefetch Architecture with Efficient Branch Prediction for a 64-bit 4-way Superscalar Microprocessor)

  • 문상국;문병인;이용환;이용석
    • 한국통신학회논문지
    • /
    • 제25권11B호
    • /
    • pp.1939-1947
    • /
    • 2000
  • 본 논문에서는 명령어의 효율적인 페치를 위해 분기 타겟 주소 전체를 사용하지 않고 캐쉬 메모리(cache memory) 내의 적은 비트 수로 인덱싱 하여 한 클럭 사이클 안에 최대 4개의 명령어를 다음 파이프라인으로 보내줄 수 있는 방법을 제시한다. 본 프리페치 유닛은 크게 나누어 3개의 영역으로 나눌 수 있는데, 분기에 관련하여 미리 부분적으로 명령어를 디코드 하는 프리디코드(predecode) 블록, 타겟 주소(NTA : Next Target Address) 테이블 영역을 추가시킨 명령어 캐쉬(instruction cache) 블록, 전체 유닛을 제어하고 가상 주소를 관리하는 프리페치(prefetch) 블록으로 나누어진다. 사용된 명령어들은 SPARC(Scalable Processor ARChitecture) V9에 기준 하였고 구현은 Verilog-HDL(Hardwave Description Language)을 사용하여 기능 수준으로 기술되고 검증되었다. 구현된 프리페치 유닛은 명령어 흐름에 분기가 존재하더라도 단일 사이클 안에 4개까지의 명령어들을 정확한 예측 하에 다음 파이프라인으로 보내줄 수 있다. 또한 NTA를 사용한 방법은 같은 수의 레지스터 비트를 사용하였을 때 BTB(Branch Target Buffer)를 사용하는 방법과 비교하여 2배정도 많은 개수의 분기 명령 주소를 저장할 수 있는 장점이 있다.

  • PDF

비순차이슈 수퍼스칼라 프로세서에서 리오더버퍼의 성능개선 (Performance Improvement of Reorder Buffer in Out-of-order Issue Superscalar Processors)

  • 장문석;이정우;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권1_2호
    • /
    • pp.90-102
    • /
    • 2001
  • 리오더버퍼는 명령어를 비순차로 이슈하는 수퍼스칼라 파이프라인에서의 명령어 실행을 순차적으로 완료하는데 사용된다. 본 논문에서는 리오더버퍼에 의하여 발생할 수 있는 명령어의 스테그네이션(stagnation)을 효율적으로 제거시킬 뿐만 아니라 리오더버퍼의 크기를 감소시킬 수 있는 쉘터버퍼를 사용한 리오더버퍼 구조를 제안하였다. 시뮬레이션을 수행한 결과 리오더버퍼의 엔트리 개수가 8개에서 32개 사이일 때 쉘터버퍼는 단지 1개 또는 2개만 사용하여도 뚜렷한 성능 향상을 얻을 수 있음을 보여준다. 쉘터버퍼를 4개 사용했을 때는 2개만 사용했을 경우와 비교하여 주목할만한 성능 향상은 없었다. 이는 쉘터버퍼를 2개만 사용하여도 대부분의 스테그네이션을 제거하는데 충분함을 보여준다. 실행율의 손실이 없는 상태에서 2개의 쉘터버퍼를 사용하면 Whetstone 벤치마크 프로그램에서는 44%, FFT 벤치마크 프로그램에서는 50%, FM 벤치마크 프로그램에서는 60%, Linpack 벤치마크 프로그램에서는 75%의 리오더버퍼의 크기를 줄일 수 있었다. 쉘터버퍼를 사용했을 때 수행 시간 역시 Whetstone에서는 19.78%, FFT에서는 19.67%, FM에서는 23.93%, Linpack에서는 8.65%의 성능 향상을 얻을 수 있었다.

  • PDF

고 레이놀즈수 유동의 수치해석시 벽함수 사용에 관한 연구 (A Study of using Wall Function for Numerical Analysis of High Reynolds Number Turbulent Flow)

  • 최정규;김형태
    • 대한조선학회논문집
    • /
    • 제47권5호
    • /
    • pp.647-655
    • /
    • 2010
  • In this paper, a numerical study is carried out for super-pipe, flat plate and axisymmetric body flows to investigate a validity of using wall function and high $y_1^+$ in calculation of high Reynolds number flow. The velocity profiles in boundary layer agree well with the law of the wall. And it is found that the range of $y^+$��which validated the logarithmic law of the wall grows with increasing Reynolds number. From the result, an equation is suggested that can be used to estimate a maximum $y^+$ value of validity of the log law. And the slope(1/$\kappa$) of the log region of the numerical result is larger than that of experimental data. On the other hand, as $y_1^+$ is increasing, both the friction and the pressure resistances tend to increase finely. When using $y_1^+$ value beyond the range of log law, the surface shear stress shows a significant error and the pressure resistance increases rapidly. However, when using $y_1^+$ value in the range, the computational result is reasonable. From this study, the use of the wall function with high value of $y_1^+$ can be justified for a full scale Reynolds number ship flow.

국부적 불연속을 갖는 도파관을 따라 전파되는 파동에 대한 파수 영역 유한 요소 해석 (Propagation of Structural Waves along Waveguides with Non-Uniformities Using Wavenumber Domain Finite Elements)

  • 유정수
    • 한국음향학회지
    • /
    • 제33권3호
    • /
    • pp.191-199
    • /
    • 2014
  • 파이프, 평판과 같이 단면의 형상이 길이 방향으로 일정한 도파관 구조물을 따라 전파되는 진동의 반사 및 투과 특성은 여러 공학 분야에서 응용되는 중요한 주제이다. 도파관에 조인트 또는 균열 등의 국부적 불연속이 있는 경우, 스펙트럴 요소(spectral element)와 유한 요소(finite elment)를 결합한 SE/FE 방법이 주로 사용되고 있다. 그러나 이 방법은 보 이론에 기반한 스펙트럴 요소가 사용되므로 저주파수 대역 해석에 국한되는 단점이 있다. 고주파수 대역 해석에는 스펙트럴 수퍼 요소(spectral super element)와 유한 요소를 결합한 SSE/FE 방법이 제안되었으나 유한요소와 스펙트럼 요소의 연성으로 인해 많은 연산 시간이 요구된다. 이러한 문제점을 개선하고자, 본 연구에서는 국부적 불연속 구간의 단면이 일정한 경우에 대해 국부적 불연속 구간을 스펙트럴 수퍼 요소로 대체한 SSE/SSE 연성 해석을 시도하였다. 적용 모델로는 국부적 결함을 가진 레일의 파동 반사 및 투과, 그리고 주기적 보강재를 가진 평판의 진동전파에 대해 적용하였다. 결함을 가진 레일의 해석 예를 통해, 본 논문에서 사용한 SSE/SSE 방법과 기존의 SSE/FE 방법의 성능을 비교하였다. 보강재를 가진 평판의 예를 통해서는 반복 구조를 가진 도파관의 파동 전파 특성 해석에 SSE/SSE 방법이 유용함을 확인하였다.

수퍼스칼라 프로세서의 해석적 모델 및 성능 분석 (Analytical Models and their Performance Analysis of Superscalar Processors)

  • 김학준;김선모;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.847-862
    • /
    • 1999
  • 본 논문에서는 유한버퍼의(finite-buffered) 동기화된(synchronous) 큐잉모델(queueing model)을 이용하여 명령어들간의 병렬성, 분기명령의 빈도수, 분기예측(branch prediction)의 정확도, 캐쉬미스 등의 파라미터들을 고려하여 프로세서의 명령어 실행율을 예측하며 캐쉬의 성능과 파이프라인 성능간의 관계를 분석할 수 있는 새로운 해석적 모델을 제안하였다. 해석적 모델은 모델의 타당성을 검증하기 위해서 시뮬레이션을 수행하여 얻은 결과와 비교하였다. 해석적 모델과 시뮬레이션을 비교한 결과 대부분 10% 오차 내에서 일치하였다. 본 연구를 통하여 얻은 해석적 모델을 사용하면 시뮬레이션에서는 드러나지 않는 성능제약의 원인에 대한 명확한 규명이 가능하기 때문에 성능향상을 위한 설계자료를 얻을 수 있으며, 시스템 성능 밸런스를 위한 캐쉬와 비순차이슈 파이프라인 성능간의 관계에 대한 정확한 분석이 가능하다.Abstract This research presents a novel analytic model to predict the instruction execution rate of superscalar processors using the queuing model with finite-buffer size and synchronous operation mode. The proposed model is also able to analyze the performance relationship between cache and pipeline. The proposed model takes into account various kinds of architectural parameters such as instruction-level parallelism, branch probability, the accuracy of branch prediction, cache miss, and etc.. To prove the correctness of the model, we performed extensive simulations and compared the results with the analytic model. Simulation results showed that the proposed model can estimate the average execution rate accurately within 10% error compared to simulation results. The proposed model can explain the causes of performance bottleneck which cannot be uncovered by the simulation method only. The model is also able to show the effect of the cache miss on the performance of out-of-order issue superscalar processors, which can provide an valuable information in designing a balanced system.

ILP 명령 스케쥴링에서의 복사 제거를 위한 낙관적 융합 기법 (Optimistic Colescing Technique for Copy Elimination in ILP Instruction Scheduling)

  • 박진표;문수묵
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.692-701
    • /
    • 1999
  • 수퍼스칼라(superscalar)나 VLIW 와 같은 명령어 수준 병렬화(ILP) 프로세서의 성능을 극대화하는 과감한 명령어 스케쥴링은 소프트웨어 파이프라이닝과같은 스케쥴링 과정을 거치면서 일반적인 복사 명령어 제거 기법으로 없앨 수 없는 서로 간섭하는 복사 명령을 많이 만들어내는데 루프 내부에 생성된 이러한 복사명령은 적절한 루프 펼침을 수행하여 간섭관계를 없앰으로서 제거할 수 있다. 본 논문에서는 이와 같이 루프 펼침이 수행된 루프 내부의 복사명령을 제거하는 기법으로 그래프 컬러링 상에 구현한 낙관적 융합기법을 제안한다. 그래프 컬러링에서의 융합기법은 간선의 개수가 많은 노드를 만들어 낼수 있으므로 채색성에 부정적인 영향을 주는 것으로 알려져 왔으나 본 기법에서는 융합되는 노드에 동시에 간섭하는 노드의 간선의 수가 줄어드는 긍정적인 영향을 최대한 이용하여 채색성을 높이고 융합된 노드에 대한 실제 버림(spill)이 일어나는 경우 유효 범위 분절(live range splitting)을 통하여 버림의 부담을 최대한 줄이도록 하였으며 이를 VLIW 스케쥴링 된 SPEC 정수벤치마크 루프내부의 복사 명령 제거에 적용한 결과 제거 가능한 복사 명령의 99%를 제거하면서도 버림명령은 다른 융합 기법과 비교하여 가장 적게 발생하는 우수한 결과를 얻을수 있었다.