• 제목/요약/키워드: Branch Prediction Accuracy

검색결과 55건 처리시간 0.036초

3차원 구조 멀티코어 프로세서의 분기 예측 기법에 관한 온도 효율성 분석 (Analysis on the Thermal Efficiency of Branch Prediction Techniques in 3D Multicore Processors)

  • 안진우;최홍준;김종면;김철홍
    • 정보처리학회논문지A
    • /
    • 제19A권2호
    • /
    • pp.77-84
    • /
    • 2012
  • 프로세서의 성능을 효율적으로 증가시키기 위한 기법 중 하나로 명령어 수준의 병렬성을 높이는 추론적 수행(Speculative execution)이 사용되고 있다. 추론적 수행 기법의 효율성을 결정하는 가장 중요한 핵심 요소는 분기 예측기의 정확도이다. 하지만, 높은 예측율을 보장하는 복잡한 구조의 분기 예측기를 최근 주목 받고 있는 3차원 구조 멀티코어 프로세서에 적용하는데 있어서는 발열 현상이 큰 장애요소가 될 것으로 예측된다. 본 논문에서는 3차원 구조 멀티코어 프로세서에서 발생할 수 있는 분기 예측기의 높은 발열 문제를 해결하기 위해 두 가지 기법을 제시하고, 이에 대한 효율성을 상세하게 분석하고자 한다. 첫번째 기법은 분기 예측기의 온도가 임계 온도 이상으로 올라가는 경우 분기 예측기의 동작을 일시적으로 정지시키는 동적 온도 관리 기법이고, 두번째 기법은 3차원 구조 멀티코어 프로세서의 각 층 별로 온도를 고려하여 서로 다른 복잡도를 지닌 분기 예측기를 차등 배치하는 기법이다. 두 가지 기법 중에서 복잡도를 고려한 차등 배치 기법은 평균 $87.69^{\circ}C$의 온도를 나타내는 반면, 동적 온도 관리 기법은 평균 $89.64^{\circ}C$의 온도를 나타내었다. 그리고, 각 층에서 발생하는 온도 변화율을 각 기법에 대하여 비교한 결과, 동적 온도 관리 기법의 온도 변화율은 평균 $17.62^{\circ}C$을 나타내었고 복잡도 차등 배치 기법의 온도 변화율은 평균 $11.17^{\circ}C$을 나타내었다. 이러한 온도 분석을 통하여 3차원 멀티코어 프로세서에서 분기 예측기의 온도를 제어하였을 경우, 복잡도 차등 배치 기법을 적용하는 것이 더 효율적임을 알 수 있다. 성능적인 측면을 분석한 결과, 동적 온도 관리 기법은 해당 기법을 적용하지 않았을 경우보다 평균 27.66%의 성능하락을 나타내었지만, 복잡도 차등 배치 기법은 평균 3.61%의 성능 하락만을 나타내었다.

지하철 터널내 열차풍 예측 프로그램 개발에 관한 연구 (A Study on the Development of the Train Wind Rate Prediction Program in Tunnel of the Subway)

  • 김종열;최광환
    • 동력기계공학회지
    • /
    • 제3권1호
    • /
    • pp.38-44
    • /
    • 1999
  • Subway is one of the most important transportation and its facilities are increased by the drift of population to cities in these days. But heat generation results from lighting, human and traffic increase in subway, half-closed space, gives uncomfortable sense to the subway passengers. Therefore, natural ventilation by piston effect is done to relieve uncomfortable sense. But train wind by piston effect gives uncomfortable sense to the subway passengers, too. So the numerical calculation of inflow and outflow amounts is important to predict thermal environment and reduce train wind. In case of actual survey of train wind in target station, the amount of train wind are about $3100m^3/train$ at the minimum, about $6000m^3/train$ at the maximum, about $4200m^3/train$ on average. When comparison between simulation for train wind prediction and actual survey for accuracy was done train wind prediction program showed similar results.

  • PDF

Prediction of maximum shear modulus (Gmax) of granular soil using empirical, neural network and adaptive neuro fuzzy inference system models

  • Hajian, Alireza;Bayat, Meysam
    • Geomechanics and Engineering
    • /
    • 제31권3호
    • /
    • pp.291-304
    • /
    • 2022
  • Maximum shear modulus (Gmax or G0) is an important soil property useful for many engineering applications, such as the analysis of soil-structure interactions, soil stability, liquefaction evaluation, ground deformation and performance of seismic design. In the current study, bender element (BE) tests are used to evaluate the effect of the void ratio, effective confining pressure, grading characteristics (D50, Cu and Cc), anisotropic consolidation and initial fabric anisotropy produced during specimen preparation on the Gmax of sand-gravel mixtures. Based on the tests results, an empirical equation is proposed to predict Gmax in granular soils, evaluated by the experimental data. The artificial neural network (ANN) and Adaptive Neuro Fuzzy Inference System (ANFIS) models were also applied. Coefficient of determination (R2) and Root Mean Square Error (RMSE) between predicted and measured values of Gmax were calculated for the empirical equation, ANN and ANFIS. The results indicate that all methods accuracy is high; however, ANFIS achieves the highest accuracy amongst the presented methods.

분기 동시 수행을 이용한 단일 칩 멀티프로세서의 성능 개선 (Performance Improvement of Single Chip Multiprocessor using Concurrent Branch Execution)

  • 이승렬;김준식;최재혁;최상방
    • 대한전자공학회논문지SD
    • /
    • 제44권2호
    • /
    • pp.61-71
    • /
    • 2007
  • 프로세서 성능향상에 일반적으로 이용되어 오던 명령어 수준의 병렬성은 이제 그 한계를 드러내고 있다. 명령어 수준의 병렬성을 이용하는데 장애가 되는 요인 중에 하나는 분기문에 의한 제어 흐름의 변화이다. 단일 칩 멀티프로세서는 쓰레드 수준의 병렬성을 이용하는 프로세서이다. 그러나 다중 쓰레드를 고려하지 않고 작성된 프로그램을 수행하는 경우에는 단일 칩 멀티프로세서의 성능을 최대한 사용할 수 없는 단점이 있다. 이와 같은 두 가지 성능 저하 요인을 극복하기 위해 본 논문에서는 다중 경로 수행 기법을 단일 칩 멀티프로세서에 적용한 분기 동시 수행 기법을 제안한다. 제안된 방법에서는 유휴 중인 프로세서를 이용하여 조건 분기의 두 흐름을 모두 수행하게 한다. 이를 통하여 분기문에 의한 제어 흐름이 끊기는 것을 막고 유휴 시간을 줄여서 프로세서의 효율을 높일 수 있다. 시뮬레이션을 통하여 본 논문에서 제시한 분기 동시 수행의 효과를 분석한 결과 분기 동시 수행으로 약 20%의 유휴 시간이 감소하였고, 분기 예측 성공률은 최대 10% 향상 되었다. 전체적으로 일반적인 단일 칩 멀티프로세서에 비해 최대 39%의 성능 향상을 이루었고, 슈퍼스칼라 프로세서에 비해 최대 27%의 성능 향상을 이루었다.

내장형 프로세서를 위한 저전력 분기 예측기 설계 기법 (A Power-aware Branch Predictor for Embedded Processors)

  • 김철홍;송성근
    • 정보처리학회논문지A
    • /
    • 제14A권6호
    • /
    • pp.347-356
    • /
    • 2007
  • 프로세서의 파이프라인 길이가 점차 길어지고 한 사이클에 이슈되는 명령어의 수가 증가함에 따라, 분기 예측기의 정확도는 프로세서의 성능에 상당한 영향을 미치게 되었다. 또한, 내장형 프로세서를 설계하는데 있어서는 전력 효율성이 가장 중요한 설계 고려 사항 중 하나가 되었다. 그러므로, 내장형 프로세서의 분기 예측기를 설계할 때에는 성능과 전력 효율성이 함께 고려되어야 한다. 본 논문에서는 gshare 분기 예측기가 적용된 내장형 프로세서에서 선택적인 BTB (Branch Target Buffer) 접근을 가능하게 하는 저전력 분기 예측기를 제안하고자 한다. 제안하는 분기 예측기 내에서 BTB는 직전 명령어가 테이큰 (Taken) 분기로 예측되지 않는 경우에는, PHT (Pattern History Table)의 예측 결과가 테이큰인 경우에만 접근된다. PHT의 예측 결과가 테이큰인 분기 명령어의 경우에만 다음에 인출될 명령어의 주소를 BTB 접근을 통해 얻은 주소로 결정하기 때문이다. 물론, 이와 같은 선택적인 BTB 접근으로 인하여 성능 저하가 발생하는 것을 방지하기 위해 직전 명령어가 테이큰분기로 예측된 경우에는 PHT의 예측 결과에 관계없이 BTB는 항상 접근된다. 선택적인 BTB 접근을 하기 위해, 제안하는 분기 예측기 내의 PHT는 기존 분기 예측기의 PHT와 비교하여 1 사이클 일찍 접근되도록 구현한다. 1 사이클 빠른 접근을 위해 제안하는 PHT는 한 번의 접근을 통해 두 개의 예측 결과를 동시에 얻어오게 구현하고, 이를 통해 PHT의 접근 횟수도 줄임으로써 분기 예측기의 전력 소모를 줄이는 효과 또한 얻게 된다. 제안하는 분기 예측기는 하드웨어 오버헤드나 예측 정확도의 감소 없이 전력 소모를 줄일 수 있다는 장점을 가진다. 실험 결과에 따르면, 제안하는 분기 예측기는 기존의 분기 예측기와 비교하여 $35{\sim}48%$의 전력 소모를 줄이는 결과를 보인다.

Application of support vector machine with firefly algorithm for investigation of the factors affecting the shear strength of angle shear connectors

  • Chahnasir, E. Sadeghipour;Zandi, Y.;Shariati, M.;Dehghani, E.;Toghroli, A.;Mohamad, E. Tonnizam;Shariati, A.;Safa, M.;Wakil, K.;Khorami, M.
    • Smart Structures and Systems
    • /
    • 제22권4호
    • /
    • pp.413-424
    • /
    • 2018
  • The factors affecting the shear strength of the angle shear connectors in the steel-concrete composite beams can play an important role to estimate the efficacy of a composite beam. Therefore, the current study has aimed to verify the output of shear capacity of angle shear connector according to the input provided by Support Vector Machine (SVM) coupled with Firefly Algorithm (FFA). SVM parameters have been optimized through the use of FFA, while genetic programming (GP) and artificial neural networks (ANN) have been applied to estimate and predict the SVM-FFA models' results. Following these results, GP and ANN have been applied to develop the prediction accuracy and generalization capability of SVM-FFA. Therefore, SVM-FFA could be performed as a novel model with predictive strategy in the shear capacity estimation of angle shear connectors. According to the results, the Firefly algorithm has produced a generalized performance and be learnt faster than the conventional learning algorithms.

수퍼스칼라 프로세서의 해석적 모델 및 성능 분석 (Analytical Models and their Performance Analysis of Superscalar Processors)

  • 김학준;김선모;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.847-862
    • /
    • 1999
  • 본 논문에서는 유한버퍼의(finite-buffered) 동기화된(synchronous) 큐잉모델(queueing model)을 이용하여 명령어들간의 병렬성, 분기명령의 빈도수, 분기예측(branch prediction)의 정확도, 캐쉬미스 등의 파라미터들을 고려하여 프로세서의 명령어 실행율을 예측하며 캐쉬의 성능과 파이프라인 성능간의 관계를 분석할 수 있는 새로운 해석적 모델을 제안하였다. 해석적 모델은 모델의 타당성을 검증하기 위해서 시뮬레이션을 수행하여 얻은 결과와 비교하였다. 해석적 모델과 시뮬레이션을 비교한 결과 대부분 10% 오차 내에서 일치하였다. 본 연구를 통하여 얻은 해석적 모델을 사용하면 시뮬레이션에서는 드러나지 않는 성능제약의 원인에 대한 명확한 규명이 가능하기 때문에 성능향상을 위한 설계자료를 얻을 수 있으며, 시스템 성능 밸런스를 위한 캐쉬와 비순차이슈 파이프라인 성능간의 관계에 대한 정확한 분석이 가능하다.Abstract This research presents a novel analytic model to predict the instruction execution rate of superscalar processors using the queuing model with finite-buffer size and synchronous operation mode. The proposed model is also able to analyze the performance relationship between cache and pipeline. The proposed model takes into account various kinds of architectural parameters such as instruction-level parallelism, branch probability, the accuracy of branch prediction, cache miss, and etc.. To prove the correctness of the model, we performed extensive simulations and compared the results with the analytic model. Simulation results showed that the proposed model can estimate the average execution rate accurately within 10% error compared to simulation results. The proposed model can explain the causes of performance bottleneck which cannot be uncovered by the simulation method only. The model is also able to show the effect of the cache miss on the performance of out-of-order issue superscalar processors, which can provide an valuable information in designing a balanced system.

Compressive strength prediction by ANN formulation approach for CFRP confined concrete cylinders

  • Fathi, Mojtaba;Jalal, Mostafa;Rostami, Soghra
    • Earthquakes and Structures
    • /
    • 제8권5호
    • /
    • pp.1171-1190
    • /
    • 2015
  • Enhancement of strength and ductility is the main reason for the extensive use of FRP jackets to provide external confinement to reinforced concrete columns especially in seismic areas. Therefore, numerous researches have been carried out in order to provide a better description of the behavior of FRP-confined concrete for practical design purposes. This study presents a new approach to obtain strength enhancement of CFRP (carbon fiber reinforced polymer) confined concrete cylinders by applying artificial neural networks (ANNs). The proposed ANN model is based on experimental results collected from literature. It represents the ultimate strength of concrete cylinders after CFRP confinement which is also given in explicit form in terms of geometrical and mechanical parameters. The accuracy of the proposed ANN model is quite satisfactory when compared to experimental results. Moreover, the results of the proposed ANN model are compared with five important theoretical models proposed by researchers so far and considered to be in good agreement.

On DC-Side Impedance Frequency Characteristics Analysis and DC Voltage Ripple Prediction under Unbalanced Conditions for MMC-HVDC System Based on Maximum Modulation Index

  • Liu, Yiqi;Chen, Qichao;Li, Ningning;Xie, Bing;Wang, Jianze;Ji, Yanchao
    • Journal of Power Electronics
    • /
    • 제16권1호
    • /
    • pp.319-328
    • /
    • 2016
  • In this study, we first briefly introduce the effect of circulating current control on the modulation signal of a modular multilevel converter (MMC). The maximum modulation index is also theoretically derived. According to the optimal modulation index analysis and the model in the continuous domain, different DC-side output impedance equivalent models of MMC with/without compensating component are derived. The DC-side impedance of MMC inverter station can be regarded as a series xR + yL + zC branch in both cases. The compensating component of the maximum modulation index is also related to the DC equivalent impedance with circulating current control. The frequency characteristic of impedance for MMC, which is observed from its DC side, is analyzed. Finally, this study investigates the prediction of the DC voltage ripple transfer between two-terminal MMC high-voltage direct current systems under unbalanced conditions. The rationality and accuracy of the impedance model are verified through MATLAB/Simulink simulations and experimental results.

Relationship between Plastochrone and Development Indices Estimated by a Nonparametric Rice Phenology Model

  • Lee, Byun-Woo;Nam, Taeg-Su;Yim, Young-Seon
    • 한국작물학회지
    • /
    • 제44권2호
    • /
    • pp.149-153
    • /
    • 1999
  • Prediction of rice developmental stage is necessary for proper crop management and a prerequisite for growth simulation as well. The objectives of the present study were to find out the relationship between the plastochrone index(PI) and the developmental index(DVI) estimated by non-parametric phenology model which simulates the duration from seedling emergence(DVI=0) to heading(DVI=l) by employing daily mean air temperature and daylength as predictor variables, and to confirm the correspondency of developmental indice to panicle developmental stages based on this relationship. Four japonica rice cultivars, Kwanakbyeo, Sangpungbyeo, Dongjinbyeo, and Palgumbyeo which range from very early to very late in maturity, were grown by sowing directly in dry paddy field five times at an interval of two weeks. Data for seedling emergence, leaf appearance, differentiation stage of primary rachis branch and heading were collected. The non-parametric phenology model predicted well the duration from seedling emergence to heading with errors of less than three days in all sowings and cultivars. PI was calculated for every leaf appearance and related to the developmental index estimated for corresponding PI. The stepwise polynomial analysis produced highly significant square-rooted cubic or biquadratic equations depending on cultivars, and highly significant square-rooted biquadratic equation for pooled data across cultivars without any considerable reduction in accuracy compared to that for each cultivar. To confirm the applicability of this equation in predicting the panicle developmental stage, DVI at differentiation stage of primary rachis branch primordium was calculated by substituting PI with 82 corresponding to this stage, and the duration reaching this DVI from seedling emergence was estimated. The estimated duration revealed a good agreement with that observed in all sowings and cultivars. The deviations between the estimated and the observed were not greater than three days, and significant difference in accuracy was not found for predicting this developmental stage between those equations derived for each cultivar and for pooled data across all cultivars tested.

  • PDF