• 제목/요약/키워드: 유한버퍼

검색결과 47건 처리시간 0.033초

수퍼스칼라 프로세서의 해석적 모델 및 성능 분석 (Analytical Models and their Performance Analysis of Superscalar Processors)

  • 김학준;김선모;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.847-862
    • /
    • 1999
  • 본 논문에서는 유한버퍼의(finite-buffered) 동기화된(synchronous) 큐잉모델(queueing model)을 이용하여 명령어들간의 병렬성, 분기명령의 빈도수, 분기예측(branch prediction)의 정확도, 캐쉬미스 등의 파라미터들을 고려하여 프로세서의 명령어 실행율을 예측하며 캐쉬의 성능과 파이프라인 성능간의 관계를 분석할 수 있는 새로운 해석적 모델을 제안하였다. 해석적 모델은 모델의 타당성을 검증하기 위해서 시뮬레이션을 수행하여 얻은 결과와 비교하였다. 해석적 모델과 시뮬레이션을 비교한 결과 대부분 10% 오차 내에서 일치하였다. 본 연구를 통하여 얻은 해석적 모델을 사용하면 시뮬레이션에서는 드러나지 않는 성능제약의 원인에 대한 명확한 규명이 가능하기 때문에 성능향상을 위한 설계자료를 얻을 수 있으며, 시스템 성능 밸런스를 위한 캐쉬와 비순차이슈 파이프라인 성능간의 관계에 대한 정확한 분석이 가능하다.Abstract This research presents a novel analytic model to predict the instruction execution rate of superscalar processors using the queuing model with finite-buffer size and synchronous operation mode. The proposed model is also able to analyze the performance relationship between cache and pipeline. The proposed model takes into account various kinds of architectural parameters such as instruction-level parallelism, branch probability, the accuracy of branch prediction, cache miss, and etc.. To prove the correctness of the model, we performed extensive simulations and compared the results with the analytic model. Simulation results showed that the proposed model can estimate the average execution rate accurately within 10% error compared to simulation results. The proposed model can explain the causes of performance bottleneck which cannot be uncovered by the simulation method only. The model is also able to show the effect of the cache miss on the performance of out-of-order issue superscalar processors, which can provide an valuable information in designing a balanced system.

고준위 폐기물 처분용기 주변에서의 열전달 해석 (Analysis of Heat Transfer around the High Level Waste Canisters)

  • 최희주;최종원;이종열;권영주
    • 한국방사성폐기물학회:학술대회논문집
    • /
    • 한국방사성폐기물학회 2003년도 가을 학술논문집
    • /
    • pp.270-275
    • /
    • 2003
  • 고준위 폐기물 처분용기 개념설계의 일부분으로 열전달 해석을 수행하였다. 현재까지 진행된 처분개념인 지하 500m 암반 내 처분공에 4개의 PWR 사용후 핵연료 다발을 처분용기에 넣어 처분하였을 경우에 대해 온도 분포를 구하였다. 열전달 해석에는 유한요소법을 이용하는 NISA 프로그램을 이용하였다. 처분용기 내 핵연료의 열 발생에 의한 $\ulcorner$처분용기+벤토나이트 버퍼+처분터널+암반$\lrcorner$ 복합시스템의 온도분포를 구하였다. 처분터널 사이의 간격이 40m 처분공 사이의 간격이 6m인 경우 처분용기 외곽 쉘과 완충재 사이의 온도는 처분 후 15-16년에 도달할 때 최대 $87.5^{\circ}C$까지 증가하다가 서서히 감소하였다.

  • PDF

LFS의 쓰기 성능 최적화를 위한 세그먼트 공간 재활용 기법 (A Segment Space Recycling Scheme for Optimizing Write Performance of LFS)

  • 오용석;김은삼;최종무;이동희;노삼혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.963-967
    • /
    • 2009
  • LFS(Log-structured File System)는 쓰기 요청을 세그먼트 버퍼에 모으고, 세그먼트 단위로 순차 기록함으로써 무작위 쓰기에서도 최적의 성능을 보여준다. 그러나 디스크의 공간이 유한하여, LFS는 여유 세그먼트를 생성하는 클리닝을 수행해야 한다. 파일 시스템의 사용률이 증가함에 따라 세그먼트 클리닝 비용이 급격히 증가하는 단점이 있다. 본 논문에서는 LPS의 쓰기 성능 최적화를 위한 세그먼트 공간 재활용 기법을 설명한다. 이 기법은 유효 세그먼트를 재활용하여 여유 공간을 생성하는 방법으로 빈 세그먼트가 없이 쓰기요청을 처리 할 수 있다. 따라서 높은 비용의 클리닝 동작 없이, 데이터를 세그먼트 내 여유공간에 동적 재배치하여 쓰기요청을 처리한다. 또한 효율적인 세그먼트 공간 재활용을 위해 데이터 및 세그먼트의 지역성을 고려하는 분류기법을 설명한다. 실험 결과에서 이 기법은 파일 시스템의 사용률이 90%인 경우에도 기존 WOLF 기법을 사용한 LFS 보다 HDD에서 1.9배, SSD에서 1.6배의 성능향상을 보여준다.

움직이는 관찰자용 3차원 디스플레이 방법 (3D Display Method for Moving Viewers)

  • 허경무;김명신
    • 전자공학회논문지CI
    • /
    • 제37권4호
    • /
    • pp.37-45
    • /
    • 2000
  • 본 논문에서는 관찰자의 위치가 변하더라도 이를 실시간 추적하여 관찰자의 시점에 정확히 대응하는 입체영상을 구현할 수 있는 방법을 제안하였다. 즉 고성능의 하드웨어 장비가 아닌, 일반적으로 사용되는 개인용 컴퓨터에서도 인간의 두 눈을 찾아내고 관찰자의 움직임을 추적할 수 있도록 하는 알고리즘을 제안하였으며, 또한 관찰자의 위치에 따라 달라지는 물체의 모습을 표현해 주기 위해 유한한 다수의 입력 영상 정보를 이용하여 입체 영상을 제작하고 관찰자의 위치 이동에 정확히 대응하는 영상을 디스플레이하는 방법을 제안하였다. 본 논문에서 제안한 방법을 통해 평균 0.39초의 짧은 시간내에 약 97.5%까지 정확히 두 눈의 위치를 찾을 수 있었으며, Fl6 모델을 사용하여 여러 관찰자의 시점에 대응하는 3차원 디스플레이 실험 결과를 보임으로써 본 방법의 우수함을 보였다. 그리고 실제 로봇을 이용하여 좌우 카메라로 얻은 좌우 영상과 인벤터를 통해 버퍼에서 렌더링되는 스테레오 영상과의 유사도를 측정하여, 관찰자의 시점에 대응하여 렌더링되는 3차원 영상이 최적의 시점 대응 영상임을 확인하였다.

  • PDF

3-Line 버퍼를 사용한 실시간 Sobel 윤곽선 추출 블록 FPGA 구현 (FPGA Implementation for Real Time Sobel Edge Detector Block Using 3-Line Buffers)

  • 박찬수;김희석
    • 전기전자학회논문지
    • /
    • 제19권1호
    • /
    • pp.10-17
    • /
    • 2015
  • 본 논문에서는 3-Line buffers를 사용하여 Sobel 윤곽선 추출 블록을 FPGA로 효율적으로 설계하여 구현하고자 한다. FPGA는 영상처리 알고리즘 중 하나인 Sobel 윤곽선 추출 알고리즘을 처리하기에 적절한 환경을 제공한다. 윤곽선 추출을 위한 방법으로는 파이프라인 방법을 사용하였다. Sobel 윤곽선 연산에서 윤곽선 강도 레벨을 결정하기 위하여 유한 상태 기계로 구현 된 마스크 연산을 이용한 모델을 제안한다. 효율적인 LUT 및 플리플롭의 사용으로 시스템의 성능이 향상됨을 입증하였다. 제안하는 3-line buffers을 이용한 Sobel 추출 연산은 Xilinx 14.2으로 합성하고 Virtex II xc2vp-30-7-FF896 FPGA device으로 구현하였다. Matlab을 이용하여 제안된 3-Line buffers 설계 시 PSNR 성능이 향상됨을 확인하였다.

양자우물 안에 양자점을 형성한 나노복합체 구조에 삽입된 InAs 양자점의 변형효과와 전자적 성질

  • 유찬호;김태환
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2014년도 제46회 동계 정기학술대회 초록집
    • /
    • pp.308.1-308.1
    • /
    • 2014
  • 반도체에서 양자점이 포함된 나노복합체의 전자적 구조와 성질에 대한 연구는 기본적인 양자 물리적 현상을 이해하고 전자소자 및 광소자의 다양한 응용 분야를 파생할 수 있기 때문에 많은 관심을 갖고 있다. 나노복합체를 구성하는 각각의 양자우물과 양자점에 대한 실험과 이론에 대한 연구는 많이 진행되고 있으며, 양자우물 안에 양자점이 삽입된 나노복합체에 대한 연구는 상대적으로 미흡한 상태이다. 또한 양자우물 안에 자발 형성된 양자점이 삽입된 나노복합체에 대한 전기적 특성 및 광학적 특성에 대한 연구는 많으나, 양자우물 안에 삽입된 양자점에 대한 전자적 구조에 대한 연구는 거의 없다. 양자우물 안에 양자점을 형성한 나노복합체 구조를 사용하여 제작한 전자소자와 광소자의 효율을 향상시키기 위해서는 이 복합 구조의 전자적 성질에 대한 연구가 필요하다. 본 연구에서는 단일 양자우물 안에 자발 형성된 InAs 양자점을 포함한 나노복합체의 전자적 특성을 분석하기 위하여 변형효과와 비포물선효과를 포함한 전자적 부띠 에너지에 대하여 비교 분석하였다. InAs 양자점은 20 nm의 직경을 갖고 있으며, GaAs 기판위에 버퍼층과 AlAs 층을 사용한 양자우물 구조에 삽입되었다. 단일 양자우물 안에 삽입된 양자점의 전자적 구조는 형상 의존 변형효과와 비포물선 효과를 고려한 쉬뢰딩거 방정식을 삼차원 가변 메시 유한차분법을 사용하여 수치해석 방법으로 분석하였다. 수치해석 방법으로 양자우물의 우물 폭의 영향을 받는 양자점의 크기변화에 따라 삼차원적인 전자 및 정공의 부띠 에너지와 기저상태 및 여기 상태의 파동 함수를 계산하였다. 이러한 결과는 나노복합체 안에 형성된 InAs 양자점의 전자적 특성을 이해하는데 도움을 주며, InAs가 포함된 나노복합체를 사용한 전자 소자와 광소자 연구에 기초 자료로 사용될 수 있다.

  • PDF

호환성 및 속도 향상을 위한 FPGA 기반 DDR 메모리 인터페이스의 최적화 (Optimization of FPGA-based DDR Memory Interface for better Compatibility and Speed)

  • 김대운;강봉순
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1914-1919
    • /
    • 2021
  • 첨단산업의 발전에 따라 영상처리 하드웨어의 연구는 필수적이고, 실제 칩 동작을 위해서는 게이트 수준의 타이밍 검증이 필요하다. 이를 위해 주로 FPGA 기반 검증이 이루어지는데 기존에는 DDR3 메모리 인터페이스를 적용했지만, 최근에는 FPGA 스펙이 향상되면서 DDR4 메모리가 사용된다. 이 때 기존에 사용하던 메모리 인터페이스를 적용하면 CPU와 메모리의 성능 차이에 의한 신호들의 타이밍 불일치가 발생하기 때문에 사용할 수 없다. 본 논문에서는 기존 인터페이스 시스템 FSM의 State 최적화를 통해 문제를 해결하고, 이 과정에서 AXI Data Width 수정을 통해 데이터 읽기 속도를 2배 증가시킨다. 실제 사례 분석을 위해 Xilinx 사의 SoC보드 중 DDR3 메모리를 사용하는 ZC706과 DDR4 메모리를 사용하는 ZCU106을 사용한다.