• Title/Summary/Keyword: 프로파일 감소

Search Result 202, Processing Time 0.029 seconds

A Branch Misprediction Recovery Mechanism using Control Independence (제어 독립성을 이용한 분기 예상 실패 복구 메커니즘)

  • 윤성룡;신영호;박홍준;조영일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.636-638
    • /
    • 2000
  • 제어 독립성(Control Independence)은 슈퍼스칼라 프로세서에서 명령어 수준 병렬성(Instruction-Level Parallelism)을 향상시키기 위한 중요한 요소로 작용하고 있다. 분기 예상기법(Branch Prediction Mechanism)에서 잘못 예상될 경우에는 예상한 분기 방향의 명령어들을 제거하고 올바른 분기 방향의 명령어들을 다시 반입하여 수행해야 한다. 본 논문에서는 컴파일 시 프로파일링을 통한 정적인 방법과 프로그램상의 제어 흐름을 통해 동적으로 제어 독립적인 명령어를 탐지함으로써 분기 명령어의 잘못된 예상으로 인해 제거되는 명령어를 효과적으로 감소시켜 프로세서의 성능을 향상시키는 메커니즘을 제안한다. SPECint95 벤치마크 프로그램에 대해 기존의 방법과 본 논문에서 제안한 방법 사이의 사이클 당 수행된 명령어 수를 분석한 결과, 4-width 프로세서에서 4%~6%, 8-width 프로세서에서 11%~18%, 16-width 프로세서에서 15%~17%의 성능 향상을 보이고 있다.

  • PDF

A Selective Recovery Mechanism of Control-Flow Independent Instructions (제어 독립적인 명령어의 선택적 복구 메커니즘)

  • 윤성룡;신영호;조영일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.715-717
    • /
    • 2002
  • 최신의 프로세서는 분기명령에 의한 파이프라인 지연을 피하기 위해 분기 예상 기법을 사용하고 있다. 그러나 예측기에서 예상이 잘못된 경우에는 예상한 분기 방향의 명령어들을 무효화시키고 올바른 분기 방향의 명령어들을 다시 반입하여 수행시키므로 서 수행 사이클과 하드웨어 자원을 낭비하게된다. 본 논문에서는 컴파일 시 프로파일링을 통한 정적인 방법과 프로그램상의 제어 흐름을 통해 동적으로 제어 독립적인 명령어를 탐지해서 분기 명령어의 잘못된 예상으로 인해 무효화되는 명령어를 효과적으로 감소시켜 프로세서의 성능을 향상시키는 메커니즘을 제안한다. SPECint95 벤치마크 프로그램에 대해 기존의 방법과 본 논문에서 제안한 방법 사이의 사이클 당 수행된 명령어 수를 분석한 결과, 4-이슈 프로세서에서 2%-7%, 8-이슈 프로세서에서 4%-l5%, 16-이슈 프로세서에서 18%-28%의 성능 향상을 보이고 있다.

  • PDF

Image Reconstruction of Sinogram Restoration using Inpainting method in Sparse View CT (Sparse view CT에서 inpainting 방법을 이용한 사이노그램 복원의 영상 재구성)

  • Kim, Daehong;Baek, Cheol-Ha
    • Journal of the Korean Society of Radiology
    • /
    • v.11 no.7
    • /
    • pp.655-661
    • /
    • 2017
  • Sparse view CT has been widely used to reduce radiation dose to patient in radiation therapy. In this work, we performed sinogram restoration from sparse sampling data by using inpainting method for simulation and experiment. Sinogram restoration was performed in accordance with sampling angle and restoration method, and their results were validated with root mean square error (RMSE) and image profiles. Simulation and experiment are designed to fan beam scan for various projection angles. Sparse data in sinogram were restored by using linear interpolation and inpainting method. Then, the restored sinogram was reconstructed with filtered backprojection (FBP) algorithm. The results showed that RMSE and image profiles were depended on the projection angles and restoration method. Based on the simulation and experiment, we found that inpainting method could be improved for sinogram restoration in comparison to linear interpolation method for estimating RMSE and image profiles.

The Effect of Obstacles in a Compartment on Personnel Injury Caused by Blast (격실 내 장애물이 폭압에 의한 인원 피해에 미치는 영향)

  • Park, Sung-Jun
    • Journal of the Korea Society for Simulation
    • /
    • v.26 no.3
    • /
    • pp.1-11
    • /
    • 2017
  • Blast injuries in a compartment are investigated, and the effects of obstacles on blast injury are particularly analyzed by comparing injuries in the compartments with or without protruding obstacles inside. Even if blast pressure profile tends to be complicated in a confined space unlike in open field, it can be obtained in a relatively short time by using some empirical fast running models for simple confined spaces. However, a finite element method should be employed to obtain blast pressure profiles in a case with obstacles in confined spaces, because the obstacles heavily disturb blast waves. On the other hand, Axelsson SDOF(Single degree of freedom) model and ASII(Adjusted severity of injury index) injury level are employed to estimate blast injury in compartments, because the usual pressure-impulse injury criterion based on the ideal Friedlander waves in open the field cannot be applied to personnel in a confined space due to complexity of blast waves inside. In cases with obstacles, chest wall velocity was reduced by 26 to 76 percent(%) and the personnel injury in the compartment caused by blast was also reduced.

Dynamic Code Placement Techniques for Scratch-Pad Memory (Scratch-Pad 메모리를 위한 동적 코드 배치 기법)

  • Kim Chihun;Jang Choonki;Lee Jaejin;Min Sang Lyul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.784-786
    • /
    • 2005
  • SPM (Scratch-Pad Memory)을 위한 코드 배치 기법과 demand paging기법을 Post pass optimizer를 사용하여 구현한다. 코드 배치 문제는 ILP (Integer Linear Programming) 문제로 변환하여 해결한다. 최적 화기는 ILP 해답의 질을 높이기 위해 응용 프로그램의 프로파일 정보를 사용하고, 코드로부터 natural loop을 추출한다. 또한 SPM을 사용하여 demand paging을 할수 있도록 추가 코드를 삽입한다. 이 기법을 사용해 6개의 내장형 응용 프로그램을 실험하였고, 프로그램 크기의 $20\%$에 해당하는 SPM에 대해 전력 소모는 $75.9\%$로 감소하였고 성능은 $54.5\%$ 증가하였다.

  • PDF

A Study on the Optimal Message Length of File Transfer Protocol via Satellite and Terrestrial Links (위성과 지상 회선에서 파일 전송 프로토콜의 최적 메세지 길이에 대한 연구)

  • Park, Jin-Yang;Lee, Yong-Hun;Kim, Jeong-Ho;Lee, Sang-Beom
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.1
    • /
    • pp.215-223
    • /
    • 1997
  • The advantages of service in satellite links are representatively a long distance and large capacity transfer and simultaneous communication. And terrestrial links are of high speed and high quality data transfer Therefore a combined form of characteristics of satellite and terrestrial links is desirable to furnish a good quality service to subscribers. And in satellite links an analysis method and a simulation method of file transfer are conducted to evaluate the efficiency of file transfer. The parameters are used the message length and transmission time, and the number of chain record and transmission time. From the results of evaluation, in satellite links, it is found that when the message length is shorter than 512 bytes, the file transmission time becomes extremely long and when the message length is set at 1024 bytes, the file transmission time abruptly increase from 2048 bytes. Also it is confirmed that when the number of chain record is under 15, the file transmission time becomes extremely long and if the number increase up to 90,the time becomes gradually short and over 90,it becomes constant.Therefore,from the result of file transmission in th case of utilizing satelite links,it is confirmed that the optimum message length in the minmum transmission time is present closely at 1024 bytes.Also it is confirmed that when the satelite transmission sped becoms smaller from 24kbps to2400bps,the optimum message length also becomes smaller from 640 bytes to 256bytes.

  • PDF

Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone (인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현)

  • 김병수;김동형;강경옥;홍진우;정재호
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

Flat Indexing: A Compilation Technique to Enhance the Parallelism of Logic Programs (논리 프로그램의 병렬도 개선을 위한 플랫 인덱싱 기법)

  • Kim, Hie-Cheol;Lee, Yong-Doo
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.7
    • /
    • pp.1908-1922
    • /
    • 1998
  • 본 논문은 논리언어 프로그램의 효율적인 클로즈(Clause) 인덱싱을 위한 컴파일 기법에 대한 체계적인 접근방법을 제시한다. 본 접근방법의 핵심으로서 노드당 평균 병렬도와 클로즈 수행시도(clause trial) 횟수를 정확하게 나타낼 수 있는 기법으로서 인덱싱트리(Indexign Tree)를 제안한다. 인덱싱트리는 인덱싱 수행 시에 인덱싱을 위한 지시어(Instruction)의 수행 결과로 프로그램으 컨트롤이 실패처리코드로 이동하는 경우도 정량적으로 나타내 준다. 인덱싱트리를 사용하여 논리 프로그램을 위한 대표적인 가상머신인 WAM(Warren Abstract Machine)을 분석한 결과, WAM에서 사용하는 인덱싱 기법이 논리 프로그램의 병렬 처리에 있어 탐색트리의 병렬도를 감소시키며, 또한 스케쥴링의 효율성을 저하시키는 결점을 내포하고 있음을 발견할 수 있었다. 이러한 결점을 해결하기 위하여 본 논문은 플랫 인덱싱이라는 새로운 인덱싱 기법을 제안하고 이것을 실제 논리언어 컴파일러에 구현하여 측정한 향상 및 분석 결과를 보여준다.

  • PDF

Power consumption scheduling scheme based on the per-appliance power requirement on the smart grid (스마트 그리드에서 기기별 전력 요구량에 기반한 전력 사용 스케줄 기법)

  • Lee, Junghoon;Kim, Hye-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1363-1364
    • /
    • 2010
  • 본 논문에서는 스마트 그리드 시스템에서 사용자의 전력 사용 요구를 받아 이를 효율적으로 스케줄링하는 시스템을 설계하고 그 프로토타입을 구현한다. 각 기기들이 시작가능시간, 종료시한, 시간대별 사용량 변화를 명세하는 프로파일 등을 스케줄러에 넘겨주면 스케줄러는 각 작업의 시작가능시간과 여유시간 내에서 작업들을 배치한 후 리커시브하게 서치 스페이스를 확장하여 가장 최소의 단위시간당 최대 전력 요구량을 갖는 스케줄을 찾아낸다. 비선점형 작업의 특성에 의해 스페이스 확장의 복잡도를 크게 줄일 수 있으며 최소비용 소비 스케줄 등 다양한 목표를 위해 변경될 수 있다. 구현된 시스템은 주어진 작업 집합에 대해 최대 전력 요구량을 30 % 감소시키는 스케줄을 생성한다.

Development of C-Model Simulator for H.264/SVC Decoder (H.264/SVC 복호기 C-Model 시뮬레이터 개발)

  • Cheong, Cha-Keon
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.3
    • /
    • pp.9-19
    • /
    • 2009
  • In this paper, we propose a novel hardware architecture to facilitate the applicable SoC chip design of H.264/SVC which has a great deal of advancement in the international standardization in recent. Moreover, a new C-model simulator based on the proposed hardware system will be presented to support optimal SoC circuit development. Since the proposed SVC decoder is consist of some hardware engine for processing of major decoding tools and core processor for software processing, the system is simply implemented with the conventional embedded system. To improve the feasibility and applicability, and reduce the decoder complexity, the hardware decoder architecture is constructed with only the consideration of IPPP structure scalability without using the full B-picture. Finally, we present results of decoder hardware implementation and decoded picture to show the effectiveness of the proposed hardware architecture and C-model simulator.