• 제목/요약/키워드: 프로파일 감소

검색결과 202건 처리시간 0.027초

제어 독립성을 이용한 분기 예상 실패 복구 메커니즘 (A Branch Misprediction Recovery Mechanism using Control Independence)

  • 윤성룡;신영호;박홍준;조영일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.636-638
    • /
    • 2000
  • 제어 독립성(Control Independence)은 슈퍼스칼라 프로세서에서 명령어 수준 병렬성(Instruction-Level Parallelism)을 향상시키기 위한 중요한 요소로 작용하고 있다. 분기 예상기법(Branch Prediction Mechanism)에서 잘못 예상될 경우에는 예상한 분기 방향의 명령어들을 제거하고 올바른 분기 방향의 명령어들을 다시 반입하여 수행해야 한다. 본 논문에서는 컴파일 시 프로파일링을 통한 정적인 방법과 프로그램상의 제어 흐름을 통해 동적으로 제어 독립적인 명령어를 탐지함으로써 분기 명령어의 잘못된 예상으로 인해 제거되는 명령어를 효과적으로 감소시켜 프로세서의 성능을 향상시키는 메커니즘을 제안한다. SPECint95 벤치마크 프로그램에 대해 기존의 방법과 본 논문에서 제안한 방법 사이의 사이클 당 수행된 명령어 수를 분석한 결과, 4-width 프로세서에서 4%~6%, 8-width 프로세서에서 11%~18%, 16-width 프로세서에서 15%~17%의 성능 향상을 보이고 있다.

  • PDF

제어 독립적인 명령어의 선택적 복구 메커니즘 (A Selective Recovery Mechanism of Control-Flow Independent Instructions)

  • 윤성룡;신영호;조영일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.715-717
    • /
    • 2002
  • 최신의 프로세서는 분기명령에 의한 파이프라인 지연을 피하기 위해 분기 예상 기법을 사용하고 있다. 그러나 예측기에서 예상이 잘못된 경우에는 예상한 분기 방향의 명령어들을 무효화시키고 올바른 분기 방향의 명령어들을 다시 반입하여 수행시키므로 서 수행 사이클과 하드웨어 자원을 낭비하게된다. 본 논문에서는 컴파일 시 프로파일링을 통한 정적인 방법과 프로그램상의 제어 흐름을 통해 동적으로 제어 독립적인 명령어를 탐지해서 분기 명령어의 잘못된 예상으로 인해 무효화되는 명령어를 효과적으로 감소시켜 프로세서의 성능을 향상시키는 메커니즘을 제안한다. SPECint95 벤치마크 프로그램에 대해 기존의 방법과 본 논문에서 제안한 방법 사이의 사이클 당 수행된 명령어 수를 분석한 결과, 4-이슈 프로세서에서 2%-7%, 8-이슈 프로세서에서 4%-l5%, 16-이슈 프로세서에서 18%-28%의 성능 향상을 보이고 있다.

  • PDF

Sparse view CT에서 inpainting 방법을 이용한 사이노그램 복원의 영상 재구성 (Image Reconstruction of Sinogram Restoration using Inpainting method in Sparse View CT)

  • 김대홍;백철하
    • 한국방사선학회논문지
    • /
    • 제11권7호
    • /
    • pp.655-661
    • /
    • 2017
  • 방사선 치료 전 환자 위치 확인을 위해 수행하는 콘빔 CT 촬영에서 환자 선량 감소를 위해 Sparse view CT가 사용되고 있다. 본 연구는 시뮬레이션과 실험을 통해 선형보간법과 inpainting 방법을 이용하여 사이노그램의 sparse 데이터 복원하고 평가하는 것이다. 사이노그램 복원은 여러 간격의 각도로 획득된 영상에 적용되었다. 복원된 사이노그램은 역투영재구성법으로 재구성되었고, 그 결과를 평균제곱근오차와 영상의 프로파일로 나타내었다. 결과에 따르면, 평균제곱근오차와 영상 프로파일은 투영 각도와 복원법에 의존하였다. 시뮬레이션과 실험 결과에서 inpainting 복원법은 선형보간법에 비해 사이노그램의 복원 측면에서 개선된 결과를 보여주었다. 따라서, inpainting 방법은 환자 선량을 감소시키면서 영상화질을 유지시키는데 기여할 수 있을 것이다.

격실 내 장애물이 폭압에 의한 인원 피해에 미치는 영향 (The Effect of Obstacles in a Compartment on Personnel Injury Caused by Blast)

  • 박성준
    • 한국시뮬레이션학회논문지
    • /
    • 제26권3호
    • /
    • pp.1-11
    • /
    • 2017
  • 격실 내부에서의 폭발로 인한 인원의 피해를 분석하였다. 특히 격실 내에서 폭압 전파에 영향을 미치는 돌출된 장애물의 유무에 따른 인원 피해를 비교하였다. 격실 내에 장애물이 없는 경우에 경험적 고속처리모델을 이용하여 폭압을 예측할 수 있다. 하지만 격실 내부에서는 폭압 프로파일이 개활지에서와 달리 복잡하며 의자와 같은 구조물이 존재하는 경우에는 경험적 고속처리모델 적용이 불가하다. 따라서 장애물이 있는 격실 내부 폭압은 유한요소해석을 이용해 획득하였다. 또한 개활지의 폭압 프로파일을 기준으로 개발된 Friedlander 압력-충격량 곡선을 격실 내부에서의 복잡한 폭압 전파로 인해 피해평가에 적용할 수 없어, Axelsson 단자유도 모델을 적용하여 인원 피해를 분석하였다. 장애물이 있는 경우 인원의 흉벽 속도는 26에서 76 퍼센트(%) 만큼 감소되었으며 격실내 인원피해 또한 감소되었다.

Scratch-Pad 메모리를 위한 동적 코드 배치 기법 (Dynamic Code Placement Techniques for Scratch-Pad Memory)

  • 김지훈;장춘기;이재진;민상렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.784-786
    • /
    • 2005
  • SPM (Scratch-Pad Memory)을 위한 코드 배치 기법과 demand paging기법을 Post pass optimizer를 사용하여 구현한다. 코드 배치 문제는 ILP (Integer Linear Programming) 문제로 변환하여 해결한다. 최적 화기는 ILP 해답의 질을 높이기 위해 응용 프로그램의 프로파일 정보를 사용하고, 코드로부터 natural loop을 추출한다. 또한 SPM을 사용하여 demand paging을 할수 있도록 추가 코드를 삽입한다. 이 기법을 사용해 6개의 내장형 응용 프로그램을 실험하였고, 프로그램 크기의 $20\%$에 해당하는 SPM에 대해 전력 소모는 $75.9\%$로 감소하였고 성능은 $54.5\%$ 증가하였다.

  • PDF

위성과 지상 회선에서 파일 전송 프로토콜의 최적 메세지 길이에 대한 연구 (A Study on the Optimal Message Length of File Transfer Protocol via Satellite and Terrestrial Links)

  • 박진양;이용훈;김정호;이상범
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.215-223
    • /
    • 1997
  • 위성 회선의 대표적인 장점은 장거리 대용량 전송과 동보 통신이며, 지상 회선은 고속, 고품질의 데이타 전송이다. 따라서 가입자에게 양질의 파일 전송 서비스를 제 공하기 위해서 위성 회선과 지상회선의 특성을 결합한 형태의 서비스가 필요하다. 본 논문은 위성 회선에서 파일 전송의 타당성을 검토하기 위하여 HDLC와 FTAM접속 프로 토콜을 설계하여 위성 회선과 지상 회선의 파일 전송 효율에 대하여 해석하였다. 적 용된 전송 파라시터는 단위 메세지 길이와 파일의 전송 시간, 체인 레코드 길이를 512 바이트 보다 짧게하면 파일 전송 시간은 극단적으로 길게되며, 1024 바이트로 했 을 때 최소로 되고 2048 바이트 부터 급격하게 증가되었다. 체인 레코드수가 15개 이 하일 경우 전송 시간의 곡선은 극단적으로 감소되고 90개까지는 서서히 감소하며 90 개 이상에서는 일정한 전송 시간을 유지하였다. 이들의 결과에서 최적의 단위 메세지 길이는 1024 바이트 부근이라는 것을 확인할 수 있었다. 또한 위성 회선의 전송 속도 가 24 kbps에서 2400 bps로 늦어짐에 따라 최적 메세지의 길이도 640 바이트에서 256 바이트로 짧게 됨을 확인할 수 있었다.

  • PDF

인터넷 화상 전화용 음성 코텍을 위한 MPEG4-CELP 부호화기의 구현 (Implementation of MPEG4-CELP Vocoder for Speech Codec of Internet Video Phone)

  • 김병수;김동형;강경옥;홍진우;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.119-122
    • /
    • 2000
  • 인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.

  • PDF

논리 프로그램의 병렬도 개선을 위한 플랫 인덱싱 기법 (Flat Indexing: A Compilation Technique to Enhance the Parallelism of Logic Programs)

  • 김희철;이용두
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1908-1922
    • /
    • 1998
  • 본 논문은 논리언어 프로그램의 효율적인 클로즈(Clause) 인덱싱을 위한 컴파일 기법에 대한 체계적인 접근방법을 제시한다. 본 접근방법의 핵심으로서 노드당 평균 병렬도와 클로즈 수행시도(clause trial) 횟수를 정확하게 나타낼 수 있는 기법으로서 인덱싱트리(Indexign Tree)를 제안한다. 인덱싱트리는 인덱싱 수행 시에 인덱싱을 위한 지시어(Instruction)의 수행 결과로 프로그램으 컨트롤이 실패처리코드로 이동하는 경우도 정량적으로 나타내 준다. 인덱싱트리를 사용하여 논리 프로그램을 위한 대표적인 가상머신인 WAM(Warren Abstract Machine)을 분석한 결과, WAM에서 사용하는 인덱싱 기법이 논리 프로그램의 병렬 처리에 있어 탐색트리의 병렬도를 감소시키며, 또한 스케쥴링의 효율성을 저하시키는 결점을 내포하고 있음을 발견할 수 있었다. 이러한 결점을 해결하기 위하여 본 논문은 플랫 인덱싱이라는 새로운 인덱싱 기법을 제안하고 이것을 실제 논리언어 컴파일러에 구현하여 측정한 향상 및 분석 결과를 보여준다.

  • PDF

스마트 그리드에서 기기별 전력 요구량에 기반한 전력 사용 스케줄 기법 (Power consumption scheduling scheme based on the per-appliance power requirement on the smart grid)

  • 이정훈;김혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1363-1364
    • /
    • 2010
  • 본 논문에서는 스마트 그리드 시스템에서 사용자의 전력 사용 요구를 받아 이를 효율적으로 스케줄링하는 시스템을 설계하고 그 프로토타입을 구현한다. 각 기기들이 시작가능시간, 종료시한, 시간대별 사용량 변화를 명세하는 프로파일 등을 스케줄러에 넘겨주면 스케줄러는 각 작업의 시작가능시간과 여유시간 내에서 작업들을 배치한 후 리커시브하게 서치 스페이스를 확장하여 가장 최소의 단위시간당 최대 전력 요구량을 갖는 스케줄을 찾아낸다. 비선점형 작업의 특성에 의해 스페이스 확장의 복잡도를 크게 줄일 수 있으며 최소비용 소비 스케줄 등 다양한 목표를 위해 변경될 수 있다. 구현된 시스템은 주어진 작업 집합에 대해 최대 전력 요구량을 30 % 감소시키는 스케줄을 생성한다.

H.264/SVC 복호기 C-Model 시뮬레이터 개발 (Development of C-Model Simulator for H.264/SVC Decoder)

  • 정차근
    • 한국콘텐츠학회논문지
    • /
    • 제9권3호
    • /
    • pp.9-19
    • /
    • 2009
  • 본 논문에서는 최근 국제표준화가 이루어진 H.264/SVC 복호기 SoC 칩 개발을 위한 새로운 하드웨어 구조를 제안하고, 최적인 회로개발을 지원하기 위한 C-모델 시뮬레이터를 개발한다. 제안된 SVC 복호기는 표준규격의 기능들을 최적으로 처리하기 위한 하드웨어 엔진과 핵심 프로세서를 이용한 소프트웨어 등으로 구성되어 있어 기존의 임베디드 시스템으로 간단히 구현할 수 있다. 본 논문에서 제안한 복호기의 C-모델 시뮬레이터는 SVC의 스케일러블 베이스라인 프로파일을 기반으로 복잡도 감소를 위하여 B-픽처 구조를 사용하지 않는 IPPP 구조에 의한 스케일러블 만을 고려함으로서 칩 설계의 실용성을 증가시켰다. 하드웨어 구조와 C-모델 시뮬레이터의 유효성을 검증하기 위해 제안한 H.264/SVC 호기 시스템에 대한 결과를 제시한다.