• 제목/요약/키워드: Register file

검색결과 45건 처리시간 0.029초

SIMD 프로그래머블 셰이더를 위한 멀티포트 레지스터 파일 설계 및 구현 (Multi-Port Register File Design and Implementation for the SIMD Programmable Shader)

  • 윤완오;김경섭;정진하;최상방
    • 대한전자공학회논문지SD
    • /
    • 제45권9호
    • /
    • pp.85-95
    • /
    • 2008
  • 3D 그래픽 알고리즘은 특성상 방대한 양의 스트림 데이터에 대하여 복잡한 연산을 수행하여야 한다. 이러한 알고리즘을 하드웨어에서 신속하게 수행할 수 있는 버텍스 셰이더와 픽셀 세이더의 도입으로 그래픽 프로세서는 "소프트웨어 셰이더의 하드웨어화"라는 목표를 어느 정도 달성한 것처럼 보이지만, 여전히 Z-버퍼 기반이라는 특정 알고리즘의 틀에서 벗어나지 못하고 있다. 향후 그래픽 프로세서가 궁극적으로 추구하는 모델은 알고리즘에 독립적인 그리고 버텍스 셰이더와 픽셀 셰이더가 통합된 셰이더로 발전할 것이다. 본 논문에서는 프로그래머블 통합 셰이더 프로세서에서 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위한 멀티포트 레지스터 파일 모델을 설계하고 구현하였다. 설계한 멀티포트 레지스터 파일을 기능적 레벨에서 시뮬레이션을 하여 그 성능을 검증 하였으며, FPGA Virtex-4(xc4vlx200)에 직접 구현하여 하드웨어 리소스 사용율과 속도를 확인 하였다.

다수 혹은 긴 워드 연산을 위한 레지스터 파일 확장을 통한 대칭 및 비대칭 암호화 알고리즘의 가속화 (Accelerating Symmetric and Asymmetric Cryptographic Algorithms with Register File Extension for Multi-words or Long-word Operation)

  • 이상훈;최린
    • 전자공학회논문지CI
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 연구에서는 대칭 및 비대칭 암호화 알고리즘을 가속화하기 위해, 다수 혹은 긴 워드 연산을 위한 레지스터 파일 확장 구조 (Register File Extension for Multi-words or Long-word Operation: RFEMLO)라는 새로운 레지스터 파일 구조를 제안한다. 암호화 알고리즘은 긴 워드 피연산자에 대한 명령어를 통하여 가속화 할 수 있다는 점에 착안하여, RFEMLO는 하나의 레지스터 명을 통해 여러 개의 레지스터에 접근할 수 있도록 하여 여러 연산자에 대해 동일한 연산을 수행할 수 있도록 하거나, 여러 개의 레지스터를 하나의 데이터로 사용할 수 있게 한다. RFEMLO는 긴 워드 피연산자에 대한 명령어 집합의 추가와 이를 지원하는 기능 유닛을 추가함으로서 범용 프로세서에 적용할 수 있다. 제안된 하드웨어 구조와 명령어 집합의 효율성을 평가하기 위해 Simplescalar/ARM 3.0을 사용하여 대칭 및 비대칭의 다양한 암호화 알고리즘에 적용하였다. 실험 결과, RFEMLO을 적용한 순차적 파이프라인을 가진 프로세서에서 대칭 암호화 알고리즘의 경우 $40%{\sim}160%$의 성능 향상을, 비대칭 암호화 알고리즘의 경우 $150%{\sim}230%$의 높은 성능향상을 얻을 수 있었다. RFEMLO의 적용을 통한 성능 항상은 이슈 폭의 증가를 이용한 슈퍼스칼라 구현에 따른 성능 향상과 비교할 때, 훨씬 적은 하드웨어 비용으로 효과적인 성능 향상을 얻을 수 있음을 확인하였으며 슈퍼스칼라 프로세서에 RFEMLO를 적용하는 경우에도 대칭 암호화 알고리즘에서는 최대 83.6%, 비대칭 암호화 알고리즘에서는 최대 138.6%의 추가적인 성능향상을 얻을 수 있었다.

레지스터 리네이밍 방법을 사용하는 조건부 실행 비순차적 명령어 이슈 마이크로프로세서에 관한 연구 (Research on Conditional Execution Out-of-order Instruction Issue Microprocessor Using Register Renaming Method)

  • 최규백;김문경;홍인표;이용석
    • 한국통신학회논문지
    • /
    • 제28권9A호
    • /
    • pp.763-773
    • /
    • 2003
  • 본 논문에서는 조건부 실행 비순차적 명령어 이슈 컴퓨터 시스템에서의 레지스터 리네이밍 방법을 제안한다. 레지스터 리네이밍은 읽기 후 쓰기 그리고 쓰기 후 쓰기 의존성을 제거하는 기술이다. 레지스터 리네이밍 방법을 사용하는 조건부 실행 비순차적 명령어 이슈 컴퓨터 시스템을 구현하기 위해서, 우리는 순차적 상태 물리적 레지스터와 미리보기 상태 물리적 레지스터들 양자를 모든 논리적 레지스터들이 공유할 수 있도록 포함하고 있는 레지스터 파일을 사용한다. 또한 본 논문에서 제안된 구조를 구현하기 위해서 순차적 상태 지시기, 리네이밍 상태 지시기, 물리적 레지스터 할당 지시기, 조건 예측 버퍼, 리오더 버퍼들을 구현한다. 이러한 모든 하드웨어를 이용해서, 레지스터 리네이밍 방법을 사용하는 조건부 실행 비순차적 명령어 이슈 컴퓨팅 시스템의 레지스터 리네이밍 및 순차적 상태의 추적을 가능하게 한다. 본 논문에서는 위의 하드웨어를 사용하여 기존 레지스터 리네이밍 방법에 비해서 적은 하드웨어 비용으로 내용 검색(associative lookup)을 제거하고 짧은 복구 시간을 제공하는 개량된 레지스터 리네이밍 방법을 제안한다.

의사 랜덤 one-time pad를 이용한 암호화 및 복호화에 관한 연구 (A Study on the Encryption and Decryption Using Pseudo-Random One-Time Pad)

  • 허비또;조현묵;백경갑;백인천;차균현
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1991년도 추계종합학술발표회논문집
    • /
    • pp.100-102
    • /
    • 1991
  • In this paper, we use LFSR(Linear Feedback Shift Register) as a kind of pseudo-random one-time pad. Key generator is constructed using r separate LFSR's with IP(Irreducible Polynominal) which are relatively prime. Key generated in this method has high linear complexity. And also, file cryptosystem for file encryption and decryption is constructed.

SPICE를 이용한 16-BIT ALU의 회로 해석 및 설계에 관한 연구 (A Study on the Analysis and Design of 16-BIT ALU by Using SPICE)

  • 강희조
    • 한국통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.197-212
    • /
    • 1990
  • 빠른 설계 시간 및 재 설계 가능성 부여 등에 주안점을 두어 고성능의 단일 칩 16-bit data path를 설계하였다. 원칙적인 설계 방법의 체계적인 연구를 위하여 module화의 개념을 근간으로한 설계방법을 도입하였으며, 이에 따라 각 내부블럭이 bus에 연결되어 독립적으로 동작하는 subsystem이 되도록 이를 결합하여 전체 시스템의 설계를 완성하였다. 시스템은 data path이다. Data path는 16-bit의 데이터를 처리하는 부분으로 ALU(Arithmetic Logic Unit), register file, barrel shifter 및 bus 회로로 구성된다. 이 회로에서의 게이트의 폭과 길이는 spice2를 사용하여서 결정하였다. 회로 시뮬레이션의 결과는 기대하였던 회로 특성과 잘 일치하였다.

  • PDF

패션온라인창업 교육을 위한 전자책 콘텐츠 개발에 대한 연구 (A Study on the Development of E-book Contents for Fashion Online Entrepreneurship Education)

  • 정화연;홍은희
    • 한국의상디자인학회지
    • /
    • 제26권1호
    • /
    • pp.33-44
    • /
    • 2024
  • This study developed e-book content in order to use e-books as a tool to provide more efficient classes to learners who are familiar with smart devices and online spaces. E-book contents were produced using Sigil-0.9.10. The development process is as follows. Before e-book development, it is necessary to prepare manuscript files, image files to be inserted, fonts to be used, and e-book covers. After inserting the book cover images, it is necessary to register the table of contents using the title tag and register the free fonts. Also, a style must be created for text or images used in the main text connected to a file containing the entire text. Then, after separating the entire text file into separate files according to each chapter, the text is completed in turn. E-books were produced focusing on hyperlink functions so that educational content and various example images could be accessed. Currently, there is a lack of research on e-books as textbooks in universities within the fashion design major. In the future, if e-book contents are developed according to the characteristics of courses and the level of learners, they can be used as effective teaching tools.

e-Learning 서버 작업부하 분석 (Analysis of e-Learning Server Workload)

  • 손세일;김흥준;안효범
    • 한국산학기술학회논문지
    • /
    • 제8권1호
    • /
    • pp.65-72
    • /
    • 2007
  • 본 논문은 단국대학교의 e-learning 서버의 부하 분석을 통해 교육용 서버의 통계적 부하 모델 작성을 위한 기초 자료 제공을 목적으로 한다. 분석 결과로 파일의 크기 분포, 파일 유형별 접속 빈도와 전송량, 접근 간격, 선호도 변화, 네트워크별 접근 비율 등을 제시하였다. 특히, 동영상 파일의 크기 분포와 접근 빈도별 파일 분포는 이전의 연구들과는 다른 결과가 나타났다. 이것은 동영상 강의를 제작하기 위해 저작 도구를 사용하고 수강생 수의 제약이 없는 온라인 교육의 특성이 반영되었기 때문이다. 본 논문에서 제시된 분석 결과는 e-learning 시스템 구조와 서버 성능 향상을 위한 연구에 기초 자료로 이용될 수 있다.

  • PDF

향상된 재구성능력을 가진 고속 어레이 구조 (Fast Array Architecture with Improved Reconfigurability)

  • 이재익;김진상;조원경;김영수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(2)
    • /
    • pp.451-454
    • /
    • 2004
  • The reconfigurable architecture is increasingly important for design of multi-mode communication systems and computation-intensive DSP systems. The proposed coarse-grain architecture is based on a reconfigurable processing element consisting of a MAC unit, a register file, a context data register, and PE interconnect control blocks. The main feature of the Proposed architecture is the loop context which enables faster configuration. Also, we propose another area-efficient reconfigurable architecture with improved reconfigurability. The SystemC modeling results show that the proposed architecture can reduce 9 clock cycles of 2D DCT compared to existing architectures.

  • PDF

MANET에서 장치의 이동성을 고려한 클러스터 기반 P2P 알고리즘 (Cluster-based P2P scheme considering node mobility in MANET)

  • 우혁;이동준
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.1015-1024
    • /
    • 2011
  • 최근 애드혹 네트워크에서의 모바일 P2P에 대한 관심이 높아지고 있다. 비록 유선 네트워크에서 P2P 알고리즘에 대한 많은 연구가 있었지만, 기존 P2P 프로토콜들은 장치의 이동성을 고려하지 않아 모바일 애드혹 네트워크(MANET, Mobile Ad-hoc Network)에 적합하지 않다. 본 연구에서는 애드혹 네트워크에서 장치의 이동성을 고려하여 클러스터 기반의 새로운 P2P 프로토콜을 제안한다. 기존의 클러스터 기반의 P2P 알고리즘에서 각 클러스터는 슈퍼피어와 슈퍼피어에 자신이 갖고 있는 파일 목록을 등록한 피어들로 구성된다. 이동성이 높은 피어들은 클러스터 간에 자주 핸드오프가 발생하고, 이로 인하여 슈퍼피어에 파일 목록을 등록하기 위한 트래픽이 많이 발생한다. 제안하는 알고리즘에서 이동성이 낮은 피어들은 기존의 클러스터 기반 P2P의 피어들과 동일하게 동작하고, 이동성이 높은 피어들은 다르게 동작한다. 즉 이동성이 높은 피어들은 새로운 클러스터에 참여시, 자신의 존재를 슈퍼피어에게 알리지만 파일 목록을 등록하지는 않으며 파일을 찾고자 할 때 우선 슈퍼피어에 등록된 파일 목록을 검색하고 만약 찾지 못하였을 경우 검색 메시지를 클러스터 내에 전파(broadcast)한다. 본 논문에서 제안 알고리즘을 수학적으로 모델링하고 P2P 트래픽과 라우팅 트래픽에 대한 분석과 최적화를 수행하였고 수학적 모델링 결과에서 제안 알고리즘의 성능이 기존의 클러스터 기반 P2P 알고리즘과 Gnutella 알고리즘에 비해 비슷하거나 더 좋음을 보였다.

Dual MAC를 이용한 음성 부호화기용 DSP Core 설계에 관한 연구 (Design of a dedicated DSP core for speech coder using dual MACs)

  • 박주현
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.137-140
    • /
    • 1995
  • In the paper, CDMA's vocoder algorithm, QCELP, was analyzed. And, 16-bit programmable DSP core for QCELP was designed. When it is used two MACs in DSP, we can implement low-power DSP and estimate decrease of parameter computation speed. Also, we implemented in FIFO memory using register file to increase the access time of the data. This DSP was designed using logic synthesis tool, COMPASS, by top-down design methodology. Therefore, it is possible to cope with rapid change at mobile communication market.

  • PDF