• 제목/요약/키워드: 소프트웨어-하드웨어 공동최적화

검색결과 3건 처리시간 0.023초

2T1C 셀 기반 DRAM 인메모리 컴퓨팅을 위한 소프트웨어-하드웨어 공동 체적화 센스 증폭기 (A Software-Hardware Co-Optimized Sense Amplifier for 2T1C Cell-based DRAM In-Memory-Computing)

  • 유회준;황선주;엄소연;하상우
    • 반도체공학회 논문지
    • /
    • 제2권4호
    • /
    • pp.8-12
    • /
    • 2024
  • 이 논문은 DRAM 인메모리 컴퓨팅을 위한 소프트웨어-하드웨어 공동 최적화 기법을 제시하며, 2T1C 셀 시스템에서 센스 증폭기의 읽기 전력을 크게 감소시킨다. 2 의 보수 표현(2's complement)에서 부호 절대값 표현(signed magnitude)으로 전환함으로써, 데이터 '0'의 발생률을 52%에서 73%로 증가시킨다. 이로 인해 읽기 전력을 13%까지 감소시킬 수 있다. 가변 기준 전압을 포함하는 새로운 센스 증폭기를 설계하여 추가로 15%의 전력 감소에 기여하였다. 이러한 공동 최적화 전략은 기존 대비 총 읽기 전력을 26% 감소시켰으며, 메모리 집약적 컴퓨팅 환경에서 에너지 효율성의 상당한 개선을 보인다.

에너지 효율적인 FPGA 가속기 설계를 위한 하드웨어 및 소프트웨어 공동 설계 플랫폼 (Hardware and Software Co-Design Platform for Energy-Efficient FPGA Accelerator Design)

  • 이동규;박대진
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.20-26
    • /
    • 2021
  • 오늘날의 시스템들은 더 빠른 실행 속도와 더 적은 전력 소모를 위해 하드웨어와 소프트웨어 요소를 함께 포함하고 있다. 기존 하드웨어 및 소프트웨어 공동 설계에서 소프트웨어와 하드웨어의 비율은 설계자의 경험적 지식에 의해 나뉘었다. 설계자들은 반복적으로 가속기와 응용 프로그램을 재구성하고 시뮬레이션하며 최적의 결과를 찾는다. 설계를 변경하며 반복적으로 시뮬레이션하는 것은 시간이 많이 소모되는 일이다. 본 논문에서는 에너지 효율적인 FPGA 가속기 설계를 위한 하드웨어 및 소프트웨어 공동 설계 플랫폼을 제안한다. 제안하는 플랫폼은 가속기를 구성하는 주요 성분을 변수화해 응용 프로그램 코드와 하드웨어 코드를 자동으로 생성하여 설계자가 적절한 하드웨어 비율을 쉽게 찾을 수 있도록 한다. 공동 설계 플랫폼은 Xilinx Alveo U200 FPGA가 탑재된 서버에서 Vitis 플랫폼을 기반으로 동작한다. 공동 설계 플랫폼을 통해 1000개의 행을 가지는 두 행렬의 곱셈 연산 가속기를 최적화한 결과 응용프로그램보다 실행 시간이 90.7%, 전력 소모가 56.3% 감소하였다.

하드웨어 복잡도를 줄이기 위한 RDO내 DCT 공유구조의 HEVC 화면내 예측부호화기 (An HEVC intra encoder sharing DCT with RDO for a low complex hardware)

  • 이석호;장준영;변경진;엄낙웅
    • 스마트미디어저널
    • /
    • 제3권4호
    • /
    • pp.16-21
    • /
    • 2014
  • HEVC 차세대 비디오 압축 표준은 ITU-TSG16 WP와 ISO/IEC JTC1/SC29, WG 11 두 단체 공동으로 2013년 표준화가 완료되었으며 기존 H.264 하이프로파일과 비교하여 압축효율은 두배 정도이다. HEVC에서 화면내 예측 (intra prediction) 모드는 planar와 DC 모드를 포함한 35개의 방향성 모드가 있으나 모든 모드를 적용한 부호화기를 구현하기 위해서는 하드웨어 복잡도가 증가하며 각 코딩유닛(coding unit) 사이즈에 따라 정확한 모드예측을 위한 RDO (rate distortion optimization) 계산에 필요한 DCT 사이즈도 증가하였기 때문에 본 논문에서는 하드웨어 사이즈를 줄이기 위하여 양자화를 위한 DCT와 SSE 계산을 위한 RDO 블럭내 DCT를 공유하는 화면내 예측부호기를 제안한다. 성능은 HEVC 참조소프트웨어인 HM-13.0과 비교하여 BD-rate는 평균 20% 증가하며 부호화시간은 4배 이상 단축되어 300MHz에서 FHD ($1920{\times}1080p$) 영상의 초당 60 프레임 실시간 부호화가 가능하다.