• 제목/요약/키워드: memory unit

검색결과 560건 처리시간 0.023초

NAND 전하트랩 플래시메모리를 위한 p채널 SONOS 트랜지스터의 특성 (The Characteristics of p-channel SONOS Transistor for the NAND Charge-trap Flash Memory)

  • 김병철;김주연
    • 한국전기전자재료학회논문지
    • /
    • 제22권1호
    • /
    • pp.7-11
    • /
    • 2009
  • In this study, p-channel silicon-oxide-nitride-oxide-silicon(SONOS) transistors are fabricated and characterized as an unit cell for NAND flash memory. The SONOS transistors are fabricated by $0.13{\mu}m$ low power standard logic process technology. The thicknesses of gate insulators are 2.0 nm for the tunnel oxide, 1.4 nm for the nitride layer, and 4.9 nm for the blocking oxide. The fabricated SONOS transistors show low programming voltage and fast erase speed. However, the retention and endurance of the devices show poor characteristics.

Large-scale 3D fast Fourier transform computation on a GPU

  • Jaehong Lee;Duksu Kim
    • ETRI Journal
    • /
    • 제45권6호
    • /
    • pp.1035-1045
    • /
    • 2023
  • We propose a novel graphics processing unit (GPU) algorithm that can handle a large-scale 3D fast Fourier transform (i.e., 3D-FFT) problem whose data size is larger than the GPU's memory. A 1D FFT-based 3D-FFT computational approach is used to solve the limited device memory issue. Moreover, to reduce the communication overhead between the CPU and GPU, we propose a 3D data-transposition method that converts the target 1D vector into a contiguous memory layout and improves data transfer efficiency. The transposed data are communicated between the host and device memories efficiently through the pinned buffer and multiple streams. We apply our method to various large-scale benchmarks and compare its performance with the state-of-the-art multicore CPU FFT library (i.e., fastest Fourier transform in the West [FFTW]) and a prior GPU-based 3D-FFT algorithm. Our method achieves a higher performance (up to 2.89 times) than FFTW; it yields more performance gaps as the data size increases. The performance of the prior GPU algorithm decreases considerably in massive-scale problems, whereas our method's performance is stable.

The Novel OverDriving Technology with Optimum Look-Up-Table

  • Huang, Ming-Wei;Huang, Juin-Ying;Tseng, Wen-Tse;Yu, Hong-Tien
    • 한국정보디스플레이학회:학술대회논문집
    • /
    • 한국정보디스플레이학회 2005년도 International Meeting on Information Displayvol.I
    • /
    • pp.276-279
    • /
    • 2005
  • The proposed Novel OverDriving Technology with Optimum Look-up-Table(LUT)is suggested to be a better solution to reducing the occurrence of overshooting caused by the traditional overdriving method implemented to normally liquid crystal (VA mode). Chunghwa Picture Tubes, LTD. (CPT) has successfully implement this tech into 20 inch TFTLCD TV module at the present day. The proposed technology can speed up gray-to-gray response time of LCD less than one half of frame time. On the side, Optimum LUT construction apply the compression scheme to record total actual grayscale transfer characteristics instead of applying the normal spread method such as linear / non-linear interpolation. The memory space is been reduced and the distortion of the image quality is lesser.

  • PDF

원자로 제어봉 구동장치 제어시스템용 전력제어기 FPGA 설계 (Design of FPGA in Power Control Unit for Control Rod Control System)

  • 이종무;신종렬;김춘경;박민국;권순만
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.563-566
    • /
    • 2003
  • We have designed the power control unit which belongs to the power cabinet and controls the power supplied to Control Rod Drive Mechanism(CRDM) as a digital system based on Digital Signal Processor(DSP). The power control unit dualized as the form of Master/Slave has had its increased reality. The Central Process Unit(CPU) board of a power control unit possesses two Digital Signal Processors(DSPs) of the control DSP for performing the tasks of power control and system monitoring and the communication of the Control DSP and the Communication DSP. To accomplish the functions requested in the power control unit effectively, we have installed Field Programmable Gate Arrays(FPGAS) on the CPU board and have FPGAs perform the memory mapping, the generation of each chip selection signal, the giving and receiving of the signals between the power controllers dualized, the fault detection and the generation of the firing signals.

  • PDF

항공기 3차원 충돌회피 알고리즘 구현과 실시간 운영체계를 이용한 Micro Controller Unit의 성능 비교 (Implementation of 3-D Collision Avoidance Algorithm and Comparison of Micro Controller Unit's Performance using Real-Time Operating System)

  • 임지성;김동신;박인혁;이상철
    • 항공우주시스템공학회지
    • /
    • 제12권5호
    • /
    • pp.48-53
    • /
    • 2018
  • 본 논문에서는 RTOS과 항공기의 3차원 충돌회피 알고리즘을 세 개의 MCU에 적용하여 각 MCU의 성능을 비교하였다. MCU는 많이 사용되는 Microchip Technology사의 ATmega2560과 STM사의 ARM Cortex-M3, ARM Cortex-M4를 선정하였으며, RTOS는 공개되어 있는 FreeRTOS 를 사용하였다. 성능을 확인하기 위해 적용된 3차원 충돌회피 알고리즘은 수직회피와 수평회피를 통합한 알고리즘이며 C++로 구현하였다. MCU의 성능은 각 MCU의 사용 메모리와 계산 시간을 측정하여 비교하였다. 비교 결과 세 MCU 중, 계산 시간은 ARM Cortex-M4가 빨랐으며, ATmega2560이 적은 메모리를 사용하였다.

텐서 처리부의 분석 및 파이썬을 이용한 모의실행 (Analysis of Tensor Processing Unit and Simulation Using Python)

  • 이종복
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.165-171
    • /
    • 2019
  • 컴퓨터 구조의 연구 결과, 특정 영역의 하드웨어를 개발하는 과정에서 가격 대 에너지 성능의 획기적인 개선이 이뤄진다고 알려져 있다. 본 논문은 인공신경망(NN)의 추론을 가속화시킬 수 있는 텐서 처리부(TPU) ASIC에 대한 분석을 수행하였다. 텐서 처리부의 핵심장치는 고속의 연산이 가능한 MAC 행렬곱셈기와 소프트웨어로 관리되는 온칩 메모리이다. 텐서 처리부의 실행모델은 기존의 CPU와 GPU의 실행모델보다 인공신경망의 반응시간 요구사항을 제대로 충족시킬 수 있으며, 수많은 MAC과 큰 메모리를 장착함에도 불구하고 면적이 작고 전력 소비가 낮다. 텐서플로우 벤치마크 프레임워크에 대하여 텐서 처리부를 활용함으로써, CPU 또는 GPU보다 높은 성능과 전력 효율을 나타낼 수가 있다. 본 논문에서는 텐서 처리부를 분석하고, 파이썬을 이용하여 모델링한 OpenTPU에 대하여 모의실행을 하였으며, 그 핵심장치인 행렬 곱셈부에 대한 합성을 시행하였다.

HARP의 캐쉬 메모리 및 메모리 관리 유니트 구조 설계

  • 이규호;강익태
    • ETRI Journal
    • /
    • 제10권3호
    • /
    • pp.49-61
    • /
    • 1988
  • HARP(High-performance Architecture for Risc-type Processor)는 한국전자통신연구소에서 정의한 고유모델의 RISC형 32비트 CPU이다. HACAM(HArp CAche and Mmu)은 HARP의 캐쉬 메모리 및 MMU(Memory Management Unit)를 custom IC로 구현한 VLSI 칩이다. 본 논문에서는 HACAM의 구조 설계에 대해 메모리 구조 및 메모리 관리 방식, 캐쉬 메모리 및 HACAM의 구성 등으로 나누어 설명하고 그 타당성을 논하였다.

  • PDF

다중 섹터 사이즈를 지원하는 낸드 플래시 메모리 기반의 저장장치를 위한 효율적인 FTL 매핑 관리 기법 (Efficient FTL Mapping Management for Multiple Sector Size-based Storage Systems with NAND Flash Memory)

  • 임승호;최민
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권12호
    • /
    • pp.1199-1203
    • /
    • 2010
  • 컴퓨터 시스템에서 Host와 저장장치간의 데이터 이동은 섹터를 기본 단위로 하고 있는데, 섹터 사이즈는 시스템마다 다른 가변적인 크기일 수 있다. 낸드 플래시 메모리는 구조상 페이지 사이즈와 섹터 사이즈 사이의 상관관계에 있어서, 섹터 사이즈가 낸드 플래시 메모리를 관리하는 방식에 상당한 영향을 미친다. 본 논문에서는 낸드 플래시 메모리 기반의 저장장치에서 효율적인 다중 섹터 사이즈를 지원하는 FTL 매핑 관리 기법을 제안하고, 그 관리 방법과 성능에 관하여 분석하여 본다. 본 논문에서 제안한 방식에 의하면 다중 섹터를 지원하는 낸드 플래시 메모리 저장장치를 효율적으로 관리하여 줄 수 있다.

OpenCL을 활용한 이기종 파이프라인 컴퓨팅 기반 Spark 프레임워크 (Spark Framework Based on a Heterogenous Pipeline Computing with OpenCL)

  • 김대희;박능수
    • 전기학회논문지
    • /
    • 제67권2호
    • /
    • pp.270-276
    • /
    • 2018
  • Apache Spark is one of the high performance in-memory computing frameworks for big-data processing. Recently, to improve the performance, general-purpose computing on graphics processing unit(GPGPU) is adapted to Apache Spark framework. Previous Spark-GPGPU frameworks focus on overcoming the difficulty of an implementation resulting from the difference between the computation environment of GPGPU and Spark framework. In this paper, we propose a Spark framework based on a heterogenous pipeline computing with OpenCL to further improve the performance. The proposed framework overlaps the Java-to-Native memory copies of CPU with CPU-GPU communications(DMA) and GPU kernel computations to hide the CPU idle time. Also, CPU-GPU communication buffers are implemented with switching dual buffers, which reduce the mapped memory region resulting in decreasing memory mapping overhead. Experimental results showed that the proposed Spark framework based on a heterogenous pipeline computing with OpenCL had up to 2.13 times faster than the previous Spark framework using OpenCL.