• 제목/요약/키워드: Arithmetic units

검색결과 59건 처리시간 0.025초

AB9: A neural processor for inference acceleration

  • Cho, Yong Cheol Peter;Chung, Jaehoon;Yang, Jeongmin;Lyuh, Chun-Gi;Kim, HyunMi;Kim, Chan;Ham, Je-seok;Choi, Minseok;Shin, Kyoungseon;Han, Jinho;Kwon, Youngsu
    • ETRI Journal
    • /
    • 제42권4호
    • /
    • pp.491-504
    • /
    • 2020
  • We present AB9, a neural processor for inference acceleration. AB9 consists of a systolic tensor core (STC) neural network accelerator designed to accelerate artificial intelligence applications by exploiting the data reuse and parallelism characteristics inherent in neural networks while providing fast access to large on-chip memory. Complementing the hardware is an intuitive and user-friendly development environment that includes a simulator and an implementation flow that provides a high degree of programmability with a short development time. Along with a 40-TFLOP STC that includes 32k arithmetic units and over 36 MB of on-chip SRAM, our baseline implementation of AB9 consists of a 1-GHz quad-core setup with other various industry-standard peripheral intellectual properties. The acceleration performance and power efficiency were evaluated using YOLOv2, and the results show that AB9 has superior performance and power efficiency to that of a general-purpose graphics processing unit implementation. AB9 has been taped out in the TSMC 28-nm process with a chip size of 17 × 23 ㎟. Delivery is expected later this year.

케이스기반플랜기법에 의한 적응력있는 레슨플렌생성기 (An Adaptive Lesson Plan Generator Based on Case-Based Planning)

  • 이재인
    • 인지과학
    • /
    • 제4권2호
    • /
    • pp.85-114
    • /
    • 1994
  • 지능형 교수 시스템(ITS:lntelligent Tutoring System)의 개발에 관한 연구에서 중요한 분야 중 하나의 교수법의 제어에 관한 연구이다. 즉 전체 학습목적 또는 학습주제의 선정(curriculmplan),선정된 학습목적에 적합한 레슨플랜(lesson plan),자연스런 대화진행(discourse plan) 방법에 관한 연구이다.본 논문에서는 위의 세가지 플랜 중 레슨플랜에 케이스 기반 플랜기법(casebased planing)을 적용하여 생성하는 방법을 제안하였다.기존의 레슨플랜생성기는 학습목적이 결정될 때마다 그에 적합한 레슨플랜을 생성하였다.이와달리 본 연구에서는 이미 기억된 플랜이 있으면 그 플랜을 그대로 사용하거나 수정하여 사용하고 기억된 플랜이 없으면 새로 생성할 수 있는 학습목적에 적응력 있는 레슨 플랜생성기를 개발하였다.연구의 대상으로는 미적분학의 부정적분으로 하였고 제시된 문제의 일반형을 유추하기 위하여 기술언어와 커리큘럼트리(curriculum tree)를 고안하였다.본 연구결과는 다른 분야 ITS의 레슨플랜생서기 개발에 이용할 수 있으며 또한 적분을 교육하는 실제 학습현장에서도 사용될 수 있을 것이다.

다중필터 리프팅 방식을 이용한 고성능 라인기반 필터링 구조 (High-Performance Line-Based Filtering Architecture Using Multi-Filter Lifting Method)

  • 서영호;김동욱
    • 대한전자공학회논문지SD
    • /
    • 제41권8호
    • /
    • pp.75-84
    • /
    • 2004
  • 본 논문에서는 Motion JPEG2000 등의 이산 웨이블릿 기반의 고속 영상처리를 위해서 리프팅 방식의 효율적인 H/W 구조를 제안하였다. 리프팅 내부연산의 반복성을 이용하여 알고리즘 레벨에서 구조적인 사상을 적용하고 데이터 스케줄링을 이용하여 최적화되고 간략화된 리프팅 기반의 필터링 셀의 구조를 제안한다. 이를 바탕으로 (9,7) 및 (5,3) 필터를 모두 수용할 수 있는 리프팅 커널의 구조를 구현하였다. 제안된 리프팅 커널은 일정 대기지연 시간 후에 연속적으로 데이터를 출력할 수 있는 간략화된 구조를 갖고 있다. 시간적인 순서로 입력되는 데이터에 대해서 일정한 출력을 발생할 수 있기 때문에 단순히 H/W를 추가하면 병렬적인 동작을 통해서 높은 출력율을 간단히 얻을 수 있다. 본 논문에서 제안된 리프팅 커널은 ASIC 및 FPGA 환경으로 모두 구현하였는데, ASIC으로는 삼성전자의 0.35㎛ CMOS 라이브러리를 이용하여 구현하였고 FPGA은 Altera사의 APEX을 타겟으로 하였다. ASIC의 경우 리프팅 연산을 위해 41,592개의 게이트 수와 라인 버퍼링을 위한 128Kbit의 메모리를 사용하였으며, FPGA의 경우 6,520개의 LE(Logic Element)와 128개의 ESB(Embedded System Block)을 사용하였다. 각각의 경우에 대해서 125MHz와 52MHz의 속도에서 안정적으로 동작할 수 있었다.

하드웨어 구조의 H.264/AVC 가변길이 복호기 설계 (Design of Hardwired Variable Length Decoder for H.264/AVC)

  • 유용훈;이찬호
    • 대한전자공학회논문지SD
    • /
    • 제45권11호
    • /
    • pp.71-76
    • /
    • 2008
  • H.264(또는 MPEG-4/AVC pt.10) 압축 표준은 고성능 영상 압축 알고리즘으로 그 적용 범위를 넓혀 가고 있다. H.264 압축 표준의 가변길이 코드(Variable Length Code)는 데이터의 통계적 중복성의 특성을 이용하여 압축을 한다. 이러한 압축된 비트 스트림은 복호기에서 연속된 비트 스트림을 잘라내는 작업과 테이블에서 비트 스트림과 비교하는 작업을 진행하는데 순수 하드웨어 구현이 까다로운 연산부이다. 본 논문에서는 HD 영상을 실시간으로 복호 가능한 가변길이 복호기 구조를 제안한다. Exp-Golomb 복호기는 연산기로 구성되어 있으며, CAVLD는 테이블과 연산기를 혼합하여 최적화된 하드웨어로 설계하였다. 비트 스트림의 분할(parsing) 작업은 배럴 쉬프터(Barrel shifter)와 1값 감지기(First 1's detector)에서 진행되며, 이 두 유닛은 Exp-Golomb 복호기와 CAVLD가 공유하는 구조로 설계하여 불필요한 하드웨어를 제거하였다. CAVLD와 재정렬(Reorder) 유닛간의 병목현상으로 가변길이 복호기 뿐만 아니라 H.264 디코더 전체의 성능 저하가 나타나는 단점을 제거하기 위해서 CAVLD와 재정렬 유닛간 FIFO와 재정렬 유닛의 최종 출력에 메모리를 두어 병목현상을 제거하였다. 제안된 가변길이 복호기는 Verilog-HDL을 이용하여 설계하고 FPGA를 통해 검증하였다. 0.18um 표준 CMOS 공정을 사용한 합성 결과는 22,604 게이트 수이며, 동작 주파수 120MHz에서 HD 영상이 복호됨을 확인하였다.

EGML 기반 이동객체 검출 프로세서의 저면적 하드웨어 구현 (A Small-area Hardware Implementation of EGML-based Moving Object Detection Processor)

  • 성미지;신경욱
    • 한국정보통신학회논문지
    • /
    • 제21권12호
    • /
    • pp.2213-2220
    • /
    • 2017
  • EGML (Effective Gaussian Mixture Learning) 기반의 배경차분 기법을 이용한 이동객체 검출 (Moving Object Detection; MOD) 프로세서의 효율적인 하드웨어 구현 방식을 제안한다. 하드웨어 복잡도를 감소시키기 위해 배경 생성에 사용되는 일부 연산을 근사화하여 구현하였으며, 배경차분과 가우시안 계산의 나눗셈 연산에 사용되는 하드웨어 자원이 공유되도록 설계하였다. 설계한 MOD 프로세서는 MATLAB/Simulink를 이용한 HDL-netlist 시뮬레이션과 FPGA-in-the-loop 방식을 통해 기능을 검증하였다. IEEE CDW-2014 데이터 세트의 6가지 영상을 입력으로 사용하여 MOD 성능을 평가한 결과, 평균 재현율(recall)은 0.7700, 평균 정밀도(precision)는 0.7170, F-measure가 0.7293으로 평가되었다. Xilinx ISE를 이용하여 FPGA 합성한 결과, Virtex5 XC5VSX95T 디바이스에서 총 882 슬라이스와 $146{\times}36kbit$의 블록 램으로 구현되었으며, 동일한 알고리듬을 적용한 기존의 구현 사례에 비해 약 60%의 하드웨어를 감소시켰다. MOD 프로세서는 최대 75 MHz의 클록 주파수로 동작하여 $800{\times}600$ 해상도의 영상에 대해 39 fps의 성능으로 실시간 처리가 가능한 것으로 평가되었다.

ATM-PON에서 MAC을 위한 승인분배 알고리즘의 FPGA 구현 (FPGA Implementation of a Grant Distribution Algorithm for the MAC in the ATM-PON)

  • 김태민;정해;신건순;김진희
    • 대한전자공학회논문지TC
    • /
    • 제38권10호
    • /
    • pp.1-9
    • /
    • 2001
  • ATM-PON(Passive Optical Network)에서 OLT(Optical Line Termination)가 ONU(Optical Network Unit)에게 동적으로 대역폭을 할당하기 위하여 MAC(Medium Access Control) 프로토콜이 필요하다. 이를 통하여 OLT는 ONU의 정보를 수집하고 각 ONU에게 효율적으로 승인을 제공한다. MAC 프로토콜의 두 가지 중요한 기능은 승인 요청 절차와 승인 분배 알고리즘이다. 후자는 TC(Transmission Convergence) 기능모듈에서 연산 량이 가장 많은 부분이며, 칩 면적에서 비교적 큰 부분을 차지하고, 전체 동작 속도를 제한하는 요소가 되기도 하며, 각 트래픽에 대한 서비스 품질을 보장할 수 있도록 설계되어야 한다. 본 논문에서는 MAC을 FPGA를 이용하여 구현하며, 이것은 활동중인 ONU의 수와 큐 길이 정보에 따라 동적으로 대역폭을 할당하며, 각 ONU의 셀 지연변이를 최소화하기 위하여 승인을 등 간격으로 배분한다. 동적인 대역할당을 위하여 MAC 스케쥴러의 구조는 프로그램 가능한 look-up 테이블을 가지고 있다. 또한 이 구조는 단순하면서도 적은 칩 면적과 적은 지연시간을 가지고 있다.

  • PDF

대용량 공간 데이터를 위한 병렬 처리 기법 (A Parallel Processing Technique for Large Spatial Data)

  • 박승현;오병우
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.1-9
    • /
    • 2015
  • 그래픽 처리 장치(GPU)는 내부에 대량의 산술 논리 연산 장치(ALU)를 보유하고 있다. 대량의 ALU는 병렬 처리를 위해 이용될 수 있으므로, GPU는 효율적인 데이터 처리를 제공한다. 공간 데이터를 지도상에 표현하기 위하여 지리학적 좌표가 필요하다. 좌표들은 측지경도와 측지위도의 형태로 저장된다. 데카르트 좌표계로 구성된 지도를 표현하기 위하여 측지경도와 측지위도는 국제 횡단 메르카토르 좌표계(UTM)로 전환돼야 한다. 좌표계 변환 과정과 변환된 좌표를 화면상에 표현하기 위한 렌더링 과정은 복잡한 부동 소수점 계산이 필요하다. 본 논문에서는 성능 향상을 위해 GPU를 활용한 좌표변환 과정과 렌더링 과정을 병렬적으로 처리하는 기법을 제안한다. 대용량 공간 데이터는 파일로 디스크 내에 저장된다. 대용량 공간 데이터를 효율적으로 처리하기 위하여 공간 데이터 파일들을 하나의 대용량 파일로 병합하고 Memory Mapped File 기법을 활용하여 파일에 접근하는 기법을 제안한다. 본 논문에서는 TIGER/Line 데이터를 활용하여 747,302,971개의 점으로 구성된 공간 데이터의 좌표 변환 및 렌더링 처리 과정을 GPU를 활용하여 병렬로 수행하는 연구를 진행한다. CPU를 이용하여 좌표변환 과정 결과와 렌더링 처리 과정 결과를 비교하여 속도 향상 정도에 대한 결과를 제시한다.

임상 간호사의 교대근무 기간이 circadian rhythm 변화에 미치는 영향 (Effect of Shift Interval for the Clinical Nurse on the Circadian Rhythm)

  • 황애란;정현숙;임영신;이혜원;김조자
    • 대한간호학회지
    • /
    • 제21권2호
    • /
    • pp.129-149
    • /
    • 1991
  • Circadian rhythm is entrained in the 24-hour time interval by periodic factors in the environment, known as zeitgeber. But most rotating work schedules are outside the range of the entrainment of the pacemaker timing the human circadian sleep - wake cycle. It has been postulated that physiological and emotional disturbances occur in most human functions when the circadian rhythm is disturbed. So application of circadian principles to the design of shift schedules can aid in maintaining the temporal integrity of the circadian system and thereby minimize for the shift worker any detrimental consequences of circadian disruption. This study was a quasi-experimental study to test the effect of shift intervals for the clinical nurse on the circadian rhythm. Twenty nurses newly employed in general units of two hospitals were selected as an experimental group and twelve college nursing students as a control group. Both groups were selected according to an established criteria using a purposive sampling technique. Ten subjects were assigned to a weekly shift group and another ten to a biweekly shift group engaged in a semi -continuous shift schedule(sunday off) with a backward direction, that is, morning -evening - night shift. The control group worked a morning shift for 42 days. Oral temperature rhythm, waking tim, sleep - wake cycle, fatigue, and mental performance were measured during the experimental period. The data collection period was from April 30, 1990 to June 10, 1990. MANOVA, paired t-test, ANOVA, and Student Newman Keuls method were used for statistical analysis. The results are summarized as follows. 1. Phase delay in the acrophase of temperature rhythm was shown according to the backward rotating shift. A complete adaptation to work on the night shift was achieved between the sixth and ninth day of the night shift. 2. There was no difference in either waking time or sleep- wake cycle according to the duration of the working day for every shift group. Significant difference was found in the waking time and the sleep -wake cycle for subjects on the morning, evening, and night shift in both of the shift groups(weekly shift group : λ=0.121, p<0.01, λ=0.112, p<0.01, biweekly shift group : λ=0.116, p<0.01, λ=0.084, p<0.01). 3. There was no difference in fatigue between the first working day and the last working day for the control group and for the biweekly shift group. In the weekly shift group, physical fatigue was significantly different for the first day and the sixth day of the night shift(t=-2.28, p<0.05). Physical fatigue and total fatigue on the first day of the night shift showed a significant difference among the control group, the weekly shift group, and the biweekly shift group(F=5.79, p<0.01, F=4.56, p<0.05). There was a significant difference between the shift groups and the control group(p<0.05), Physical fatigue, neurosensory fatigue and total fatigue on the last day of the night shift showed a significant difference among the control group, the weekly shift group, and the biweekly shift group(F=12.65, p<0.01, F=7.77, p<0.01, F=9.68, p<0.01). There was a significant difference between the shift groups and the control group(p<0.05). 4. No difference in mental performance was seen between the first day and the last day of work in each case. An arithmatic test on the first day of the night shift revealed a significant difference among the control group, the weekly shift group, and the biweekly shift group(F=3.79, p<0.05). There was a significant difference between the shift groups and the control group(p<0.05) . The digital symbol substitution test and the arithmetic test on the last day of the night shift showed a significant difference among the control group, the weekly shift group, and the biweekly shift group(F=3.68, p<0.05, F=5.55, p<0.01), and both showed a significant difference between the shift groups and the control group(p<0.05). Accordingly, this study showed that during night duty, the waking time, sleep- wake cycle, and fatigue increased and mental performance decreased compared with morning and evening duty. It was also found that the weekly shift group had a higher fatigue score on the sixth day of night duty as compared to the -first day, but the waking time, sleep- wake cycle, and mental performance revealed no difference for the duration of the night duty or between shift groups, and complete adaptation of temperature rhythm was achieved between the sixth and ninth day of night duty. It is possible to conclude from these results that for intermediate circadian type in a healthy young woman, a biweekly shift system is more compatible with the circadian timing system than weekly shift system.

  • PDF

범불안장애환자의 정신생리적 반응 (The Psychophysiologic Response in Korean Patients with Generalized Anxiety Disorder)

  • 정상근;황익근
    • 수면정신생리
    • /
    • 제4권1호
    • /
    • pp.107-119
    • /
    • 1997
  • 연구목적 : 범불안 장애환자에서 스트레스작업에 의한 정신 생리적 반응양상이 건강대조군과의 사이에 어떠한 차이가 있고, 정신생리적 반응과 불안평가척도들 사이에 어떠한 관계가 있는지를 알아보기 위해 본 연구를 시행하였다. 연구방법 : 범불안장애환자 23명과 건강군 23명을 대상으로, 기저기전 해밀턴 불안평가척도, 상태-특성불안검사, 기저기직전 스트레스작업직후 검사종료시 주관적 스트레스정도, 기저기와 휴식기 및 두 가지 스트레스작업(암산과 이야기작업) 동안의 정신생리적 측정치들(피부온도, 근전도, 맥박, 피부전도반응)을 평가분석하였다. 연구결과 : 1) 근전도는 암산작업 직후 및 이야기작업 직후 휴식기간에, 맥박수준은 암산작업 기간을 제외한 나머지 전체기간에 불안장애군이 대조군보다 유의하게 더 높았다. 2) 피부온도의 경우 암산작업시 놀람반응, 근전도의 경우 암산작업시 놀람 및 회복반응 모두, 피부전도반응의 경우 암산작업 직후 회복 반응에서 불안장애군이 대조군보다 통계적으로 유의하게 더 적은 변화량을 보였다. 불안장애군내에서 스트레스작업시 피부전도반응만 놀람반응에 비해 회복반응이 통계적으로 유의하게 더 적었다. 3) 기저기전 상태불안점수가 높을수록 이야기작업 직후 휴식기간의 피부전도반응이 통계적으로 유의하게 더 높았다. 해밀턴 불안평가척도와 특성불안점수가 높을수록 암산과 이야기 작업기간중, 특성불안점수가 높을수록 이야기작업 직후 휴식기간중 피부전도반응수준은 통계적으로 유의하게 더 높았다. 4) 근전도에서 상태불안점수가 높을수록 이야기작업시 회복반응이 통계적으로 유의하게 더 적었다. 피부전도반응에서 해밀턴 불안척도점수가 높을수록 암산작업시 놀람반응이, 이야기작업시 놀람반응이, 상태불안수준이 높을수록 이야기작업시 놀람 반응이 통계적으로 유의하게 더 컸다.

  • PDF