• 제목/요약/키워드: 공유 연산기

검색결과 60건 처리시간 0.028초

저전력 영상 특징 추출 하드웨어 설계를 위한 하드웨어 폴딩 기법 기반 그라디언트 매그니튜드 연산기 구조 (Gradient Magnitude Hardware Architecture based on Hardware Folding Design Method for Low Power Image Feature Extraction Hardware Design)

  • 김우석;이주성;안호명
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.141-146
    • /
    • 2017
  • 본 논문에서는 저전력 영상 특징 추출 하드웨어 설계를 위한 하드웨어 폴딩 기법 기반 저면적 Gradient magnitude 연산기 구조를 제안한다. 하드웨어 복잡도를 줄이기 위해 Gradient magnitude 벡터의 특징을 분석하여 기존 알고리즘을 하드웨어를 공유하여 사용할 수 있는 알고리즘으로 변경하여 Folding 구조가 적용될 수 있도록 했다. 제안된 하드웨어 구조는 기존 알고리즘의 특징을 최대한 이용했기 때문에 데이터 품질의 열화가 거의 없이 구현될 수 있다. 제안된 하드웨어 구조는 Altera Quartus II v16.0 환경에서 Altera Cyclone VI (EP4CE115F29C7N) FPGA를 이용하여 구현되었다. 구현 결과, 기존 하드웨어 구조를 이용하여 구현한 연산기와의 비교에서 41%의 logic elements, 62%의 embedded multiplier 절감 효과가 있음을 확인했다.

전력선 위상 측정을 위한 하이브리드 센서 칩 개발 (Development of a hybrid sensor chip for power line phase measurement)

  • 김병일;홍근표;황진용;안병선;장태규
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.436-438
    • /
    • 2005
  • 본 논문에서는 전력선 위상 측정을 위해 A/D 변환기 및 위상계측 연산장치를 집적한 하이브리드 센서칩의 구현 기법을 제시하였다. 개발한 위상계측 연산장치는 recursive sliding-DFT에 기반하였으며 곱셈기의 시분할 공유 구조를 사용하여 칩의 구현 면적을 최소화 하였다. 60Hz의 전력선 신호를 중심주파수로 하는 AD 변환장치는 sigma-delta ADC를 기반으로 하여 8-bit 정밀도를 제공하며 아날로그부의 구현을 최소화하도륵 설계하였다. 설계한 하이브리드 센서칩은 컴퓨터 시뮬레이션 및 FPGA 구현을 통해 동작을 검증하였으며, 검증 완료후 $0.35{\mu}m$ CMOS 공정기술로 구현하였다. 전력선 위상을 측정하기 위해 구현된 4채널 하이브리드 센서 칩의 설계면적은 $5{\times}5m^2$ 의 약 20%정도를 차지하였다.

  • PDF

VP9 디코더에 대한 행렬 기반의 정수형 역변환 구조 (Integer Inverse Transform Structure Based on Matrix for VP9 Decoder)

  • 이태희;황태호;김병수;김동순
    • 전자공학회논문지
    • /
    • 제53권4호
    • /
    • pp.106-114
    • /
    • 2016
  • 본 논문에서는 VP9 디코더에 대한 행렬 기반의 정수형 역변환 구조를 제안한다. 제안하는 구조는 DCT(Discreste Cosine Transform), ADST(Asymmetric Discrete Sine Transform) 그리고 WHT(Walsh-Hadamard Transform)에 대한 알고리즘을 공유하며 버터플라이구조보다 하드웨어 리소스를 줄이고 제어하기 쉬운 하드웨어 구조이다. VP9 구글 모델 내 정수형 역변환은 버터플라이구조 기반의 정수형 역변환 구조를 가진다. 일반적인 버터플라이구조와는 달리 구글모델 내 정수형 역변환은 각 단계마다 라운드 쉬프트 연산기를 가지며, 비대칭 구조의 사인 변환을 포함한다. 따라서 제안하는 구조는 모든 역변환 모드에 대해 행렬계수 값을 근사하고, 이 계수 값을 이용하여 행렬연산 방식을 사용한다. 본 논문의 기술을 사용하면 역변환 알고리즘에 대한 모드별 동작 공유 및 버터플라이구조에 비해 곱셈기 수를 2배가량 감소시킬 수 있다. 그래서 하드웨어 리소스를 효율적으로 관리가 가능해진다.

순환 DFT에 기초한 광역 동기 위상 측정 장치의 ASIC 구현 (An ASIC implementation of Synchronized Phase Measurement Unit based on Sliding-DFT)

  • 김종윤;김석훈;장태규
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 A
    • /
    • pp.302-304
    • /
    • 2001
  • 본 논문에서는 다 채널 위상 측정 장치를 전용하드웨어로 구현하기 위한 설계 구조에 대하여 제시하였으며, 연산량이 많은 곱셈기를 시분할에 의해 공유하는 구조를 제시하였다. 또한 페이저 측정을 위한 Sliding-DFT 알고리즘을 순환 구현할 경우의 근사 구현 오차에 관한 정량적인 연구를 수행하였다. 이러한 오차 영향의 해석을 기반으로 하여 곱셈기 공유 구조를 적용한 위상 측정 장치를 설계하고, 설계한 하드웨어의 내부동작을 보여주는 시뮬레이션을 통해 설계의 정확성을 확인하였다.

  • PDF

SHA-1과 HAS-160과 의사 난수 발생기를 구현한 해쉬 프로세서 설계 (Design of Hash Processor for SHA-1, HAS-160, and Pseudo-Random Number Generator)

  • 전신우;김남영;정용진
    • 한국통신학회논문지
    • /
    • 제27권1C호
    • /
    • pp.112-121
    • /
    • 2002
  • 본 논문에서는 미국과 한국의 해쉬 함수 표준인 SHA-1과 HAS-160 해쉬 알고리즘, 그리고 SHA-1을 이용한 의사 난수 발생기를 구현한 프로세서를 설계하였다. SHA-1과 HAS-160이 동일한 단계 연산을 가지므로, 한 단계 연산만을 구현하여 공유함으로써 하드웨어 리소스를 감소시켰다. 그리고 메시지 변수의 사전 계산과 단계 연산을 두 단계의 파이프라인 구조로 구현함으로써 한 개의 클럭으로 한 단계 연산을 수행하는 방식보다 최장지연경로는 1/2로 줄고, 총 단계 연산에 필요한 클럭 수는 하나만 증가하므로 성능은 약 2배 향상되었다. 그 결과, 설계한 해쉬 프로세서는 삼성 0.5 um CMOS 스탠다드 셀 라이브러리를 근거로 산출할 때, 100 MHz의 동작 주파수에서 약 624 Mbps의 성능을 얻을 수 있다. 그리고 의사 난수 발생기로 사용될 때는 약 195 Mbps의 난수 발생 성능을 가진다. 이러한 성능은 지금까지 상용화된 국내외의 어느 해쉬 프로세서보다 빠른 처리 시간을 가지는 것으로 판단된다.

모바일 환경을 이용한 정보 시스템의 구현 (Information System Implementation of Mobile Environment Use)

  • 이정기;신명숙;안성수;이준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.943-945
    • /
    • 2005
  • P2P 환경에서의 파일 공유 방식은 클라이언트/서버 방식과는 다르게 값비싼 서버를 사용하지 않고 클라이언트 컴퓨터들만을 사용하여 자료의 공유 및 관리를 분산시킨다. 이러한 이유로 대용량의 서버를 사용하는 클라이언트/서버 방식에서 발생하는 인적, 물적 자원의 낭비를 최소화 할 수 있다. 또한 사용자의 수가 늘어날수록 연산, 협업의 성과가 높아지는 등의 혜택을 제공한다. 이와 같은 이유로 인해 많은 사람들이 P2P에 관심을 갖고, 또한 현재 각광받고 있는 모바일 관련 분야에도 P2P를 이용한 연구들이 활발하게 진행되고 있다. 모바일 P2P 서비스란 서버의 중개 없이, 서버에 접속해 있는 한 모바일 클라이언트에서 다른 모바일 클라이언트로 다양한 정보 및 데이터를 전송하는 방식으로, 종래의 P2P 개념을 모바일 기반으로 확장한 것이다. 본 연구에서는 모바일 P2P 서비스를 영농정보 공유, 재해 정보의 통계 및 분석을 위한 프로그램에 응용하였다.

  • PDF

스마트모바일 서비스 - M2M 기술 및 표준 동향 (Smart Mobile Services - M2M Technology and Its Standardization Trends)

  • 유상근;홍용근;김형준
    • 전자통신동향분석
    • /
    • 제26권2호
    • /
    • pp.50-60
    • /
    • 2011
  • 정보통신기술의 발달은 개인용 컴퓨터나 노트북 컴퓨터와 같은 컴퓨터를 중심으로 이루어진 네트워킹 및 인터넷 환경을 컴퓨터를 포함한 스마트폰, PDA, 휴대용 멀티미디어 기기와 같이 이동이 가능한 소형의 기기를 중심으로 변화시키고 있다. 그러나, 연산, 통신 및 네트워킹 기능이 가능한 소형 장치들은 정보화 기기뿐만 아니라 계량기, 온도계와 같은 일반적인 사물에도 부착될 수가 있다. 사물에 부착된 이러한 소형 장치들은 사물의 정보를 자동으로 획득하게 해주거나 사물간의 통신 네트워크를 통해 정보의 상호 공유가 가능해진다. 이와 같이 사물에 부착된 통신 장치를 이용하여 사물이 네트워크에 연결되거나 사물간에 통신 네트워크를 구성하여 정보를 공유하는 개념 및 기술을 지칭하는 용어로 IoT, M2M 및 사물지능통신 등이 있다. 이러한 네트워크 환경에서는 사람 대 사람, 사람 대 사물뿐만 아니라 사물 대 사물간의 통신 네트워크가 가능해져 모든 객체간의 정보 공유가 가능해지며 이는 미래 유비쿼터스 정보 서비스 사회로 진화하기 위한 필수적인 기술 요소라 할 수 있을 것이다.

  • PDF

Common sub-expression sharing과 CORDIC을 이용한 OFDM 시스템의 저면적 파이프라인 FFT 구조 (Low-area Pipeline FFT Structure in OFDM System Using Common Sub-expression Sharing and CORDIC)

  • 최동규;장영범
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.157-164
    • /
    • 2009
  • 이 논문에서는 OFDM시스템에서 가장 큰 칩 면적을 차지하고 높은 전력을 요구하는 핵심 연산 블록인 FFT에 대하여 파이프라인 Radix-4 MDC 방식의 저면적 구조를 제안하였다. 나비연산기에서 Twiddle factor 복소 곱셈연산을 수행할 때, 기존의 곱셈기를 사용하지 않고 CSD형 계수의 공통패턴을 공유하여 덧셈의 수를 줄일 수 있는 Common sub-expression sharing 방식과 CORDIC 알고리즘을 사용하여 구현 면적을 감소시켰다. 제안구조는 Verilog-HDL을 통해 모델링하고 Synopsys로 논리합성한 결과 기존구조와 비교하여 복소곱셈부는 48.2%감소효과, 전체 FFT구조는 22.1%의 면적 감소효과를 달성하였다. 따라서 제안된 FFT구조는 다양한 크기의 FFT를 사용하는 OFDM용 시스템에 효율적으로 사용될 수 있는 구조임을 보였다.

하드웨어 구조의 H.264/AVC 가변길이 복호기 설계 (Design of Hardwired Variable Length Decoder for H.264/AVC)

  • 유용훈;이찬호
    • 대한전자공학회논문지SD
    • /
    • 제45권11호
    • /
    • pp.71-76
    • /
    • 2008
  • H.264(또는 MPEG-4/AVC pt.10) 압축 표준은 고성능 영상 압축 알고리즘으로 그 적용 범위를 넓혀 가고 있다. H.264 압축 표준의 가변길이 코드(Variable Length Code)는 데이터의 통계적 중복성의 특성을 이용하여 압축을 한다. 이러한 압축된 비트 스트림은 복호기에서 연속된 비트 스트림을 잘라내는 작업과 테이블에서 비트 스트림과 비교하는 작업을 진행하는데 순수 하드웨어 구현이 까다로운 연산부이다. 본 논문에서는 HD 영상을 실시간으로 복호 가능한 가변길이 복호기 구조를 제안한다. Exp-Golomb 복호기는 연산기로 구성되어 있으며, CAVLD는 테이블과 연산기를 혼합하여 최적화된 하드웨어로 설계하였다. 비트 스트림의 분할(parsing) 작업은 배럴 쉬프터(Barrel shifter)와 1값 감지기(First 1's detector)에서 진행되며, 이 두 유닛은 Exp-Golomb 복호기와 CAVLD가 공유하는 구조로 설계하여 불필요한 하드웨어를 제거하였다. CAVLD와 재정렬(Reorder) 유닛간의 병목현상으로 가변길이 복호기 뿐만 아니라 H.264 디코더 전체의 성능 저하가 나타나는 단점을 제거하기 위해서 CAVLD와 재정렬 유닛간 FIFO와 재정렬 유닛의 최종 출력에 메모리를 두어 병목현상을 제거하였다. 제안된 가변길이 복호기는 Verilog-HDL을 이용하여 설계하고 FPGA를 통해 검증하였다. 0.18um 표준 CMOS 공정을 사용한 합성 결과는 22,604 게이트 수이며, 동작 주파수 120MHz에서 HD 영상이 복호됨을 확인하였다.

딥뉴럴네트워크를 위한 기능성 기반의 핌 가속기 (Functionality-based Processing-In-Memory Accelerator for Deep Neural Networks)

  • 김민재;김신덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.8-11
    • /
    • 2020
  • 4 차 산업혁명 시대의 도래와 함께 AI, ICT 기술의 융합이 진행됨에 따라, 유저 레벨의 디바이스에서도 AI 서비스의 요청이 실현되었다. 이미지 처리와 관련된 AI 서비스는 피사체 판별, 불량품 검사, 자율주행 등에 이용되고 있으며, 특히 Deep Convolutional Neural Network (DCNN)은 이미지의 특색을 파악하는 데 뛰어난 성능을 보여준다. 하지만, 이미지의 크기가 커지고, 신경망이 깊어짐에 따라 연산 처리에 있어 낮은 데이터 지역성과 빈번한 메모리 참조를 야기했다. 이에 따라, 기존의 계층적 시스템 구조는 DCNN 을 scalable 하고 빠르게 처리하는 데 한계를 보인다. 본 연구에서는 DCNN 의 scalable 하고 빠른 처리를 위해 3 차원 메모리 구조의 Processing-In-Memory (PIM) 가속기를 제안한다. 이를 위해 기존 3 차원 메모리인 Hybrid Memory Cube (HMC)에 하드웨어 및 소프트웨어 모듈을 추가로 구성하였다. 구체적으로, Processing Element (PE)간 데이터를 공유할 수 있는 공유 캐시 및 소프트웨어 스택, 파이프라인화된 곱셈기 및 듀얼 프리페치 버퍼를 구성하였다. 이를 유명 DCNN 알고리즘 LeNet, AlexNet, ZFNet, VGGNet, GoogleNet, RestNet 에 대해 성능 평가를 진행한 결과 기존 HMC 대비 40.3%의 속도 향상을 29.4%의 대역폭 향상을 보였다.