• 제목/요약/키워드: 하드웨어 최적화

검색결과 471건 처리시간 0.028초

하드웨어 구현을 위한 컴퓨터 생성 홀로그램 연산의 최적화 (An Optimization of Computer-Generated Hologram Operation for Hardware Implementation)

  • 최현준;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.224-226
    • /
    • 2010
  • 컴퓨터 생성 홀로그램(computer-generated hologram, CGH) 기법은 광학 신호들을 근사화한 후 PC에서 수학적인 연산으로 디지털 홀로그램을 생성하는 기술이다. 본 논문에서는 CGH 기법을 하드웨어로 구현할 경우 완벽한 병렬처리와 파이프라이닝이 가능하도록 연산식을 최적화하는 방법을 제안한다. 제안한 방법은 홀로그램의 이전 좌표에서 계산된 값에 일정한 값을 더하여 홀로그램을 생성하는 반복가산 기법의 일반항을 분석하여 하드웨어에 최적화된 수식으로 변형하는 것이다. 최적화된 수식의 경우 현재 좌표의 홀로그램을 계산하기 위해 이전 좌표에서 연산되었던 결과값을 기다렸다 이용하지 않기 때문에 실시간 디지털 홀로그래피를 위한 전용 하드웨어의 설계에 적합할 것이다.

  • PDF

FPGA 기반 성능 개선을 위한 CIE1931 색역 변환 알고리즘의 최적화된 하드웨어 구현 (Optimized hardware implementation of CIE1931 color gamut control algorithms for FPGA-based performance improvement)

  • 김대운;강봉순
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.813-818
    • /
    • 2021
  • 본 논문에서는 기존 CIE1931 색역 변환 알고리즘의 최적화된 하드웨어 구현 방법을 제안한다. 안개제거 알고리즘의 후처리 방법 중 비교적 연산량이 적은 기존 알고리즘은 연산 과정에서 Split multiplier를 사용한 큰 비트의 계산으로 하드웨어 자원 소모량이 크다는 단점이 있다. 제안하는 알고리즘은 기존 알고리즘의 미리 정의된 2번의 행렬 곱셈 연산을 하나로 줄임으로써 연산량 감소, 하드웨어 소형화를 실현하였고, Split multiplier 연산을 최적화시킴으로써 탑재하기에 더욱 효율적인 하드웨어를 구현하였다. 하드웨어는 Verilog HDL 언어로 설계하였고, Xilinx Vivado 프로그램을 이용한 논리합성 결과를 비교하여 4K 표준 환경에서 실시간 처리가 가능한 성능을 확인하였다. 또한, 2가지 FPGA에서의 탑재 결과를 통해 제안하는 하드웨어의 성능을 검증하였다.

블록기반 신경망을 이용한 패턴분류 (Pattern Classification using the Block-based Neural Network)

  • 공성근
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.396-403
    • /
    • 1999
  • 본 논문에서는 새로운 블록기반 신경망을 제안하고 블록기반 신경망의 패턴류 성능을 확인하였다. 블록기반 신경망은 4개의 가변 입출력을 가지는 블록을 기본 구성요소로하고 있으며 블록들의 2차원배열 형태로 이루어진다. 블록기반 신경망은 재구성가능 하드웨어에 의하여 구현이 용이하고 구조 및 가중치의 최적화에 진화 알고리즘을 적용시킬수 있는 새로운 신경망 모델이다. 블록 기반 신경망의 구조와 가중치를 재고성 가능 하드웨어(FPGA)의 비트열에 대응시키고 유전자 알고리즘에 의하여 전역최적화를 하여 구조와 가중치를 최적화한다. 유전 알고리즘에 의하여 설계된 블록기반 신경망을 비선형 결정평면을 가지는 여러 학습패턴에 적용하여 패턴분류 성능을 확인하였다.

  • PDF

개미 집단 시스템을 이용한 진화 하드웨어 (Evolvable Hardware Using Ant Colony System)

  • 황금성;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.244-246
    • /
    • 2002
  • 진화 하드웨어(Evolvable Hardware)는 환경 적응력이 강하고 최적의 상태를 유연하게 유지하는 하드웨어 설계 기법이나 회로가 복잡해질수록 진화가 어려워지는 문제로 인해 활용이 늦어지고 있다. 본 논문에서는 이를 해결하기 위한 많은 연구 중 회로 진화 과정 분석을 위한 방법으로 개미집단 시스템을 제안한다. 경로 최적화 알고리즘인 개미집단 시스템을 적절히 변형하여 진화 하드웨어에 적용시키는 방법을 제안하고 이를 실험으로 확인하였으며, 실험 결과 하드웨어의 진화 과정을 관찰할 수 있었고, 목표 하드웨어의 해공간 특성이 페로몬으로 분포하고 있음도 관찰할 수 있었다.

  • PDF

소프트웨어/하드웨어 최적화된 타원곡선 유한체 연산 알고리즘의 개발과 이를 이용한 고성능 정보보호 SoC 설계 (Design of a High-Performance Information Security System-On-a-Chip using Software/Hardware Optimized Elliptic Curve Finite Field Computational Algorithms)

  • 문상국
    • 한국정보통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.293-298
    • /
    • 2009
  • 본 연구에서는 193비트 타원곡선 암호화프로세서를 보조프로세서 형태로 제작하여 FPGA에 구현하였다. 프로그램 레벨에서 최적화된 알고리즘과 수식을 제안하여 증명하였고, 검증을 위해 Verilog와 같은 하드웨어 기술언어를 통하여 다시 한번 분석 하여 하드웨어 구현에 적합하도록 수정하여 최적화 하였다. 그 이유는 프로그래밍 언어의 순차적으로 컴파일되고 실행되는 특성이 하드웨어를 직접 구현하는 데에 본질적으로 틀리기 때문이다. 알고리즘적인 접근과 더불어 하드웨어적으로 2중적으로 검증된 하드웨어 보조프로세서를 Altera 임베디드 시스템을 활용하여, ARM9이 내장되어 있는 Altera CycloneII FPGA 보드에 매핑하여 실제 칩 프로토타입 IP로 구현하였다. 구현된 유한체 연산 알고리즘과 하드웨어 IP들은 실제적인 암호 시스템에 응용되기 위하여, 193 비트 이상의 타원 곡선 암호 연산 IP를 구성하는 라이브러리 모듈로 사용될 수 있다.

저전력 영상 특징 추출 하드웨어 설계를 위한 공통 부분식 제거 기법 기반 이미지 필터 하드웨어 최적화 (Image Filter Optimization Method based on common sub-expression elimination for Low Power Image Feature Extraction Hardware Design)

  • 김우석;이주성;안호명;김병철
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.192-197
    • /
    • 2017
  • 본 논문은 저전력 영상 특징 추출 하드웨어 설계를 위한 공통 부분식 제거 기법 기반 이미지 필터 하드웨어 최적화 기법을 제안한다. 저전력 및 고성능 물체인식 하드웨어는 공장 자동화를 위한 산업용 로봇에 필수 모듈로 채택되고 있다. 따라서 물체인식 하드웨어의 영상 특징 추출 알고리즘에 다양하게 적용되는 Gaussian gradient 필터 하드웨어의 저면적 설계가 필수적이다. Gaussian gradient 필터의 하드웨어 복잡도를 줄이기 위해 필터에 사용되는 계수의 Symmetric한 특징과 Transposed form FIR 필터 하드웨어 구조를 이용했다. 제안된 이미지 필터의 하드웨어 구조는 알고리즘에 적용된 계수의 변형 없이 구현되었기 때문에 윤곽선 검출 알고리즘에 적용했을 때 검출 데이터의 열화 없이 구현될 수 있다. 제안된 이미지 필터 하드웨어 구조는 기존 구조와 비교했을 때 곱셈기의 수를 50% 절감할 수 있음을 확인했다.

FPGA상에서 스파이킹 뉴럴 네트워크 지원을 위한 모델 최적화 (Model Optimization for Supporting Spiking Neural Networks on FPGA Hardware)

  • 김서연;윤영선;홍지만;김봉재;이건명;정진만
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.70-76
    • /
    • 2022
  • 클라우드 서버를 이용한 IoT 응용 개발은 네트워크로 연결된 하드웨어에 데이터 송수신 지연, 네트워크 트래픽, 실시간 처리 지원을 위한 비용 등의 문제가 발생한다. 엣지 클라우드 기반 플랫폼에서는 이러한 문제를 해결하기 위해 빠른 데이터 전달이 가능하도록 뉴로모픽 하드웨어를 사용할 수 있다. 본 논문에서는 FPGA상에서 스파이킹 뉴럴 네트워크를 위한 모델 최적화 기법을 제안한다. 뉴로모픽 하드웨어에 최적화된 네트워크 모델 파라미터를 자동 조정하는 것에 초점을 맞추었다. 정확도에 대한 사용자 요구사항을 기반으로 더 높은 성능을 보이도록 최적화를 수행한다. 성능 분석 결과, 기존의 오픈 프레임워크에서 지원하는 고정 기법과 달리 사용자의 요구사항을 모두 만족하였으며 수행시간 측면에서 더 높은 성능을 보였다.

학습된 신경망 설계를 위한 가중치의 비트-레벨 어레이 구조 표현과 최적화 방법 (Bit-level Array Structure Representation of Weight and Optimization Method to Design Pre-Trained Neural Network)

  • 임국찬;곽우영;이현수
    • 대한전자공학회논문지SD
    • /
    • 제39권9호
    • /
    • pp.37-44
    • /
    • 2002
  • 학습된 신경망(Pre-trained neural network)은 고정된 가중치(weight)를 갖는다. 이 논문에서는 이러한 특성을 이용하여 신경망의 효과적인 디지털 하드웨어의 설계방법을 제안한다. 이를 위해 신경망의 PEs(Processing Elements)연산은 행렬-벡터 곱셈으로 표하고 고정된 가중치와 입력 데이터의 관계를 비트-레벨 어레이(array) 구조로 표현하여, 노드 소거와 가중치 비트 패턴에 따른 공유 노드 설정을 통한 최적화로 연산에 필요한 노드를 최소화한다. FPGA 시뮬레이션 결과, 완전한 정확성에 기반한 하드웨어를 설계하는 경우, 하드웨어 비용을 상당부분 줄였고 동작 주파수가 높다는 것을 확인하였다. 또한, 제안한 설계방법은 한정된 공간 내에서 많은 수의 PEs 구현이 가능함으로, 큰 신경망 모델에 대한 온-칩(on-chip) 구현이 가능하다.

네트워크 플로우에 기반한 아키텍쳐 수준에서의 전력 최적화 (Network-Flow Based Architecture-Level Power Optimization)

  • 여준기;김태환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.667-669
    • /
    • 2002
  • 이 논문은 행위 합성(behavioral synthesis)에서 전력 소모 최적화를 위한 효율적인 알고리즘을 제안한다. 이전의 논문에서 전력 최적화를 위한 여러가지의 하드웨어 할당/바인딩(allocation/binding) 문제들이 네트워크 플로우 문제로 나타내어 질 수 있고, 최적으로 풀릴 수 있음이 보여졌다. 그러나, 그 연구에서는 고정된 스케줄이 가정되고 있다. 이와 관련해서 주어진 스케줄에 대한 하드웨어 할당/바인딩 문제를 위한 최적의 네트워크 플로우 결과가 주어졌을 때, 주어진 스케줄을 일부분 바꾼 것에 데란 새로운 최적의 네트워크 플로우 결과를 얻는 것이 주요 문제이다. 이 때문에 우리는 네트워크 구조와 플로우 계산간의 관계에 대한 분석으로 부터 최대 플로우 계산 단계와 최소 비용 계산 단계의 2단계 과정을 고안하였다. 실험결과를 통해 우리의 설계가 스케줄의 영향과 각 스케줄에 대한 최적의 바인딩을 이용함으로써 전력 소모와 계산 시간에서 매우 향상된 결과를 얻을 수 있음을 볼 수 있다.

  • PDF

임베디드 디바이스용 자가적응형 컴퓨팅 기술동향 (Trends on Self-Adaptive Computing Technology for Embedded Devices)

  • 이문수;석종수;김영주;차정은;김정시;정영준
    • 전자통신동향분석
    • /
    • 제31권4호
    • /
    • pp.55-64
    • /
    • 2016
  • 컴퓨터 시스템을 위한 소프트웨어 개발에 있어 성능 최적화는 하드웨어 및 운영체제에 대한 전문 지식과 다양한 상황을 고려할 수 있는 숙련을 필요로 하는 매우 어려운 작업으로 알려져 있다. 특히, 임베디드 시스템의 경우 사용되는 하드웨어와 운영체제의 종류가 매우 다양하여 임베디드 소프트웨어의 성능 최적화에는 더욱 많은 시간과 노력이 요구된다. 자가적응형 컴퓨팅은 소프트웨어 개발에 있어 성능 최적화 작업 노력을 최소화하기 위한 기술로 소프트웨어 실행을 실시간으로 감시하면서 소프트웨어 실행에 관여하는 다양한 컴퓨터 시스템 리소스들을 제어하여 소프트웨어가 요구하는 성능을 자동으로 맞춰주는 컴퓨팅 기술이다. 본고에서는 자가적응형 컴퓨팅 기술 현황을 살펴본 후 임베디드 디바이스를 위한 자가적응형 컴퓨팅 기술 개발 사례를 소개한다.

  • PDF