• 제목/요약/키워드: 하드웨어 효율

검색결과 1,670건 처리시간 0.025초

양방향 모델을 적용한 Full-image Guided Filter의 효율적인 VLSI 구조 (Efficient VLSI Architecture of Full-Image Guided Filter Based on Two-Pass Model)

  • 이겨레;박태근
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1507-1514
    • /
    • 2016
  • Full-image guided filter는 커널 윈도우 영역만 필터링에 반영되는 기존의 커널 윈도우 기반 가이드 필터와 달리 가중치 전파 도식과 양방향 모델이 적용되어 영상의 모든 픽셀이 필터링에 반영된다. 이로써 가이드 필터의 경계 보존과 평활화 등의 가이드 이미지 필터의 특성을 유지하면서도 계산 복잡도를 개선할 수 있다. 본 논문에서는 full-image guided filter의 더 빠른 처리가 필요한 스테레오 비전 및 각종 실시간 시스템 분야에 적용될 수 있도록 효율적인 하드웨어 구조를 제안하였다. 필터링 프로세스에서 발생하는 각종 데이터의 종속성 분석과 영상의 PSNR 분석, 데이터 빈도 분석 등을 통하여 적합한 하드웨어 구조를 제안하였다. 또한 양방향 모델이 적용된 가중치 연산 모듈의 휴식 구간이 최소화되도록 효율적인 스케줄링을 하였고 실시간 처리가 가능하게 하였다. 제안한 하드웨어 구조는 동부하이텍 0.11um 표준셀 라이브러리로 합성하였을 경우 최대 동작주파수 214MHz(384*288 영상: 965 fps)와 76K(내부 메모리 제외) 게이트의 하드웨어 복잡도를 나타냈다.

메모리 크기에 효율적인 적분영상 하드웨어 설계 연구 (A Study of Integral Image Hardware Design for Memory Size Efficiency)

  • 이수현;정용진
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.75-81
    • /
    • 2014
  • 적분영상은 입력영상의 픽셀 값을 기준좌표부터 순차적으로 누적하여 만든 영상으로, Haar-like features와 같은 네모난 박스 모양의 필터 연산을 효율적으로 처리하기 위하여 사용된다. 그러나 적분영상은 입력영상보다 3배 이상 많은 메모리를 소모하기 때문에, 메모리 자원이 제한적인 하드웨어 설계 환경에서는 사용이 어렵다. 본 논문에서는 효율적인 메모리 사용을 위한 적분영상 하드웨어 설계 방법을 제안한다. 해당 방법은 적분영상 이외에 세로적분영상과 가로적분영상을 생성하고, 입력영상을 재사용 하는 방법을 사용한다. 그리고 박스 필터의 크기에 따라 modulo 연산을 적용하여 적분영상의 데이터 크기를 줄이는 방법을 함께 적용하였다. 적분 영상 데이터를 읽기 위해 나누어진 영상 데이터를 다시 덧셈해야하는 연산 오버헤드가 발생하지만, 4개의 데이터를 단순히 더하는 연산이므로 병렬처리가 가능한 하드웨어 환경에서는 큰 영향을 미치지 않는다. Xilinx사의 Virtex5-LX330T를 대상으로 실험한 결과 $640{\times}480$ 크기의 8bit gray-scale 입력영상에서 최대 $32{\times}32$ 크기의 필터사용을 기준으로 50%의 적분영상 메모리를 감소시킬 수 있다.

플래시 메모리 상에서 효율적인 B-트리 설계 및 구현 (The Efficient Design and Implementation of The B-Tree on Flash Memory)

  • 남정현;박동주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.55-57
    • /
    • 2005
  • 최근 들어 PDA, 스마트카드, 휴대폰, MP3 플레이어 등과 같은 이동 컴퓨팅 장치의 데이터 저장소로 플래시 메모리를 많이 사용하고 있다. 이런 이동 컴퓨팅 장치의 데이터를 효율적으로 삽입$\cdot$삭제$\cdot$검색하기 위한 색인기법이 필요하다. 기존연구에서는 BFTL(B-Tree Flash Translation Layer)기법을 사용하여 플래시 메모리 상에 B-트리 구축 시 쓰기연산을 감소시켜 비용을 줄였지만, B-트리 검색비용과 하드웨어 구성비용이 증가한다는 단점을 가지고 있다. 본 논문에서는 기존 연구의 문제점을 개선하고 효율적으로 플래시 메모리상에 B-트리를 구현하기위해 BOF(B-Tree On Flash Memory)기법을 제안한다. 이 기법을 통해 BFTL 기법에 근접하는 구축비용을 얻을 수 있을 뿐만 아니라 상당한 검색비용을 줄일 수 있다. 또한 하드웨어적 비용도 고려하여 저비용으로 B-트리를 구현하였다.

  • PDF

스마트카드를 이용하여 공개채널로 매표방지와 전체검증을 제공하는 전자선거기법 (A New Universally Verifiable and Receipt-free Electronic Voting Scheme Through Public Channel by Using Smartcard)

  • 김형석;김상진;오희국
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2003년도 동계학술대회
    • /
    • pp.605-610
    • /
    • 2003
  • 선거를 전자적으로 구성하기 위해서는 비밀성(privacy), 선거권(eligibility) 등과 함께 전체검증(universal verifiability)과 매표방지(receipt-freeness) 속성을 반드시 제공해야 한다. 지금까지 제안된 전자선거 기법은 매표방지와 전체검증을 제공하기 위해 도청 불가능한 채널이라는 물리적인 가정 하에 이루어지거나 하드웨어 장치를 이용하더라도 장치에 대한 신뢰가 가정되었다. 본 논문에서는 믹스 서버나 랜덤마이저의 역할을 스마트카드와 같은 안전한 하드웨어 장치가 하므로 물리적 가정 없이 효율적으로 구현한다. 제안한 시스템은 표를 섞는 과정에서 permutation matrix를 사용하여 증명하므로 증명의 회수가 적고 간단하여 효율적이다. 또한, 지금까지 제안된 대부분의 선거 기법은 ElGamal 암호시스템의 준동형 특성을 이용하여 모든 표를 결합한 다음 해독하여 집계를 계산하는데 이는 이산대수 문제를 효율적으로 해결할 수 있어야 가능했다. 이 논문에서는 ElGamal 암호시스템과 다차잉여 기반 암호알고리즘인 Naccacne 암호알고리즘을 결합하여 표를 인코딩 함으로써 유권자의 수가 많은 선거에 대해서도 다항 시간 내에 집계가 가능하다.

  • PDF

효율적인 몽고메리 모듈러 곱셈기의 설계 (A Design of Efficient Modular Multiplication based on Montgomery Algorithm)

  • 박혜영;유기영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1003-1006
    • /
    • 2004
  • 본 논문에서는 몽고메리 모듈러 곱셈(Montgomery Modular Multiplication) 알고리즘을 이용하여 효율적인 모듈러 곱셈기를 제안한다. 본 논문에서 제안한 곱셈기는 프로그램 가능한 셀룰라 오토마타(Programmable Cellular Automata, PCA)를 기반의 구조로 설계되어 하드웨어 복잡도를 줄이고, 곱셈시 몽고메리 알고리즘을 이용하여 일반적인 나눗셈 없이 모듈러 연산을 수행하여 시간 복잡도를 최소화 한다. 제안된 곱셈기는 시간적, 공간적인 면에서 간단하고 효과적으로 구성되어 지수연산을 위한 하드웨어의 하부구조나 오류 수정 코드(Error Correcting Code)의 연산에서 효율적으로 이용될 수 있을 것이다.

  • PDF

Pipeline-Aware QC-IRA-LDPC 부호 및 효율적인 복호기 구조 (Pipeline-Aware QC-IRA-LDPC Code and Efficient Decoder Architecture)

  • 사부흐;이한호
    • 전자공학회논문지
    • /
    • 제51권10호
    • /
    • pp.72-79
    • /
    • 2014
  • 본 논문은 PIPELINE-AWARE QC-IRA-LDPC (PA-QC-IRA-LDPC) 코드 생성 방법과 Rate-1/2 (2016,1008) PA-QC-IRA-LDPC 코드에 대한 효율적인 고속 복호기 구조를 제안한다. 제안한 방법은 비트 오류율 (BER) 성능 저하 없이 파이프라인 기법을 사용하여 임계경로를 나눌 수 있다. 또한 제안한 복호기 구조는 데이터 처리량, 하드웨어 효율 및 에너지 효율을 크게 향상시킬 수 있다. 제안한 복호기 구조는 90-nm CMOS 기술을 사용하여 합성 및 레이아웃이 수행되었으며, 이전에 보고된 복호기 구조들에 비해서 하드웨어 효율성이 53%이상 향상되었고, 훨씬 좋은 에너지 효율성을 보여준다.

시뮬링크를 활용한 SCA 웨이브폼의 자동 생성 방법론 (Auto-Generation Methodology of SCA Waveforms by Using Simulink)

  • 김선희;심효택;설진호;맹승렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.520-525
    • /
    • 2008
  • SCA(Software Communications Architecture)는 SDR(Software Defined Radio)를 위한 표준 플랫폼으로, 어떤 플랫폼에서도 SCA 표준을 이용하여 구현된 시스템이라면 SCA 규격을 지켜 작성된 소프트웨어 모듈을 실행할 수 있도록 하고 있다. SDR은 기존의 하드웨어로 구현하였던 무선 통신 시스템을 모두 소프트웨어로 구현하고자 하는 기술이지만, 임베디드 시스템의 경우에는 프로세서의 성능이 현저히 떨어지기 때문에 실시간 신호 처리를 보장할 수가 없다는 문제점이 있다. 따라서, 무선통신의 성능을 보장하기 위해서는 범용 프로세서와 함께 DSP나 FPGA와 같은 특화된 하드웨어의 사용이 필요하게 되었다. 이러한 경우에는 웨이브폼 어플리케이션 작성을 위해서 하드웨어와 소프트웨어의 파티셔닝도 고려해야 한다. 본 논문에서는 SCA 플랫폼에서의 웨이브폼 어플리케이션을 빠르게 생성하는 방법을 제안하여 다양한 하드웨어를 사용하는 플랫폼에서의 최종 웨이브폼 어플리케이션을 위한 설계 공간 탐색(Design space exploration)을 도와, 내장형 시스템에서도 효율적으로 실행 가능한 웨이브폼 어플리케이션을 개발할 수 있도록 한다.

  • PDF

IPv6용 IPSec 하드웨어 칩을 위한 AES 모듈 (AES Modules for IPSec Hardware Chips in IPv6)

  • 김경태;김지욱;박상길;양인제;김동규;이정태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.920-925
    • /
    • 2002
  • 급속히 고갈되어가는 IPv4의 주소 부족 문제를 해결하기 위하여, 차세대 인터넷 프로토콜 (IP)인 IPv6가 제안되었고 실용화 단계까지 진행되고 있다. IPv6에서의 요구 사항 중의 하나인 IPSec은 IPv4의 취약한 보안 기능을 강화하는 것이다. 현재 IPSec에서 반드시 구현되어야 할 암호화 알고리즘으로 MD5, SHA1, 3DES와 더불어 최근 표준안으로 채택된 AES(Rijndael)을 요구하고 있다. IPv6의 고속 수행을 위하여는 IPSec이 하드웨어로 구현될 필요성이 있으므로, 본 논문에서는 IPv6용 IPSec 칩에 탑재할 AES 하드웨어 모듈을 구현하였다. 제안된 하드웨어 모듈은 효율적인 알고리즘의 수행과 구현을 위하여, 암호화/복호화 단계가 동일한 구조로 동작하도록 설계하였으며, 가변적인 128, 196,256 비트의 키에 대하여 같은 로직을 사용하도록 설계하였다.

  • PDF

복부 CT 영상에서 빠른 폐 분할을 위한 그래픽 하드웨어 기반 레벨 셋 기법 (Hardware-based Level Set Method for Fast Lung Segmental ion on CT Abdomen Image)

  • 박성진;홍헬렌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.886-888
    • /
    • 2005
  • 본 논문에서는 복부 CT 영상에서 폐 부위를 빠르게 분할하기 위하여 그래픽 하드웨어를 사용한 레벨 셋 기법을 제안한다. 제안방법은 다음과 같이 세 단계로 구성된다. 첫째, 레벨 셋 기법을 그래픽 하드웨어로 효율적으로 구현하기 위하여 초기 레벨 셋 값 설정과 설정된 레벨 셋 값을 텍스처메모리에 저장한다. 둘째, 레벨 셋 기법의 가장 중요한 부분인 속도함수를 그래픽 하드웨어의 빠른 연산을 이용하여 계산하고, 레벨 셋 값을 갱신한다. 셋째, 갱신된 레벨 셋 값을 통하여 제로-레벨 셋을 찾는다. 본 논문에서는 제안 방법을 평가하기 위하여 일련의 복부 CT 영상을 사용하며, 육안평가 및 수행시간 면에서 기존 소프트웨어 기반 레벨 셋 기법과 비교분석한다. 실험결과 본 제안방법은 소프트웨어 기반 레벨 셋 기법과 분할결과를 동일하게 유지하면서 평균 9배 빠르게 폐 부위를 분할하였다.

  • PDF

셀룰라 오토마아에 기반한 신경망 (Neural Networks based on Cellular Automata)

  • 조용군;신석영;강훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 춘계학술대회 학술발표 논문집
    • /
    • pp.57-60
    • /
    • 1998
  • Darwin Machine은 자기 자신의 구조를 전자적인 속도로 진화해 나가는 하드웨어로서 복잡한 구조와 성질으 진화 기법을 사용하여 만들어 나가는 진화공학(Evolutionary Engineering)의 한 예이다. 하드웨어가 전자적인 속도로 진화하기 위해서는 각각으리 하드웨어 구성요소들이 병렬적으로 작동해햐 하는데 셀룰라 오토마타는 이러한 문제를 해결하는 적합한 구조이며, 하드췌어에 쉽게 이식할 수 있는 장점이 있다. 신경망의 학습 능력과 진한 연산을 이용하면 효율적인 진화를 유도할 수 있다. 본 논문에서는 이러한 하드웨어 구현을 위한 셀룰라 오토마타에 기반한 신경망을 보이고자 한다.

  • PDF