• 제목/요약/키워드: Pipeline computing

검색결과 57건 처리시간 0.028초

Real-time Speed Limit Traffic Sign Detection System for Robust Automotive Environments

  • Hoang, Anh-Tuan;Koide, Tetsushi;Yamamoto, Masaharu
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권4호
    • /
    • pp.237-250
    • /
    • 2015
  • This paper describes a hardware-oriented algorithm and its conceptual implementation in a real-time speed limit traffic sign detection system on an automotive-oriented field-programmable gate array (FPGA). It solves the training and color dependence problems found in other research, which saw reduced recognition accuracy under unlearned conditions when color has changed. The algorithm is applicable to various platforms, such as color or grayscale cameras, high-resolution (4K) or low-resolution (VGA) cameras, and high-end or low-end FPGAs. It is also robust under various conditions, such as daytime, night time, and on rainy nights, and is adaptable to various countries' speed limit traffic sign systems. The speed limit traffic sign candidates on each grayscale video frame are detected through two simple computational stages using global luminosity and local pixel direction. Pipeline implementation using results-sharing on overlap, application of a RAM-based shift register, and optimization of scan window sizes results in a small but high-performance implementation. The proposed system matches the processing speed requirement for a 60 fps system. The speed limit traffic sign recognition system achieves better than 98% accuracy in detection and recognition, even under difficult conditions such as rainy nights, and is implementable on the low-end, low-cost Xilinx Zynq automotive Z7020 FPGA.

Energy Efficient and Low-Cost Server Architecture for Hadoop Storage Appliance

  • Choi, Do Young;Oh, Jung Hwan;Kim, Ji Kwang;Lee, Seung Eun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권12호
    • /
    • pp.4648-4663
    • /
    • 2020
  • This paper proposes the Lempel-Ziv 4(LZ4) compression accelerator optimized for scale-out servers in data centers. In order to reduce CPU loads caused by compression, we propose an accelerator solution and implement the accelerator on an Field Programmable Gate Array(FPGA) as heterogeneous computing. The LZ4 compression hardware accelerator is a fully pipelined architecture and applies 16 dictionaries to enhance the parallelism for high throughput compressor. Our hardware accelerator is based on the 20-stage pipeline and dictionary architecture, highly customized to LZ4 compression algorithm and parallel hardware implementation. Proposing dictionary architecture allows achieving high throughput by comparing input sequences in multiple dictionaries simultaneously compared to a single dictionary. The experimental results provide the high throughput with intensively optimized in the FPGA. Additionally, we compare our implementation to CPU implementation results of LZ4 to provide insights on FPGA-based data centers. The proposed accelerator achieves the compression throughput of 639MB/s with fine parallelism to be deployed into scale-out servers. This approach enables the low power Intel Atom processor to realize the Hadoop storage along with the compression accelerator.

모바일 환경에서의 동적 장면의 효율적인 이차 광선 추적을 위한 격자 가속 구조 (Grid Acceleration Structure for Efficiently Tracing the Secondary Rays in Dynamic Scenes on Mobile Platforms)

  • 서웅;최병준;임인성
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.573-580
    • /
    • 2017
  • 최근 모바일 기기성능의 비약적인 향상에도 불구하고 아직 발열과 배터리의 한계로 인하여 PC 플랫폼에 비해 성능이 제한적이다. 따라서 고화질의 렌더링을 위하여 모바일 광선 추적 기술을 적용하는데 있어, 주 광선 계산은 래스터화 기반의 OpenGL ES 렌더링으로 대치한 후 이차 광선만을 추적하는 방법을 고려할 수 있다. 이 경우 전체 렌더링 과정에서 이차 광선의 추적 비용이 대부분의 시간을 차지하게 되는데, 본 논문에서는 이러한 문제를 해결하고자 동적인 장면 렌더링 시 응집성이 떨어지는 이차 광선의 탐색 성능을 개선하는 볼륨 격자 구조 방법을 제안한다. 이를 위해 가능한 모든 이차 광선을 정해진 적은 수의 샘플링 광선으로 모델링하여, 균일 격자 구조의 단점인 광선 추적 경로상의 모든 셀을 방문해야하는 문제를 완화하는 방법으로 격자 탐색의 성능을 향상시켰다. 또한 전체 렌더링 성능을 향상시키기 위하여 모바일 기기의 CPU와 GPU를 효과적으로 활용할 수 있는 하이브리드 렌더링 파이프라인을 제안한다.

SIMD 기반의 VBP 기법을 적용한 효율적인 퀵정렬의 구현 (An Implementation of Efficient Quicksort Utilizing SIMD-Based VBP Technique)

  • 홍길석;김홍연;강성현;민준기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권8호
    • /
    • pp.498-503
    • /
    • 2017
  • SIMD(Single Instruction Multiple Data)는 대표적인 병렬화 아키텍처 중 하나로, SIMD 레지스터에 적재된 여러 개의 데이터들을 하나의 명령어로 처리하는 기술이다. 퀵정렬(Quicksort)은 데이터 값들이 리스트로 저장되어 있을 때, 임의의 위치에 있는 데이터 값을 피봇으로 하여 그것보다 작은 값은 왼편으로, 큰 값은 오른편으로 분할하여 생성된 두 개의 서브리스트에 대하여 같은 작업을 반복함으로써 데이터 값들을 정렬하는 정렬 알고리즘이다. 본 연구에서는 SIMD 명령어를 이용하여 파이프라인 아키텍처에서 조건 예측 실패에 따른 성능 저하를 유발하지 않도록 분기 조건을 최소로 사용하는 효율적인 퀵정렬(Quicksort) 알고리즘을 제안한다. 또한, VBP(Vertical Bit Parallel) 기법과 얼리 프루닝(early pruning) 기법을 적용하여 SIMD 레지스터에 데이터를 바이트 단위로 적재함으로써 퀵 정렬 알고리즘의 성능을 향상하였다.

Validation of fetus aneuploidy in 221 Korean clinical samples using noninvasive chromosome examination: Clinical laboratory improvement amendments-certified noninvasive prenatal test

  • Kim, Min-Jeong;Kwon, Chang Hyuk;Kim, Dong-In;Im, Hee Su;Park, Sungil;Kim, Ji Ho;Bae, Jin-Sik;Lee, Myunghee;Lee, Min Seob
    • Journal of Genetic Medicine
    • /
    • 제12권2호
    • /
    • pp.79-84
    • /
    • 2015
  • Purpose: We developed and validated a fetal trisomy detection method for use as a noninvasive prenatal test (NIPT) including a Clinical Laboratory Improvement Amendments (CLIA)-certified bioinformatics pipeline on a cloud-based computing system using both Illumina and Life Technology sequencing platforms for 221 Korean clinical samples. We determined the necessary proportions of the fetal fraction in the cell-free DNA (cfDNA) sample for NIPT of trisomies 13, 18, and 21 through a limit of quantification (LOQ) test. Materials and Methods: Next-generation sequencing libraries from 221 clinical samples and three positive controls were generated using Illumina and Life Technology chemistries. Sequencing results were uploaded to a cloud and mapped on the human reference genome (GRCh37/hg19) using bioinformatics tools. Based on Z-scores calculated by normalization of the mapped read counts, final aneuploidy reports were automatically generated for fetal aneuploidy determination. Results: We identified in total 29 aneuploid samples, and additional analytical methods performed to confirm the results showed that one of these was a false-positive. The LOQ test showed that the proportion of fetal fraction in the cfDNA sample would affect the interpretation of the aneuploidy results. Conclusion: Noninvasive chromosome examination (NICE), a CLIA-certified NIPT with a cloud-based bioinformatics platform, showed unambiguous success in fetus aneuploidy detection.

$5\times5$ CNN 하드웨어 및 전.후 처리기 구현 (An Implementation of the $5\times5$ CNN Hardware and the Pre.Post Processor)

  • 김승수;전흥우
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.865-870
    • /
    • 2006
  • 셀룰러 신경회로망(Cellular Neural Networks: CNN)은 그 구조가 간단함에도 불구하고 강력한 연산능력을 가지고 있어 영상처리에 이용되어 왔다. 그러나 실제의 대규모 영상에 포함된 화소의 양과 같은 막대한 셀들을 필요로 하는 CNN하드웨어를 구현하는 것은 불가능하다. 본 논문에서는 시 다중화 처리 기법으로 대규모 실영상을 처리할 수 있는 $5\times5$ CNN 하드웨어와 전 후 처리기를 구현하였다. 구현된 $5\times5$ CNN 하드웨어와 전 후 처리기의 성능을 평가하기 위해 $ 레나영상에 대해 윤곽선 검출을 수행하였으며, 약 4,000번의 시다중화 블록처리와 각 블록 마다 10번의 제어 펄스에 의한 파이프라인 동작에 의해 영상처리가 수행되었다. 따라서 본 논문에서 구현된 $5\times5$ CNN 하드웨어와 전 후 처리기를 실영상 처리에 이용할 수 있다.

병렬 컴퓨터를 위한 저지연 프로그램형 조견표 경로지정 엔진 (Low-Latency Programmable Look-Up Table Routing Engine for Parallel Computers)

  • 장래혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권2호
    • /
    • pp.244-253
    • /
    • 2000
  • 병렬 컴퓨터의 메시지 전달에서 응용에 관계없이 일반적으로 우수한 경로 지정 및 스위칭 정책은 존재하지 않으므로, 사용자가 응용에 따라서 정책을 변경할 수 있게 하는 것이 바람직하다. 본 논문에서는 마이크로프로세서 구조에 기초한 경로 지정 엔진과는 달리, 성능의 감소 없이 융통성 있는 경로 지정과 스위칭 기능을 수행할 수 있는 조견표(look-up table) 경로 지정 엔진의 구현에 대하여 기술한다. 제안된 경로 지정 엔진은 조견표의 내용을 바꿈으로써 웜홀(wormhole), 가상 컷스루우(virtual cut-through) 및 패킷 스위칭(packet switching) 등은 물론, 다양한 경로 지정 알고리즘의 혼성(hybride)스위칭을 구현할 수 있다. 경로 지정 엔진의 조견표는 파이프라인 구조로 되어 있어, 하나의 플릿(flit) 정도의 저 지연을 가지므로, 단일 경로 지정 및 스위칭 정책을 하드와이어(hardwired)로 구현한 경우 보다 큰 성능의 감소 없이 다중의 경로 지정 동작을 중첩할 수 있다. 제안된 4개의 파이프 라인단은 해저드(hazard)를 일으키지 않으므로, 고 비용의 포워딩(forwarding) 회로가 필요 없다. 경로 지정 엔진은 시간공유의 컷스루우 버스나 크로스바(crossbar) 스위치를 갖는 단일 경로로 되어 있는 4개의 물리적 경로를수용할 수 있다. 제안된 경로 지정 엔진은 Xilinx 4000XL 시리즈 FPGA를 사용하여 구현되었다.

  • PDF

범용 모니터에서 실시간 3d 디스플레이가 가능한 입체 뷰잉 시스템 개발 (A 3d Viewing System for Real-time 3d Display General Monitors)

  • 이상용;진성아
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.13-19
    • /
    • 2012
  • 3d 영상 기술은 영화, 게임, 공연, 전시 등 콘텐츠 산업에서 폭 넓게 활용되고 있다. 또한 건축, 의료, 원전 산업에서도 활용도가 증대되고 있다. 하지만 3d 영상 생성기술은 거의 대부분 카메라를 두 대 이상 사용하여 촬영한 뒤 두 영상을 정합하는 방식이거나, 한 대를 사용하여 촬영한 영상을 변환보드를 이용하여 변환하는 기술이다. 이와 같이 추가적인 작업 시간이 필요한 3d 영상 생성 기술은 실시간 재생(real-time)을 지원하는 서비스에는 한계가 있다. 또한 범용적인 모니터 사용에 제약을 받는다. 제안된 기술은 특히 3d 게임 플레이나 입체영화 감상을 위해 요구되는 특별한 편광 모니터나 3d 입체 컨버터 없이도 실 3d 콘텐츠나 게임을 실시간으로 즐길 수 있는 방법을 제안한다. 단일 카메라만으로 생성가능하며 별도의 추가적인 에디팅이 불필요한 실시간 3d 영상을 생성기술을 개발하고 평가하였다.

DEEP-South: Round-the-Clock Physical Characterization and Survey of Small Solar System Bodies in the Southern Sky

  • Moon, Hong-Kyu;Kim, Myung-Jin;Roh, Dong-Goo;Park, Jintae;Yim, Hong-Suh;Choi, Young-Jun;Bae, Young-Ho;Lee, Hee-Jae;Oh, Young-Seok
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.54.2-54.2
    • /
    • 2016
  • Korea Microlensing Telescope Network (KMTNet) is the first optical survey system of its kind in a way that three KMTNet observatories are longitudinally well-separated, and thus have the benefit of 24-hour continuous monitoring of the southern sky. The wide-field and round-the-clock operation capabilities of this network facility are ideal for survey and the physical characterization of small Solar System bodies. We obtain their orbits, absolute magnitudes (H), three dimensional shape models, spin periods and spin states, activity levels based on the time-series broadband photometry. Their approximate surface mineralogy is also identified using colors and band slopes. The automated observation scheduler, the data pipeline, the dedicated computing facility, related research activity and the team members are collectively called 'DEEP-South' (DEep Ecliptic Patrol of Southern sky). DEEP-South observation is being made during the off-season for exoplanet search, yet part of the telescope time is shared in the period between when the Galactic bulge rises early in the morning and sets early in the evening. We present here the observation mode, strategy, software, test runs, early results, and the future plan of DEEP-South.

  • PDF

실시간 정밀 모션 제어를 위한 안드로이드 응용 설계 및 구현 (Design and Implementation of an Android Application for Real-time Motion Control)

  • 김도현;강형석;강정남;이은규;김강희
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.315-319
    • /
    • 2015
  • 본 논문은 실시간 정밀 모션 제어를 위한 안드로이드 응용의 설계와 구현을 다룬다. 안정적인 실시간 성능을 제공하기 위해서 다축 모터들이 특정 모션을 만들어낼 수 있도록 실시간 필드버스에 주기적으로 좌표 벡터 명령을 전달하고 그에 대한 피드백을 받는 모션 제어부를 데몬 프로세스 형태의 안드로이드 서비스로 구현하고, 이 모션 제어 서비스에 모션의 좌표 벡터들을 생성하여 전달하는 모션 계획부를 안드로이드 UI 응용으로 구현하였다. 이러한 소프트웨어 구성을 지원하기 위해서 멀티코어 프로세서를 모션 제어 서비스의 실행을 전담하는 실시간 코어들과 UI 응용의 실행을 전담하는 비실시간 코어로 나누었으며, 모션 제어 서비스와 응용 사이의 통신을 공유 메모리 형태로 구현하였다. 성능 측정 결과, 8축 모터들을 2개씩 그룹지어 4개의 쓰레드로 제어하는 경우에도 태스크 활성화 지터의 99%를 ${\pm}55{\mu}s$ 미만으로 유지하면서, 모션 제어 주기를 2ms까지 달성할 수 있었다.