• 제목/요약/키워드: Hardware acceleration

검색결과 114건 처리시간 0.022초

하이브리드 IPTV를 위한 리치 미디어 프레임워크 개발 (Development of a Rich Media Framework for Hybrid IPTV)

  • 성민영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.631-636
    • /
    • 2010
  • 최근 방송통신 융합의 경향에 따라 IP 네트워크 통신 기반의 주문형 미디어와 지상파, 케이블등에 기반한 방송형 미디어를 모두 수용하는 하이브리드 IPTV가 주목을 받고 있다. 본 논문에서는 최신 H.264 코덱을 지원하는 하이브리드 IPTV를 위한 리치 미디어 프레임워크를 제안한다. 이를 위해 하이브리드 미디어를 다루는 TV에 최적화된 미디어 콤포넌트와 RIA 런타임 엔진을 개발한다. 미디어 콤포넌트는 RF 방송, IP 기반 저장된 미디어 및 라이브 미디어의 다양한 재생 방식에 대해 일관되면서도 효율적인 응용 인터페이스를 제공하도록 설계되었다. 특히, 성능과 이식성을 위해 미디어 콤포넌트는 미디어 스트림 추상화, 적응식 주문형 I-프레임 탐색, 재생시간 자동 계산 등을 채택하였다. 제안된 미디어 인터페이스를 기반으로 RIA 런타임 프로토타입을 개발하였다. RIA 런타임은 한정된 자원을 갖는 IPTV 환경에서의 최적화된 렌더링을 위해 프로세서의 내장 그래픽 가속기를 최대한 활용하도록 설계되었다. 개발된 프레임워크의 성능과 유용성을 검증하기 위해 시연 및 실험을 실시하고 그 결과를 제시한다. 제안된 프레임워크는 IPTV 기반 VOD, 광고, 교육 등의 응용에서 벡터 그래픽 및 하이브리드 미디어를 지원하는데 효과적으로 사용될 것으로 기대된다.

스마트 운전자 보조 시스템에서 영상인식기법의 실시간 처리를 위한 운전 상태 기반의 동적 프레임 제외 기법 (Driving Condition based Dynamic Frame Skip Method for Processing Real-time Image Recognition Methods in Smart Driver Assistance Systems)

  • 손상현;전용수;백윤주
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.54-62
    • /
    • 2018
  • 기술의 발전에 따라 다양한 응용을 위한 장치가 연구 및 개발되고 있으며 운전자 보조 시스템은 그 중 대표적인 기술이다. 운전자 보조 시스템 기술은 차량 주변의 정보를 인식하기 위해 영상인식 기법을 사용한다. 차량에 적용되는 운전자 보조 장치는 계산시간이 오래 걸리는 다수의 영상인식기법을 실시간으로 처리하는데 어려움이 존재한다. 이를 위해 제한된 하드웨어에서 영상인식 기법의 실시간 처리를 위한 동적 프레임 제외 기법을 제안한다. 기존의 연구에서 프레임 제외는 처리시간에 비례하여 정적으로 설정되었으며 처리 할 수 있는 영상인식기법의 수가 적음을 알 수 있다. 차량의 속도와 가속도를 통해 주행상태를 파악하여 동적으로 프레임 제외률을 설정하고 그에 맞게 영상인식 기법을 처리하여 그 수를 최대화시켰다. 실험을 통해 처리 수가 정적 기법에 비해 32.5% 상승함을 확인하였다.

멀티 코어와 GPU 결합 구조를 이용한 DEVS 기반 대규모 하이브리드 시스템 모델링 시뮬레이션의 가속화 (Accelerated Large-Scale Simulation on DEVS based Hybrid System using Collaborative Computation on Multi-Cores and GPUs)

  • 김성섭;조정훈;박대진
    • 한국시뮬레이션학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-11
    • /
    • 2018
  • 이산 사건 시스템 명세 (DEVS)를 이용한 하이브리드 시스템 시뮬레이션은 IoT 기반 Smart factory의 최적 동작을 위한 파라미터 추출 등 멀티 레벨 모델 계층을 포함한 복잡계 시스템의 해석에서 중요한 도구로 사용되고 있다. 하이브리드 시스템은 연속 시간 시스템과 이산 사건 시스템의 특성을 모두 포함하고 있어 그 복잡성으로 인해 결과를 얻기 위해 많은 시간을 필요로 한다. 본 연구에서는 멀티 코어와 GPU가 결합된 이기종 컴퓨터 구조를 이용한 DEVS 기반 대규모 하이브리드 시스템 시뮬레이션의 가속화를 제안한다. 제안하는 멀티 코어-GPU 상호 결합 시뮬레이션 실행 플랫폼을 사용하여 상대적으로 많은 순간 전력을 소모하지만 실행 시간 측면에서 빠른 시뮬레이션이 오히려 전체 에너지 소모 측면에서 장점을 가지는 것을 보여주고자 한다. 이를 위해 대규모 모델의 수평적/수직적 상호 결합된 DEVS 기반 하이브리드 시스템을 시뮬레이션 하였고 효과적인 시뮬레이션을 위한 하드웨어의 조합, 동작 파라미터 변경에 따른 성능 향상을 전력 소모 관점에서 분석하였다.

네트워크 침입방지 시스템을 위한 고속 패턴 매칭 가속 시스템 (A High-speed Pattern Matching Acceleration System for Network Intrusion Prevention Systems)

  • 김선일
    • 정보처리학회논문지A
    • /
    • 제12A권2호
    • /
    • pp.87-94
    • /
    • 2005
  • 패턴 매칭(Pattern Matching)은 네트워크 침입방지 시스템에서 가장 중요한 부분의 하나며 많은 연산을 필요로 한다. 날로 증가되는 많은 수의 공격 패턴을 다루기 위해, 네트워크 침입방지 시스템에서는 회선 속도로 들어오는 패킷을 처리 할 수 있는 다중 패턴 매칭 방법이 필수적이다. 본 논문에서는 현재 많이 사용되고있는 네트워크 침입방지 및 탐지 시스템인 Snort와 이것의 패턴 매칭 특성을 분석한다. 침입방지 시스템을 위한 패턴 매칭 방법은 다양한 길이를 갖는 많은 수의 패턴과 대소문자 구분 없는 패턴 매칭을 효과적으로 다룰 수 있어야 한다. 또한 여러 개의 입력 문자들을 동시에 처리 할 수 있어야 한다. 본 논문에서 Shift-OR 패턴 매칭 알고리즘에 기반을 둔 다중 패턴 매칭 하드웨어 가속기를 제시하고 여러 가지 가정 하에서 성능 측정을 하였다. 성능 측정에 따르면 제시된 하드웨어 가속기는 현재 Snort에서 사용되는 가장 빠른 소프트웨어 다중 패턴 매칭 보다 80배 이상 빠를 수 있다.

시청피로 저감형 S3D 영상 재생 시스템 구현 및 실시간 처리를 위한 알고리즘 연산량 분석 (Implementation of Stereoscopic 3D Video Player System Having Less Visual Fatigue and Its Computational Complexity Analysis for Real-Time Processing)

  • 이재성
    • 한국정보통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.2865-2874
    • /
    • 2013
  • 최근 박스 오피스 상위권 작품들의 상당수가 Stereoscopic 3D 상영을 병행하고 있으며 삼성, LG 등 세계 유수 가전업체들이 3DTV 판촉에 열을 올리고 있다. 그러나 사람마다 양쪽 눈동자 간격이 다르고 시청 거리와 위치도 개인마다 다르다는 점을 무시한 채 동일한 양안 시차로 제작된 3D 컨텐츠를 시청하게 될 경우 실세계에서 느끼는 입체감과 커다란 괴리가 발생하게 되어 극심한 시각 피로와 두통을 유발하게 된다. 이를 해결하기 위해 본 논문에서는 양안 시차와 시청 거리를 반영하여 입체 컨텐츠를 실시간으로 보정, 재생하는 S3D 렌더링 시스템을 제안 및 구현하고 그 연산 복잡도를 분석한다. 분석 결과 Optical Flow 알고리즘 블록은 한 프레임당 수행 시간이 최대 732초에 이르러 반드시 하드웨어 가속기 형태로 전용칩화할 필요가 있음을 확인하였고 Warping 알고리즘 처리 블록도 프레임당 최대 5.7초의 시간이 필요해 HD급 또는 1080p Full HD 화면 재생을 위해서는 함께 전용칩화 할 필요가 있음을 확인하였다.

편광 기반 주파수 스캐닝 간섭 시스템 및 병렬 프로그래밍 기반 측정 고속화 (A Polarization-based Frequency Scanning Interferometer and the Measurement Processing Acceleration based on Parallel Programing)

  • 이승현;김민영
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.253-263
    • /
    • 2013
  • 광학측정기법 중 주파수 스캐닝 간섭계는 기존 3차원 측정기법과 비교하여 광학 하드웨어 구조가 측정과정동안 고정되어 있어, 대물렌즈나 대상물체의 수직 스캐닝 없이 단지 광원의 주파수만 특정한 주파수 밴드내에서 스캐닝 하여 대상물체에 주사되므로, 우수한 광학 측정 성능을 보인다. 광원의 주파수를 변경하여 간섭계를 통해 간섭 영상을 획득한 후, 밝기 영상 데이터를 주파수 영역 데이터로 변환하고, 고속 푸리에 변환을 통한 주파수 분석을 이용하여 대상 물체의 높이 정보를 계측한다. 하지만, 대상물체의 광학적 특성에 기인한 광학노이즈와 주파수 스캐닝동안 획득되는 영상의 수에 따라 증가하는 영상처리시간은 여전히 주파수 스캐닝 간섭계의 문제이다. 이를 위해, 1) 편광기반 주파수 스캐닝 간섭계가 광학 노이즈에 대한 강인성을 확보하기 위해 제안되어진다. 시스템은 주파수 변조 레이저, 참조 거울 앞단의 ${\lambda}/4$ 판, 대상 물체 앞단의 ${\lambda}/4$ 판, 편광 광분배기, 이미지 센서 앞단의 편광기, 광섬유 광원 앞단의 편광기, 편광 광분배기와 광원의 편광기 사이에 위치하는 ${\lambda}/2$ 판으로 구성된다. 제안된 시스템을 이용하여, 편광을 기반으로한 간섭이미지의 대조대비를 조절할 수 있다. 2) 신호처리 고속화 방법이 간섭계 시스템을 위해 제안되며, 이는 그래픽 처리 유닛(GPU)과 같은 병렬처리 하드웨어와 계산 통합 기기 구조(CUDA)와 같은 프로그래밍 언어로 구현된다. 제안된 방법을 통해 신호처리 시간은 실시간 처리가 가능한 작업시간을 얻을 수 있었다. 최종적으로 다양한 실험을 통해 제안된 시스템을 정확도와 신호처리 시간의 관점으로 평가하였고, 실험결과를 통해 제안한 시스템이 광학측정기법의 실적용을 위해 효율적임을 보였다.

스마트 시설환경 실시간 시뮬레이션을 위한 하드웨어 가속 기술 분석 (A Benchmark of Hardware Acceleration Technology for Real-time Simulation in Smart Farm (CUDA vs OpenCL))

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.160-160
    • /
    • 2017
  • 자동화 기술을 통한 한국형 스마트팜의 발전이 비약적으로 이루어지고 있는 가운데 무인화를 위한 지능적인 스마트 시설환경 관찰 및 분석에 대한 요구가 점점 증가 하고 있다. 스마트 시설환경에서 취득 가능한 시계열 데이터는 온도, 습도, 조도, CO2, 토양 수분, 환기량 등 다양하다. 시스템의 경계가 명확함에도 해당 속성의 특성상 타임도메인과 공간도메인 상에서 정확한 추정 또는 예측이 난해하다. 시설 환경에 접목이 증가하고 있는 지능형 관리 기술 구현을 위해선 시계열 공간 데이터에 대한 신속하고 정확한 정량화 기술이 필수적이라 할 수 있다. 이러한 기술적인 요구사항을 해결하고자 시도되는 다양한 방법 중에서 공간 분해능 향상을 위한 다지점 계측 메트릭스를 실험적으로 구성하였다. $50m{\times}100m$의 단면적인 연동 딸기 온실을 대상으로 $3{\times}3{\times}3$의 3차원 환경 인자 계측 매트릭스를 설치하였다. 1 Hz의 주기로 4가지 환경인자(온도, 습도, 조도, CO2)를 계측하였으며, 계측 하는 시점과 동시에 병렬적으로 공간통계법을 이용하여 미지의 지점에 대한 환경 인자들을 실시간으로 추정하였다. 선행적으로 50 cm 공간 분해능에 대응하기 위하여 Kriging interpolation법을 횡단면에 대하여 분석한 후 다시 종단면에 대하여 분석하였다. 3 Ghz에 해당하는 연산 능력을 보유한 컴퓨터에서 1초 동안 획득한 데이터에 대한 분석을 마치는데 소요되는 시간이 15초 내외로 나타났다. 이는 해당 알고리즘의 매우 높은 시간 복잡도(Order of $O=O^3$)에 기인하는 것으로 다양한 시설 환경의 관리 방법론에 적절히 대응하기에 한계가 있다 할 수 있다. 실시간으로 시간 복잡도가 높은 연산을 수행하기 위한 기술적인 과제를 해결하고자, 근래에 관심이 증가하고 있는 NVIDIA 사에서 제공하는 CUDA 엔진과 Apple사의 제안을 시작으로 하여 공개 소프트웨어 개발 컨소시엄인 크로노스 그룹에서 제공하는 OpenCL 엔진을 비교 분석하였다. CUDA 엔진은 GPU(Graphics Processing Unit)에서 정보 분석 프로그램의 연산 집약적인 부분만을 담당하여 신속한 결과를 산출할 수 있는 라이브러리이며 해당 하드웨어를 구비하였을 때 사용이 가능하다. 반면, OpenCL은 CUDA 엔진이 특정 하드웨어에서 구동이 되는 한계를 극복하고자 하드웨어에 비의존적인 라이브러리를 제공하는 것이 다르며 클러스터링 기술과 연계를 통해 낮은 하드웨어 성능으로 인한 단점을 극복하고자 하였다. 본 연구에서는 CUDA 8.0(https://developer.nvidia.com/cuda-downloads)버전과 Pascal Titan X(NVIDIA, CA, USA)를 사용한 방법과 OpenCL 1.2(https://www.khronos.org/opencl/)버전과 Samsung Exynos5422 칩을 장착한 ODROID-XU4(Hardkernel, AnYang, Korea)를 사용한 방법을 비교 분석하였다. 50 cm의 공간 분해능에 대응하기 위한 4차원 행렬($100{\times}200{\times}5{\times}4$)에 대하여 정수 지수화를 위한 Quantization을 거쳐 CUDA 엔진과 OpenCL 엔진을 적용한 비교한 결과, CUDA 엔진은 1초 내외, OpenCL 엔진의 경우 5초 내외의 연산 속도를 보였다. CUDA 엔진의 경우 비용측면에서 약 10배, 전력 소모 측면에서 20배 이상 소요되었다. 따라서 우선적으로 OpenCL 엔진 기반 하드웨어 가속 기술 최적화 연구를 통해 스마트 시설환경 실시간 시뮬레이션 기술 도입을 위한 기술적 과제를 풀어갈 것이다.

  • PDF

EXT3NS 파일 시스템을 위한 버퍼 캐시의 설계 및 구현 (Design and Implementation of Buffer Cache for EXT3NS File System)

  • 손성훈;정성욱
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2202-2211
    • /
    • 2006
  • EXT3NS 파일 시스템은 Network-Storage Card(NS 카드)라는 전용 하드웨어를 기반으로 하는 멀티미디어 스트리밍 서버를 위한 파일 시스템이다. EXT3NS는 NS 카드 상의 PCI memory(PMEM)를 이용, 스트리밍 시 디스크에 있는 데이터를 메인 메모리를 거치지 않고 바로 네트워크 카드로 내보냄으로써 스트리밍 서버의 성능을 향상시킨다. 본 논문에서는 NS 카드에 있는 PMEM을 기반으로 한 버퍼 캐시를 추가 설계, 구현하고, 이 버퍼 캐시가 EXT3NS 파일 시스템을 채용한 서버의 멀티미디어 스트리밍의 성능을 개선시킬 수 있음을 보인다. 또한, 제안된 버퍼 캐시 상에서 다수의 동시 사용자를 지원하는 멀티 미디어 스트리 밍 서버를 위한 버퍼 캐시 교체 정책인 Old New Section(ONS) 교체 기법을 제안한다. 제안된 OSN 교체 기법은 멀티미디어 스트리밍 환경에서 기존의 교체 정책들 보다 좋은 성능을 보인다. 성능 평가 결과, 다시 읽기동작과 무작위 읽기 동작에서 기존의 EXT3NS 파일 시스템 보다 PMEM에 캐시를 사용한 EXT3NS가 각각 평균 33MB/sec, 2.4MB/sec의 성능이 향상 되었다. 또한, 다시 읽기 동작의 경우 기존의 Least Frequently Used(LFU) 교체 정 책을 사용한 경우보다 ONS 교체 정책을 사용한 경우가 약 600KB/sec의 성능 증가를 보인다. 이러한 결과는 동시에 여러명의 사용자 요구를 처리해야 하는 대용량 멀티 미디어 스트리밍 서버에서 보다 효과적인 읽기 동작을 처리할 수 있음을 나타낸다.

임베디드 시스템을 위한 OpenVG 구현 (Implementation of OpenVG on Embedded Systems)

  • 이환용;백낙훈
    • 한국멀티미디어학회논문지
    • /
    • 제12권3호
    • /
    • pp.335-344
    • /
    • 2009
  • 기존의 2차원 그래픽스 환경에서는 비트맵이나 래스터 위주의 연산들이 주가 되었지만, 최근에는 범위성(範圍性, scalability)을 지원하기 위해서, 임베디드 시스템과 웹 브라우저를 중심으로 2차원 스케일러블 벡터 그래픽스 기능(scalable vector graphics feature)을 제공하고 있다. 현재는 Flash, SVG 등이 활발히 사용되고 있으며, 이를 지원하기 위한 하위 라이브러리 표준으로는 크로노스 그룹(Khronos Group)의 OpenVG가 실질적 API 표준(de facto API standard)의 역할을 담당하고 있다. 이 논문에서는 OpenVG 표준의 구현 결과인 AlexVG의 설계 및 구현 과정, 최종 결과를 제시한다. AlexVG의 구현은 설계 당시부터 또다른 실질적 표준인 SVG-Tiny와의 연계를 염두에 두었고, 현재 OpenVG의 응용 프로그램들은 물론이고, SVG-Tiny 표준에 따른 미디어 파일들을 재생할 수 있는 능력을 제공한다. 제공하는 기능 면에서 본다면, AlexVG는 OpenVG 적합성 검사(conformance test)를 100% 통과하였으며, SVG-Tiny 적합성 검사의 그래픽스 관련 부분도 100% 통과하였다. 성능 면에서는 자원의 제한이 심한 휴대용 기기들과 임베디드 기기들에서의 효율성에 초점을 맞추었다. 그 결과로, 기존의 참조 구현(reference implementation)에 비하여 획기적인 속도 향상을 가져 왔으며, 특히 ARM 등의 저성능 CPU에서도 다른 라이브러리나 하드웨어 지원 없이 우수한 실행 속도를 보이고 있다.

  • PDF

Head motion during cone-beam computed tomography: Analysis of frequency and influence on image quality

  • Moratin, Julius;Berger, Moritz;Ruckschloss, Thomas;Metzger, Karl;Berger, Hannah;Gottsauner, Maximilian;Engel, Michael;Hoffmann, Jurgen;Freudlsperger, Christian;Ristow, Oliver
    • Imaging Science in Dentistry
    • /
    • 제50권3호
    • /
    • pp.227-236
    • /
    • 2020
  • Purpose: Image artifacts caused by patient motion cause problems in cone-beam computed tomography (CBCT) because they lead to distortion of the 3-dimensional reconstruction. This prospective study was performed to quantify patient movement during CBCT acquisition and its influence on image quality. Materials and Methods: In total, 412 patients receiving CBCT imaging were equipped with a wireless head sensor system that detected inertial, gyroscopic, and magnetometric movements with 6 dimensions of freedom. The type and amplitude of movements during CBCT acquisition were evaluated and image quality was rated in 7 different anatomical regions of interest. For continuous variables, significance was calculated using the Student t-test. A linear regression model was applied to identify associations of the type and extent of motion with image quality scores. Kappa statistics were used to assess intra- and inter-rater agreement. Chi-square testing was used to analyze the impact of age and sex on head movement. Results: All CBCT images were acquired in a 10-month period. In 24% of the investigations, movement was recorded (acceleration: >0.10 [m/s2]; angular velocity: >0.018 [°/s]). In all examined regions of interest, head motion during CBCT acquisition resulted in significant impairment of image quality (P<0.001). Movement in the horizontal and vertical axes was most relevant for image quality (R2>0.7). Conclusion: Relevant head motions during CBCT imaging were frequently detected, leading to image quality loss and potentially impairing diagnosis and therapy planning. The presented data illustrate the need for digital correction algorithms and hardware to minimize motion artefacts in CBCT imaging.