• 제목/요약/키워드: StreamThread

검색결과 12건 처리시간 0.023초

슈퍼스칼라 구조를 갖지 않는 고성능 Stream Processor 설계 (A Design of a High Performance Stream Processor without Superscalar Architecture)

  • 이관호;김치용
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.77-80
    • /
    • 2017
  • 본 논문에서는 기존의 superscalar GP-GPU 구조와 달리 superscalar issue를 제거하여 GP-GPU성능을 향상하는 방법을 제안한다. superscalar issue를 제거하기 위해 stream processor의 구조를 단순화했다. stream processor의 구조가 단순화 됨에 따라 하드웨어의 크기를 크게 늘리지 않고 thread 개 수가 늘려 성능을 개선하였다. thread 개수가 늘어남에 따라 thread의 묶음인 warp을 관리하는 warp scheduler 구조를 새롭게 제안하였다. 제안하는 warp scheduler는 superscalar issue가 제거 되어 있기 때문에 warp 활성화 정보를 통해 라운드 로빈 스케쥴링을 통해 활성화 된 warp에게 명령어를 전달한다. 성능 비교는 가우시안 필터링 연산을 사용하였으며 기존의 GP-GPU의 비해 7.89배의 성능향상을 보였다.

병렬 알고리즘의 가속화를 위한 GP-GPU의 Thread할당 기법 (Thread Distribution Method of GP-GPU for Accelerating Parallel Algorithms)

  • 이관호;김치용
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.92-95
    • /
    • 2017
  • 본 논문에서는 적은 면적의 GP-GPU에서 성능을 향상시키기 위한 방법을 제안한다. 본 논문에서는 superscalar와 같이 과도하게 스케줄링 복잡성을 증가시키지 않는 대신 단순한 코어의 수를 늘려 성능을 극대화 시키는 방법을 제안한다. GP-GPU를 구성하는 Stream Processor의 구조를 단순화한다. 또한, Warp Schedule에서 thread 할당을 어플리케이션에 적합한 방법을 개발하여 성능을 개선한다. 성능을 검증하는 방안으로 neural network의 한 분야인 딥러닝에 대한 스레드 할당방식을 제안한다. Neural Network 알고리즘의 경우 Intel CPU 대비 90%에서 ARM Cortex-A15 4 core 대비 98% 성능 향상을 확인할 수 있었다.

State Thread 기반 실시간 데이터 스트림 관리 시스템 (Real-Time Data Stream Management System Using State Thread)

  • 박원빈;송창근;고영웅
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.177-180
    • /
    • 2010
  • RFID를 기반으로 유비쿼터스 환경의 응용 서비스를 지원하는 미들웨어는 지속적으로 끊임없이 입력되는 데이터 스트림을 실시간으로 처리하고 응용 서비스에서 요구하는 결과를 획득하여 전달해야 한다. 이와 같은 요구사항을 만족하기 위해 데이터 스트림 관리 시스템(DSMS)이 제안되었으며 다양한 연구가 시도되고 있다. 본 논문에서는 대량의 이벤트가 입력되는 환경에서 우선순위가 높은 질의를 실시간으로 처리하기 위한 DSMS를 제안하고 있다. 본 연구는 스탠포드의 STREAM 프로젝트를 활용하여 설계 및 구현하였으며, 각 쿼리를 State Thread로 동작시키는 방법을 이용하였다. 쓰레드 라이브러리의 스케줄러 부분을 실시간 스케줄러로 개선하는 작업을 진행하였으며, 실험을 통하여 쓰레드 스케줄러가 질의에 대해서 실시간으로 스케줄링을 할 수 있음을 보이고 있다.

Transition of Rivulet Flow from Linear to Droplet Stream

  • Kim, Ho-Young;Kim, Jin-Ho;Kang, Byung-Ha;Lee, Seung-Chul;Lee, Jae-Heon
    • International Journal of Air-Conditioning and Refrigeration
    • /
    • 제10권3호
    • /
    • pp.147-152
    • /
    • 2002
  • When a liquid is supplied through a nozzle onto a relatively non-wetting inclined solid surface, a narrow rivulet forms. There exist several regimes of rivulet flow depending on various flow conditions. In this paper, the fundamental mechanism behind the transition of a linear rivulet to a droplet flow is investigated. The experiments show that the droplet flow emerges due to the necking of a liquid thread near the nozzle. Based on the observation, it is argued that when the retraction velocity of a liquid thread exceeds its axial velocity, the bifurcation of the liquid thread occurs, and this argument is experimentally verified.

MPEG-2 TS로부터 MMTP 스트림으로의 변환기 개발 (A Development of MPEG-2 TS-to-MMTP Stream Converter)

  • 박민규;김용한
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.252-264
    • /
    • 2020
  • 2017년 5월 31일 세계 최초로 우리나라에서 지상파 UHD 방송이 상용화되었다. 기존 HDTV 방송은 압축된 미디어와 부가 데이터를 다중화하여 전달하기 위해 MPEG-2 TS(Transport Stream) 표준을 사용하였으나, 지상파 UHD 방송 규격에서는 차세대 표준인 MMT(MPEG Media Transport)가 채택되었다. 그러나 UHD 콘텐츠 제작 비용이 고가이므로, 현재 전체 방송시간 중 일부만 UHD로 방송되고 있으며 점차로 그 시간을 증가시켜 가고 있는 중이다. 한편 MMT가 채택된 ATSC 3.0 표준의 경우에도 북미에서 본격적인 상용화 단계에 이르지 못하고 있다. 이로 인해 MMT 방송 장비는 아직도 고가의 초기 단계에 있다. 본 논문에서는 기존 MPEG-2 TS 다중화기의 출력을 입력으로 받아 MMTP(MMT Protocol) 패킷 스트림으로 변환하는 저렴한 장비를 개발하는 데에 활용할 수 있는 소프트웨어를 다중 쓰레드(multi-thread) 기반으로 일반 PC 상에서 구현하고 그 기능을 실험을 통해 검증하였다.

Multi-Channel Internet Radio Platform에 대한 연구 (A Study of Multi-Channel Internet Radio Platform)

  • 김종덕;김영길
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1723-1728
    • /
    • 2010
  • 본 논문에서는 뮤직 콘텐츠의 무분별한 사용의 피해를 줄이고 대형 매장과 임의의 공간과 공간사이 다른 콘텐츠를 서비스 할 수 있는 Multi-Channel Internet Radio Platform 에 대해 설계 방안을 제공하고 구현 연구를 진행한다. 본 플랫폼은 Multi-Channel Connection을 위한 Application 설계방법과 그에 따른 Multi Stream을 위한 Hardware Path를 구현하는 방법 제안 및 구현 결과를 제공한다.

Stereo 360 VR을 위한 실시간 압축 영상 획득 시스템 (Real-Time Compressed Video Acquisition System for Stereo 360 VR)

  • 최민수;백준기
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.965-973
    • /
    • 2019
  • 본 논문에서는 Stereo 4K@60fps 360 VR 실시간 영상 획득 시스템을 영상 스트림 획득과 영상 인코딩(encoding), 영상 스티칭(stitching) 모듈로 나누어 설계하였다. 시스템은 6대의 카메라로부터 HDMI Interface를 통해 획득된 6개의 2K@60fps의 영상 스트림을 스티칭을 통하여 실시간으로 Stereo 4K@60fps 360 VR 영상을 획득한다. 영상 획득 단계에서는 멀티 스레드(Multi-Thread)를 이용하여 각 카메라로부터 실시간으로 영상 스트림을 획득하였다. 영상 인코딩 단계에서는 영상 획득과 영상 스티칭 모듈 간의 전송 리소스를 줄이기 위하여 멀티 스레드를 이용한 Raw Frame 메모리 전송과 병렬 인코딩을 하였다. 영상 스티칭 단계에서는 스티칭 Calibration 전처리작업을 통하여 스티칭 실시간성을 확보하였다.

빅 스트림 기반 초고속 데이터 스토리지 성능 평가 (Performance Evaluation of Big Stream based High Speed Data Storage)

  • 송민규;강용우;김효령
    • 한국전자통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.817-828
    • /
    • 2017
  • 단일 스트림 기준으로 10Gbps에 달하는 데이터 처리를 수행하는 시스템은 매우 제한적이고, 그에 관한 애플리케이션 역시 극소수에 불과한 실정이다. 하지만 이러한 시스템은 물리, 천문 등 과학연구 분야에서 더욱 그 중요성이 부각되고 있으며, 업그레이드 된 성능을 요구하고 있다. 이를 위해 해당 분야의 중소기업 지원을 위해 1년 전 10Gbps 수준으로 네트워크 입력되는 고속의 패킷 수신, 저장을 수행하는 초고속 스토리지가 개발되었다. 하지만 실제 연구 현장에서 사용되기 위해서는 객관화된 성능 평가가 수반되어야 하며 최적화가 이뤄져야 한다. 본 논문에서는 이에 필요한 시스템 환경을 구축한 것을 시작으로 객관화된 성능 지표를 얻기 위한 실험 과정 및 방법론에 대해 논의하였다.

멀티-코어 서버의 성능 분석 및 특성화 (Performance Analysis and Characterization of Multi-Core Servers)

  • 이명호;강준석
    • 정보처리학회논문지A
    • /
    • 제15A권5호
    • /
    • pp.259-268
    • /
    • 2008
  • 멀티-코어 프로세서는 최근 마이크로프로세서 시장의 주류 제품으로 자리 잡았다. 이러한 멀티-코어 프로세서를 기반으로 하는 서버들은 고성능 컴퓨팅 분야와 상용 응용 프로그램 분야에서 그 사용 범위를 넓혀가고 있다. 멀티-코어 프로세서는 높아진 병렬성으로 인하여 응용 프로그램의 성능도 한 단계 더 높여줄 것으로 기대된다. 하지만, 칩 내부의 여러 코어들이 공유 자원들을 사용하면서 발생하는 경쟁과 충돌이 성능에 병목으로 작용하기도 한다. 그러므로 멀티-코어 서버 상에서 높은 성능과 확장성을 얻기 위해서는 공유 자원의 사용을 최적화 하는 것이 필수적이다. 본 논문에서는 코어들 간의 공유 자원 사용에서 발생하는 긍정적/부정적인 효과들이 실제 응용 프로그램의 성능에 어떻게 반영되는지 실험을 통하여 분석해 본다. 또한 이러한 분석을 통하여 멀티-코어 서버의 성능을 특성화한다.

NTGST 병렬화를 이용한 고해상도 BLU 검사의 고속화 (NTGST-Based Parallel Computer Vision Inspection for High Resolution BLU)

  • 김복만;서경석;최흥문
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.19-24
    • /
    • 2004
  • 본 논문에서는 LCD (liquid crystal display) 생산라인에서 컴퓨터 비전에 의한 BLU (back light unit)의 고해상도 정밀검사를 원활하게 하기 위해 SIMD (single instruction stream and multiple data stream)형 병렬 구조의 다중 프로세서를 이용하여 계산 집약적인 NTGST (noise-tolerant generalized symmetry transform) 검사 알고리즘을 병렬구현 하였다. 먼저 알고리즘 자체의 속도향상을 위해 C 코드의 최적화를 거친 후, 순차형 프로그램을 N개의 데이터를 동시에 처리하는 SIMD형 언어로 변환하고, 검사영상 데이터를 SIMD형 다중프로세서에서 P개의 각 쓰레드에 분할 할당함으로써 O(NP)의 속도향상이 가능하도록 하였다. Dual Pentium Ⅲ 프로세서를 사용하여 실험한 결과, 제안한 병렬시스템은 기존보다 Sp=8 배 이상 고속 처리가 가능하여, 다양한 크기의 BLU에 대한 고해상도 정밀검사장비에도 신축적으로 확장적용 가능함을 확인하였다.