• 제목/요약/키워드: Stream processor

검색결과 76건 처리시간 0.021초

머신러닝 컴파일러와 모듈로 스케쥴러에 관한 연구 (A Study on Machine Learning Compiler and Modulo Scheduler)

  • 조두산
    • 한국산업융합학회 논문집
    • /
    • 제27권1호
    • /
    • pp.87-95
    • /
    • 2024
  • This study is on modulo scheduling algorithms for multicore processor in machine learning applications. Machine learning algorithms are designed to perform a large amount of operations such as vectors and matrices in order to quickly process large amounts of data stream. To support such large amounts of computations, processor architectures to support applications such as artificial intelligence, neural networks, and machine learning are designed in the form of parallel processing such as multicore. To effectively utilize these multi-core hardware resources, various compiler techniques are being used and studied. In this study, among these compiler techniques, we analyzed the modular scheduler, which is especially important in one core's computation pipeline. This paper looked at and compared the iterative modular scheduler and the swing modular scheduler, which are the most widely used and studied. As a result, both schedulers provided similar performance results, and when measuring register pressure as an indicator, it was confirmed that the swing modulo scheduler provided slightly better performance. In this study, a technique that divides recurrence edge is proposed to improve the minimum initiation interval of the modulo schedulers.

SIMD 프로그래머블 셰이더를 위한 멀티포트 레지스터 파일 설계 및 구현 (Multi-Port Register File Design and Implementation for the SIMD Programmable Shader)

  • 윤완오;김경섭;정진하;최상방
    • 대한전자공학회논문지SD
    • /
    • 제45권9호
    • /
    • pp.85-95
    • /
    • 2008
  • 3D 그래픽 알고리즘은 특성상 방대한 양의 스트림 데이터에 대하여 복잡한 연산을 수행하여야 한다. 이러한 알고리즘을 하드웨어에서 신속하게 수행할 수 있는 버텍스 셰이더와 픽셀 세이더의 도입으로 그래픽 프로세서는 "소프트웨어 셰이더의 하드웨어화"라는 목표를 어느 정도 달성한 것처럼 보이지만, 여전히 Z-버퍼 기반이라는 특정 알고리즘의 틀에서 벗어나지 못하고 있다. 향후 그래픽 프로세서가 궁극적으로 추구하는 모델은 알고리즘에 독립적인 그리고 버텍스 셰이더와 픽셀 셰이더가 통합된 셰이더로 발전할 것이다. 본 논문에서는 프로그래머블 통합 셰이더 프로세서에서 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위한 멀티포트 레지스터 파일 모델을 설계하고 구현하였다. 설계한 멀티포트 레지스터 파일을 기능적 레벨에서 시뮬레이션을 하여 그 성능을 검증 하였으며, FPGA Virtex-4(xc4vlx200)에 직접 구현하여 하드웨어 리소스 사용율과 속도를 확인 하였다.

메모리 스트림 할당 기법을 이용한 영상처리용 엔트로피 프로세서 설계 (Design of the Entropy Processor using the Memory Stream Allocation for the Image Processing)

  • 이선근;정우열
    • 한국전자통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.1017-1026
    • /
    • 2012
  • IT산업의 가속화로 인하여 다양한 미디어 환경이 조성되고 있는 현대사회에 3D-TV 등의 실시간 영상화면은 매우 중요한 이슈이다. 이러한 고화질의 실시간 영상은 매우 다양한 분야에 적용되고 있으며 CCTV 등의 영상 성능에 중요한 파라미터가 되고 있다. 그러나 이러한 고화질의 영상이라도 보안에 취약한 단점이 있기 때문에 보안채널 또는 각종 보안 알고리즘을 이용하여 이러한 단점을 없애고자 하는 시도가 매우 활발히 진행 중에 있다. 본 연구에서는 이러한 단점을 별도의 보안기술을 부가하여 처리속도를 감소시키는 것이 아니라 영상처리 자체에 보안기능을 부가함으로서 실시간 처리 및 보안성을 증대시키기 위한 방안을 제시한다.

다자간 화상회의 시스템에서의 동시 전송방법에 의한 데이터 입출력 시간 단축 방안 (Data Input/Output Time Reduction Scheme with the Simultaneous Transmission Method for Multi-participants Video Conference System)

  • 김현기
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.234-240
    • /
    • 2000
  • 본 논문에서는 멀티미디어 데이터 스트림이 기존의 시스템 버스를 이용하여 네트워크 접속장치로부터 주기억 장치 및 멀티미디어 처리장치에 동일한 데이터가 동시에 전송될 수 있는 방법을 제 안한다. 제안한 방법은 시스템 버스 내부의 데이터 흐름을 개선하고, 멀티미디어 데이터의 입출력 시간을 단축시킬 수 있다. 또한, 본 논문에서 제안한 방법을 다자간 화상회의 시스템에 적용하여 참석자 수에 따른 시스템 버스의 사용횟수, 버스사이클 및 데이터의 전송시간을 기존의 방법과 비교하였다. 성능비교 결과, 제안한 방법이 기존의 방법보다 참석자의 수에 관계없이 시스템 버스의 사용횟수는 50%, 전송시간은 75%씩 감소되리라 예상된다.

  • PDF

IMAGE DATA CHAIN ANALYSIS FOR SATELLITE CAMERA ELECTRONIC SYSTEM

  • Park, Jong-Euk;Kong, Jong-Pil;Heo, Haeng-Pal;Kim, Young-Sun;Chang, Young-Jun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.791-793
    • /
    • 2006
  • In the satellite camera, the incoming light source is converted to electronic analog signals by the electronic component for example CCD (Charge Coupled Device) detectors. The analog signals are amplified, biased and converted into digital signals (pixel data stream) in the video processor (A/Ds). The outputs of the A/Ds are digitally multiplexed and driven out using differential line drivers (two pairs of wires) for cross strap requirement. The MSC (Multi-Spectral Camera) in the KOMPSAT-2 which is a LEO spacecraft will be used to generate observation imagery data in two main channels. The MSC is to obtain data for high-resolution images by converting incoming light from the earth into digital stream of pixel data. The video data outputs are then MUXd, converted to 8 bit bytes, serialized and transmitted to the NUC (Non-Uniformity Correction) module by the Hotlink data transmitter. In this paper, the video data streams, the video data format, and the image data processing routine for satellite camera are described in terms of satellite camera control hardware. The advanced satellite with very high resolution requires faster and more complex image data chain than this algorithm. So, the effective change of the used image data chain and the fast video data transmission method are discussed in this paper

  • PDF

비트열 처리를 위한 저비용 명령어 세트 (A Low Cost Instruction Set for Bit Stream Process)

  • 함동현;이형표;이용석
    • 전자공학회논문지CI
    • /
    • 제45권2호
    • /
    • pp.41-47
    • /
    • 2008
  • 대부분의 미디어 압축 코덱에는 가변 길이 부호 기법이 적용된다. 본 논문에서는 이러한 가변 길이 부호의 복호 과정을 가속하기 위해 비트열 처리 전용 레지스터와 이를 이용하는 비트열 처리 전용 명령어 세트를 추가하는 방법을 제안한다. 본 논문에서 제안하는 명령어 세트는 프로세서에 기본적으로 존재하는 데이터 패스를 최대한 활용하고 비트열 정보를 비트열 입력포트 대신 메모리에서 읽어온다. 따라서 제안하는 명령어 세트는 프로세서의 변형을 최소화하고 추가적인 입력 제어기와 버퍼 없이 범용 프로세서에 적용하여 가변 길이 부호의 복호과정을 가속할 수 있다. 제안하는 명령어 세트의 데이터 패스를 TSMC $0.25{\mu}m$ 라이브러리를 이용하여 합성한 결과, 65 비트의 메모리와 344 게이트가 필요하였으며 0.19 ns의 추가적인 지연 시간이 있었다. 제안하는 명령어 세트는 H.264/AVC의 가변 길이 부호의 복호 수행 시간을 약 55 % 감소시켰다.

RTLS를 위한 위치 데이터 스트림 처리기 개발 (Development of Location Data Stream Processor for RTLS)

  • 이승철;홍봉희;김기홍;박재관
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2007년도 GIS 공동춘계학술대회 논문집
    • /
    • pp.15-20
    • /
    • 2007
  • 최근 항만 물류 및 자산 관리 분야에서 실시간 위치 정보를 처리하는 RTLS(Real Time Locating System)시스템이 도입되고 있다. 이러한 시스템에서 RTLS 서버는 태그를 부착한 이동 객체들의 위치 데이터 스트림을 일정 시간 동안 수집하여 애플리케이션으로 전달한다. 이 때 위치 정보는 전파 굴절 현상으로 인해 오차가 발생하며, 이동 객체에 부착된 태그는 수 초 마다 위치 정보를 보고하기 때문에 시스템의 과부하를 초래하게 된다. 본 논문에서는 표준과의 호환성을 고려하고, 요구사항을 반영한 위치 데이터 스트림 처리기를 설계 및 개발하였다. RTLS 시스템의 전파 굴절 현상으로 야기되는 비정상적인 위치 오차를 보정하기 위해 맵 매칭 기법을 도입하여 위치 데이터 스트림의 신뢰성을 제공하며, 위치 변화가 없는 객체의 위치 데이터 스트림을 빠르게 정제하는 정지 상태 제거 필터를 개발하여 질의 처리 시 부하를 줄인다. 또한 각 애플리케이션의 질의 결과에 무의미한 위치 정보를 배제하는 중요 위치 수집기를 개발하여 시스템 성능을 향상시킨다.

  • PDF

범용 DSP기반의 HD급 비디오/오디오 디코더 시스템 개발 (Development of DSP based Decoder for High-definition Video/Audio System)

  • 박영근;김봉주;김영덕;장태규;이전우
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1956-1959
    • /
    • 2003
  • 본 논문에서는 HDTV(High Definition TV) 방송수신을 위한 DSP(Digital Signal Processor)기반의 HD급 비디오/오디오 디코더 시스템을 개발하고 그 성능을 확인하였다. DSP 플랫폼은 TI(Texas Instrument)사의 TMS320C6415를 대상으로 하였으며 TI의 DSP RTOS인 DSP/ BIOS를 이용하여 방송스트림인 TS(Transport Stream)을 분리하기 위한 TS Demuxer, MPEG-2 비디오 디코더 및 AC-3 오디오디코더 알고리즘을 통합하였으며, 각각의 알고리즘은 대상 DSP플랫폼인 TMS320C64x에 맞게 고정소수점 구조화 및 최적화를 실시하였다. 테스트를 위한 시스템은 스트리밍을 위한 호스트 PC와 PCI(Peripheral Component Interconnect)버스를 통해 연결된 DSP보드로 구성하였으며 실제 HDTV당송용 스트림과 SD(Standard Definition)급 스트림을 이용하여 성능을 확인하였다.

  • PDF

현장진단 전문가 시스템의 개발 : 휴리스틱과 인플루언스 다이아그램 (Development of On-Line Diagnostic Expert System : Heuristics and Influence Diagrams)

  • 김영진
    • 대한산업공학회지
    • /
    • 제23권1호
    • /
    • pp.95-113
    • /
    • 1997
  • This paper outlines a framework for a diagnosis of a complex system with uncertain information. Sensor validation ploys a vital role in the ability of the overall system to correctly determine the state of a system monitored by imperfect sensors. Here, emphases are put on the heuristic technology and post-processor for reasoning. Heuristic Sensor Validation (HSV) exploits deeper knowledge about parameter interaction within the plant to cull sensor faults from the data stream. Finally the modified probability distributions and validated data are used as input to the reasoning scheme which is the runtime version of the influence diagram. The output of the influence diagram is a diagnostic mapping from the symptoms or sensor readings to a determination of likely failure modes. Once likely failure modes are identified, a detailed diagnostic knowledge base suggests corrective actions to improve performance. This framework for a diagnostic expert system with sensor validation and reasoning under uncertainty applies in $HEATXPRT^{TM}$ a data-driven on-line expert system for diagnosing heat rate degradation problems in fossil power plants [1].

  • PDF

기상레이더 반사도 자료의 계층적 압축 기법 (Hierarchical Compression Technique for Reflectivity Data of Weather Radar)

  • 장봉주;이건행;임상훈;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제18권7호
    • /
    • pp.793-805
    • /
    • 2015
  • Nowadays the amount of data obtained from advanced weather radars is growing to provide higher spatio-temporal resolution. Accordingly radar data compression is important to use limited network bandwidth and storage effectively. In this paper, we proposed a hierarchical compression method for weather radar data having high spatio-temporal resolution. The method is applied to radar reflectivity and evaluated in aspects of accuracy of quantitative rainfall intensity. The technique provides three compression levels from only 1 compressed stream for three radar user groups-signal processor, quality controller, weather analyst. Experimental results show that the method has maximum 13% and minimum 33% of compression rates, and outperforms 25% higher than general compression technique such as gzip.