• 제목/요약/키워드: pipelining

검색결과 141건 처리시간 0.027초

IP기반 H.264 디코더 설계를 위한 동기화 파이프라인 최적화 (An optimization of synchronous pipeline design for IP-based H.264 decoder design)

  • 고병수;공진흥
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.407-408
    • /
    • 2008
  • This paper presents a synchronous pipeline design for IP-based H.264 decoding system. The first optimization for pipelining aims at efficiently resolving the data dependency due to motion compensation/intra prediction feedback data flow in H.264 decoder. The second one would enhance the efficiency of execution per each pipelining stage to explore the optimized latency and stage number. Thus, the 3 stage pipeline of CAVLD&ITQ|MC/IP&Rec.|DF is obtained to yield the best throughput and implementation. In experiments, it is found that the synchronous pipelined H.264 decoding system, based on existing IPs, could deal with Full HD video at 125.34MHz, in real time.

  • PDF

IP기반 H.264 디코더 설계를 위한 동기식 비선형 및 병렬화 파이프라인 설계 (A design of synchronous nonlinear and parallel for pipeline stage on IP-based H.264 decoder implementation)

  • 고병수;공진흥
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.409-410
    • /
    • 2008
  • This paper presents nonlinear and parallel design for synchronous pipelining in IP-based H.264 decoder implementation. Since H.264 decoder includes the dataflow of feedback loop, the data dependency requires one NOP stage per pipelining latency to drop the throughput into 1/2. Further, it is found that, in execution time, the stage scheduled for MC is more occupied than that for CAVLD/ITQ/DF. The less efficient stage would be improved by nonlinear scheduling, while the fully-utilized stage could be accelerated by parallel scheduling of IP. The optimization yields 3 nonlinear {CAVLD&ITQ}|3 parallel (MC/IP&Rec.)| 3 nonlinear {DF} pipelined architecture for IP-based H.264 decoder. In experiments, the nonlinear and parallel pipelined H.264 decoder, including existing IPs, could deal with full HD video at 41.86MHz, in real time processing.

  • PDF

VLSI Implementation for the MPDSAP Adaptive Filter

  • Choi, Hun;Kim, Young-Min;Ha, Hong-Gon
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.238-243
    • /
    • 2010
  • A new implementation method for MPDSAP(Maximally Polyphase Decomposed Subband Affine Projection) adaptive filter is proposed. The affine projection(AP) adaptive filter achieves fast convergence speed, however, its implementation is so expensive because of the matrix inversion for a weight-updating of adaptive filter. The maximally polyphase decomposed subband filtering allows the AP adaptive filter to avoid the matrix inversion, moreover, by using a pipelining technique, the simple subband structured AP is suitable for VLSI implementations concerning throughput, power dissipation and area. Computer simulations are presented to verify the performance of the proposed algorithm.

FPGA 상에서 은닉층 뉴런에 최적화된 MLP의 설계 방법 (MLP Design Method Optimized for Hidden Neurons on FPGA)

  • 경동욱;정기철
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.429-438
    • /
    • 2006
  • 일반적으로 신경망은 비선형성 문제를 해결하기 위해서 소프트웨어로 많이 구현되었지만, 영상처리 및 패턴인식과 같은 실시간 처리가 요구되는 응용에서는 빠른 처리가 가능한 하드웨어로 구현되고 있다. 다양한 종류의 신경망 중에서 다층 신경망(MLP: multi-layer perceptron)의 하드웨어 설계는 빠른 처리속도와 적은 면적 그리고 구현의 용이성으로 고정소수점 연산을 많이 사용하였다. 하지만 고정소수점 연산을 사용하는 하드웨어 설계는 높은 정확도의 부동소수점 연산을 많이 사용하는 소프트웨어 MLP를 쉽게 적용할 수 없는 문제점을 가진다. 본 논문에서는 높은 정확도와 높은 유연성을 가지는 부동소수점 연산을 사용하면서도 은닉층 뉴런수를 주기(cycle)로 빠르게 수행하는 MLP의 완전 파이프라이닝(fully-pipelining) 설계방법을 제안한다. MLP는 주어진 문제에 의해서 자연스럽게 입력층과 출력층의 구조가 결정되지만, 은닉층 구조는 사용자에 의해서 결정된다. 그러므로 제안된 설계방법은 많은 반복수행이 요구되는 영상처리 및 패턴인식 등의 분야에서 은닉층 뉴런수를 최적화 하여 쉽게 성능 향상을 이룰 수 있다.

파이프라이닝 기법을 적용한 USN 물류관리 시스템 효율성 향상에 관한 연구 (A Study on Efficiency Improvement of USN Logistics Management System applied Pipelining Techniques)

  • 김석수;정성모
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1214-1219
    • /
    • 2009
  • USN(Ubiquitous Sensor Network) 기술이 발전하면서 다양한 분야에서 이를 활용하기 위한 연구들이 활발하게 진행되고 있다. 특히 물류관리 분야에서의 연구가 활발히 진행되고, 세계적인 대형마트 및 대형 물류 창고 등과 연계되어 실제 적용되고 있다. 이렇게 활용도가 높아지고 있는 USN 기술이지만, 완벽하게 실시간으로 데이터처리를 하기란 쉽지 않다. 수천, 수만 개의 센서를 사용하는 초대형 물류창고와 같이 대량의 데이터 값이 오차 없이 수집되어야 하는 분야의 경우, 기존의 데이터처리 방식으로는 실시간 데이터를 수집의 효율성이 낮을 수밖에 없다. 이와 맞물려 하드웨어의 고속화는 이루어졌지만, 소프트웨어적 구현이 미미한 현재, 이러한 문제점을 해결하기 위하여 파이프라인 기법을 통한 소프트웨어 고속화를 실현 시키는 것이 관건이다. 따라서 본 논문에서는 파이프라이닝 기법을 적용하여 물류관리 시스템의 실시간 데이터 수집의 효율성을 높이고 값의 오차를 줄일 수 있는 USN 물류관리 시스템을 제안하였다.

온톨로지 기반 사용자 제시 조건을 이용한 시맨틱 서비스 조합 (Pipelining Semantically-operated Services Using Ontology-based User Constraints)

  • 정한민;이미경;류범종
    • 한국콘텐츠학회논문지
    • /
    • 제9권10호
    • /
    • pp.32-39
    • /
    • 2009
  • 현재까지 제안된 웹 서비스나 웹 서비스에 시맨틱 마크업이 추가된 시맨틱 웹 서비스와 달리 시맨틱 서비스 (Semantically-operated Service)는 온톨로지를 이용하여 검색 기능 또는 추론 기능을 제공하는 서비스로 정의할 수 있다. 온톨로지 기반이므로 URI (Uniform Resource Identifier)를 지원하며 온톨로지 스키마에 정의된 클래스와 속성 (Property)을 사용하여 미리 정의된 작업을 수행한다. 시맨틱 서비스는 입력 인자가 온톨로지에 정의된 클래스들을 포함하므로 시맨틱 서비스 조합 (Pipelining) 시에 반드시 온톨로지를 참조할 필요가 있다. 본 연구는 시맨틱 정보 위주의 사용자 제시 조건을 입력받아 시맨틱 브로커를 이용하는 방식으로 시맨틱 서비스 관리 서버에 등록된 시맨틱 서비스들 내의 온톨로지 정보와 관리 정보를 참조하여 조건에 맞는 시맨틱 서비스를 조합하는 방법을 제안한다. 사용자 제시 조건으로는 입력 인스턴스, 출력 클래스, 시각화 유형 (Visualization Type), 시맨틱 서비스명, 속성명이 있다. 시맨틱 서비스 조합은 사용자 제시 조건을 기반으로 모든 과정이 자동적으로 이루어지며, 그 결과는 복합 시맨틱 서비스와 일부 워크플로우를 포함하는 시맨틱 서비스 파이프라인들로서 사용자에게 순위화되어 제시된다. 사용자는 시맨틱 브로커에 의해 제시된 시맨틱 서비스 파이프라인들을 실행해 봄으로써 원하는 시맨틱 서비스 조합을 찾을 수 있다. 결국, 본 연구를 통해 개발된 시맨틱 서비스 조합 시스템은 다양한 곳에서 개발된 시맨틱 서비스들을 자동으로 조합하여 새로운 시맨틱 서비스를 개발하고자 하는 서비스 기획자들을 지원하는데 획기적인 도움을 줄 것으로 기대한다.

무선 센서 네트워크에서 에너지 효율성과 지연 감소를 위한 다중 채널 파리프라인 기법 (Multi-Channel Pipelining for Energy Efficiency and Delay Reduction in Wireless Sensor Network)

  • 이요한;김대영
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.11-18
    • /
    • 2014
  • 무선 센서 네트워크에서 다중 흐름들 (multiple flows) 이 동시에 발생하여 sink 노드로 전달되는 과정에서 기존의 duty cycling 기반의 단일 채널 센서 네트워크 MAC 프로토콜들은 경쟁 (contention) 과 충돌 (collision) 로 인한 심각한 성능 저하를 보인다. 본 논문에서는 이러한 문제점을 해결하기 위해서 다중 채널을 활용하는 Multi-Channel Pipelining (MCP) 기법을 제안한다. 본 논문은 종단 간 지연시간 (end-to-end latency) 을 최소화하기 위해서 다중 홉 상에 노드들의 wake-up 스케줄에 시차를 두는 SDPS (Staggered Dynamic Phase Shift) 알고리즘과 에너지 효율성을 최적화하기 위한 PLI (Phase-Locking Identification) 알고리즘을 제안한다. 이러한 방법을 바탕으로 다중 흐름들은 다중 채널에서 동적으로 파이프라인 (pipeline) 되어 처리됨으로써 성능이 향상된다. Qualnet 시뮬레이션을 통해 본 논문에서 제안하는 MCP 기법이 기존의 센서 네트워크 MAC 프로토콜들 보다 듀티 사이클 (duty cycle), 종단 간 지연시간, 패킷 전달율 (packet delivery ratio), 통합 처리량(aggregate throughput) 관점에서 성능을 향상시킴을 보였다. 또한, MCP 의 듀티 사이클과 종단 간 지연시간을 위한 분석 모델을 제안하고 시뮬레이션을 통해 검증하였다.

Bounding Worst-Case DRAM Performance on Multicore Processors

  • Ding, Yiqiang;Wu, Lan;Zhang, Wei
    • Journal of Computing Science and Engineering
    • /
    • 제7권1호
    • /
    • pp.53-66
    • /
    • 2013
  • Bounding the worst-case DRAM performance for a real-time application is a challenging problem that is critical for computing worst-case execution time (WCET), especially for multicore processors, where the DRAM memory is usually shared by all of the cores. Typically, DRAM commands from consecutive DRAM accesses can be pipelined on DRAM devices according to the spatial locality of the data fetched by them. By considering the effect of DRAM command pipelining, we propose a basic approach to bounding the worst-case DRAM performance. An enhanced approach is proposed to reduce the overestimation from the invalid DRAM access sequences by checking the timing order of the co-running applications on a dual-core processor. Compared with the conservative approach, which assumes that no DRAM command pipelining exists, our experimental results show that the basic approach can bound the WCET more tightly, by 15.73% on average. The experimental results also indicate that the enhanced approach can further improve the tightness of WCET by 4.23% on average as compared to the basic approach.

작업 파이프라이닝을 위한 그리드 워크플로우 스케줄러 설계 (Design of Grid Workflow System Scheduler for Task Pipelining)

  • 이인선
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권7호
    • /
    • pp.1-10
    • /
    • 2010
  • 워크플로우 관리자는 대량의 계산용 그리드 자원을 데스크탑 컴퓨터에서 개인이 편리하게 워크플로우를 만들고 수행할 수 있게 해주는 유용한 도구이다. 보통 데이터는 스테이지-인, 프로세스, 스테이지-아웃의 순서로 순차적으로 진행되며 워크플로우 시스템은 이 과정을 자동화해준다. 그러나 최근의 e-science에서는 사용되는 데이터 량이 급속하게 증가하고 있고 원하는 출력물을 얻기 위해 여러 번의 과정을 수행하면서 데이터 이동 시간이 전체 수행시간의 많은 부분을 차지하게 되어 스테이징 과정의 개선이 중요한 이슈가 되고 있다. 본 논문에서는 스테이징 과정을 개선하고, 이를 이용하여 가능한 한 많은 작업들을 동시 수행시키는 스케줄러를 설계하였다. 또한 모의실험을 통해 제안한 스케줄러의 성능이 10~40%까지 향상됨을 보였다.

128-비트 블록 암호화 알고리즘 SEED의 저면적 고성능 하드웨어 구조를 위한 하드웨어 설계 공간 탐색 (A Hardware Design Space Exploration toward Low-Area and High-Performance Architecture for the 128-bit Block Cipher Algorithm SEED)

  • 이강
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권4호
    • /
    • pp.231-239
    • /
    • 2007
  • 본 논문에서는 국내 표준 128비트 블록 암호화 알고리즘인 SEED를 하드웨어로 설계할 경우 면적-성능간의 trade-off 관계를 보여준다. 본 논문에서 다음 4가지 유형의 설계 구조를 비교한다. (1) Design 1 : 16 라운드 완전 파이프라인 방식, (2) Design 2 : 단일 라운드의 반복 사용 방식 (3) Design 3 : G 함수 공유 및 반복 사용 방식 (4) Design 4 : 단일 라운드 내부 파이프라인 방식. (1),(2),(3)의 방식은 기존의 논문들에서 제안한 각기 다른 설계 방식이며 (4)번 설계 방식이 본 논문에서 새롭게 제안한 설계 방식이다. 본 논문에서 새롭게 제안한 방식은, F 함수 내의 G 함수들을 파이프라인 방식으로 연결하여 면적 요구량을 (2)번에 비해서 늘이지 않으면서도 파이프라인과 공유블록 사용의 효과로 성능을 Design 2와 Design 3보다 높인 설계 방식이다. 본 논문에서 4가지 각기 다른 방식을 각각 실제 하드웨어로 설계하고 FPGA로 구현하여 성능 및 면적 요구량을 비교 분석한다. 실험 분석 결과, 본 논문에서 새로 제안한 F 함수 내부 3단 파이프라인 방식이 Design 1 방식을 제외하고 가장 throughput 이 높다. 제안된 Design 4 가 단위 면적당 출력성능(throughput)면에서 다른 모든 설계 방식에 비해서 최대 2.8배 우수하다. 따라서, 새로이 제안된 SEED 설계가 기존의 설계 방식들에 비해서 면적대비 성능이 가장 효율적이라고 할 수 있다.