• 제목/요약/키워드: latency reduction

검색결과 152건 처리시간 0.024초

RLP : An Efficient HSR Traffic Reduction Algorithm

  • ;전제현;신상헌;이종명
    • 한국위성정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.47-53
    • /
    • 2012
  • In this paper, we present an algorithm called redundant logical paths (RLP) for efficient HSR traffic reduction. It creates redundant logical paths between each HSR node and all the other nodes. Eventually, a logical full-meshed network or paths will be established among all HSR node types, except the Quadbox type, which is used only for interconnection. The logical full-meshed network will be used instead of using the standard HSR protocol that depends on the concepts of the duplication and forwarding of the received frame until it reaches the destination node. The RLP algorithm results in significantly less frame traffic because there is no random forwarding as in the standard HSR protocol. For the sample network in this paper simulation results showed a 61.5-80% reduction in network frame traffic compared to the standard HSR. Our algorithm will avoid latency issues in the network and even network congestion, thus improving network efficiency.

Integer-Pel Motion Estimation for HEVC on Compute Unified Device Architecture (CUDA)

  • Lee, Dongkyu;Sim, Donggyu;Oh, Seoung-Jun
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권6호
    • /
    • pp.397-403
    • /
    • 2014
  • A new video compression standard called High Efficiency Video Coding (HEVC) has recently been released onto the market. HEVC provides higher coding performance compared to previous standards, but at the cost of a significant increase in encoding complexity, particularly in motion estimation (ME). At the same time, the computing capabilities of Graphics Processing Units (GPUs) have become more powerful. This paper proposes a parallel integer-pel ME (IME) algorithm for HEVC on GPU using the Compute Unified Device Architecture (CUDA). In the proposed IME, concurrent parallel reduction (CPR) is introduced. CPR performs several parallel reduction (PR) operations concurrently to solve two problems in conventional PR; low thread utilization and high thread synchronization latency. The proposed encoder reduces the portion of IME in the encoder to almost zero with a 2.3% increase in bitrate. In terms of IME, the proposed IME is up to 172.6 times faster than the IME in the HEVC reference model.

근사화된 계층 변조의 연판정 비트 검출을 통한 연산 지연시간 감소 (Computational Latency Reduction via Simplified Soft-bit Estimation of Hierarchical Modulation)

  • 유동호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.175-178
    • /
    • 2022
  • 본 논문은 고차 계층 변조, 즉 계층 64QAM의 연판정 비트 검출을 위한 단순화된 연산 방법을 다룬다. 이는 기존 계층 변조의 연판정 비트, 즉 LLR(Log-Likelihood Ratio)값의 근사를 통해 불필요한 연산을 줄여 이에 필요한 지연시간을 줄일 수 있다. 또한 제안된 기법은 기존의 연판정 비트 검출 기법과 매우 유사한 비트 오류율(BER: Bit Error Rate) 성능을 유지하기 때문에 연판정 비트를 활용하는 방송 및 통신 시스템에 폭넓게 적용될 수 있을 것으로 기대한다.

  • PDF

WANProxy의 성능 분석 및 개선 (Performance Analysis and Improvement of WANProxy)

  • 김하늘;지승규;정규식
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권3호
    • /
    • pp.45-58
    • /
    • 2020
  • 클라우드 서비스와 모바일 기기의 대중화로 네트워크 트래픽이 계속 증가하고 있는 현재 추세에 LAN 대역폭에 비해 WAN 대역폭이 아주 낮다. WAN 환경에서는 전송 프로토콜, 패킷 손실, 네트워크 대역폭 한계 때문에 생기는 성능 문제를 극복하는 WAN 최적화기가 필요하다. 본 논문에서는 오픈소스 WAN 최적화기인 WANProxy의 데이터 중복제거 알고리즘을 분석하고 성능을 네트워크 대기시간 및 WAN 대역폭 관점에서 평가한다. 또한, WANProxy에 추가로 zstd를 적용하는 2단계 압축을 적용할 경우의 성능을 평가한다. 또한, WANProxy의 데이터 중복 제거 방법을 개선한 새로운 방법을 제안하고 성능 개선 효과를 평가한다. 데이터 세그먼트 크기를 2048바이트로 하고 Silesia의 12개 데이터 파일을 이용한 성능 실험을 수행한다. 실험 결과에 의하면, WANProxy에 의한 평균 압축률이 150.6이고 네트워크 대기시간 평균 감소율은 10 Mbps WAN 환경에서는 95.2%, 100 Mbps WAN 환경에서는 60.7%가 된다. WANProxy에 추가로 zstd를 적용하는 방법은 WANProxy를 적용하는 경우와 비교할 때 압축률이 평균 33% 증가하지만 네트워크 대기시간이 10 Mbps WAN 환경에서는 평균 2.1%, 100 Mbps WAN 환경에서는 평균 5.2% 각각 증가한다. 본 논문에서 제안한 개선 방법을 WANProxy에 적용한 경우는 기존의 WANProxy와 비교할 때 압축률이 평균 34.8% 증가하고 네트워크 대기시간이 10 Mbps WAN 환경에서는 평균 13.8%, 100 Mbps WAN 환경에서는 평균 12.9% 각각 감소한다. 성능 분석 결과에 의하면, WAN 대역폭이 10 Mbps 이하인 환경에서 WANProxy를 적용할 경우 네트워크 대기시간과 WAN 대역폭 관점에서 성능 개선 효과가 아주 우수하고 WAN 대역폭이 100 Mbps 환경에서도 우수하다.

링크 도선 길이를 고려한 고성능 비동기식 NoC 토폴로지 생성 기법 (Link-wirelength-aware Topology Generation for High Performance Asynchronous NoC Design)

  • 김상헌;이재성;이재훈;한태희
    • 전자공학회논문지
    • /
    • 제53권8호
    • /
    • pp.49-58
    • /
    • 2016
  • 어플리케이션 특성에 따라 링크 대역폭 요구량이 다양하게 분포하는 이종 (heterogeneous) 아키텍처 기반 네트워크-온-칩 (Network-on-Chip, NoC) 설계에 있어 링크 지연 시간이 독립적으로 설정될 수 있는 비동기식 프로토콜을 적용할 경우 동기식 설계에 비해 성능 향상의 기회가 확대될 수 있다. 본 논문에서는 비동기식 NoC에서 각 링크의 대역폭 요구량과 도선 길이에 따른 지연 시간 모델을 제시하고 이를 최적화하는 simulated annealing (SA) 기법을 이용한 플로어플랜 기반 토폴로지 생성 알고리즘을 제안하였다. 생성된 토폴로지와 각 링크의 도선 길이를 기반으로 대응하는 도선 지연시간을 계산하고 로직 합성 단계를 거쳐 생성된 gate-level netlist와 표준지연시간 모델을 이용한 시뮬레이션을 통해 성능을 측정하였다. 링크 도선 길이를 고려하지 않은 일반적인 토폴로지 생성 알고리즘인 TopGen과 비교하여, 제안된 알고리즘이 다양한 어플리케이션 실험에서 평균 13.7% 지연 시간 단축 효과 및 처리량 측면 지표인 실행 시간에서 평균 11.8% 감소 효과가 있음을 확인할 수 있었다.

MPEG 시스템용 다중 작업에 적합한 양방향 버스 구조 (Bi-directional Bus Architecture Suitable to Multitasking in MPEG System)

  • 전치훈;연규성;황태진;위재경
    • 대한전자공학회논문지SD
    • /
    • 제42권4호
    • /
    • pp.9-18
    • /
    • 2005
  • 본 논문은 OCP(Open Core Protocol)에 호환되는 파이프라인 구조를 가진 시스템 버스와 MPEG 시스템에 적합한 메모리 버스로 구성된 계층 구조를 가지는 새로운 동기 세그먼트 버스를 제안한다. 이 구조는 MPEG 시스템의 모바일 제품에 사용되는 영상 데이터 처리를 위한 메모리 인터페이스에 기반을 둔 버스 구조와 멀티 마스터와 멀티 슬레이브를 사용하여 고성능의 다중 처리를 위한 양방향 다중 버스 구조(hi-direction multiple bus architecture)를 가진다. 효율적인 데이터 처리를 위하여 파이프라인 스테이지와 결합된 마스터와 슬레이브의 주소번지가 latency를 결정하며, 시스템의 특성에 따라서 각각의 IP 코어를 배치하였다. 제안된 버스는 저전력 구현을 위하여 세그먼트 버스 구조를 가지고, 멀티미디어 SoC 시스템의 성능 저하 없이 다중 작업이 가능한 구조를 가지며 확장이 가능하다. 제안된 버스 구조는 AMBA와 비교하였을 때 bandwidth는 3.7배 증가하였고 latency는 0.25배 감소하였다.

Proxy Mobile IPv6 네트워크에서 Fast Handover 기법 설계 (Design of Fast Handover Mechanism in Proxy Mobile IPv6 Networks)

  • 박병주;한연희;김봉기
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권4호
    • /
    • pp.301-310
    • /
    • 2008
  • 기존의 MIPv6는 오랜 시간동안의 핸드오버로 인하여 많은 패킷 손실 및 오랜 세션 단절을 야기시킨다. 이러한 문제점들을 향상시키기 위하여 Fast handover for Mobile IPv6(FMIPv6) 프로토콜이 개발되었지만 여전히 터널링에 기반한 라우팅 방법은 패킷 순서 어긋남 문제로 인하여 성능이 하락하는 문제를 야기한다. 최근 모바일 단말에서의 이동성 관리 부하를 줄여주기 위하여, 네트워크 이동성 기반인 Proxy Mobile IPv6(PMIPv6)가 제안되었다. PMIPv6는 모바일 단말에서 수행하던 이동성 관리를 네트워크 에이전트에서 해줌으로서 단말의 부하를 줄이고 이동성 관리 지연 시간을 줄일 수 있다. 본 논문에서는 PMIPv6에서 안정되고 향상된 최적화 라우팅 기술이 접목된 빠른 핸드오버 방법인 Fast Proxy Mobile IPv6(EF-PMIPv6) 제안한다. 제안한 EF-PMIPv6는 고속의 IAPP 기술 및 ND 기법을 이용하여 기존의 MIPv6와 PMIPv6 기법에 비하여 고속의 핸드오버를 지원해 줄 수 있다. 또한 수식분석을 통하여 제안한 방법의 향상된 점을 보여준다. 분석에 있어서는 다양한 파라미터들을 이용하여 제안한 방법과 기존의 방법들에 있어서 핸드오버 지연시간을 비교하였다.

웜홀 스위칭하는 양방향 베니언 망에서의 두 단계 멀티캐스트 (Two-phase Multicast in Wormhole-switched Bidirectional Banyan Networks)

  • 권위남;권보섭;박재형;윤현수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권3호
    • /
    • pp.255-263
    • /
    • 2000
  • 다단계 상호 연결망은 대규모 멀티컴퓨터의 대표적인 연결망 구조이다. 브로드캐스트와 멀티캐스트 통신은 캐쉬 관리, 리덕션, 베리어 동기화와 같은 협동 통신을 지원하기 위한 기반 기술이다. 본 논문은 대규모 멀티컴퓨터 시스템을 구성하기에 적합한 웜홀 스위칭하는 양방향 베니언 망에서 동작하는 멀티캐스트 기법을 제안한다. 제안하는 기법은 간단한 하드웨어하에서 교착상태를 일으키지 않고 두 번의 전송 단계를 거침으로써 멀티캐스트와 브로드캐스트를 수행한다. 또한, 원하는 목적 노드의 주소를 큐브로 병합하고, 헤더는 단일 큐브로 인코딩된다. 출력 링크에 경쟁이 발생하면 가장 상위 입력 링크로 부터 들어온 플릿에게 우선 순위를 줌으로써 교착상태를 방지한다. 제안하는 기법을 시뮬레이션을 통해서 통신지연 시간의 관점에서 다른 기법과 비교 평가함으로써 제안하는 멀티캐스트 기법의 성능이 우수함을 보였다. 또한, 제안하는 브로드캐스트 기법은 팬아웃이 $2^m({\geq} {\sqrt{N}}$ 인 최소의 정수, N 은 시스템 크기)인 멀티캐스트의 성능과 유사한 월등한 성능을 낸다는 것을 보였다.

  • PDF

Leveraging Proxy Mobile IPv6 with SDN

  • Raza, Syed M.;Kim, Dongsoo S.;Shin, DongRyeol;Choo, Hyunseung
    • Journal of Communications and Networks
    • /
    • 제18권3호
    • /
    • pp.460-475
    • /
    • 2016
  • The existing Proxy Mobile IPv6 suffers from a long handover latency which in turn causes significant packet loss that is unacceptable for seamless realtime services such as multimedia streaming. This paper proposes an OpenFlow-enabled proxy mobile IPv6 (OF-PMIPv6) in which the control of access gateways is centralized at an OpenFlow controller of a foreign network. The proposed OF-PMIPv6 separates the control path from the data path by performing the mobility control at the controller, whereas the data path remains direct between a mobile access gateway and a local mobility anchor in an IP tunnel form. A group of simple OpenFlow-enabled access gateways performs link-layer control and monitoring activities to support a comprehensive mobility of mobile nodes, and communicates with the controller through the standard OpenFlow protocol. The controller performs network-layer mobility control on behalf of mobile access gateways and communicates with the local mobility anchor in the Proxy Mobile IPv6 domain. Benefiting from the centralized view and information, the controller caches the authentication and configuration information and reuses it to significantly reduce the handover latency. An analytical analysis of the proposed OF-PMIPv6 reactive and proactive handover schemes shows 43% and 121% reduction in the handover latency, respectively, for highly utilized network. The results gathered from the OF-PMIPv6 testbed suggest similar performance improvements.

JPEG2000 시스템의 코드블록 메모리 크기 및 대역폭 감소를 위한 Multi-mode Embedded Compression 알고리즘 및 구조 (Multi-mode Embedded Compression Algorithm and Architecture for Code-block Memory Size and Bandwidth Reduction in JPEG2000 System)

  • 손창훈;박성모;김영민
    • 대한전자공학회논문지SD
    • /
    • 제46권8호
    • /
    • pp.41-52
    • /
    • 2009
  • Motion JPEG2000과 같은 동영상 압축 시스템에서는 데이터 메모리에 대한 빈번한 접근이 전체 시스템에 큰 병목 현상이 된다. 이처럼 시스템에서 요구하는 메모리의 대역폭을 감소시키기 위해서, 본 논문은 약간의 화질 손실이 있는 새로운 embedded compression(EC) 알고리즘과 구조를 고안하였다. 또한, 메모리 내의 압축된 데이터에 임의 접근성(Random Accessibility)과 짧은 지연 시간(Latency)을 보장하기 위해서 매우 단순하면서도 효율적인 entropy 부호화 방법을 제안하였다. 본 논문에서는 JPEG2000 표준안 알고리즘에는 어떠한 변경도 하지 않으면서, 제안한 multi-mode 알고리즘을 통해 JPEG2000 시스템에서 요구하는 메모리의 대역폭의 감소(약 52${\sim}$81%) 와 코드블록 메모리의 크기를 약 2 배 이상 감소시킬 수 있었다.