• 제목/요약/키워드: Average latency

검색결과 186건 처리시간 0.026초

하이브리드 광학 네트워크-온-칩에서 지연 시간 최적화를 위한 매핑 알고리즘 (A Latency Optimization Mapping Algorithm for Hybrid Optical Network-on-Chip)

  • 이재훈;이창림;한태희
    • 전자공학회논문지
    • /
    • 제50권7호
    • /
    • pp.131-139
    • /
    • 2013
  • 기존 전기적 상호 연결을 사용한 네트워크-온-칩(Network-on-Chip, NoC)의 전력 및 성능 한계를 보완하고자 광학적 상호연결을 이용하는 하이브리드 광학 네트워크-온-칩(HONoC)이 등장하였다. 하지만 HONoC에서는 광학적 소자 특성으로 인해 서킷 스위칭을 사용함으로써 경로 충돌이 빈번하게 발생하며 이로 인해 지연 시간 불균형의 문제가 심화되어 전체적인 시스템 성능에 악영향을 미치게 된다. 본 논문에서는 경로 충돌을 최소화 시켜 지연 시간을 최적화 할 수 있는 새로운 태스크 매핑 알고리즘을 제안하였다. HONoC 환경에서 태스크를 각 Processing Element (PE)에 할당하고 경로 충돌을 최소화하며, 부득이한 경로 충돌의 경우 워스트 케이스 (worst case) 지연 시간을 최소화 할 수 있도록 하였다. 모의실험 결과를 통해 무작위 매핑 방식, 대역폭 제한 매핑 방식과 비교하여, 제안된 알고리즘이 $4{\times}4$ 메시 토폴로지에서는 평균 43%, $8{\times}8$ 메시 토폴로지에서는 평균 61%의 지연 시간 단축 효과가 있음을 확인할 수 있었다.

특정 용도 하이브리드 광학 네트워크-온-칩에서의 에너지/응답시간 최적화를 위한 토폴로지 설계 기법 (Topology Design for Energy/Latency Optimized Application-specific Hybrid Optical Network-on-Chip (HONoC))

  • 최적;이재훈;김현중;한태희
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.83-93
    • /
    • 2014
  • 최근 수년간 전기적 상호 연결 (electrical interconnect, EI) 기반 네트워크-온-칩 (Network-on-Chip, NoC) 에 대한 연구가 활발히 진행되고 있는 가운데, 궁극적으로 금속 배선은 대역폭, 응답 시간(latency), 전력 소모 등에서 물리적 한계에 직면할 것으로 예상된다. 실리콘 포토닉스(silicon photonics) 기술 발전으로 광학적 상호 연결(optical interconnect, OI)을 결합한 하이브리드 광학 네트워크-온-칩(Hybrid Optical NoC, HONoC)이 이러한 문제를 극복하기 위한 유망한 해결책으로 부각되고 있다. 한편 시스템-온-칩(System-on-Chip, SoC)은 높은 에너지 효율을 위하여 이기종 멀티 코어(Heterogeneous multi-core)로 구성되고 있어서 정형화된 토폴로지 기반 NoC 아키텍처의 확장이 필요하다. 본 논문에서는 타깃 애플리케이션 트래픽 특성을 고려한 에너지 및 응답 시간 최적화 하이브리드 광학 네트워크-온-칩의 토폴로지 설계 기법을 제안한다. 유전자 알고리즘을 이용하여 구현하였고, 실험 결과 평균 전력손실은 13.84%, 평균 응답 시간은 28.14% 각각 감소하였다.

GPGPU 자원 활용 개선을 위한 블록 지연시간 기반 워프 스케줄링 기법 (A Novel Cooperative Warp and Thread Block Scheduling Technique for Improving the GPGPU Resource Utilization)

  • ;최용;김종면;김철홍
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권5호
    • /
    • pp.219-230
    • /
    • 2017
  • 멀티스레딩 기법이 적용된 GPGPU는 내부 병렬 자원들을 기반으로 데이터를 고속으로 처리하고 메모리 접근시간을 감소시킬 수 있다. CUDA, OpenCL 등과 같은 프로그래밍 모델을 활용하면 스레드 레벨 처리를 통해 응용프로그램의 고속 병렬 수행이 가능하다. 하지만, GPGPU는 범용 목적의 응용프로그램을 수행함에 있어 내부 하드웨어 자원들을 효과적으로 사용하지 못한다는 단점을 보이고 있다. 이는 GPGPU에서 사용하는 기존의 워프/스레드 블록 스케줄러가 메모리 접근시간이 긴 명령어를 처리하는데 있어서 비효율적이기 때문이다. 이와 같은 문제점을 해결하기 위해 본 논문에서는 GPGPU 자원 활용률을 개선하기 위한 새로운 워프 스케줄링 기법을 제안하고자 한다. 제안하는 워프 스케줄링 기법은 스레드 블록의 워프들 중 긴 메모리 접근시간을 가진 워프와 짧은 메모리 접근시간을 가진 워프들을 구분한 후, 긴 메모리 접근시간을 가진 워프를 우선 할당하고, 짧은 메모리 접근시간을 가진 워프를 나중에 할당하여 처리한다. 또한, 메모리와 내부 연결망에서 높은 경합이 발생했을 때 동적으로 스트리밍 멀티프로세서의 수를 감소시켜 워프 스케줄러를 효과적으로 사용할 수 있는 기법도 제안한다. 실험결과에 따르면, 15개의 스트리밍 멀티프로세서를 가진 GPGPU 플랫폼에서 제안된 워프 스케줄링 기법은 기존의 라운드로빈 워프 스케줄링 기법과 비교하여 평균 7.5%의 성능(IPC)이 향상됨을 확인할 수 있다. 또한, 제안된 두 개의 기법을 동시에 적용하였을 경우에는 평균 8.9%의 성능(IPC) 향상을 보인다.

주문형 비디오 시스템에서의 동적 버퍼 할당 기법 (A Dynamic Buffer Allocation Scheme in Video-on-Demand System)

  • 이상호;문양세;황규영;조완섭
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권9호
    • /
    • pp.442-460
    • /
    • 2001
  • 주문형 비디오 시스템에서 초기 대기시간과 메모리요구량의 최소화는 중요하다. 초기대기시간의 최소화는 빠른 응답시간의 서비스를 제공할 수 있게 하고 메모리 요구량의 최소화는 동일한 메로리량으로 더 많은 동시 사용자 용청을 서비스할수 있게 한다. 주문형 비디오 시스템에서는 사용자 요청에서 할달되는 버퍼 크기가 증가함에 따라 초기대기시간과 메모리 요구량이 증가하므로 사용자 요청에 할당되는 버퍼의 크키를 최소화해야한다. 그러나 기존의 정적 버퍼 할당 기법은 시스템이 완전 부하된 상태에 있다는 가정하에서 버퍼 크기를 결정하여 시스템이 불안정 부하인 경우에는 사용자 요청에서 필요 이상으로 큰 버퍼를 할당한다. 본 논문에서는 시스템의 완전 부하 상태 뿐만 아니라 불와전 부하 상태에서도 사용자 요청에게 최소 크기의 버퍼를 할당하는 동적 버퍼 할당 기법을 제안한다. 동적 버퍼 할당기법은 서비스 중인 사용자 요청 수와 이들 요청들을 서비스하는 동안에 도착하는 사용자 요청수에 기반하여 버퍼크기를 동적으로 결정한다. 또한 분석과 시뮬레이션을 통하여 동적 버퍼 할당 기법이 초기대기시간과 지원 가능한 동시 사용자 요청수에 있어서 정적 버퍼 할당 기법에 비해 크게 우수함을 보인다. 시뮬레이션 결과, 동적 버퍼 할당 기법이 정적 버퍼 할당 기법에 비해 평균 초기대기시간을 29%~65%줄이고, 다수의 디스크들로 구성된 시스템에서는 서비스한 평균 동시 사용자 요청수를 48%~67% 증가시킨것으로 나타났다. 이와같은 결과는 동적 버퍼 할당 기법이 주문형 비디오 시스템의성능과 용량을 크게 향상시킴을 보여주는것이다.

  • PDF

성상도 집합 그룹핑 기반의 적응형 병렬 및 반복적 QRDM 검출 알고리즘 (Adaptive Parallel and Iterative QRDM Detection Algorithms based on the Constellation Set Grouping)

  • 마나르모하이센;안홍선;장경희;구본태;백영석
    • 한국통신학회논문지
    • /
    • 제35권2A호
    • /
    • pp.112-120
    • /
    • 2010
  • 본 논문에서는 집합 그룹핑을 이용한 APQRDM (adaptive parallel QRDM) 알고리즘과 AIQRDM (adaptive iterative QRDM) 알고리즘을 제안한다. 제안된 검출 알고리즘은 집합 그룹핑을 이용하여 QRDM 알고리즘의 트리 검색 단계를 PDP (partial detection phases) 로 분할하여 수행한다. 기존 QRDM 알고리즘의 트리 검색 단계가 4개의 PDP로 나누어질 때, APQRDM 알고리즘은 기존 QRDM 알고리즘의 1/4 에 해당하는 검출 지연(latency) 을 가지며, AIQRDM 알고리즘은 기존 QRDM 알고리즘의 약 1/4에 해당하는 하드웨어 요구량을 가진다. 모의실험 결과는 $4{\times}4$ 시스템의 경우, APQRDM 알고리즘은 12dB의 Eb/N0에서 기존 QRDM 알고리즘의 약 43%에 해당하는 연산 복잡도를 가지며, AIQRDM 알고리즘은 0dB의 Eb/N0에서 기존 QRDM 알고리즘의 54%, AQRDM 알고리즘의 10%에 해당하는 연산 복잡도를 가짐을 보인다.

근전도 전자 망치를 이용한 깊은힘줄반사의 측정자 간 신뢰도 (Inter-Rater Reliability of the Deep Tendon Reflex by using EMG Electric Reflex Hammer)

  • 이정우;서태화
    • 대한통합의학회지
    • /
    • 제10권4호
    • /
    • pp.137-143
    • /
    • 2022
  • Purpose : The purpose of this study was to evaluate the reliability analysis of the deep tendon reflex by using electromyography (EMG). Methods : The study was tested on 30 volunteers who are women in their 20s. Using an electronic reflective hammer of EMG, deep tendon reflex was measured on all subjects with the participation of three trained physical therapists as raters. First, the subjects were comfortably seated on a table with their knees bent at 90 °. The three raters tapped the electric hammer at intervals of 10 seconds to avoid habituation until a total of 10 compound muscle action potential records were collected. Intraclass correlation coefficients (ICCs) were calculated to assess the inter-rater reliability of the deep tendon reflex with the use of EMG. The items of analysis included amplitude (mV), latency (ms), duration (ms), and area (mV × ms) of the compound evoked potentials. Results : Based on the average records of 10 compound muscle action potential, excellent reliability (ICC: .912) was achieved in terms of area, and there was good reliability in terms of latency (ICC: .795) and duration (ICC: .800). In the shortest latency of the compound muscle action potential, good reliability was achieved in terms of amplitude (ICC: .865), duration (ICC: .781), and area (ICC: .832). In the amplitude of peak-to-peak of compound muscle action potential, excellent reliability was recorded in terms of amplitude (ICC: .924), and good reliability was recorded in terms of duration (ICC: .801) and area (ICC: .874). Conclusion : The findings in this study indicate that electromyography via an electric hammer is a reliable method of assessing and measuring deep tendon reflexes. Especially, it may be an excellent gauge in the area of average values of the compound muscle action potentials and the amplitude of peak-to-peak of compound muscle action potentials.

공장자동화용 토큰버스 네트워크의 퍼지 성능관리기 개발 (Development of Fuzzy Network Performance Manager for Token Bus Networks in Automated Factories)

  • 이상호;손준우;이석
    • 대한기계학회논문집A
    • /
    • 제20권8호
    • /
    • pp.2436-2448
    • /
    • 1996
  • This paper presents the development of three types of network performance manager for IEEE 802.4 token bus networks that are a part of Manufacturing Automation Protocol(MAP). The performance managers attempt to keep the average data latency below a certain level specified for each priority class. All of the three performance managers are based on a set of fuzzy rules incorporating the knowledge on the relationship between data latency and parameters of the priority mechanism. These Fuzzy Network Performance Managers(FNPMs) have been evaluated via discrete event simulation to demonstrate their efficacy.

데이터 망각을 활용한 비휘발성 메모리 기반 파일 캐시 관리 기법 (Forgetting based File Cache Management Scheme for Non-Volatile Memory)

  • 강동우;최종무
    • 정보과학회 논문지
    • /
    • 제42권8호
    • /
    • pp.972-978
    • /
    • 2015
  • 비휘발성 메모리는 바이트 단위 접근과 비휘발성을 지원한다. 이러한 특성들은 비휘발성 메모리를 캐시, 메모리, 디스크와 같은 메모리 계층 구조 가운데 하나의 영역으로 사용을 가능케 한다. 비휘발성 메모리의 흥미로운 특성은 데이터 보존 기간이 실제로는 제한적인 기간을 가지고 있다는 것이다. 게다가 데이터 보존 기간과 쓰기 지연간의 트레이드오프가 존재 한다. 본 논문에서는 이를 활용하여 비휘발성 메모리를 파일 캐시로 사용하는 새로운 관리 기법을 제안한다. 제안하는 기법은 기존의 캐시 관리 기법과는 반대로 짧은 데이터 보존 시간으로 데이터를 저장하고 쓰기 성능을 개선한다. 제안하는 기법은 LRU 대비 평균 접근 지연 시간을 최대 31%, 평균 24.4%로 감소시킴을 보인다.

뇌파데이터에 기반한 맞춤형 수면유도음향의 실시간제어 (Customized Realtime Control of Sleep Induction Sound based on Brain Wave Data)

  • 위현승;이병문
    • 한국멀티미디어학회논문지
    • /
    • 제23권2호
    • /
    • pp.204-215
    • /
    • 2020
  • People who have sleep disorders such as insomnia take a long time to get to sleep, namely sleep latency. In order to reduce it, effective stimulations and environments to induce sleep such as ASMR or pink noise are necessary. However these have different effects and preferences for each individual. Therefore customized service and control for the sleep induction will be provide to him/her. In this paper, we proposed SIS control system which provides selectively sound control among various kinds of ASMR and pink noise according to sleep state measured from brain wave data for an individual. In order to verify the effectiveness of the system, we had conducted totally 30 experiments for 5 people, and all EEG data measured from all the people during sleep. An average of 3.7 hours was spent per experiment. In comparison experiments with and without sound control for sleep induction, the latency time was reduced by an average of 8 minutes as well as delta waves and theta waves, which appear only in deep sleep, are increased by 21%.

Energy-Saving Strategy for Green Cognitive Radio Networks with an LTE-Advanced Structure

  • Jin, Shunfu;Ma, Xiaotong;Yue, Wuyi
    • Journal of Communications and Networks
    • /
    • 제18권4호
    • /
    • pp.610-618
    • /
    • 2016
  • A green cognitive radio network (CRN), characterized by base stations (BSs) that conserve energy during sleep periods, is a promising candidate for realizing more efficient spectrum allocation. To improve the spectrum efficiency and achieve greener communication in wireless applications, we consider CRNs with an long term evolution advanced (LTE-A) structure and propose a novel energy-saving strategy. By establishing a type of preemptive priority queueing model with a single vacation, we capture the stochastic behavior of the proposed strategy. Using the method of matrix geometric solutions, we derive the performance measures in terms of the average latency of secondary user (SU) packets and the energy-saving degree of BSs. Furthermore, we provide numerical results to demonstrate the influence of the sleeping parameter on the system performance. Finally, we compare the Nash equilibrium behavior and social optimization behavior of the proposed strategy to present a pricing policy for SU packets.