• 제목/요약/키워드: Resource Underutilization

검색결과 11건 처리시간 0.028초

KAWS: Coordinate Kernel-Aware Warp Scheduling and Warp Sharing Mechanism for Advanced GPUs

  • Vo, Viet Tan;Kim, Cheol Hong
    • Journal of Information Processing Systems
    • /
    • 제17권6호
    • /
    • pp.1157-1169
    • /
    • 2021
  • Modern graphics processor unit (GPU) architectures offer significant hardware resource enhancements for parallel computing. However, without software optimization, GPUs continuously exhibit hardware resource underutilization. In this paper, we indicate the need to alter different warp scheduler schemes during different kernel execution periods to improve resource utilization. Existing warp schedulers cannot be aware of the kernel progress to provide an effective scheduling policy. In addition, we identified the potential for improving resource utilization for multiple-warp-scheduler GPUs by sharing stalling warps with selected warp schedulers. To address the efficiency issue of the present GPU, we coordinated the kernel-aware warp scheduler and warp sharing mechanism (KAWS). The proposed warp scheduler acknowledges the execution progress of the running kernel to adapt to a more effective scheduling policy when the kernel progress attains a point of resource underutilization. Meanwhile, the warp-sharing mechanism distributes stalling warps to different warp schedulers wherein the execution pipeline unit is ready. Our design achieves performance that is on an average higher than that of the traditional warp scheduler by 7.97% and employs marginal additional hardware overhead.

인지라디오 네트워크에서 전력과 부반송파 할당을 위한 휴리스틱 (An Heuristic for Joint Assignments of Power and Subcarriers in Cognitive Radio Networks)

  • 백천현
    • 경영과학
    • /
    • 제29권2호
    • /
    • pp.65-77
    • /
    • 2012
  • With the explosivley increasing demand in wireless telecommunication service, the shortage of radio spectrum has been worsen. The traditional approach of the current fixed spectrum allocation leads to spectrum underutilization. Recently, CR (Cognitive Radio) technologies are proposed to enhance the spectrum utilization by allocating dynamically radio resources to CR Networks. In this study, we consider a radio resource(power, subcarrier) allocation problem for OFDMA-based CRN in which a base station supports a variety of CUs (CRN Users) while avoiding the radio interference to PRN (Primary Radio Network). The problem is mathematically formulated as a general 0-1 IP problem. The optimal solution method for the IP problem requires an unrealistic execution time due to its complexity. Therefore, we propose an heuristic that gives an approximate solution within a reasonable execution time.

Honey Bee Based Load Balancing in Cloud Computing

  • Hashem, Walaa;Nashaat, Heba;Rizk, Rawya
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권12호
    • /
    • pp.5694-5711
    • /
    • 2017
  • The technology of cloud computing is growing very quickly, thus it is required to manage the process of resource allocation. In this paper, load balancing algorithm based on honey bee behavior (LBA_HB) is proposed. Its main goal is distribute workload of multiple network links in the way that avoid underutilization and over utilization of the resources. This can be achieved by allocating the incoming task to a virtual machine (VM) which meets two conditions; number of tasks currently processing by this VM is less than number of tasks currently processing by other VMs and the deviation of this VM processing time from average processing time of all VMs is less than a threshold value. The proposed algorithm is compared with different scheduling algorithms; honey bee, ant colony, modified throttled and round robin algorithms. The results of experiments show the efficiency of the proposed algorithm in terms of execution time, response time, makespan, standard deviation of load, and degree of imbalance.

Hybrid S-ALOHA/TDMA Protocol for LTE/LTE-A Networks with Coexistence of H2H and M2M Traffic

  • Sui, Nannan;Wang, Cong;Xie, Wei;Xu, Youyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권2호
    • /
    • pp.687-708
    • /
    • 2017
  • The machine-to-machine (M2M) communication is featured by tremendous number of devices, small data transmission, and large uplink to downlink traffic ratio. The massive access requests generated by M2M devices would result in the current medium access control (MAC) protocol in LTE/LTE-A networks suffering from physical random access channel (PRACH) overload, high signaling overhead, and resource underutilization. As such, fairness should be carefully considered when M2M traffic coexists with human-to-human (H2H) traffic. To tackle these problems, we propose an adaptive Slotted ALOHA (S-ALOHA) and time division multiple access (TDMA) hybrid protocol. In particular, the proposed hybrid protocol divides the reserved uplink resource blocks (RBs) in a transmission cycle into the S-ALOHA part for M2M traffic with small-size packets and the TDMA part for H2H traffic with large-size packets. Adaptive resource allocation and access class barring (ACB) are exploited and optimized to maximize the channel utility with fairness constraint. Moreover, an upper performance bound for the proposed hybrid protocol is provided by performing the system equilibrium analysis. Simulation results demonstrate that, compared with pure S-ALOHA and pure TDMA protocol under a target fairness constraint of 0.9, our proposed hybrid protocol can improve the capacity by at least 9.44% when ${\lambda}_1:{\lambda}_2=1:1$and by at least 20.53% when ${\lambda}_1:{\lambda}_2=10:1$, where ${\lambda}_1,{\lambda}_2$ are traffic arrival rates of M2M and H2H traffic, respectively.

GPU 성능 향상을 위한 MSHR 정보 기반 워프 스케줄링 기법 (A new warp scheduling technique for improving the performance of GPUs by utilizing MSHR information)

  • 김광복;김종면;김철홍
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권3호
    • /
    • pp.72-83
    • /
    • 2017
  • GPU는 다수의 워프를 병렬적으로 수행함으로써 레이턴시를 숨기면서 높은 처리량을 제공할 수 있다. 만약 GPU에서 캐쉬에 대한 요청이 미스를 발생시킨다면 하위 메모리로부터 요청한 데이터를 받을 때까지 MSHR(Miss Status Holding Register)을 통해 미스 정보를 추적하고 다른 워프를 수행한다. 최신 GPU에서는 캐쉬 자원에 대한 과도한 요청이 발생한 경우 자원점유 실패가 발생하여 GPU 자원을 충분히 활용할 수 없는 경우가 자주 발생한다. 본 논문에서는 MSHR 자원 부족으로 인해 발생하는 성능 감소를 줄이고자 새로운 워프 스케줄링 기법을 제안한다. L1 데이터 캐쉬에서 각 워프별 캐쉬 미스율은 긴 사이클 동안 비슷하게 유지되는 특성을 이용하여 각 워프들의 캐쉬 미스율을 예측하고, 이를 바탕으로 MSHR의 자원을 더 이상 사용할 수 없는 상태에서는 낮은 캐쉬 미스율을 보일 것으로 예측되는 워프들과 연산 위주 워프들을 우선적으로 이슈 한다. 제안하는 기법은 예측된 캐쉬 미스율과 MSHR 상태를 기반으로 캐쉬 자원을 더 효율적으로 사용함으로써 GPU 성능을 향상시킨다. 실험 결과, 제안된 기법은 LRR(Loose Round Robin) 정책에 비해 자원점유실패 사이클이 25.7% 감소하고 IPC(Instruction Per Cycle)가 6.2% 증가한다.

하향링크 무선 통신 시스템에서의 Inter-cell DCA 알고리즘 (Inter-cell DCA Algorithm for Downlink Wireless Communication Systems)

  • 김효수;김동회;박승영
    • 한국통신학회논문지
    • /
    • 제33권7A호
    • /
    • pp.693-701
    • /
    • 2008
  • 주파수 재 사용률이 1인 OFDMA(Orthogonal Frequency Division Multiple Access) 시스템에서는 인접한 셀에서 동일채널을 사용하는 것은 셀 간 간섭(Inter-cell-Interference)이 발생하므로 셀 간 간섭을 최소로 하는 채널할당이 이루어져야 한다. 본 논문에서는 OFDMA환경에서 새로운 최대 CNIR(Carrier to Noise and Interference Ratio) 기반의 분산형 Inter-cell DCA (Dynamic Channel Allocation) 알고리즘을 제안한다. 제안된 Inter-cell DCA 알고리즘은 자신의 셀에서 채널할당 요구 시 자신의 셀 내에서 채널이 포화상태이거나 할당 가능한 채널이 남아 있지만 주변 셀 간섭으로 인해 기준 CNIR 문턱치 값을 만족하지 못할 경우에도 인접한 셀의 할당 가능한 채널들의 CNIR을 검색하여 최대 값을 갖는 채널을 할당하는 방법이다. 제안된 방법은 채널 할당 확률을 높여 신규호 블록율과 신규호 생성에 의한 기존채널의 강제 종료율을 동시에 감소시켜 시스템 수율을 향상시킬 수 있음을 시뮬레이션을 통해 확인하였다.

Hair microscopy: an easy adjunct to diagnosis of systemic diseases in children

  • Dharmagat Bhattarai;Aaqib Zafar Banday;Rohit Sadanand;Kanika Arora;Gurjit Kaur;Satish Sharma;Amit Rawat
    • Applied Microscopy
    • /
    • 제51권
    • /
    • pp.18.1-18.12
    • /
    • 2021
  • Hair, having distinct stages of growth, is a dynamic component of the integumentary system. Nonetheless, derangement in its structure and growth pattern often provides vital clues for the diagnosis of systemic diseases. Assessment of the hair structure by various microscopy techniques is, hence, a valuable tool for the diagnosis of several systemic and cutaneous disorders. Systemic illnesses like Comel-Netherton syndrome, Griscelli syndrome, Chediak Higashi syndrome, and Menkes disease display pathognomonic findings on hair microscopy which, consequently, provide crucial evidence for disease diagnosis. With minimal training, light microscopy of the hair can easily be performed even by clinicians and other health care providers which can, thus, serve as a useful tool for disease diagnosis at the patient's bedside. This is especially true for resource-constrained settings where access and availability of advanced investigations (like molecular diagnostics) is a major constraint. Despite its immense clinical utility and non-invasive nature, hair microscopy seems to be an underutilized diagnostic modality. Lack of awareness regarding the important findings on hair microscopy may be one of the crucial reasons for its underutilization. Herein, we, therefore, present a comprehensive overview of the available methods for hair microscopy and the pertinent findings that can be observed in various diseases.

Trends in Regional Disparities in Cardiovascular Surgery and Mortality in Korea: A National Cross-sectional Study

  • Dal-Lae Jin;Kyoung-Hoon Kim;Euy Suk Chung;Seok-Jun Yoon
    • Journal of Preventive Medicine and Public Health
    • /
    • 제57권3호
    • /
    • pp.260-268
    • /
    • 2024
  • Objectives: Regional disparities in cardiovascular care in Korea have led to uneven patient outcomes. Despite the growing need for and access to procedures, few studies have linked regional service availability to mortality rates. This study analyzed regional variation in the utilization of major cardiovascular procedures and their associations with short-term mortality to provide better evidence regarding the relationship between healthcare resource distribution and patient survival. Methods: A cross-sectional study was conducted using nationwide claims data for patients who underwent coronary artery bypass grafting (CABG), percutaneous coronary intervention (PCI), stent insertion, or aortic aneurysm resection in 2022. Regional variation was assessed by the relevance index (RI). The associations between the regional RI and 30-day mortality were analyzed. Results: The RI was lowest for aortic aneurysm resection (mean, 26.2; standard deviation, 26.1), indicating the most uneven regional distribution among the surgical procedures. Patients undergoing this procedure in regions with higher RIs showed significantly lower 30-day mortality (adjusted odds ratio [aOR], 0.73; 95% confidence interval, 0.55 to 0.96; p=0.026) versus those with lower RIs. This suggests that cardiovascular surgery regional availability, as measured by RI, has an impact on mortality rates for certain complex surgical procedures. The RI was not associated with significant mortality differences for more widely available procedures like CABG (aOR, 0.96), PCI (aOR, 1.00), or stent insertion (aOR, 0.91). Conclusions: Significant regional variation and underutilization of cardiovascular surgery were found, with reduced access linked to worse mortality for complex procedures. Disparities should be addressed through collaboration among hospitals and policy efforts to improve outcomes.

GPU 성능 저하 해결을 위한 내부 자원 활용/비활용 상태 분석 (Analysis on the Active/Inactive Status of Computational Resources for Improving the Performance of the GPU)

  • 최홍준;손동오;김종면;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.1-11
    • /
    • 2015
  • 최신 고성능 컴퓨팅 시스템에서는, 대용량 병렬 연산을 효과적으로 처리할 수 있는 GPU의 우수한 연산 성능을 그래픽 처리 이외의 범용 작업에 활용하는 GPGPU 기술에 관한 연구가 활발하게 진행 중이다. 하지만 범용 응용프로그램의 특성이 GPU 구조에 최적화되어 있지 않기 때문에 범용 프로그램 수행 시 GPGPU는 GPU의 연산 자원을 효과적으로 활용하지 못하고 있다. 그러므로 본 논문에서는 GPGPU 기술을 사용하는 컴퓨팅 시스템의 성능을 보다 향상시킬 수 있는 GPU 연구에 대한 방향을 제시하고자 한다. 이를 위하여, 본 논문에서는 GPU 성능 저하 원인 분석을 수행한다. GPU 성능 저하 원인을 보다 명확하게 분류하고자 본 논문에서는 GPU 코어의 상태를 완전 활성화 상태, 불완전 활성화 상태, 유휴 상태, 메모리스톨 상태, 그리고 GPU 코어 스톨 상태 등 5가지로 정의하였다. 완전 활성화 상태를 제외한 모든 GPU 코어 상태들은 컴퓨팅 시스템의 성능 저하를 유발한다. 본 논문에서 성능 저하 원인을 찾고자 벤치마크 프로그램의 특성에 따라 각 GPU 코어 상태의 비율 변화를 측정하였다. 분석 결과에 따르면, 불완전 활성화 상태, 유휴 상태, 메모리 스톨 상태 그리고 GPU 코어 스톨 상태는 연산 자원 활용률 저하, 낮은 프로그램 병렬성, 높은 메모리 요청, 그리고 구조적 해저드에 의해 각각 유발된다.

범용 응용프로그램 실행 시 하드웨어 구성과 분기 처리 기법에 따른 GPU 성능 분석 (Analysis of Impact of Correlation Between Hardware Configuration and Branch Handling Methods Executing General Purpose Applications)

  • 최홍준;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.9-21
    • /
    • 2013
  • GPU의 연산 능력과 유연성이 강화됨에 따라, GPU는 그래픽 응용프로그램뿐만 아니라 범용 응용프로그램도 수행한다. 특히, GPU 회사들이 제공하는 API를 활용함으로써 프로그래머들은 보다 쉽게 GPGPU 응용프로그램을 작성할 수 있다. 하지만 대부분의 범용 응용프로그램은 분기 명령어를 많이 포함하고 있기 때문에, 범용 응용프로그램을 수행하는 경우 GPU의 연산 자원을 충분히 활용할 수 없다. 분기 명령어를 처리하기 위해서 다양한 워프 생성 기법들이 제안되었다. GPU 구조에서는 높은 연산 자원 활용률을 보이는 워프 생성기법이 우수한 성능을 보일 것으로 예상된다. 하지만 예상과는 달리, 실험 결과에 따르면 높은 연산 자원 활용률을 보이는 워프 생성 기법의 성능이 상대적으로 낮은 연산 자원 활용률을 보이는 워프 생성 기법의 성능보다 낮게 나타난다. 높은 연산 자원 활용률을 보이는 워프 생성 기법에서 유발한 많은 메모리 요구로 인한 심각한 메모리 병목 현상이 원인으로 분석된다. 그러므로 적절한 하드웨어 지원이 없는 경우, 높은 연산자원 활용률이 반드시 우수한 성능을 보장한다고 할 수 없다. 이러한 이유로, 본 논문에서는 하드웨어 자원과 워프 생성 기법사이의 상관관계에 대한 상세한 분석을 수행하고자 한다. 본 논문의 분석 결과는 분기 명령어에 의해 발생된 GPU의 성능 저하 문제를 해결하고자 할 때 중요한 가이드라인이 될 것이다.