• Title/Summary/Keyword: 고성능 컴퓨팅

Search Result 291, Processing Time 0.024 seconds

Design and Implementation of an Efficient PC Cluster Using Mobile Agent (이동 에이전트를 이용한 효율적인 PC 클러스터 시스템의 설계 및 구현)

  • 최종욱;김영균;오길호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.577-579
    • /
    • 2002
  • 적은 비용으로 고성능 컴퓨팅 시스템을 구축하는 방법중의 하나로 클러스터링이라는 방법이 도입되어 그에 관련된 많은 연구와 방법들이 적용되고 있다. 하지만 베어울프와 같은 대표적인 기존의 고성능 연산 클러스터링의 방법은 주로 동일한 운영체제 환경에서 플러스터링 노드들의 통신에서는 MPI나 PVM등의 병렬처리용 라이브러리에 국한되어 있다. 이러한 방법은 서로 이질적인 네트워크 환경에서 특정 기능의 모듈을 동적으로 확장하거나 적용하는 것에 대해서는 사용자나 관리자의 많은 수동적인 노력을 필요로 하고 있다. 이에 본 논문에서는 네트워크상에서의 자바 기반의 이동 에이전트를 이용하여 서로 다른 이질적인 시스템들에 대한 확장과 이동이 용이하고 실시간 노드들의 정보를 수집하여 제안한 클러스터링 알고리즘을 적용하여 병렬처리 가능한 작업들의 분배 및 처리할 수 있는 이동 에이전트 기반의 클러스터링 시스템을 연구하였다.

  • PDF

Current Status and Outlook of pNFS and Its Implementation (pNFS 표준화 및 연구개발 동향)

  • Park, J.S.;Kim, S.Y.;Cha, M.H.;Kim, D.O.;Kim, Y.C.;Kim, H.Y.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.5
    • /
    • pp.55-65
    • /
    • 2011
  • 요즘 신산업으로 떠오르고 있는 개인 유전체 분석이나 차세대 시퀀싱 기술과 같은 고성능 컴퓨팅 응용들은 data-intensive한 작업들을 요구하며, 이러한 응용을 지원하기 위한 고성능 파일 시스템 기술에 대한 연구들이 다수 진행 중이다. 그러나 그 결과물들은 업체별로 보유한 고유 기술로서, 상호 호환성 등의 문제로 인해 표준화의 필요성이 제기되어 왔다. 현재 파일 시스템과 관련하여 거의 모든 IT 업체에서 사용하고 있는 실질적인 표준은 NFS(Network File System)이다. IETF(Internet Engineering Task Force)에서는 이러한 요구사항들을 반영하여 2010년에 NFSv4.1 표준을 공표하였고, 특히 I/O 성능을 향상시키기 위한 pNFS(parallel NFS)는 NFSv4.1의 핵심 기능으로서 다수업체들과 연구기관들에서 많은 관심을 받고 있다. 본 고에서는 pNFS 표준화 및 연구개발 동향과 관련된 이슈들에 대해 기술하고자 한다.

  • PDF

Object Recognition using On-Chip Multiprocessing Microprocessor (다중처리 마이크로프로세서를 이용한 객체 인식)

  • Chung, Yong-Wha;Park, Kyoung;Hahn, Woo-Jong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.762-767
    • /
    • 1999
  • 객체 인식은 고성능 컴퓨팅을 필요로 하는 흥미있는 응용 분야이다. 현재 대부분의 고성능 컴퓨터는 슈퍼스칼라 구조의 범용 마이크로프로세서를 채택하고 있으나, 반도체 집적도가 증가함에 따라 슈퍼스칼라 구조를 대신할 새로운 마이크로프로세서가 구조가 제안되고 있다. 본 논문에서는 최근 새로운 마이크로프로세서 구조로 급부상하고 있는 다중처리 마이크로프로세서 구조가 객체 인식 응용에 적합한지를 분석한다. 성능 특성을 확인하기 위하여 먼저 프로그램 구동방식의 마이크로프로세서 시뮬레이터와 프로그래밍 환경을 개발하였다. 이를 기반으로 시뮬레이션을 수행한 결과, 다중처리 마이크로프로세서가 작은 오버헤드로 쓰레드 수준의 병렬성을 적절히 활용하고 있어 객체 인식 응용에 적합한 구조임을 확인하였다.

  • PDF

A High Performance Job Scheduling Policy for Computational Grid (계산 그리드를 위한 고성능 작업 스케줄링 정책)

  • Jo, Ji-Hun;Kim, Jun-Sang;Lee, Won-Joo;Jeon, Chang-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.493-496
    • /
    • 2007
  • 그리드 컴퓨팅은 방대한 데이터 저장 공간과 고성능 연산능력을 요구하는 작업에 적합하다. 동적계획법(dynamic programming)은 방대한 크기의 동적 테이블(dynamic table)을 구성하여 최적해(optimal solution)을 찾기 때문에 그리드에서 수행하기에 적합한 작업이다. 본 논문에서는 동적 테이블을 구성하고 분산 배치하는 할당 정책을 제안한다. 그리고 동적계획법 기반의 어플리케이션을 그리드에서 효율적으로 수행할 수 있는 그리드 시스템 구조를 제안한다.

  • PDF

An experimental study on Intel KNL processor to improve the performance of high bandwidth on-chip memory (인텔 KNL 프로세서 사례를 통한 고성능 온칩 메모리의 성능 병목 분석 및 해결 방안 연구)

  • Byun, Eun-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.92-95
    • /
    • 2020
  • 나날이 커져가는 데이터 처리량의 수요를 충족시키기 위한 방법의 하나로 수십개의 코어와 여러 채널의 고대역폭 메모리를 탑재한 프로세서가 상위 슈퍼컴퓨터 시스템에 도입되어 사용되고 있다. 이러한 Scale-out 방식은 성능 한계를 크게 끌어올릴 수 있지만 제대로 된 작업 배분이 되지 않았을 때 성능이 떨어질 가능성이 있다. 본 연구에서는 인텔 KNL 프로세서의 고성능 온칩 메모리의 성능 벤치마크를 진행하여 병목 현상이 실제로 존재함을 확인하였다. 또한 이런 성능 저하 패턴을 찾아내고 원인을 분석하여 향후의 시스템에서 이러한 문제를 최소화하기 위해서 하드웨어, 시스템 소프트웨어 수준에의 보완 방안을 제안한다.

Design and Implementation of an InfiniBand System Interconnect for High-Performance Cluster Systems (고성능 클러스터 시스템을 위한 인피니밴드 시스템 연결망의 설계 및 구현)

  • Mo, Sang-Man;Park, Kyung;Kim, Sung-Nam;Kim, Myung-Jun;Im, Ki-Wook
    • The KIPS Transactions:PartA
    • /
    • v.10A no.4
    • /
    • pp.389-396
    • /
    • 2003
  • InfiniBand technology is being accepted as the future system interconnect to serve as the high-end enterprise fabric for cluster computing. This paper presents the design and implementation of the InfiniBand system interconnect, focusing on an InfiniBand host channel adapter (HCA) based on dual ARM9 processor cores The HCA is an SoC tailed KinCA which connects a host node onto the InfiniBand network both in hardware and in software. Since the ARM9 processor core does not provide necessary features for multiprocessor configuration, novel inter-processor communication and interrupt mechanisms between the two processors were designed and embedded within the KinCA chip. Kinch was fabricated as a 564-pin enhanced BGA (Bail Grid Array) device using 0.18${\mu}{\textrm}{m}$ CMOS technology Mounted on host nodes, it provides 10 Gbps outbound and inbound channels for transmit and receive, respectively, resulting in a high-performance cluster system.

I/O Translation Layer Technology for High-performance and Compatibility Using New Memory (뉴메모리를 이용한 고성능 및 호환성을 위한 I/O 변환 계층 기술)

  • Song, Hyunsub;Moon, Young Je;Noh, Sam H.
    • Journal of KIISE
    • /
    • v.42 no.4
    • /
    • pp.427-433
    • /
    • 2015
  • The rapid advancement of computing technology has triggered the need for fast data I/O processing and high-performance storage technology. Next generation memory technology, which we refer to as new memory, is anticipated to be used for high-performance storage as they have excellent characteristics as a storage device with non-volatility and latency close to DRAM. This research proposes NTL (New memory Translation layer) as a technology to make use of new memory as storage. With the addition of NTL, conventional I/O is served with existing mature disk-based file systems providing compatibility, while new memory I/O is serviced through the NTL to take advantage of the byte-addressability feature of new memory. In this paper, we describe the design of NTL and provide experiment measurement results that show that our design will bring performance benefits.

Characteristic of Data Distribution and Data Replication based Model of LDAP System in High Performance Grid Environments (고성능 Grid 환경에서의 LDAP 시스템의 분산모델과 복제모델의 특성)

  • 권성호;김희철
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.9 no.1
    • /
    • pp.77-84
    • /
    • 2004
  • Recently, as the number of entities participating in the Grid system increased, the response time of LDAP system became inadequate. Consequently, we have to design new LDAP that suitable for high performance Grid environments. For this, researches about analysis of performance LDAP system are needed firstly. However, because researches are focused mostly on read operation optimized environments, so these result of researches are not directly applied to high performance Grid environments that write operation occupies most. In this paper, we provide overall results of analysis of performance of LDAP system with respect to number of node, query arrival rate, probability of read and so on. The analysis is based on in analytic performance model by applying the M/M/1 queuing model. Finally, based on the results, we suggest the direction for the design of high performance LDAP system and this research results can be applied as basic materials to design of GIS in high performance Grid environments as well as.

  • PDF

The Node Scheduling of Multi-Threaded Process for CC-NUMA System (CC-NUMA 시스템을 위한 다중 스레드 프로세스의 노드 스케줄링 설계 및 구현)

  • Kim, Jeong-Nyeo;Kim, Hae-Jin;Lee, Cheol-Hoon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.2
    • /
    • pp.488-496
    • /
    • 2000
  • this paper describes the design and implementation of node scheduling for MX Server that is CC-NUMA System COMSIX, the operating system of MX Server, is designed to suit for CC-NUMA Architecture. MX Server consists of up to 8 nodes, and each node is connected by SCI ring. This node scheduling scheme considers data locality for performance improvement of Oracle8i DBMS on the CC-NUMA architecture. For DBMS such as Oracle8i, a multi-threaded process may be run to tie on particular disk. We have developed a CG binding function that the multi-threaded process bound the node. Currently, We don't have an available CC-NUMA Platform. Instead of MX Server, we developed the Node scheduling scheme for multi-threaded process to suit server platform on the PC test-bed and tested completely.

  • PDF

Heterogeneous Multi-Core Processor and Software Technology Trend for Embedded Devices (임베디드 기기를 위한 이기종 멀티코어 프로세서 및 소프트웨어 기술 동향)

  • Na, G.J.;Baek, W.K.;Jung, Y.J.
    • Electronics and Telecommunications Trends
    • /
    • v.28 no.2
    • /
    • pp.1-10
    • /
    • 2013
  • 1980년대와 1990년대가 서버와 데스크톱 중심 컴퓨팅의 시대였다고 한다면 2000년대 들어 모바일 분야를 포함하는 임베디드 프로세서 시장이 급격히 확장되며 임베디드 중심 시대로 산업구조가 재편되고 있다. 그리고, 2010년대에는 임베디드 프로세서 시장이 더욱 확대되고 기술도 더불어 발전되고 있는데, 최근 기술을 주도하고 있는 뜨거운 용어 중의 하나가 이기종 멀티코어 컴퓨팅이라 할 수 있다. 시장이 요구하는 고성능 컴퓨팅을 수용하고 임베디드 기기의 특성상 저전력을 실현해야 하는 현실적 문제를 해결하기 위한 이기종 멀티코어 하드웨어가 임베디드 기기에도 적용을 앞다투고 있는 상황이며, 적절한 응용 콘텐츠에 맞춰 이기종 멀티코어 하드웨어를 활용하기 위한 소프트웨어에 대한 관심과 발전도 발 맞춰 진행되고 있다. 이에 본고에서는 임베디드 기기 분야에 한정하여 이기종 멀티코어 하드웨어와 소프트웨어의 기술 동향을 살펴보고자 한다.

  • PDF