CGRID construction based on Etherboot technology and its utilization to sequence analysis

Etherboot 기반의 CGRID 구축과 서열분석에의 적용

  • Published : 2005.12.01

Abstract

Recently, amount of the data such as sequences is being increased rapidly due to deploying computational technique and advance of experiment tools in the biological areas. In bioinformatics, it is very significant to extract the knowledge from such huge biological data. Sequence comparisons are most frequently used to predict the function of the genes or proteins. However it takes so much time to process the persistently increasing data In this paper, we propose hardware-based grid, CGRID(Chungbuk National University GRID), to improve performance and complement existing middleware-only approach and apply it in the sequence comparison. Hardware-based approach is easy to construct, maintain, and manage the grid as not requiring the software installation individually for every node. We reduce orthologous database construction time from 33 weeks to just a week. Furthermore, CGRID guarantees that the performance increases proportionally as adding the nodes.

최근 생물학 분야에서 실험 도구의 발달 및 컴퓨터 기술의 도입으로 생물 데이터가 폭발적으로 증가하고 있다. 대량의 생물 데이터로부터 의미 있는 정보를 추출하는 것은 매우 중요한 문제이다. 서열비교는 유전자 및 단백질 기능 예측을 하기 위해 사용되는 가장 기본적인 분석방법이다. 하지만, 급격히 증가하는 대량의 서열데이터에 대하여 처리시간 또한 많이 소요된다. 본 논문에서는 이러한 성능상의 한계를 극복하고 기존 미들웨어 방식의 그리드를 보완하기 위하여 하드웨어 기반의 그리드인 CGRID (Chungbuk national university GRID)를 제안하고 서열비교에 적용한다. 하드웨어 기반의 그리드 방식은 기존의 방식과는 달리 모든 작업노드에 반복적으로 프로그램 설치를 할 필요가 없으므로 그리드 구축, 유지 및 관리가 용이하다. 27대의 PC로 구성된 CGRID에서 89종의 오솔로그 데이터베이스 구축 시간을 33주에서 1주일로 단축하였다. 또한, 실험을 통하여 CGRID에서 PC의 수가 증가함에 따라 시스템의 성능이 비례하여 향상됨을 확인하였다.

Keywords