DOI QR코드

DOI QR Code

Petri net based ETL Process Modeling

페트리넷 기반의 ETL프로세스 모델링

  • Jung, Sung-Jae (Division of Technology Innovation, EN-CORE Corporation) ;
  • Choe, Yun-Ho (Division of Technology Innovation, EN-CORE Corporation) ;
  • Hwang, Jongha (Division of Technology Innovation, EN-CORE Corporation) ;
  • Kim, Dong-Hoon (Division of Technology Innovation, EN-CORE Corporation) ;
  • Lee, Hwasik (Division of Technology Innovation, EN-CORE Corporation)
  • Published : 2015.10.28

Abstract

ETL(Extraction, Transformation, Loading)작업은 데이터웨어하우스 시스템 구축 및 유지관리 뿐만 아니라 차세대 정보시스템 구축의 핵심 프로세스에 해당한다. 특히 차세대 정보시스템 구축에 있어서 ETL 작업의 성능은 시스템오픈의 성패를 좌우하는 중요한 요소이다. 일반적으로 차세대시스템 구축의 데이터 전환을 위해 수행되는 ETL작업은 대용량데이터에 대한 다양한 형태의 데이터변형 과정을 수반하며 반드시 정해진 시간안에 완료되어야 한다. 또한, 수 많은 원천 집합을 추출하여 타겟시스템의 형태에 맞게 변형 및 적재하는 작업은 한정된 컴퓨팅 자원내에서 수행되어야 한다. 따라서 자원성능을 고려한 ETL작업 스케줄 최적화는 데이터전환 작업에 있어 필수적인 고려사항이 된다. 이 연구에서는 가용한 물리자원을 최대한 활용하여 ETL 프로세스의 처리능(throughput)을 최대화 하는데 초점을 맞추어, ETL프로세스를 페트리넷을 이용해 모델링하는 기법을 제시한다. 이 모델에는 ETL 프로세스가 수행될 서버의 컴퓨팅자원이 토큰화(tokenize)되어 포함된다. 이 모델을 기반으로 가용자원을 최대한 활용하면서도 자원병목이 발생하지 않는 수준으로 ETL 작업이 수행될 수 있도록 프로세스를 제어할 수 있는 방안을 제시한다.

Keywords