클라우드 환경에서 XMDR-DAI를 이용한 데이터 정제 시스템

Data Cleaning System using XMDR-DAI in Cloud

  • 투고 : 2013.12.30
  • 심사 : 2014.02.20
  • 발행 : 2014.02.28


클라우드 환경에서 비즈니스 인텔리전스를 위한 DW(Data Warehouse)는 기업 내에 데이터를 의사결정, 기업 정책을 결정하는데 사용하고 있다. 그러나 클라우드 환경에서 새로운 시스템이 추가되면 데이터 통합 측면에서 시스템간의 여러 가지 이질적인 특성으로 인해 많은 비용과 시간이 필요로 하게 된다. 따라서 본 논문에서는 클라우드 환경에서 비즈니스 인텔리전스를 위한 데이터 정제 시스템을 제안한다. 제안 시스템은 XMDR-DAI를 이용하여 분산된 시스템을 통합할 때 로컬 시스템의 영향을 최소화하고, DW의 정보를 실시간으로 생성하기 위해 데이터 통합을 위한 표준화된 정보를 제공한다. 또한 기존 시스템의 변경 없이 데이터를 통합하여 비용과 시간을 절감하고, 실시간 데이터 추출 및 정제 작업을 통한 일관성 있는 실시간 정보를 생성하여 정보의 품질의 향상시킬 수 있도록 한다.

In cloud environment, business intelligence data warehouse is used for decision making and enterprise policy. But if new system is added in cloud environment, much cost and time is needed due to heterogenous characteristics in data integration. This paper suggests a data cleaning system for business intelligence in cloud environment. The proposed system minimizes the effect of local system when it integrates distributed system using XMDR-DAI. And this system provides standardized information to generate information of data warehouse in real time. Also the proposed system saves cost and time by integrating the data without a change of existed system. And it can improve quality of information by generating coherent information through data extraction and cleaning work in real time.



  1. Armbrust, Michael, et al. "A view of cloud computing." Communications of the ACM 53.4 (2010): 50-58.
  2. Liautaud, Bernard, and Mark Hammond. e-Business intelligence: turning information into knowledge into profit. McGraw-Hill, Inc., 2000.
  3. Smith, Brian L., and Simona Babiceanu. "Investigation of extraction, transformation, and loading techniques for traffic data warehouses." Transportation Research Record: Journal of the Transportation Research Board 1879.1 (2004): 9-16.
  5. Moon, SeokJae, GyeDong Jung, and YoungKeun Choi. "XMDR-DAI Based on GQBP and LQBP for Business Process." Advanced Computer Science and Information Technology. Springer Berlin Heidelberg, 2010. 72-85.
  6. Mell, Peter, and Timothy Grance. "The NIST definition of cloud computing (draft)." NIST special publication 800.145 (2011): 7.
  7. Vassiliadis, Panos, Alkis Simitsis, and Spiros Skiadopoulos. "Conceptual modeling for ETL processes." Proceedings of the 5th ACM international workshop on Data Warehousing and OLAP. ACM, 2002.
  8. Williams, Steve, and Nancy Williams. The profit impact of business intelligence. Morgan Kaufmann, 2010.
  9. Vitt, Elizabeth, Michael Luckevich, and Stacia Misner. Business intelligence. O'Reilly, 2010.
  10. Dayal, Umeshwar, et al. "Data integration flows for business intelligence."Proceedings of the 12th International Conference on Extending Database Technology: Advances in Database Technology. Acm, 2009.