Negative Side Effects of Denormalization-Oriented Data Modeling in Enterprise-Wide Database Design

기업 전사 자료 설계에서 역정규화 중심 데이터 모델링의 부작용

  • Rhee, Hae-Kyung (Yong-In Songdam College Dept. of Computer Game Information)
  • 이혜경 (용인송담대학 컴퓨터게임정보과)
  • Published : 2006.11.25

Abstract

As information systems to be computerized get significantly scaled up, data modeling issues apparently considered to be crucial once again as the early 1980's under the terms of data governance, data architecture or data quality. Unfortuately, merely resorting to heuristics-based field approaches with more or less no firm theoretical foundation of knowledge with regard to criteria of data design lead quite often to major failures in efficacy of data modeling. In this paper, we have compared normalization-critical data modeling approach, well-known as the Non-Stop Data Modeling methodology in the literature, to the Information Engineering in which in many occasions the notion of do-normalization is supported and even recommended as a mandatory part in its modeling nature. Quantitative analyses have revealed that NS methodology ostensibly outperforms IE methodology in terms of efficiency indices like adequacy of entity judgement, degree of existence of data circulation path that confirms the balancedness of data design and ratio of unnecessary data attribute replication.

전산화 대상 규모가 확대되면서 새로운 방식의 데이터 모델링 방법론이 필요하게 됨에 따라 자료 설계라는 것에 최근 들어 1980년대 초반 못지 않게 이른 바 데이터 거버넌스 혹은 데이터 질 등의 화두의 모습으로 큰 관심이 재연되고 있다. 그러나 데이터 모델링에 대한 확고한 견해를 가지고 있지 못하기 때문에 막상 데이터베이스 설계를 실무적으로 소화해 내기에는 적지 않은 어려움을 겪게 된다 본 논문에서는 업무의 요구 형성/분석 단계부터 데이터베이스 구현까지 최종 단계까지를 체계적인 방법론을 통해 정보시스템의 데이터 모델을 창출하는 정규화 중시의NS방법론을 적용한 설계방법과 기존의 관행에 의해 역정규화를 어쩔 도리 없이 용인하고 마는 정보공학(Information Engineering, 약칭 IE)방법론 기반의 설계방법과 비교한다. 동일한 업무를 대상으로 설계된 데이터 설계 산출물을 기준으로 각종 측면에서 비교해 봄으로써 정규화 중시 기반의 체계적 방법론이 기업의 정보시스템의 성능 향상에 어느 정도 기여하는지를 정량 파악하였다. 비교 실험 결과, 개체 설정의 타당성, 설계의 균형성 지표인 사각고리형 경로 유무, 그리고 속성중복률 면에서 모두 NS방법론적 설계가 우수하였다.

Keywords

References

  1. S. Moon, 'Unclassified data is merely garbage: data modeling is more crucial than programming,' Hitech Information, vol. 14, pp. 50-51, 2003
  2. R. Y. Wang, V. C. Storey and C. P. Firth, 'A framework for analysis of data quality research,' IEEE transactions on Knowledge and Data Engineering, vol. 7, no. 7, pp. 623-640, 1995 https://doi.org/10.1109/69.404034
  3. G. L. Sanders and S. Shin, 'Denormalization Effects on Performance of RDBMS,' Proceedings of the 34th International Conference on System Sciences, Hawaii, pp. 1-9, 2001
  4. D. B. Bock and J. F. Schrage, 'Denormalization guidelines for base and transaction tables,' ACM Special Interest Group on Computer Science Education, vol. 34, no. 4, pp. 1, 2002
  5. 문송천, '데이터 아키텍춰, 형성출판사,' 2004
  6. Peter Rob, Carlos Coronel, 'Database Systems: Design, Implementation, & Management, 4/e', Thomson, 2000