DOI QR코드

DOI QR Code

A Data Quality Improvement Method in Integrations of Distributed Data: National Science & Technology Information Services

분산 데이터의 통합시 데이터의 품질향상 방안: 국가과학기술종합정보시스템

  • Published : 2009.08.31

Abstract

A currently domestic governmental R&D business is early to 100. And this is each managed individually in 15 professional organizations of research and management by characteristics of a business. For this Reason, A redundant investment issue regarding national R&D occurs, and an issue regarding efficiency of R&D investment by insufficiency of systematic R&D research project and result management is continuously raised. Ministry of Education Science and Technology establishing National Science & Technology Information Service(NTIS) in order to solve these issues. NTIS is the national R&D Portal System which can support efficiency of research and development to result utilization in planning of national research and development. As data of the same meaning are named particularly in each organizations, and that made to different data types, It is an issue to be difficult to achieve high level qualify, accuracy of integrated data in case of integration of distributed data like NTIS In this paper We consider integrated DB constructions and Information Linking of R&D Participants/Projects/Results information in a NTIS system for data qualify Improvement, and then We analyze the cause of the data quality problem, and we propose the improvement plan for data quality elevation of NTIS system.

현재 국내의 정부 R&D 사업은 300여개에 이르고 있고, 이를 사업의 특성별로 16개 국가R&D 관련 부처 청의 15개 대표연구관리 전문기관에서 각각 관리하고 있다. 이로 인하여 발생하는 국가 R&D에 대한 중복 투자와 체계적인 R&D연구과제 및 성과관리의 미흡으로 R&D 투자의 효율성에 대한 문제가 계속해서 제기되고 있다. 그러한 가운데 이러한 문제를 해결하기 위하여 교육과학기술부는 국가연구개발의 기획에서 성과활용에 이르기까지 연구개발의 효율화를 지원할 수 있는 국가 R&D 포털시스템으로써 국가과학기술종합정보시스템(NTS)을 구축하고 있다. NTIS와 같이 분산된 데이터의 통합시 동일한 의미의 데이터들이 각 조직에서 달리 명명되고 다른 데이터 유형으로 되어 있기에 통합된 데이터의 정확성과 높은 수준의 품질을 달성하는 것이 어려운 문제이다. 본 논문에서는 NTIS 시스템의 인력/과제/성과 정보의 통합DB 구축 및 연계방식과 이를 통해 수집된 데이터의 품질관리를 위한 데이터정제 프로세스를 고찰해 본다. 그 과정에서 발생할 수 있는 데이터 품질문제의 요인을 분석하여 NTIS의 데이터 품질향상을 위한 개선방안을 제시한다.

Keywords

References

  1. 김재수, "국가 R&D 정보 지식포털 NTIS", TLS (Techno Leaders' Digest), 제 219호, pp. 08, 2008.10
  2. 권도훈, 박성공, 이정욱, "이기종 데이터베이스 환경의 정보 통합을 위한 I2System(:Information Integration System) 설계", Proceedings of the 28th KISS Fall Conference, Oct. 2001 ,pp.136-138
  3. Maurizio Panti, luca Spalazzi, and Allberto Giretti, "A Case-Based Approach to Information Integration", Proceedings of the 26th VLDM Conference, Cairo, Egypt, 2000
  4. S.Ram, "Special issue on heterogeneous distributed database systems", IEEE Computer Magazine, 24(12), Dec. 1991
  5. A. Sheth and J. Larson, "Federated Database Systems for Managing Distributed, Heterogeneous and Autonomous Databases",ACM Transaction on Database Systems, 22(3), 1990
  6. T.Ozsu, U.Dayal, and P.Valduriez, "Distriguted Object Management", Mrgan Kaufmann, San Mateo, CA, 1993
  7. S.K.Oh, J.H.Son, Y.J.Lee and M.H.Kim, "Efficient Allocation of Workflow Tasks to Improve the Performance of Distributed Workflows", The Fifth Int'l Conference on Computer Science and Informatics, Serial. 5, Atlantic City, USA, P. 445 - 448, 2000
  8. Larry P. English, "Improving Data Warehouse and Business Information Quality", Wiley, 1999.02
  9. ISO/IEC 9126-1,2,3, JTC1 SC7 WG6(Evaluation & Metrics) Documents, 1996.11
  10. Dian M. Strong, Yang W. Lee and Richard Y. Wang, "Data Quality in Context", Communications of the ACM, Vol.40 No.5, 1997.05
  11. 양자영, 최병주, "데이터품질 측정도구", 한국정보과학회 논문지, 컴퓨팅의 실제 제 9권 제 3호, 2003.06
  12. 한국데이터베이스진흥센터, "데이터품질관리 지침(Ver.2.0)", 2005.11
  13. 허정희, '데이터 품질 향상을 위한 데이터 관리 프로세스 개선 사례 연구:데이터 표준과 요구사항 관리 중심으로', 한양대학교 석사학위논문, 2007
  14. 황희정, "데이터 정제 방법론에 관한 연구", 배화논총, Vol.23 No.-, 2004
  15. 한국과학기술정보연구원, "국가R&D 데이터 품질관리체계 구축 방안", 2007
  16. 한국과학기술정보연구원, “국가R&D 인력/과제/성과정보 데이터 정제 지침 및 매뉴얼 Ver 1.0", 2008
  17. 손강렬, 한희준, 임종태, "산재된 인력정보의 중복입력 문제 해결을 위한 에이전트 설계 및 구현 방법에 관한 연구", 정보관리연구지 제 38권 제 1호, 2007.03