• 제목/요약/키워드: Quality of Data

검색결과 20,896건 처리시간 0.056초

데이터 품질관리 프로세스 평가를 위한 프로세스 참조모델 (The Process Reference Model for the Data Quality Management Process Assessment)

  • 김선호;이창수
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.83-105
    • /
    • 2013
  • 데이터의 품질을 평가하기 위해서 데이터 자체의 품질을 측정하는 방법과 데이터 품질을 관리하는 프로세스를 측정하는 방법이 활용되고 있다. 최근에는 조직의 데이터 품질을 보장 및 인증하기 위해 데이터 품질관리 프로세스의 성숙도를 측정하는 방법을 활용하고 있다. 이러한 추세에 따라 본 논문에서는 데이터 품질관리의 프로세스 성숙도를 평가하는데 필요한 프로세스 참조모델을 제시한다. 우선 데이터 품질관리 프로세스 성숙도 평가 모델의 개요를 제시한다. 그리고, 프로세스 성숙도 평가에 기본이 되는 프로세스 참조모델을 제시한다. 여기서는 프로세스 도출 방안, 데이터 품질관리의 기본 원칙, SPICE 프로세스 참조 모델의 기본 개념을 기초로 하여 프로세스 참조모델의 구성과 세부 프로세스를 개발하였다. 그리고 본 모델의 특징 및 개선점을 ISO 8000-150의 프로세스와 비교하여 설명하였다.

한국의 기온자료 품질관리 알고리즘의 검증 (Validation of Quality Control Algorithms for Temperature Data of the Republic of Korea)

  • 박창용;최영은
    • 대기
    • /
    • 제22권3호
    • /
    • pp.299-307
    • /
    • 2012
  • This study is aimed to validate errors for detected suspicious temperature data using various quality control procedures for 61 weather stations in the Republic of Korea. The quality control algorithms for temperature data consist of four main procedures (high-low extreme check, internal consistency check, temporal outlier check, and spatial outlier check). Errors of detected suspicious temperature data are judged by examining temperature data of nearby stations, surface weather charts, hourly temperature data, daily precipitation, and daily maximum wind direction. The number of detected errors in internal consistency check and spatial outlier check showed 4 days (3 stations) and 7 days (5 stations), respectively. Effective and objective methods for validation errors through this study will help to reduce manpower and time for conduct of quality management for temperature data.

Geospatial Data의 품질평가를 위한 Framework (A Framework for Quality Evaluation of Geospatial Data)

  • 조기성
    • 대한공간정보학회지
    • /
    • 제4권2호
    • /
    • pp.123-136
    • /
    • 1996
  • 최근 날로 정보기술이 발전하고 사회가 다양화되면서 다양한 데이터를 공유하기 위한 데이터 표준화에 대한 요구가 증대되고 있어 이와 같은 표준화를 위해 우선적으로 지형공간데 이터의 정확성과 신뢰도를 나타내는 데이터품질의 정의 및 평가과정에 관한 연구가 요망되고 있다. 본 연구에서는 세계 각 국에서 채택하고 있는 대표적인 데이터 품질요소의 정의 및 평가방법을 비교 고찰하여 다음과 같은 결과를 얻었다. 첫째, 우리나라의 국가지형공간데이터 교환포멧의 표준내에 데이터의 품질을 평가하기 위한 요소의 정의는 평가기준이 명확한 ISO/TC211의 안을 수용하는 것이 바람직하다고 판단된다. 둘째, 본 연구를 통하여 품질평가요소에 따른 보다 합리적인 지형공간정보 데이터의 품질평가과정을 제시하였으며, 이를 KSDTS에도 적용할 것과 데이터 품질평가결과의 보고형식 등을 더욱 더 명확히 하여 국립지리원의 수치지도작성 규칙 등에도 포함시키는 것을 제안하고자 한다. 셋째, 다양한 sampling방법에 관한 연구 및 우리나라에 적합한 품질허용기준(AQL)의 정립과 대량의 데이터품질을 신속하게 자동 평가할 수 있는 컴퓨터 프로그램 작성 등이 요망된다.

  • PDF

실시간 정보를 제공하는 M2M 빅데이터 품질특성이 사용자 만족에 미치는 영향에 대한 연구 - 버스기사의 교통정보 시스템 중심으로 - (A study on the Effect of Quality Characteristics of M2M Big Data providing real-time Information on User Satisfaction)

  • 양동식;박동진;이윤재
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.25-40
    • /
    • 2022
  • 본 논문은 실시간 정보를 제공하는 M2M 빅데이터의 품질이 사용자에게 어떤 영향을 미치는지에 관한 것이다. 최근 들어 데이터의 종류(Variety), 양(Volume), 속도(Velocity) 등이 급변함에 따라 데이터의 획득 및 관리에 많은 어려움이 있다. 이러한 문제는 데이터의 품질 저하로 이어질 뿐만 아니라 데이터를 활용하여 의사결정을 내릴 때 부정적인 영향을 줄 수 있다. 일반적으로 데이터의 품질을 '사용 적합성'으로 정의하는 데 이는 데이터 품질이 사용자 요구의 기대치를 충족해야 함을 의미한다. 이것은 데이터의 품질이 빅데이터의 활용에 중요한 요소임으로 데이터의 획득과정에서부터 데이터 품질 영역(Data Quality Dimensions)에 대한 관리가 필요하다. 본 연구에서는 교통정보 시스템에 사용되는 실시간 M2M 데이터의 품질 영역과 사용자 만족도의 관계를 분석하였다. M2M 빅데이터 관련 변수 간의 영향을 분석하기 위해 연구 모델과 가설을 설정하였다. 가설을 검증하기 위해 데이터 이용자를 대상으로 설문조사 실시하고 분석을 하여 주요 요인들 간의 인과관계를 파악했다.

머신러닝을 이용한 빅데이터 도메인 자동 판별에 관한 연구 (A Study of Big Data Domain Automatic Classification Using Machine Learning)

  • 공성원;황덕열
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.11-18
    • /
    • 2018
  • 본 연구는 빅데이터 품질 진단의 핵심 요소인 도메인 기반 품질 진단을 위한 도메인 자동 판별에 관한 연구다. 빅데이터의 가치와 활용도의 증가와 4차 산업혁명의 대두로, 법률, 의료, 금융 등 IT와 융합된 다양한 분야에서 빅데이터를 활용하여 새로운 가치를 창출하려는 노력을 진행중이다. 하지만, 신뢰도가 낮은 데이터에 기반한 분석은 과정과 결과 모두에서 치명적인 문제를 발생하며, 분석 결과에 따른 판단 또한 신뢰하기 어려워 진다. 이처럼 신뢰도가 높은 데이터의 필요성 또한 증가하였지만, 데이터의 품질 확보에 대한 연구와 그에 대한 결과는 미비하다. 본 연구는 데이터 품질 향상을 위한 진단 평가의 핵심적 요소인 도메인 기반 품질 진단에서, 수작업으로 진행되었던 도메인 판별 작업을 머신러닝을 이용하여 자동화 함으로써, 작업시간을 단축하는 것을 목표로 한다. 데이터 베이스에 저장된, 도메인이 판별되어 있는 데이터의 특성에 관한 정보들을 추출하여 변수화하고, 이를 머신러닝을 이용하여 도메인 판별을 자동화 한다. 이를 빅데이터 품질 진단에 활용하고, 품질 향상에 기여하도록 한다.

고품질 데이터를 지원하는 교통데이터 웨어하우스 구축 기법 (An Integrated Framework for Data Quality Management of Traffic Data Warehouses)

  • 황재일;박승용;나연묵
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권4호
    • /
    • pp.89-95
    • /
    • 2008
  • 본 논문에서는 교통데이터 웨어 하우스에서 데이터 품질 관리를 위한 통합기법을 제안한다. 고속도로 교통관리시스템(FTMS)과 우회도로 교통정보시스템(ARTIS) 으로부터 대용량 교통데이터를 수집하여 데이터 웨어하우스를 구축하기 위한 방안을 기술하고, 다양한 분석을 위한 고품질 교통데이터를 제공하기 위한 통합 데이터 품질관리 기법을 제안하고 구현 평가한다. 제안된 통합 데이터 품질관리 기법을 활용하면 연구자들에게 검증된 고품질 교통데이터를 제공할 수 있고, 데이터처리와 평가를 위한 별도의 비용을 절감할 수 있을 것으로 기대된다.

  • PDF

정보 구조 그래프를 이용한 통합 데이터 품질 관리 방안 연구 (An Implementation of Total Data Quality Management Using an Information Structure Graph)

  • 이춘열
    • Journal of Information Technology Applications and Management
    • /
    • 제10권4호
    • /
    • pp.103-118
    • /
    • 2003
  • This study presents a database quality evaluation framework. As a way to build a framework, this study expands data quality management to include data transformation processes as well as data. Further, an information structure graph is applied to represent data transformations processes. An information structure graph is absed on a relational database scheme. Thus, data transformation processes may be stored in a relational database. This kind of integration of data transformation metadata with technical metadata eases evaluation of database qualities and their causes.

  • PDF

데이터 품질 향상을 위한 데이터 관리 프로세스 개선 사례 연구: 데이터 표준과 요구사항 관리 중심으로 (A Case Study on Improvement of Data Management Process for Enhancing Data Quality: Focus on Data Standards and Requirement Management)

  • 허희정;김종우
    • 경영정보학연구
    • /
    • 제10권1호
    • /
    • pp.91-113
    • /
    • 2008
  • 최근 기업의 각 업무가 정보화되면서 부문별, 업무별 정보시스템의 데이터 간에 심각한 중복성과 불일치성의 문제가 대두되면서 데이터 품질관리에 관심이 집중되고 있다. 본 연구는 실제로 데이터품질 관리 프로세스 개선을 통해 데이터 품질이 향상된 기업의 사례를 통하여 프로젝트 수행 과정에서의 주요 이슈와 위험요인을 살펴보고 그 해결방안을 제시함으로써 데이터 품질 향상을 위해 노력하는 타 기업들에게 도움을 주고자 하였다. 또한, 개선된 데이터 품질 관리 프로세스에 대한 다차원적인 평가로서 데이터 품질, 생산성, 고객만족도, 조직 및 문화의 측면에서 정성적이고 정량적인 지표를 통한 개선효과를 살펴보고 평가함으로써 제안된 프로세스에 의해 품질수준이 향상되었음을 검증하였고 평가 분석을 통한 시사점을 도출하였다.

A Study on Data Mining Application Problem in the TFT-LCD Industry

  • Lee, Hyun-Woo;Nam, Ho-Soo;Kang, Jung-Chul
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.823-833
    • /
    • 2005
  • This paper deals the TFT-LCD process and quality, process control problems of the process. For improvement of the process quality and yield, we apply a data mining technique to the LCD industry. And some unique quality features of the LCD process are also described. We describe some preceding researches first and relate to the TFT-LCD process and the problems of data mining in the process. Also we tried to observe the problems which need to solve first and the features from description below hazard must be considered a quality mining in LCD industry.

  • PDF

프로세스 기반의 전자카탈로그 데이터 품질관리 (Process-based e-Catalog Data Quality Management)

  • 김선호;이창수;이제현
    • 한국전자거래학회지
    • /
    • 제14권3호
    • /
    • pp.39-57
    • /
    • 2009
  • 전자거래가 보편화 되고 전자카탈로그 데이터의 양이 증가하면서 데이터 품질을 관리할 수 있는 체계적인 접근 방법이 필요해지고 있다. 이러한 필요성에 따라 여기서는 프로세스 기반의 전자카탈로그 데이터 품질관리 프레임워크를 제시한다. 이것은 기업이나 조직 의 전자카탈로그 시스템의 기대를 만족시키기 위해 지속적으로 수행하는 데이터 관리 및 개선 활동에 대한 방법이다. 이 프레임워크에서는 품질관리를 위한 대상이 데이터, 데이터 품질관리 항목, 데이터 품질관리 프로세스의 세 가지로 구분된다. 세 가지 관리 대상은 다시 관리조직의 레벨인 총괄데이터 책임자, 데이터 관리자, 사용자에 따라 세분화 되어 제시된다.

  • PDF