• 제목/요약/키워드: Data Quality Model

검색결과 4,555건 처리시간 0.032초

Verification of the Suitability of Fine Dust and Air Quality Management Systems Based on Artificial Intelligence Evaluation Models

  • Heungsup Sim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.165-170
    • /
    • 2024
  • 본 연구는 인공지능 평가 모델을 활용하여 양주시의 대기질 관리 시스템의 정확성을 검증하는 데 목적이 있다. 환경부 미세먼지 공공 데이터와 양주시 대기질 관리 시스템 데이터를 비교하여 미세먼지 데이터의 정합성과 신뢰성을 평가하였다, 이를 위해 데이터의 완전성, 유일성, 유효성, 일관성, 정확성, 무결성을 분석하였다. 데이터의 정합성을 비교하기 위해 탐색적 통계 분석을 활용하였다. 분석 결과, AI 기반 데이터 품질 지수 평가 결과, 두 데이터 세트 간에 통계적으로 유의미한 차이가 없음을 확인하였다. AI 기반 알고리즘 중 랜덤 포레스트 모델이 가장 높은 예측 정확도를 보였으며, ROC 커브와 AUC를 통해 예측 성능을 평가하였다. 특히, 랜덤 포레스트 모델은 대기질 관리 시스템의 최적화에 유용한 모델로 확인되었으며, 미세먼지 데이터의 신뢰성과 적합성을 AI 기반 모델 성능 평가로 활용할 수 있음을 확인하였다.

항만물류 서비스 품질 분석을 위한 DMQFD 모형의 개발 (Development of DMQFD Model for Analysis of Port Logistics Service Quality)

  • 송서일;이보근;정혜진
    • 산업경영시스템학회지
    • /
    • 제30권3호
    • /
    • pp.62-70
    • /
    • 2007
  • This study define the concepts of port logistics service by investigating various elements of port logistics service and grouping them in six attributes using a Data Mining technique. The QFD (Quality Function Deployment) technique is applied to measure the quality of port logistics service, and those results are analyzed. The DMQFD (Quality Function Deployment using Data Mining) model proposed in this study is a model for analyzing of port logistics service quality which is produced by combining those two stages. Using the DMQFD model, the requirements of customer could understand more correctly and systematically, and it could be an alternative tool to accomplish a customer satisfaction.

Developing an IFC-based database for construction quality evaluation

  • Xu, Zhao;Li, Bingjing;Li, Qiming
    • 국제학술발표논문집
    • /
    • The 7th International Conference on Construction Engineering and Project Management Summit Forum on Sustainable Construction and Management
    • /
    • pp.301-312
    • /
    • 2017
  • Quality evaluation and control represent increasingly important concerns for construction quality management. There is an evident need for a standard data model to be used as the basis for computer-aided quality management. This study focuses on how to realize evaluation of construction quality based on BIM and database technology. In this paper, the reinforced concrete main structure is taken as an example, and the BP neural network evaluation model is established by inquiring current construction quality acceptance specification and evaluation standard. Furthermore, IFC standard is extended to integrate quality evaluation information and realize the mapping of evaluation information in BIM model, contributing to the visualization and transfer sharing of evaluation information. Furthermore, the conceptual entity model is designed to build quality evaluation database, and this paper select MySQL workbench system to achieve the establishment of the database. This study is organized to realize the requirement of visualization and data integration on construction quality evaluation which makes it more effective, convenient, intuitive, easy to find quality problems and provide more comprehensive and reliable data for the quality management of construction enterprises and official construction administratiors.

  • PDF

공공데이터 품질관리를 위한 조직 성숙도 평가 모델 (An Organizational Maturity Assessment Model for Public Data Quality Management)

  • 김선호;이창수;정승호;김학철;이창수
    • 정보화정책
    • /
    • 제22권1호
    • /
    • pp.28-46
    • /
    • 2015
  • 정부 3.0의 확산으로 공공 데이터의 활용요구가 증대되고 있으나, 정부가 보유하고 있는 공공데이터의 품질 및 관리체계는 아직 성숙화되어 있지 않아 데이터 개방 및 활용의 저해 요소로 부각되고 있다. 데이터 관리 및 연계 활용의 효과와 효율성을 향상시키기 위해서는 데이터 품질관리에 관한 표준 마련과 이를 평가할 수 있는 평가기준의 마련이 필요하며, 지속적인 품질관리가 이루어질 수 있도록 수준을 측정할 수 있는 체계의 마련이 필요하다. 본 연구는 공공데이터 품질관리 수준을 평가하고, 품질관리 수준을 지속적으로 판단할 수 있는 데이터 품질관리 성숙도 모델을 제시한다. 성숙도 모델은 프로세스 참조 모델과 측정 프레임워크로 구성하였다. 프로세스 참조 모델은 PDCA 기반의 15개 프로세스를 정립하였으며 이를 토대로 프로세스의 능력 수준과 데이터 품질관리 조직의 성숙도 수준을 평가하는 프레임워크를 마련하였다. 본 연구에서 제시한 성숙도 모델은 향후 공공기관이 보유하고 있는 데이터의 품질관리 현 수준을 진단하고 문제점을 개선하는 등 보유 공공데이터의 지속적인 품질향상을 위한 단계별 목표와 방향성을 수립하는 데 활용할 수 있으며, 궁극적으로는 공공데이터의 품질 신뢰도 향상을 통한 안정적인 공공데이터의 민간 개방을 촉진하고 이용을 활성화하는 데 적극 기여할 것으로 판단된다.

Applying Formal Methods to Modeling and Analysis of Real-time Data Streams

  • Kapitanova, Krasimira;Wei, Yuan;Kang, Woo-Chul;Son, Sang-H.
    • Journal of Computing Science and Engineering
    • /
    • 제5권1호
    • /
    • pp.85-110
    • /
    • 2011
  • Achieving situation awareness is especially challenging for real-time data stream applications because they i) operate on continuous unbounded streams of data, and ii) have inherent realtime requirements. In this paper we showed how formal data stream modeling and analysis can be used to better understand stream behavior, evaluate query costs, and improve application performance. We used MEDAL, a formal specification language based on Petri nets, to model the data stream queries and the quality-of-service management mechanisms of RT-STREAM, a prototype system for data stream management. MEDAL's ability to combine query logic and data admission control in one model allows us to design a single comprehensive model of the system. This model can be used to perform a large set of analyses to help improve the application's performance and quality of service.

The Game Selection Model for the Payoff Strategy Optimization of Mobile CrowdSensing Task

  • Zhao, Guosheng;Liu, Dongmei;Wang, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권4호
    • /
    • pp.1426-1447
    • /
    • 2021
  • The payoff game between task publishers and users in the mobile crowdsensing environment is a hot topic of research. A optimal payoff selection model based on stochastic evolutionary game is proposed. Firstly, the process of payoff optimization selection is modeled as a task publisher-user stochastic evolutionary game model. Secondly, the low-quality data is identified by the data quality evaluation algorithm, which improves the fitness of perceptual task matching target users, so that task publishers and users can obtain the optimal payoff at the current moment. Finally, by solving the stability strategy and analyzing the stability of the model, the optimal payoff strategy is obtained under different intensity of random interference and different initial state. The simulation results show that, in the aspect of data quality evaluation, compared with BP detection method and SVM detection method, the accuracy of anomaly data detection of the proposed model is improved by 8.1% and 0.5% respectively, and the accuracy of data classification is improved by 59.2% and 32.2% respectively. In the aspect of the optimal payoff strategy selection, it is verified that the proposed model can reasonably select the payoff strategy.

작물 모형 개선을 위한 지역적응시험 자료의 정량적 품질 평가 (Quantitative Assessment of the Quality of Regional Adaptation Trial Data for Crop Model Improvement)

  • 현신우;서보훈;이석인;김광수
    • 한국농림기상학회지
    • /
    • 제22권3호
    • /
    • pp.194-204
    • /
    • 2020
  • 작물 모형의 품종에 따른 특성을 나타내는 품종 모수를 추정하기 위해서는 많은 양의 생육 관측 자료가 요구되며, 이를 확보하기 위해서는 많은 비용과 노력이 요구된다. 고품질 자료는 아니더라도 공개되어 있는 작물 생육 자료를 활용하여 모수 추정에 사용할 수 있으나, 이러한 자료의 품질에 대한 평가가 선행되어야 한다. 본 연구에서는 농업자료에 대한 정량적 평가 도구인 DatasetRanker를 사용하여 벼에 대한 지역적응시험 자료를 평가하였다. 또한, 결과를 바탕으로 자료의 품질을 개선하기 위한 관측체계의 개선방안을 제시하고자 하였다. 평가 결과 각각의 품종들은 모두 네 등급 중 세 번째로 높은 은 등급으로 평가되었으며, 더 상위의 등급을 얻지 못한 것은 대체로 생육 및 생육환경에 대한 관측자료의 부족에 기인하였다. 결과를 개선하기 위해서는 추가적인 관측자료가 요구되며, 일부 재배관리 등의 기본적인 조건들에 대한 정보를 추가하는 것만으로도 품질에 대한 평가 점수가 약 10%정도 상승할 것으로 예상되었다. 또한, 정확한 위치정보가 공개될 경우 이를 기준으로 수집되는 토양 정보와 기상 정보의 불확실성을 감소시킬 수 있을 것이다. 생육기간 중 시계열적인 관측자료가 수집된다면 품질이 상당히 개선될 것으로 예상되었으며, 이를 위한 연구가 지속적으로 이루어져야 할 것이다.

결혼생활의 질과 안정성 : 이론적 모델의 검증 (Marital Quality and Stability : A Theoretical Model)

  • 김영희
    • 대한가정학회지
    • /
    • 제37권6호
    • /
    • pp.77-96
    • /
    • 1999
  • The purpose of this study was to examine the effect of family-of-origin, personal and spousal characteristics, mediated by communication and problem-solving behavior, on marital quality and stability. On the basis of previous literature, the theoretical model was specified, estimated, and evaluated for adequacy of statistical fit for samples of 214 married women. Although the initial model was not supported by data, the revised model fitted the data adequately. Results of structural equation modeling indicated family-of-origin and communication behavior directly affected marital quality. However, the personal and spousal characteristics were linked with marital quality and stability only if they were mediated by communication and problemsolving behavior. Communication behavior was strongly related to marital quality and stability both directly and indirectly through problem-solving behavior. The model also showed marital quality can be an antecedent variable for marital stability. The findings of results is to generate more broad-minded thinking about how communication behavior, marital quality, and marital stability are interrelated.

  • PDF

빅데이터 분산처리시스템의 품질평가모델 (A Quality Evaluation Model for Distributed Processing Systems of Big Data)

  • 최승준;박제원;김종배;최재현
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.533-545
    • /
    • 2014
  • IT기술이 발전함에 따라, 우리가 접하는 데이터의 양은 기하급수적으로 늘어나고 있다. 이처럼 방대한 데이터들을 분석하고 관리하기 위한 기술로 등장한 것이 빅데이터 분산처리시스템이다. 기존 분산처리시스템에 대한 품질평가는 정형 데이터 중심의 환경을 바탕으로 이루어져 왔다. 그러므로, 이를 비정형 데이터 분석이 핵심인 빅데이터 분산처리시스템에 그대로 적용시킬 경우, 정확한 품질평가가 이루어질 수 없다. 따라서, 빅데이터 분석 환경을 고려한 분산처리시스템의 품질평가모델에 대한 연구가 필요하다. 본 논문에서는 소프트웨어 품질에 관한 국제 표준인 ISO/IEC9126에 근거하여 빅데이터 분산처리 시스템에서 요구되는 품질평가 요소를 도출하고, 이를 측정하기 위한 메트릭을 정의함으로써 새로이 품질평가모델을 제안한다.

A Study on the Domain Discrimination Model of CSV Format Public Open Data

  • Ha-Na Jeong;Jae-Woong Kim;Young-Suk Chung
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.129-136
    • /
    • 2023
  • 정부는 공공데이터 품질관리 수준평가를 진행하여 공공 개방데이터의 품질관리를 진행하고 있다. 공공 개방데이터는 XML, JSON, CSV 등 여러 오픈포맷 형태로 제공되며 CSV 형식이 대다수를 차지한다. 이러한 CSV 형식의 공공 개방데이터 품질진단 시 품질진단 담당자가 공공 개방데이터 파일의 필드명과 필드 내 데이터에 의존하여 필드 별 도메인을 판단하여 진단한다. 그러나 대량의 개방 데이터 파일을 대상으로 품질진단을 수행하기 때문에 많은 시간이 소요된다. 또한 의미 파악이 어려운 필드의 경우 품질진단의 정확성이 품질진단 담당자의 데이터 이해도 역량의 영향을 받는다. 본 논문은 필드명과 데이터 분포 통계를 이용한 CSV 형식 공공 개방데이터의 도메인 판별 모델을 제안하여 품질진단 결과가 품질진단 담당자의 역량에 좌지우지 되지 않도록 일관성과 정확성을 보장하고 진단 소요 시간 단축을 지원한다. 본 논문의 모델 적용 결과 행정안전부에서 제공하는 파일형식 개방데이터 진단도구보다 2.8% 높은 약 77%의 정답률을 보였다. 이를 통해 공공데이터 품질관리 수준진단·평가에 제안 모델 적용 시 정확성을 향상시킬 수 있을 것으로 기대한다.