• Title/Summary/Keyword: 데이터품질문제분석

Search Result 205, Processing Time 0.03 seconds

Evaluation on Quality of Publisher-Generated Usage Statistics (출판사 생성 이용통계 데이터의 품질 평가에 대한 연구)

  • Jung, Young-Im
    • Journal of Information Management
    • /
    • v.43 no.3
    • /
    • pp.161-180
    • /
    • 2012
  • In this study, concept and importance of e-journal usage statistics has been examined and Journal Usage Factor project performed by Project COUNTER group has been investigated. Advantages and limits of usage statistics generated by library, link resolver and publisher have been clarified. By analyzing various errors and problems included in publisher-generated usage statistics, we conclude that the current usage statistics is not completely credible yet.

A Quantitative Approach to Information System Audit (정보시스템 감리의 계량적 접근방법)

  • 신동익
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.11a
    • /
    • pp.622-635
    • /
    • 2001
  • 최근의 정보 시스템 감리수요는 공공부문을 중심으로 매우 빠르게 증가하여 점차적으로 민간부문으로 확대되고 있는 추세이다. 이는 정보 시스템 감리를 통해 정보 시스템의 품질 향상을 기대할 수 있기 때문이며, 향후에도 조직의 정보시스템에 대한 의존도가 증가할 것 이므로, 정보시스템의 효과성, 효율성 및 보안성은 더욱 중요한 문제로 대두 될 것이며, 따라서 시스템 감리의 중요성은 높아질 수 밖에 없을 것이다. 그러나 아직 정보시스템감리는 이러한 기대에 부응하기 위한 체계적 기술분야로 정립되지 못하고 있으며, 그 원인으로서는 분석 결과의 객관적 증거 확보를 통한 감리 결과의 신뢰성 제고가 미흡한 것이 제기되고 있다. 이는 정보시스템 감리가 다분히 주관적인 요소에 의해 수행되며 이로 인하여 감리인과 피감리인 간의 의견 상충이 다수 발생되며, 이러한 갈등은 감리의 효과성을 크게 저하시키고 있다. 본 연구 이러한 문제를 극복하기 위해 다양한 문헌 고찰을 통해 실질적인 계량적 감리 접근방법을 제시하고자 한다. 본 연구에서 제시된 방법론 실무에서 유용하게 쓰일 수 있으며, 이러한 노력은 우리나라의 감리 품질 제고에 큰 도움이 될 것이라 생각한다. 또한 이러한 계량적 데이터 추후 감리 연구의 기초 자료로 활용될 수 있어 감리 연구에도 많은 도움이 될 것이다.

  • PDF

A Scheme for Preventing Data Augmentation Leaks in GAN-based Models Using Auxiliary Classifier (보조 분류기를 이용한 GAN 모델에서의 데이터 증강 누출 방지 기법)

  • Shim, Jong-Hwa;Lee, Ji-Eun;Hwang, Een-Jun
    • Journal of IKEEE
    • /
    • v.26 no.2
    • /
    • pp.176-185
    • /
    • 2022
  • Data augmentation is general approach to solve overfitting of machine learning models by applying various data transformations and distortions to dataset. However, when data augmentation is applied in GAN-based model, which is deep learning image generation model, data transformation and distortion are reflected in the generated image, then the generated image quality decrease. To prevent this problem called augmentation leak, we propose a scheme that can prevent augmentation leak regardless of the type and number of augmentations. Specifically, we analyze the conditions of augmentation leak occurrence by type and implement auxiliary augmentation task classifier that can prevent augmentation leak. Through experiments, we show that the proposed technique prevents augmentation leak in the GAN model, and as a result improves the quality of the generated image. We also demonstrate the superiority of the proposed scheme through ablation study and comparison with other representative augmentation leak prevention technique.

A Study on the Development of Measuring Equipment in Electric Power Quality (전력품질 측정장치의 개발에 관한 연구)

  • 김응상
    • Journal of Energy Engineering
    • /
    • v.9 no.3
    • /
    • pp.163-169
    • /
    • 2000
  • 전력품질에 대한 관심과 요구가 증가되고 있는 최근의 상황하에서 기존의 전력품질 관리방 법의 개선과 새롭게 대두되는 전력품질 사항에 대한 정확한 정의와 대책이 필요하게 되었 다. 국내에서는 아직 대비가 미비한 실정이며 외국의 경우에는 장비의 도입비용이 고가이며 고정형이 대부분인 문제가 있다. 본 논문에서는 새롭게 대두되는 미소 외란에 의한 전력품 질 사항에 대해 명확하게 판단하고 검출할 수 있는 알고리즘을 제시하였다. 개발된 측정장 치는 이동형으로 만들어졌으며 제작소요비용이 몇십 만원대로 그 기능이나 성능에 비해 저 렴하다. 그리고 500$\mu\textrm{s}$의 샘플링 시간에 의해 만들어진 입력 데이터로 실험을 하고 결과를 분석하여 장치의 효용성을 입증하였다.

  • PDF

Effective code static analysis and visualization based on Normalization of internal code information (코드 내부 정보의 정규화 기반 효율적인 코드 정적 분석 및 가시화)

  • Park, Chansol;Jeon, Byungkook;Kim, R. Young Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.85-87
    • /
    • 2022
  • 고품질 코드를 위한 정적 분석은 아직도 매우 필요한 영역이며, 또한 코드의 가시화는 개발자들에게 코드의 복잡한 모듈에 대한 가이드에 필요하다. 기존의 코드 가시화는 정적 분석의 코드 내부 정보들을 DB 테이블화 및 품질 지표(CK Metrics, Coupling, # function Calls, Bed smell) 질의어화, 그리고 추출된 정보를 가시화하는 것에만 초점을 두었다. 문제는 코드 내부 정보(Class, method, parameters, etc) 테이블들에 대한 join 연산 시 엄청난 시간과 리소스가 소모된다. 이 문제를 해결하기 위해, 우리는 테이블 설계의 정규화를 제안한다. 또한 필요한 품질 지표의 질의를 통해 코드 내부 정보 추출하여 데이터 및 제어 복잡 모듈을 식별하여 refactoring 를 가이드 한다. 앞으로는 이 부분의 AI learning 을 통해 bad/good program 을 식별을 기대한다.

Big Data Governance Model for Smart Water Management (스마트 물관리를 위한 빅데이터 거버넌스 모델)

  • Choi, Young-Hwan;Cho, Wan-Sup;Lee, Kyung-Hee
    • The Journal of Bigdata
    • /
    • v.3 no.2
    • /
    • pp.1-10
    • /
    • 2018
  • In the field of smart water management, there is an increasing demand for strengthening competitiveness through big data analysis. As a result, systematic management (Governance) of big data is becoming an important issue. Big data governance is a systematic approach to evaluating, directing and monitoring data management, such as data quality assurance, privacy protection, data lifetime management, data ownership and clarification of management rights. Failure to establish big data governance can lead to serious problems by using low quality data for critical decisions. In addition, personal privacy data can make Big Brother worry come true, and IT costs can skyrocket due to the neglect of data age management. Even if these technical problems are fixed, the big data effects will not be sustained unless there are organizations and personnel who are dedicated and responsible for data-related issues. In this paper, we propose a method of building data governance for smart water data management based on big data.

Collecting and Analyzing Personal Software Process Data in Web Application Development (웹 애플리케이션 개발에서의 개인 프로세스 데이터 수집 및 분석을 위한 도구)

  • Shin, Hyun-Il;Choi, Ho-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.539-542
    • /
    • 2006
  • Personal Software Process (PSP)에서 개인 개발자들이 수행해야 되는 측정 및 분석 활동이 제시된다. 측정 및 분석 활동의 일관되고 지속적인 수행으로 개발자들은 소프트웨어 품질 향상, 보다 정확한 예측, 개인 역량의 객관적인 평가, 개인 프로세스의 정량적 관리 등의 이득을 얻을 수 있다. 측정 및 분석 활동에서 신뢰성 있는 데이터의 수집이 무엇보다 중요하다. 하지만, 데이터 수집의 높은 오버헤드(overhead)와 컨텍스트 스위칭(context switching)의 문제로 인하여 신뢰성 있는 데이터의 수집에 많은 어려움이 존재한다. 이러한 어려움을 감소시키기 위해 자동 데이터 수집 및 분석 기법이 연구되어 왔다. 본 논문에서는 기존의 자동 데이터 수집 및 분석 기법을 확장하여 웹 애플리케이션 개발에서의 개인 프로세스 데이터를 자동 수집 및 분석 하는 도구를 설명한다.

  • PDF

LCCA-embedded Monte Carlo Approach for Modeling Pay Adjustment at the State DOTs (도로공사에서 생애주기비용을 사용한 지급조정모델 개발에 관한 연구)

  • Choi Jae-ho
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • autumn
    • /
    • pp.72-77
    • /
    • 2002
  • The development of a Pay Adjustment (PA) procedure for implementing Performance-related Specifications (PRS) is known to be a difficult task faced by most State Highway Agencies (SHAs) due to the difficulty in such areas as selecting pay factor items, modeling the relationship between stochastic variability of pay factor items and pavement performance, and determining an overall lot pay adjustment. This led to the need for an effective way of developing a scientific pay adjustment procedure by incorporating Life Cycle Cost Analysis (LCCA) embedded Monte Carlo approach. In this work, we propose a prototype system to determine a PA specifically using the data in the pavement management information systems at Wisconsin Department of Transportation (WisDOT) as an exemplary to other SHAs. It is believed that the PRS methodology demonstrated in this study can be used in real projects by incorporating the more accurate and reliable performance prediction models and LCC model.

  • PDF

End-To-End QoS Performance Analysis of the ATM Network (ATM 망에서 End-To-End QoS 성능 분석)

  • 이강원
    • Korean Management Science Review
    • /
    • v.16 no.1
    • /
    • pp.25-38
    • /
    • 1999
  • 기존의 데이터망과는 달리 B-ISDN은 데이터, variable-rate 비디오 등과 같은 bursty하고 variable bit rate를 갖는 트래픽원으로부터 smooth하고 constant bit rate를 갖는 트래픽원까지 광범위한 계층의 트래픽을 모두 수용해야만 한다. 게다가 이 망은 다양한 계층의 트래픽에게 일정 수준 이상의 품질, 즉 QoS(Quality of Service)를 보장해 주어야만 한다. 셀 손실이나 지연시간 그리고 지연시간 jittere등을 포함하는 QoS 성능척도들은 응용서비스 별로 서로 다를 것이고 특히 실시간(real-time) 응용 서비스를 지원하는 망에서의 QoS문제는 특별히 중요성을 더하게 된다. 따라서 통계적 다중화에 의해 얻어지는 망자원의 효율성을 확보하면서 end-to-end QoS 보장을 해주는 문제는 B-ISDN에서 매우 중요하나 아직 대부분 미해결 문제로 남아 있는 분야이다. 본 연구에서는 end-to-end 분석에 가장 큰 에로점으로 부각되는 multi-hop망 환경하에서 트래픽 분석에 초점을 맞추어 기존 연구결과등을 폭넓게 비교 분석하고 최근 연구 동향 및 추후 연구 사항을 제시하고자 한다.

  • PDF

Survey for Objective Performance Evaluation of Skyline Query Methods (스카이라인 질의 기법의 객관적 성능 평가를 위한 연구 조사)

  • Choi, Jong-Hyeok;Nasridinov, Aziz
    • Proceedings of The KACE
    • /
    • 2018.01a
    • /
    • pp.49-52
    • /
    • 2018
  • 스카이라인 질의는 데이터들 사이의 비교 연산을 통해 지배되지 않은 데이터들의 최소 집합을 스카이라인으로 탐색하며 이때 지배되지 않고 스카이라인으로 선택된 데이터들은 지배된 데이터들을 대표하게 된다. 이러한 특징은 금융, 네트워크, 웹서비스 등 다양한 분야에서 스카이라인의 활용을 이끌어냈다. 하지만 스카이라인 질의는 데이터의 양이나 차원의 수가 증가하는 경우 전체적인 성능이 크게 감소하는 문제를 야기하기 때문에 이를 해결하기 위한 다양한 기법들이 연구 및 제안되고 있다. 하지만 실제 스카이라인 질의를 활용하기 위해서는 객관적 성능 평가를 통해 주어진 상황에서 최적의 성능을 보일 수 있는 기법을 선택해야할 필요가 있지만 기존의 연구들은 성능 평가에 있어 각 기법이 목표한 문제들에 대한 단편적인 실험을 진행하고 있기 때문에 이들을 객관적으로 평가하기 위해서는 새로운 스카이라인 성능 평가 방법이 필요한 실정이다. 본 논문에서는 이러한 문제를 해결하기에 앞서 스카이라인 질의 기법의 객관적 성능 평가를 위한 품질 요소 선택 기준을 선택하기 위해 기존 연구들에 대한 조사와 분석을 진행한다.

  • PDF