• 제목/요약/키워드: Data validation

검색결과 3,191건 처리시간 0.034초

가중 F 척도를 이용한 Trace-Driven 시뮬레이션 모델의 검증 방법 (Validation Technique of Trace-Driven Simulation Model Using Weighted F-measure)

  • 황보훈;천현재;이홍철
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.185-195
    • /
    • 2009
  • 최근 시스템들이 복잡해지면서 시뮬레이션을 통한 시스템의 분석이 주목을 받고 있다. 시뮬레이션 분석에서 가장 핵심적인 부분 중의 하나가 시뮬레이션 모델의 검증이며, 이 과정을 통하여 시뮬레이션 모델이 얼마나 실제 시스템을 대변할 수 있는지를 판단한다. 모델의 검증에서 시뮬레이션 모델과 실제시스템의 데이터를 비교할 때 발생하는 차이는 입력 데이터의 차이에 의한 영향도 있으며, 이를 통한 모델의 검증 결과는 높은 신뢰성을 보장하지 못한다. 따라서 이 논문에서는 실제와 동일한 입력 데이터를 바탕으로 하는 Trace-Driven 시뮬레이션을 기반으로 모델을 설계하였다. 한편, 출력데이터들을 하나의 통계량을 통한 검증이 아닌 클래스 별 검증을 하기 위해 데이터마이닝 분야에서 분류기의 성능을 판단하는 F 척도를 응용하여 시뮬레이션 모델의 검증을 수행하였다. 그 결과, 제안된 검증 방법은 정밀한 모델의 검증을 가능하게 하고, 검증 시에 피드백을 제공함으로써 용이한 수정 작업을 가능하게 한다.

웨이블릿 변환을 이용한 시뮬레이션 모델 검증 방법 (Validation Method of Simulation Model Using Wavelet Transform)

  • 신상미;김연진;이홍철
    • 한국시뮬레이션학회논문지
    • /
    • 제19권2호
    • /
    • pp.127-135
    • /
    • 2010
  • 시뮬레이션에서 모델의 검증 문제는 그 모델의 신뢰성을 의미하며, 그에 따라 모형의 정당성을 입증하는 가장 중요한 열쇠 중 하나이다. 하지만 지금까지 연구된 다양한 방법들 중 시계열형태의 자료를 이용한 검증 방법론은 개념적인 측면에서는 정립되었으나 구체적인 기법에 대한 연구는 부족한 상태이다. 그리하여 본 연구에서는 Wavelet 변환과 Power Spectrum을 이용한 시계열 데이터의 시뮬레이션 검증 방법을 제시하고자 한다. 이를 위해 첫 번째로 비주기적인 신호분리가 가능한 Wavelet 변환을 이용하여 스펙트럼을 추출하고, 두 번째로 스펙트럼 분석을 이용하여 실제 시스템에서 출력 데이터의 패턴이 시뮬레이션을 통해 나온 패턴과 일치하는지의 여부를 Coherence를 이용해 검정하였다. 실제 사례를 통하여 다른 검증방법들과 비교한 결과, 시뮬레이션 모델링의 완성도에 따른 모델의 일치도 여부를 보다 명확하게 검증하였다. 본 연구에서 제시한 방법을 통해, 하나의 통계량을 통한 검증이 아닌 한 구간별 검증을 통해 지금까지의 획일적인 타당성 검증 방법에서는 할 수 없었던 다양한 상황에서의 시뮬레이션 모형의 타당성 검증이 가능하게 하였다.

한국의 기온자료 품질관리 알고리즘의 검증 (Validation of Quality Control Algorithms for Temperature Data of the Republic of Korea)

  • 박창용;최영은
    • 대기
    • /
    • 제22권3호
    • /
    • pp.299-307
    • /
    • 2012
  • This study is aimed to validate errors for detected suspicious temperature data using various quality control procedures for 61 weather stations in the Republic of Korea. The quality control algorithms for temperature data consist of four main procedures (high-low extreme check, internal consistency check, temporal outlier check, and spatial outlier check). Errors of detected suspicious temperature data are judged by examining temperature data of nearby stations, surface weather charts, hourly temperature data, daily precipitation, and daily maximum wind direction. The number of detected errors in internal consistency check and spatial outlier check showed 4 days (3 stations) and 7 days (5 stations), respectively. Effective and objective methods for validation errors through this study will help to reduce manpower and time for conduct of quality management for temperature data.

Advances in the Development and Validation of Test Methods in the United States

  • Casey, Warren M.
    • Toxicological Research
    • /
    • 제32권1호
    • /
    • pp.9-14
    • /
    • 2016
  • The National Toxicology Program Interagency Center for the Evaluation of Alternative Toxicological Methods (NICEATM) provides validation support for US Federal agencies and the US Tox21 interagency consortium, an interagency collaboration that is using high throughput screening (HTS) and other advanced approaches to better understand and predict chemical hazards to humans and the environment. The use of HTS data from assays relevant to the estrogen receptor signaling data pathway is used as an example of how HTS data can be combined with computational modeling to meet the needs of US agencies. As brief summary of US efforts in the areas of biologics testing, acute toxicity, and skin sensitization will also be provided.

HVAC 파라미터 모니터링 시스템에 대한 고찰 (Computer Validation 중심으로) (A Study on HVAC Parameter Monitoring System (Regarding Computer Validation))

  • 김종구
    • 대한설비공학회:학술대회논문집
    • /
    • 대한설비공학회 2008년도 하계학술발표대회 논문집
    • /
    • pp.90-95
    • /
    • 2008
  • This article presents practical advice regarding the implementation and management of an impeccable Building Management System. The BMS was introduced to the series of computerized systems including manufacturing, storage, distribution, and quality control. Recently revised GMP regulation is requesting an improvement in drug product quality regulatory system by computer system validation. Quality is critical to guarantee the efficacy and the safety of drugs and is approved in the evaluation process after the audit trail application. HVAC parameter monitoring system will record the identity of operators entering or confirming critical data. Authority to amend entered data should be restricted to nominated persons. Any alteration to an entry of critical data should be authorized in advance and recorded with the reason for the change.

  • PDF

Predicting the popularity of TV-show through text mining of tweets: A Drama Case in South Korea

  • 김도연;김유신;최상현
    • 인터넷정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.131-139
    • /
    • 2016
  • This paper presents a workflow validation method for data-intensive graphical workflow models using real-time workflow tracing mode on data-intensive workflow designer. In order to model and validate workflows, we try to divide as modes have editable mode and tracing mode on data-intensive workflow designer. We could design data-intensive workflow using drag and drop in editable-mode, otherwise we could not design but view and trace workflow model in tracing mode. We would like to focus on tracing-mode for workflow validation, and describe how to use workflow tracing on data-intensive workflow model designer. Especially, it is support data centered operation about control logics and exchange variables on workflow runtime for workflow tracing.

원전 터빈사이클 성능 데이터의 검증 모델에 의한 성능분석 기법의 개발 (Development of Performance Analysis Methodology for Nuclear Power Plant Turbine Cycle Using Validation Model of Performance Measurements)

  • 김성근;최광희
    • 대한기계학회논문집B
    • /
    • 제24권12호
    • /
    • pp.1625-1634
    • /
    • 2000
  • Verification of measurements is required for precise evaluation of turbine cycle performance in nuclear power plant. We assumed that initial acceptance data and design data of the plant could provide correlation information between performance data. The data can be used as sample sets for the correct estimation model of measurement value. The modeling was done practically by using regression model based on plant design data, plant acceptance data and verified plant performance data of domestic nuclear power plant. We can construct more robust performance analysis system for an operation nuclear power plant with this validation scheme.

뉴로-퍼지 소프트웨어 신뢰성 예측에 대한 최적의 데이터 분할비율에 관한 연구 (A Study of Optimal Ratio of Data Partition for Neuro-Fuzzy-Based Software Reliability Prediction)

  • 이상운
    • 정보처리학회논문지D
    • /
    • 제8D권2호
    • /
    • pp.175-180
    • /
    • 2001
  • 본 논문은 미래의 소프크웨어 공장 수나 고장시간 예측 정확성을 얻기 위해, 뉴로-피지 시스템을 이용할 경우 최적의 검증 데이터 할당 비율에 대한 연구이다. 훈련 데이터가 주어졌을 때, 과소 적합과 과잉 적합을 회피하면서 최적의 일반화 능력을 얻기 취해 Early Stopping 방법이 일반적으로 사용되고 있다. 그러나 훈련과 검증 데이터로 얼마나 많은 데이터를 할당갈 것인가는 시행착오법을 이용해 경험적으로 해를 구해야만 하며, 과다한 시간이 소요된다. 최적의 검증 데이터 양을 구하기 위해 규칙 수를 증가시키면서 다양한 검증 데이터 양을 할당하였다. 실험결과 최소의 검증 데이터로도 좋은 예측 능력을 보였다. 이 결과는 뉴로-퍼지 시스템을 소프트웨어 신뢰성 분야에 적용시 실질직언 지침을 제공할 수 있는 것이다.

  • PDF

LS-SVM for large data sets

  • Park, Hongrak;Hwang, Hyungtae;Kim, Byungju
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.549-557
    • /
    • 2016
  • In this paper we propose multiclassification method for large data sets by ensembling least squares support vector machines (LS-SVM) with principal components instead of raw input vector. We use the revised one-vs-all method for multiclassification, which is one of voting scheme based on combining several binary classifications. The revised one-vs-all method is performed by using the hat matrix of LS-SVM ensemble, which is obtained by ensembling LS-SVMs trained using each random sample from the whole large training data. The leave-one-out cross validation (CV) function is used for the optimal values of hyper-parameters which affect the performance of multiclass LS-SVM ensemble. We present the generalized cross validation function to reduce computational burden of leave-one-out CV functions. Experimental results from real data sets are then obtained to illustrate the performance of the proposed multiclass LS-SVM ensemble.

STATUS AND PERSPECTIVE OF NUCLEAR DATA PRODUCTION, EVALUATION AND VALIDATION

  • TRKOV A.
    • Nuclear Engineering and Technology
    • /
    • 제37권1호
    • /
    • pp.11-24
    • /
    • 2005
  • A very important feature in the development of nuclear technology has been and will continue to be the flow of information from nuclear data production to the various applications fields in nuclear technology. Both, nuclear data and this communications flow are defined in this paper. Nuclear data result from specific technical activities including their production, evaluation, processing, verification, validation and applications. These activities are described, focusing on nuclear reactor calculations. Mathematical definitions of different types of nuclear data are introduced, and international forums involved in nuclear data activities are listed. Electronic links to various sources of information available on the web are specified, whenever possible.