• 제목/요약/키워드: data validation

검색결과 3,346건 처리시간 0.032초

현장진단 전문가 시스템의 개발 : 휴리스틱과 인플루언스 다이아그램 (Development of On-Line Diagnostic Expert System : Heuristics and Influence Diagrams)

  • 김영진
    • 대한산업공학회지
    • /
    • 제23권1호
    • /
    • pp.95-113
    • /
    • 1997
  • This paper outlines a framework for a diagnosis of a complex system with uncertain information. Sensor validation ploys a vital role in the ability of the overall system to correctly determine the state of a system monitored by imperfect sensors. Here, emphases are put on the heuristic technology and post-processor for reasoning. Heuristic Sensor Validation (HSV) exploits deeper knowledge about parameter interaction within the plant to cull sensor faults from the data stream. Finally the modified probability distributions and validated data are used as input to the reasoning scheme which is the runtime version of the influence diagram. The output of the influence diagram is a diagnostic mapping from the symptoms or sensor readings to a determination of likely failure modes. Once likely failure modes are identified, a detailed diagnostic knowledge base suggests corrective actions to improve performance. This framework for a diagnostic expert system with sensor validation and reasoning under uncertainty applies in $HEATXPRT^{TM}$ a data-driven on-line expert system for diagnosing heat rate degradation problems in fossil power plants [1].

  • PDF

A convenient approach for penalty parameter selection in robust lasso regression

  • Kim, Jongyoung;Lee, Seokho
    • Communications for Statistical Applications and Methods
    • /
    • 제24권6호
    • /
    • pp.651-662
    • /
    • 2017
  • We propose an alternative procedure to select penalty parameter in $L_1$ penalized robust regression. This procedure is based on marginalization of prior distribution over the penalty parameter. Thus, resulting objective function does not include the penalty parameter due to marginalizing it out. In addition, its estimating algorithm automatically chooses a penalty parameter using the previous estimate of regression coefficients. The proposed approach bypasses cross validation as well as saves computing time. Variable-wise penalization also performs best in prediction and variable selection perspectives. Numerical studies using simulation data demonstrate the performance of our proposals. The proposed methods are applied to Boston housing data. Through simulation study and real data application we demonstrate that our proposals are competitive to or much better than cross-validation in prediction, variable selection, and computing time perspectives.

Grid Discretization Study for the Efficient Aerodynamic Analysis of the Very Light Aircraft (VLA) Configuration

  • Sitio, Moses;Kim, Sangho;Lee, Jaewoo
    • International Journal of Aeronautical and Space Sciences
    • /
    • 제14권2호
    • /
    • pp.122-132
    • /
    • 2013
  • In this research the development of unstructured grid discretization solution techniques is presented. The purpose is to describe such a conservative discretization scheme applied for experimental validation work. The objective of this paper is to better establish the effects of mesh generation techniques on velocity fields and particle deposition patterns to determine the optimal aerodynamic characteristics. In order to achieve the objective, the mesh surface discretization approaches used the VLA prototype manufacturing tolerance zone of the outer surface. There were 3 schemes for this discretization study implementation. They are solver validation, grid convergence study and surface tolerance study. A solver validation work was implemented for the simple 2D and 3D model to get the optimum solver for the VLA model. A grid convergence study was also conducted with a different growth factor and cell spacing, the amount of mesh can be controlled. With several amount of mesh we can get the converged amount of mesh compared to experimental data. The density around surface model can be calculated by controlling the number of element in every important and sensitive surface area of the model. The solver validation work result provided the optimum solver to employ in the VLA model analysis calculation. The convergence study approach result indicated that the aerodynamic trend characteristic was captured smooth enough compared with the experimental data. During the surface tolerance scheme, it could catch the aerodynamics data of the experiment data. The discretization studies made the validation work more efficient way to achieve the purpose of this paper.

유효성을 고려한 XML 데이타 암호화 시스템의 설계 및 구현 (Design and Implementation of on XML Data Encryption System considering Validation)

  • 남궁영환;박대하;허승호;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권6호
    • /
    • pp.417-428
    • /
    • 2002
  • XML은 정보공유 및 검색에 있어서 매우 효과적인 장점을 지닌 마크업 언어이지만 보안에 취약한 단점을 가지고 있다. 한편, 이를 보완하는 XML 전자 서명, XML 데이타 암호화, XML 접근 제어 등의 연구는 XML 문서의 유효성을 배제하고 있다. 그러나 XML 기반 정보 교환 및 공유 환경에서 XML 문서의 유효성은 필수적으로 요구된다. 본 논문에서는 XML 문서의 보안성과 유효성을 동시에 지원하는 XML 보안 시스템을 설계하고 구현하였다. 제안된 시스템은 XML 데이타의 암호화 과정에서 유효성 유지를 위해 XML 스키마 정보를 갱신하여 이의 참조를 통해 XML 문서의 유효성 지원한다. 또한 XML 스키마 전자 서명과 같은 XML 스키마 관련 보안 기능을 지원하며 이 과정에서 빠른 정규화 XML 스키마 해석을 위해 DOMHash 기법을 사용하였다. 제안된 시스템을 통해 유효성을 유지하는 XML 문서는 유연성 및 확장성과 신뢰성에 있어 기존 시스템보다 좋은 기능을 갖는다.

스크린라인 관측교통량을 이용한 전수화 O/D 자료의 검증과 수정 (Validation and Correction of Expanded O/D with Link Observed Traffic Volumes at Screenlines)

  • 김익기;윤지영;추상호
    • 대한교통학회지
    • /
    • 제25권4호
    • /
    • pp.21-32
    • /
    • 2007
  • 가구통행실태조사를 통한 O/D 조사는 조사대상인 모집단의 규모가 대규모이므로 현실적으로 전수 조사는 가능하지 않아 일부 표본 자료에 국한하여 조사가 이루어지고 있다. 따라서 표본 자료를 전수화하여 모집단의 통행 O/D패턴을 추정할 수밖에 없다. 따라서 표본조사와 전수화 과정에서 발생할 수 있는 오차를 가능한 최소화하기 위해서 관측 교통량과 전수화 자료를 비교 검증하고 수정하는 과정이 절대적으로 필요하다. 이 논문에서는 다수의 스크린라인 선상의 관측 교통량과 표본조사자료를 기반으로 추정된 전수화 O/D 통행을 비교 검증하고 수정하는 방법을 제안하였다. 그리고 스크린라인으로 검증이 되지 않는 O/D 쌍에 대해서는 노선배정분석 결과와 관측 링크 교통량을 비교하여 수정하는 방안도 제안하였다. 그리고 우리나라 2004년도 전국 O/D 통행 자료를 활용한 사례연구 분석을 수행하였다.

자동기계학습 TPOT 기반 저수위 예측 정확도 향상을 위한 시계열 교차검증 기법 연구 (A Study on Time Series Cross-Validation Techniques for Enhancing the Accuracy of Reservoir Water Level Prediction Using Automated Machine Learning TPOT)

  • 배주현;박운지;이서로;박태선;박상빈;김종건;임경재
    • 한국농공학회논문집
    • /
    • 제66권1호
    • /
    • pp.1-13
    • /
    • 2024
  • This study assessed the efficacy of improving the accuracy of reservoir water level prediction models by employing automated machine learning models and efficient cross-validation methods for time-series data. Considering the inherent complexity and non-linearity of time-series data related to reservoir water levels, we proposed an optimized approach for model selection and training. The performance of twelve models was evaluated for the Obong Reservoir in Gangneung, Gangwon Province, using the TPOT (Tree-based Pipeline Optimization Tool) and four cross-validation methods, which led to the determination of the optimal pipeline model. The pipeline model consisting of Extra Tree, Stacking Ridge Regression, and Simple Ridge Regression showed outstanding predictive performance for both training and test data, with an R2 (Coefficient of determination) and NSE (Nash-Sutcliffe Efficiency) exceeding 0.93. On the other hand, for predictions of water levels 12 hours later, the pipeline model selected through time-series split cross-validation accurately captured the change pattern of time-series water level data during the test period, with an NSE exceeding 0.99. The methodology proposed in this study is expected to greatly contribute to the efficient generation of reservoir water level predictions in regions with high rainfall variability.

SVM 교차검증을 활용한 토지피복 ROI 선정 (Region of Interest (ROI) Selection of Land Cover Using SVM Cross Validation)

  • 정종철;윤형진
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.75-85
    • /
    • 2020
  • 본 연구는 토지피복 분류에 사용 가능한 ROI 생성 과정에서 기계학습 기반 교차검증을 활용하였다. 연구지역은 세종시를 포함한 2019년 10월 28일 단시기 KOMPSAT-3A 영상을 활용하였다. 연구 과정에서 4개의 밴드(Red, Green, Blue, Near Infra-red)를 독립변수로 교차검증 과정에서 학습시켰다. 또한 SVM의 4가지 기법(Linear, Polynomial, RBF, Sigmoid)을 활용하여 추출된 ROI를 기반으로 토지피복 분류를 실시하였다. 교차검증 과정에서 훈련된 3,500개의 데이터 중 1,813개의 데이터가 추출되었으며 건물, 도로, 그리고 초지에서 약 60%의 데이터가 제거되었다. 추출된 ROI를 기반으로 다른 SVM기법에 비해 SVM Linear 기법이 91.77%로 가장 높은 분류 정확도를 나타냈다. 분류 클래스 중 초지의 경우 산림과의 오분류가 가장 많이 발생하며 79.43%의 생산자 정확도로 가장 낮은 분류 정확도를 보여주었다. 연구 결과에 따라 교차검증에서 추출된 ROI는 산림, 수역, 그리고 농업지역에 대해서는 90%이상의 분류정확도를 보여주며 효과적인 분류결과를 도출할 수 있었으나, 80%의 분류정확도를 보여주는 건물, 도로, 나대지, 그리고 초지 지역을 분류하는 방법에 대해서는 추가적인 연구가 진행되어야 할 필요성이 존재한다.

Validation of RELAP5 MOD3.3 code for Hybrid-SIT against SET and IET experimental data

  • Yoon, Ho Joon;Al Naqbi, Waleed;Al-Yahia, Omar S.;Jo, Daeseong
    • Nuclear Engineering and Technology
    • /
    • 제52권9호
    • /
    • pp.1926-1938
    • /
    • 2020
  • We validated the performance of RELAP MOD3.3 code regarding the hybrid SIT with available experimental data. The concept of the hybrid SIT is to connect the pressurizer to SIT to utilize the water inside SIT in the case of SBO or SB-LOCA combined with TLOFW. We investigated how well RELAP5 code predicts the physical phenomena in terms of the equilibrium time, stratification, condensation against Separate Effect Test (SET) data. We also conducted the validation of RELAP5 code against Integrated Effect Test (IET) experimental data produced by the ATLAS facility. We followed conventional approach for code validation of IET data, which are pre-test and post-test calculation. RELAP5 code shows substantial difference with changing number of nodes. The increase of the number of nodes tends to reduce the condensation rate at the interface between liquid and vapor inside the hybrid SIT. The environmental heat loss also contributes to the large discrepancy between the simulation results of RELAP5 and the experimental data.

DARC 기반에서의 실시간 인증서 유효성 검증에 관한 연구 (A Study on the Realtime Cert-Validation of Certification based on DARC)

  • 장홍종;이정현
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2001년도 International Conference CALS/EC KOREA
    • /
    • pp.155-163
    • /
    • 2001
  • There are cases that revoke the certification because of disclosure of private key, deprivation of qualification and the expiration of a term of validity based on PKI. So, a user have to confirm the public key whether valid or invalid in the certification. There are many method such as CRL, Delta-CRL, OCSP for the cert-validation of certification. But these method many problems which are overload traffic on network and the CRL server because of processing for cert-validation of certification. In this paper we proposed the realtime cert-validation of certification method which solved problems that are data integrity by different time between transmission and receiving for CRL, and overload traffic on network and the CRL server based on DARC.

  • PDF

집단 약동학 모형을 위한 모형 진단과 적합도 검정에 대한 고찰 (Model Validation Methods of Population Pharmacokinetic Models)

  • 이은경
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.139-152
    • /
    • 2012
  • 집단 약동학 모형 추정의 결과는 환자에게 투약학 약물의 용량결정에 직접적 영향을 미치므로 추정 모형에 대한 타당도와 적합도의 검증이 중요하다. 본 논문에서는 다양한 집단 약동학 모형 적합도 검증을 위한 방법들을 비교, 분석하고 실제 임상자료를 이용하여 최적의 집단 약동학 모형을 찾고 이에 대하여 다양한 타당도, 적합도 검정을 실시하여 모형을 진단해 본다.