• 제목/요약/키워드: In-Sample Prediction

검색결과 555건 처리시간 0.031초

Large-sample comparisons of calibration procedures when both measurements are subject to error

  • Lee, Seung-Hoon;Yum, Bong-Jin
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1990년도 춘계공동학술대회논문집; 한국과학기술원; 28 Apr. 1990
    • /
    • pp.254-262
    • /
    • 1990
  • A predictive functional relationship model is presented for the calibration problem in which the standard as well as the nonstandard measurements are subject to error. For the estimation of the relationship between the two measurements, the ordinary least squares and maximum likelihood estimation methods are considered, while for the prediction of unknown standard measurementswe consider direct and inverse approaches. Relative performances of those calibration procedures are compared in terms of the asymptotic mean square error of prediction.

  • PDF

부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선 (Improving an Ensemble Model by Optimizing Bootstrap Sampling)

  • 민성환
    • 인터넷정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2016
  • 앙상블 학습 기법은 개별 모형보다 더 좋은 예측 성과를 얻기 위해 다수의 분류기를 결합하는 것으로 예측 성과를 향상시키는데에 매우 유용한 것으로 알려져 있다. 배깅은 단일 분류기의 예측 성과를 향상시키는 대표적인 앙상블 기법중의 하나이다. 배깅은 원 학습 데이터로부터 부트스트랩 샘플링 방법을 통해 서로 다른 학습 데이터를 추출하고, 각각의 부트스트랩 샘플에 대해 학습 알고리즘을 적용하여 서로 다른 다수의 기저 분류기들을 생성시키게 되며, 최종적으로 서로 다른 분류기로부터 나온 결과를 결합하게 된다. 배깅에서 부트스트랩 샘플은 원 학습 데이터로부터 램덤하게 추출한 샘플로 각각의 부트스트랩 샘플이 동일한 정보를 가지고 있지는 않으며 이로 인해 배깅 모형의 성과는 편차가 발생하게 된다. 본 논문에서는 이와 같은 부트스트랩 샘플을 최적화함으로써 표준 배깅 앙상블의 성과를 개선시키는 새로운 방법을 제안하였다. 제안한 모형에서는 앙상블 모형의 성과를 개선시키기 위해 부트스트랩 샘플링을 최적화하였으며 이를 위해 유전자 알고리즘이 활용되었다. 본 논문에서는 제안한 모형을 국내 부도 예측 문제에 적용해 보았으며, 실험 결과 제안한 모형이 우수한 성과를 보였다.

Color Determination of Beef Rib Eye Using Near Infrared Spectroscopy

  • Kang, J.O.;Park, J.Y.;Choy, Y.H.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제14권2호
    • /
    • pp.263-267
    • /
    • 2001
  • Beef samples of loin eye area from New Zealand, USA and three quality grades of Hanwoo were analyzed using near infrared spectrophotometer with reference values from laboratory optical Chromameter to determine effective spectrum range and mathematical treatment for determination of color values. $R^2s$ of prediction models were not improved much by calibrating with whole light range (400~2500 nm) compared to using visible range (400~1100 nm). Standard errors of calibration and prediction were influenced by possible bias due to sampling non-homogeneous sample sources. However, partial differentiation in the first order was more stable against sampling biases than second derivatives of the spectra. Lightness value was little different among the five sample sources of beef. Beef samples from USA were brighter and more reddish than beefs of Hanwoo or from New Zealand (p<0.05). Yellowness of USA beef was the highest followed by beef from New Zealand, which was also higher than Hanwoo beefs of three quality grades (p<0.05).

PXA255 기반 정전기 예측 임베디드 시스템 개발 (Electrostatic Prediction Embedded System based on PXA255)

  • 변치남;김강철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.406-409
    • /
    • 2007
  • 석유화학산업단지에서는 화재의 위험성이 많은 석유관련 제품을 제조 생산하는 과정에서 화재, 누전, 정전기 등에 의한 폭발사고가 자주 발생하고 있다. 따라서 정전기를 체계적으로 관리하여 폭발사고를 미연에 예방할 수 있는 시스템의 개발이 필요한 실정이다. 본 논문에서는 최소제곱 회귀분석을 기초로 연산에 사용될 샘플의 수를 동적으로 변화시켜 정전기 값을 실시간으로 예측하는 PAD(Prediction Algorithm by Difference of sample value) 알고리즘을 개발하였다. 제안된 PAD알고리즘은 이전 값과 현재 값의 차이를 이용하여 임계값을 기준으로 연산샘플 개수를 3개로 할 것인지 6개로 할 것인지를 결정한다. 모의실험을 위해 공장에서 산출된 데이터를 사용하여 기존의 LSM(Least Square Method)알고리즘을 통해 연산에 사용될 고정된 샘플수 3, 6, 9개를 모의실험 한 결과 95% 신뢰확률에서 표준편차 75.17843, 81.13392, 107.3173을 각각 얻었다. PAD는 95% 신뢰확률에서 표준편차 73.18161을 나타내 기존의 방법보다 우수한 결과를 보였다.

  • PDF

Bayesian Approach to the Prediction in the Censored Sample from Rayleigh Population

  • Ko, Jeong-Hwan;Kim, Young-Hoon;Kang, Sang-Gil
    • Journal of the Korean Data and Information Science Society
    • /
    • 제8권1호
    • /
    • pp.71-77
    • /
    • 1997
  • S independent sample 0,1,2, $\cdots$, s-1 (or stages 0,1,2, $\cdots$, s-1) are available from the Raleigh population. Procedure for predicting any order statistic in the $(s+1)^{th}$ sample is developed by obtaining the predictive distribution at stage s. Bounds for the sample size at stage S, in order to have the variance at stage S less than that at stage (s-1), are obtained.

  • PDF

구조-음향 연성해석을 통한 모형차실 모델의 소음저감 기술연구 (Noise reduction of a vehicle acoustic cavity sample using coupled Structural-Acoustic element analysis)

  • 김태정;강성종;서정범
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 1994년도 추계학술대회논문집; 한국종합전시장, 18 Nov. 1994
    • /
    • pp.288-294
    • /
    • 1994
  • A study of prediction and qualification techniques for structure borne booming noise is presented in this paper. Result from acoustic normal mode finite element analysis of a 1/2 size vehicle cavity sample model is compared to the that from an experiment. Coupled structural-acoustic analysis is performed on a 1/4 size vehicle cavity sample model surrounded by 2 mm thick normal steel plates. Interior noise levels around passensger's ear position are predicted and reduced by structural modification based on panel participation factor analysis about the sample cavity model. Futhermore, optimization technique in application of anti-vibration pad is studied.

  • PDF

The Data Processing Method for Small Samples and Multi-variates Series in GPS Deformation Monitoring

  • Guo-Lin, Liu;Wen-Hua, Zheng;Xin-Zhou, Wang;Lian-Peng, Zhang
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2006년도 International Symposium on GPS/GNSS Vol.1
    • /
    • pp.185-189
    • /
    • 2006
  • Time series analysis is a frequently effective method of constructing model and prediction in data processing of deformation monitoring. The monitoring data sample must to be as more as possible and time intervals are equal roughly so as to construct time series model accurately and achieve reliable prediction. But in the project practice of GPS deformation monitoring, the monitoring data sample can't be obtained too much and time intervals are not equal because of being restricted by all kinds of factors, and it contains many variates in the deformation model moreover. It is very important to study the data processing method for small samples and multi-variates time series in GPS deformation monitoring. A new method of establishing small samples and multi-variates deformation model and prediction model are put forward so as to resolve contradiction of small samples and multi-variates encountered in constructing deformation model and improve formerly data processing method of deformation monitoring. Based on the system theory, a deformation body is regarded as a whole organism; a time-dependence linear system model and a time-dependence bilinear system model are established. The dynamic parameters estimation is derived by means of prediction fit and least information distribution criteria. The final example demonstrates the validity and practice of this method.

  • PDF

데이터마이닝 기법을 이용한 기업부실화 예측 모델 개발과 예측 성능 향상에 관한 연구 (Development of Prediction Model of Financial Distress and Improvement of Prediction Performance Using Data Mining Techniques)

  • 김량형;유동희;김건우
    • 경영정보학연구
    • /
    • 제18권2호
    • /
    • pp.173-198
    • /
    • 2016
  • 본 연구의 목적은 비즈니스 인텔리전스 연구 관점에서 기업부실화 예측 성능을 향상키시는 것이다. 이를 위해 본 연구는 기존 연구들에서 미흡하게 다루어졌던 1) 데이터셋을 구성하는 과정에서 발생하는 바이어스 문제, 2) 거시경제위험 요소의 미반영 문제, 3) 데이터 불균형 문제, 4) 서술적 바이어스 문제를 다루어 경기순환국면을 반영한 기업부실화 예측 프레임워크를 제안하고, 이를 바탕으로 기업부실화 예측 모델을 개발하였다. 본 연구에서는 경기순환국면별로 각각의 데이터셋을 구성하고, 각 데이터셋에서 의사결정나무, 인공신경망 등 단일 분류기부터 앙상블 기법까지 다양한 데이터마이닝 알고리즘을 적용하여 실험하였다. 또한 본 연구는 데이터불균형 문제를 해결하기 위해, 오버샘플링 기법인 SMOTE(synthetic minority over-sampling technique) 기법을 통해 초기 데이터 불균형 상태에서부터 표본비율을 1:1까지 변화시켜 가며, 기업부실화 예측 모델을 개발하는 실험을 하였고, 예측 모델의 변수 선정 시에 선행연구를 바탕으로 재무비율을 추출하고, 여기서 파생된 IT 산출물인 재무상태변동성과 산업수준상태변동성을 예측 모델에 삽입하였다. 마지막으로, 본 연구는 각 순환국면에서 만들어진 기업부실화 예측 모델의 예측 성능 비교와 경기 확장기와 수축기에서의 기업부실화 예측 모델의 유용성에 대해 논의하였다. 본 연구는 비즈니스 인텔리전스 연구 측면에서 기존 연구에서 미흡하게 다루어졌던 4가지 문제점을 검토하고, 이를 해결할 프레임워크를 제안함으로써 기존 연구 대비 기업부실화 예측률을 10% 이상 향상시켰다는 점에서 연구의 의의를 찾을 수 있다.

Topological Analysis of Large Scale Structure Using the Final BOSS Sample

  • 최윤영;김주한
    • 천문학회보
    • /
    • 제39권2호
    • /
    • pp.43.2-43.2
    • /
    • 2014
  • We present the three-dimensional genus topology of large-scale structure using the CMASS sample of the Final SDSS-III Baryon Oscillation Spectroscopic Survey (BOSS) data. To estimate the uncertainties in the measured genus, we very carefully construct mock CMASS surveys along the past light cone from the Horizon Run 3. We find that the shape of the observed genus curve agrees very well with the prediction of perturbation theory and with the mean topology of the mock surveys. However, comparison with simulations show that the observed genus curve slightly deviates from the theoretical Gaussian expectation. From the deviation, we further quantify the primordial non-Gaussian contribution.

  • PDF

Default Prediction of Automobile Credit Based on Support Vector Machine

  • Chen, Ying;Zhang, Ruirui
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.75-88
    • /
    • 2021
  • Automobile credit business has developed rapidly in recent years, and corresponding default phenomena occur frequently. Credit default will bring great losses to automobile financial institutions. Therefore, the successful prediction of automobile credit default is of great significance. Firstly, the missing values are deleted, then the random forest is used for feature selection, and then the sample data are randomly grouped. Finally, six prediction models of support vector machine (SVM), random forest and k-nearest neighbor (KNN), logistic, decision tree, and artificial neural network (ANN) are constructed. The results show that these six machine learning models can be used to predict the default of automobile credit. Among these six models, the accuracy of decision tree is 0.79, which is the highest, but the comprehensive performance of SVM is the best. And random grouping can improve the efficiency of model operation to a certain extent, especially SVM.