• Title/Summary/Keyword: 랜덤모형

Search Result 233, Processing Time 0.028 seconds

The Time Series Properties and Predictive Ability Results of Annual Earnings (순이익의 기대모형 : 랜덤워크 모형의 타당성 재검증)

  • Bae, Gil-Soo;Joo, Sang-Yong
    • The Korean Journal of Financial Management
    • /
    • v.16 no.2
    • /
    • pp.243-261
    • /
    • 1999
  • 본 논문은 순이익의 시계열 속성을 조사하고, 순이익의 시계열이 랜덤워크 모형과 일치하는지를 단위근 검증방식을 사용하여 조사하며, 시계열 속성에 근거하여 도출된 예측모형과 흔히 사용되어 온 랜덤워크 모형의 예측능력을 비교하여 선행연구에서 사용되고 있는 랜덤워크 모형에 실증적 타당성을 제시하는 것을 주목적으로 하고 있다. 본 연구는 한국신용평가주식회사의 데이터 베이스에 1980년부터 1996년까지 17년간 자료가 연속적으로 포함되어 있는 금융기업을 제외한 모든 기업(272개)을 표본으로 사용하고 있다. 표본기업의 순이익 시계열에 가장 적합한 과정은 랜덤워크나 AR(1) 또는 AR(2) 모형이다. 또한 본 논문은 대부분의 기업에 때해 순이익이 랜덤워크 과정을 따른다는 가설을 기각할 수 없음을 보였다. 이들 상이한 모형의 표본외 예측력(out-of-sample predictive ability)을 비교한 결과 상수항을 포함한 랜덤워크 모형이 가장 작은 평균 절대 예측오차(mean absolute forecast error)를 갖는 것으로 나타나고 있다. 본 연구는 기존의 연구가 순이익 시계열의 불안정성(nonstationarity) 문제를 무시하거나 명시적으로 다루고 있지 않은 것과는 달리 단위근 검증(unit root test)을 통해 연간 순이익이 대체로 불안정하다는 것을 보였으며, 또한 상이한 모형의 표본외 예측능력을 비교한 결과 선행연구에서 사용하여 온 랜덤워크 모형의 우월성에 대한 실증적 증거를 제공하였다는 데 의의가 있다.

  • PDF

Semiparametric Approach to Logistic Model with Random Intercept (준모수적 방법을 이용한 랜덤 절편 로지스틱 모형 분석)

  • Kim, Mijeong
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.6
    • /
    • pp.1121-1131
    • /
    • 2015
  • Logistic models with a random intercept are useful to analyze longitudinal binary data. Traditionally, the random intercept of the logistic model is assumed to be parametric (such as normal distribution) and is also assumed to be independent to variables. Such assumptions are very strong and restricted for application to real data. Recently, Garcia and Ma (2015) derived semiparametric efficient estimators for logistic model with a random intercept without these assumptions. Their estimator shows the consistency where we do not assume any parametric form for the random intercept. In addition, the method is computationally simple. In this paper, we apply this method to analyze toenail infection data. We compare the semiparametric estimator with maximum likelihood estimator, penalized quasi-likelihood estimator and hierarchical generalized linear estimator.

소지역에서 Pseudo-EBLUP 추정

  • Sin, Min-Ung;Baek, Jeong-Yong;Kim, Ik-Chan
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.111-115
    • /
    • 2003
  • 소지역 모형들은 고정된(fixed)효과와 랜덤 효과를 포함하는 일반적 선형 혼한 모형의 특별한 경우로 간주될 수 있다. 소지역 평균이나 종계는 고정된 효과와 랜덤 효과의 일치 결합으로 표현될 수 있다. 블록 대각 공분산 구조를 갖는 선형 혼합모형(mixed model) 아래서 EBLUP은 실재문제에 있어서 많이 소지역 모형에 응용된다. 설계 가중값(design weight) 들에 의존하고 설계-일치(design consistency) 성질을 만족하는 Pseudo-EBLUP 추정량들은 소지역추정에서 합해지면 (aggregated) 사후-수정(post-adjustment)없이 벤치마킹 성질을 만족한다.

  • PDF

A Bayesian zero-inflated Poisson regression model with random effects with application to smoking behavior (랜덤효과를 포함한 영과잉 포아송 회귀모형에 대한 베이지안 추론: 흡연 자료에의 적용)

  • Kim, Yeon Kyoung;Hwang, Beom Seuk
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.2
    • /
    • pp.287-301
    • /
    • 2018
  • It is common to encounter count data with excess zeros in various research fields such as the social sciences, natural sciences, medical science or engineering. Such count data have been explained mainly by zero-inflated Poisson model and extended models. Zero-inflated count data are also often correlated or clustered, in which random effects should be taken into account in the model. Frequentist approaches have been commonly used to fit such data. However, a Bayesian approach has advantages of prior information, avoidance of asymptotic approximations and practical estimation of the functions of parameters. We consider a Bayesian zero-inflated Poisson regression model with random effects for correlated zero-inflated count data. We conducted simulation studies to check the performance of the proposed model. We also applied the proposed model to smoking behavior data from the Regional Health Survey (2015) of the Korea Centers for disease control and prevention.

랜덤 워크를 사용한 박막 성장 특성 연구

  • Lee, Yeong-Gyu;Lee, Du-Won;Jang, Ji-Hye;Kim, Hyo-Jeong;Jang, Jun-Gyeong
    • Proceeding of EDISON Challenge
    • /
    • 2015.03a
    • /
    • pp.111-116
    • /
    • 2015
  • 우리는 딥펜나노리소그래피에서 일어나는 박막 성장에 관한 잉크 확산 모형을 랜덤 워크 방법을 사용해 구현하였다. 분자동역학 연구를 바탕으로 제안된 hopping down, serial pushing, 단일 밀림 길이를 고려한 모형에 따른 박막 성장 특성을 비교하였다. 모형에 따라 그 박막 성장 특성에 확연한 차이가 있음을 발견하였으며, 잉크 분자와 기판 사이의 결합력이 중요한 변수임을 확인할 수 있었다. 그리고 원자힘현미경 탐침에서 떨어지는 잉크 분자의 속도와 단일 밀림 길이에 따른 박막 성장 차이를 알아보았다. 단일 밀림 길이가 커질수록, 탐침에서 떨어지는 잉크 분자의 속도가 빨라질수록 가지 모양의 박막이 형성됨을 알 수 있었다.

  • PDF

Study on Default Prediction Model of Policy Fund (정책자금지원 부실예측 모형 연구)

  • Lim, Sangseop
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.713-714
    • /
    • 2021
  • 소상공인은 우리나라 경제의 중요한 역할을 하는 경제적 근간이루고 있지만 상대적으로 영세하고 경영여건이 불안하다. 정부정책적인 자금지원이 필요하나 재원의 한계로 효율적인 자본분배가 필요하다. 따라서 본 논문은 랜덤포레스트 모형을 활용하여 소상공인 정책자금 대출에 관한 부실예측모형을 개발함으로써 부실징후를 사전에 파악하고 예방함으로써 사회적비용을 절감하고 자원의 효율적 분배에 기여하고자 한다.

  • PDF

Comparison of evaluation measures for classification models on binary data (이진자료 분류모형에 대한 평가측도의 특성 비교)

  • Kim, Byungsoo;Kwon, Soyoung
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.291-300
    • /
    • 2019
  • This study investigates the characteristics of evaluation measures for classification models on a binary response variable in order to evaluate their suitability for use. Six measures are considered: Accuracy, Sensitivity, Specificity, Precision, F-measure, and the Heidke's skill score (HSS). Evaluation measures are reformulated using x(ratio of actually 1), y(ratio predicted by 1), z(ratio of both actual and predicted by 1) from the confusion matrix. We suggest two necessary conditions to assess the suitability of the evaluation measures. The first condition is that the measure function is constant for x and y in the case of a random model. The second condition is that the measure function is increasing for z and decreasing for x and y. Since only HSS satisfies the two conditions, that is always appropriate as an evaluation measure for the classification model on the binary response variable, and the other measures should be used within a limited range.

Imputation of Multiple Missing Values by Normal Mixture Model under Markov Random Field: Application to Imputation of Pixel Values of Color Image (마코프 랜덤 필드 하에서 정규혼합모형에 의한 다중 결측값 대체기법: 색조영상 결측 화소값 대체에 응용)

  • Kim, Seung-Gu
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.6
    • /
    • pp.925-936
    • /
    • 2009
  • There very many approaches to impute missing values in the iid. case. However, it is hardly found the imputation techniques in the Markov random field(MRF) case. In this paper, we show that the imputation under MRF is just to impute by fitting the normal mixture model(NMM) under several practical assumptions. Our multivariate normal mixture model based approaches under MRF is applied to impute the missing pixel values of 3-variate (R, G, B) color image, providing a technique to smooth the imputed values.

Sensitivity analysis of the parameter estimates in the Bass Diffusion Model (Bass 확산 모형 계수의 추정치에 대한 민감도 분석)

  • Hong, Jeong-Sik;Kim, Yeong-Jae;An, Jae-Gyeong;Kim, Tae-Gu
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2006.11a
    • /
    • pp.413-416
    • /
    • 2006
  • 신제품이나 서비스의 수요 예측을 Bass 확산 모형을 토대로 수행할 때의 가장 큰 문제점은모형의 파라미터 추정에 필요한 데이터가 충분치 않다는 것이다. 따라서 Bass 확산 모형의 핵심적인 두 파라미터인 혁신 계수(p)와 모방 계수(q)의 추정을 시도할 때, 어느 정도의 데이터 개수가 요구되는 지를 파악하는 것은 매우 현실적인 중요성을 갖는 문제이다. 이제까지의 연구는 주로 기존의 판매 데이터를 토대로 Bass 모형의 파라미터를 추정할 때, 생기는 다양한 문제점 파악에 집중되었다. 시뮬레이션의 경우는 Bass 모형에 랜덤 오차를 추가하여 실시하였다. 이 경우 데이터 개수가 계수추정에 미치는 영향은 도출되나 각 계수별 민감도 분석이 제대로 이루어지지 못하는 한계를 가지고 있다, 따라서 본 논문에서는 시뮬레이션에서 예측치를 발생시킬 때 랜덤 오차 대신, 혁신 계수와 확산 계수의 변동을 주는 방법을 도입한다. 결과는 다음과 같다. 첫째, p 변동보다는 q 변동이 예측치의 오차에 대해 보다 중요하다. 둘째, 오차가 잠재수요의 30%이하로 떨어지기 위해서는 수요가 최대로 도달하는 시점이 $t^*$ 일 경우, $t^*\;+1$까지 데이터가 요구된다.

  • PDF

Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics (약물유전체학에서 약물반응 예측모형과 변수선택 방법)

  • Kim, Kyuhwan;Kim, Wonkuk
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.153-166
    • /
    • 2021
  • A main goal of pharmacogenomics studies is to predict individual's drug responsiveness based on high dimensional genetic variables. Due to a large number of variables, feature selection is required in order to reduce the number of variables. The selected features are used to construct a predictive model using machine learning algorithms. In the present study, we applied several hybrid feature selection methods such as combinations of logistic regression, ReliefF, TurF, random forest, and LASSO to a next generation sequencing data set of 400 epilepsy patients. We then applied the selected features to machine learning methods including random forest, gradient boosting, and support vector machine as well as a stacking ensemble method. Our results showed that the stacking model with a hybrid feature selection of random forest and ReliefF performs better than with other combinations of approaches. Based on a 5-fold cross validation partition, the mean test accuracy value of the best model was 0.727 and the mean test AUC value of the best model was 0.761. It also appeared that the stacking models outperform than single machine learning predictive models when using the same selected features.