• Title/Summary/Keyword: 회귀 분석

Search Result 12,705, Processing Time 0.041 seconds

Improving Polynomial Regression Using Principal Components Regression With the Example of the Numerical Inversion of Probability Generating Function (주성분회귀분석을 활용한 다항회귀분석 성능개선: PGF 수치역변환 사례를 중심으로)

  • Yang, Won Seok;Park, Hyun-Min
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.1
    • /
    • pp.475-481
    • /
    • 2015
  • We use polynomial regression instead of linear regression if there is a nonlinear relation between a dependent variable and independent variables in a regression analysis. The performance of polynomial regression, however, may deteriorate because of the correlation caused by the power terms of independent variables. We present a polynomial regression model for the numerical inversion of PGF and show that polynomial regression results in the deterioration of the estimation of the coefficients. We apply principal components regression to the polynomial regression model and show that principal components regression dramatically improves the performance of the parameter estimation.

Check for regression coefficient using jackknife and bootstrap methods in clinical data (잭나이프 및 붓스트랩 방법을 이용한 임상자료의 회귀계수 타당성 확인)

  • Sohn, Ki-Cheul;Shin, Im-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.4
    • /
    • pp.643-648
    • /
    • 2012
  • There are lots of analysis to determine the relation between dependent variable and explanatory variables. Often the regression analysis is used to do this, and we can analyze the how much the explanatory variable can be related with dependent variable and how much the regression model can explain the data. But the validation check of regression model is usually determined by coefficient of determination. We should check the validation of regression coefficient with different methods. This paper introduces the method for validation check the regression coefficient using the jackknife regression and bootstrap regression in clinical data.

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression (Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석)

  • Kim, Sang-Ug;Lee, Kil-Seong;Sung, Jin-Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

Multivariate Analysis for Clinicians (임상의를 위한 다변량 분석의 실제)

  • Oh, Joo Han;Chung, Seok Won
    • Clinics in Shoulder and Elbow
    • /
    • v.16 no.1
    • /
    • pp.63-72
    • /
    • 2013
  • In medical research, multivariate analysis, especially multiple regression analysis, is used to analyze the influence of multiple variables on the result. Multiple regression analysis should include variables in the model and the problem of multi-collinearity as there are many variables as well as the basic assumption of regression analysis. The multiple regression model is expressed as the coefficient of determination, $R^2$ and the influence of independent variables on result as a regression coefficient, ${\beta}$. Multiple regression analysis can be divided into multiple linear regression analysis, multiple logistic regression analysis, and Cox regression analysis according to the type of dependent variables (continuous variable, categorical variable (binary logit), and state variable, respectively), and the influence of variables on the result is evaluated by regression coefficient${\beta}$, odds ratio, and hazard ratio, respectively. The knowledge of multivariate analysis enables clinicians to analyze the result accurately and to design the further research efficiently.

A Suggestion of Two-Way Variable Algorism for Least-Squares Regression Analysis (상호변수 최소자승 회귀분석 방법의 제안)

  • Lee, Chang-Hae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2005.05b
    • /
    • pp.189-193
    • /
    • 2005
  • 기존의 회귀식을 사용하거나 새로 유도하여 사용하는 경우 모두 일반적으로 회귀분석의 특성을 간과하고 사용하는 경우가 종종 발생한다. 일반적으로 자료들에서 구해진 회귀식은 분명히 독립변수와 종속변수가 구분되어 유도되었음에도 불구하고 이 식을 사용함에 있어서는 간혹 그 구분을 무시하고 역으로 적용하는 경향이 있었다. 그러나, 독립$\cdot$종속변수가 서로 바뀌면, 연직거리의 잔차들로부터 유도되는 기존의 회귀분석에 의하여, 회귀식이 서로 달라지기 때문에 역으로 적용하여서는 안된다. 이를 해결하기 본 연구에서는 상호변수 최소자승 회귀분석법을 제안하였다. 이론적 내용을 검토를 위해 임진강 영평천의 영중수위표 지점의 2001-2003년의 유량측정자료와 수위-유량곡선을 비교 분석하였다. 결론적으로 상호변수 회귀분석을 사용하면, 기존의 잘못 사용해온 관행을 해소할 수 있을 것이다.

  • PDF

Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction (풍속 예측을 위한 선형회귀분석과 비선형회귀분석 기법의 비교 및 인자분석)

  • Kim, Dongyeon;Seo, Kisung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.5
    • /
    • pp.477-482
    • /
    • 2015
  • Linear regressions and evolutionary nonlinear regression based compensation techniques for the short-range prediction of wind speed are investigated. Development of an efficient MOS(Model Output Statistics) is necessary to correct systematic errors of the model, but a linear regression based MOS is hard to manage an irregular nature of weather prediction. In order to solve the problem, a nonlinear and symbolic regression method using GP(Genetic Programming) is suggested for a development of MOS for wind speed prediction. The proposed method is compared to various linear regression methods for prediction of wind speed. Also, statistical analysis of distribution for UM elements for each method is executed. experiments are performed for KLAPS(Korea Local Analysis and Prediction System) re-analysis data from 2007 to 2013 year for Jeju Island and Busan area in South Korea.

A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data (건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구)

  • Hong, Sang-Hoon;Hong, Kwang-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

The Analysis of Return Flow Ratio By Measuring Discharge of The Sewer Network (하수관거 내 유량측정을 통한 생활용수의 회귀율 분석)

  • Choi, Gye-Woon;Kim, Young-Kyu;Ham, Myeong-Soo;Jo, Hyoung-Gen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1169-1173
    • /
    • 2007
  • 본 연구의 시험유역은 기존에 제시되고 있는 회귀율 분석에서 각 지역별 및 업종별 다양한 회귀율을 나타내고 있어 어느 일정한 값을 결정하기 어렵고, 또한 최근 들면서 하수관거정비사업 등을 통하여 하수 차집비율이 과거에 비해 매우 높아짐에 따라 기존에 제시된 회귀율과 하수관거사업에 의해 변화되는 회귀율을 비교 분석하기위해 시험유역을 운영하였다. 물 사용량에 대한 회귀율의 정확성을 위하여 한강수계의 하남시를 대상으로 총 4개 지점에 대한 시험유역을 구성하여 생활용수의 회귀율 및 최근 환경부에서 중점적으로 추진하고 있는 하수관거 정비 사업에 따른 회귀율 변화에 대하여 계절별 회귀율을 제시하고 분석을 하였다.

  • PDF