• Title/Summary/Keyword: 회귀분석 방법

Search Result 3,596, Processing Time 0.038 seconds

Principal component regression for spatial data (공간자료 주성분분석)

  • Lim, Yaeji
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.3
    • /
    • pp.311-321
    • /
    • 2017
  • Principal component analysis is a popular statistical method to reduce the dimension of the high dimensional climate data and to extract meaningful climate patterns. Based on the principal component analysis, we can further apply a regression approach for the linear prediction of future climate, termed as principal component regression (PCR). In this paper, we develop a new PCR method based on the regularized principal component analysis for spatial data proposed by Wang and Huang (2016) to account spatial feature of the climate data. We apply the proposed method to temperature prediction in the East Asia region and compare the result with conventional PCR results.

A study on semi-supervised kernel ridge regression estimation (준지도 커널능형회귀모형에 관한 연구)

  • Seok, Kyungha
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.2
    • /
    • pp.341-353
    • /
    • 2013
  • In many practical machine learning and data mining applications, unlabeled data are inexpensive and easy to obtain. Semi-supervised learning try to use such data to improve prediction performance. In this paper, a semi-supervised regression method, semi-supervised kernel ridge regression estimation, is proposed on the basis of kernel ridge regression model. The proposed method does not require a pilot estimation of the label of the unlabeled data. This means that the proposed method has good advantages including less number of parameters, easy computing and good generalization ability. Experiments show that the proposed method can effectively utilize unlabeled data to improve regression estimation.

Analysis of Landslide Hazard Area using Logistic Regression Analysis and AHP (Analytical Hierarchy Process) Approach (로지스틱 회귀분석 및 AHP 기법을 이용한 산사태 위험지역 분석)

  • Lee, Yong-jun;Park, Geun-Ae;Kim, Seong-Joon
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.26 no.5D
    • /
    • pp.861-867
    • /
    • 2006
  • The objective of this study is to analyze the landslide hazard areas by combining LRA (Lgistic Regression Analysis) and AHP (Analytic Hierarchy Program) methods with Remote Sensing and GIS data in Anseong-si. In order to classify landslide hazard areas of seven levels, six topographic factors (slope, aspect, elevation, soil drain, soil depth, and land use) were used as input factors of LRA and AHP methods. As results, high-risk areas for landslide (1 and 2 levels) by LRA and AHP of its own were classified as 46.1% and 48.7%, respectively. A new method by applying weighting factors to the results of LRA and AHP was suggested. High-risk areas for landslide (1 and 2 levels) form the new method was classified as 58.9%.

Electronic Commerce Agent using Multi-Estimation Method (다중추정방법에 의한 전자상거래 에이전트)

  • 김우정;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.310-312
    • /
    • 2000
  • 추정을 위한 방법으로는 K-NN과 회귀분석, 신경망 등의 다양한 방법을 적용할 수 있다. 그러나 K-NN의 경우 거리에 의해서만 결과를 추정하므로 각 속성에 대한 가중치가 속성 값들의 간격에 의해 결정되고, 회귀분석은 하나의 선으로 데이터의 경향을 표현하므로 속성의 가중치는 고려되지만, 데이터의 분포가 넓을 경우에는 많은 오차를 포함하게 되는 데이터에 의존적인 문제가 존재한다. 따라서 본 연구에서는 이러한 방법들을 혼합하여 데이터에 의존적인 문제를 보안할 수 있는 다중분석방법을 제안한다.

  • PDF

회귀분석을 위한 로버스트 신경망

  • 황창하;김상민;박희주
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.2
    • /
    • pp.327-332
    • /
    • 1997
  • 다층 신경망은 비모수 회귀함수 추정의 한 방법이다. 다충 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있다. 그러나 이 알고리즘은 이상치에 매우 민감하여 이상치를 포함하고 있는 자료에 대하여 원하지 않는 회귀함수를 추정한다. 본 논문에서는 통계물리에서 자주 사용하는 방법을 이용하여 로버스트 역전파 알고리즘을 제안하고 수학적으로 신경망과 매우 유사한 PRP(projection pursuit regression) 방법, 일반적인 역전파 알고리즘과 모의실험을 통해 비교 분석한다.

  • PDF

회귀분석을 이용한 Data Editing

  • 허문열
    • Journal of the Korean Operations Research and Management Science Society
    • /
    • v.5 no.1
    • /
    • pp.89-90
    • /
    • 1980
  • 원래 다량자료의 정리(Large Scale Data Screening)는 어떤 정립된 이론에 의해 수행되는 것보다는 그 자료자체가 가지는 성격과 자원의 Availability 등을 고려하여 수행되는 것이 상례이다. 여기서는 여러 방법 중 자료가 모두 수치로 나타나는 경우 자료정리의 한 유용한 방법으로 회귀분석을 사용하는 방법에 대해 설명코자 한다.

  • PDF

Comparison Study of Parameter Estimation Methods for Some Extreme Value Distributions (Focused on the Regression Method) (극단치 분포의 모수 추정방법 비교 연구(회귀 분석법을 기준으로))

  • Woo, Ji-Yong;Kim, Myung-Suk
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.463-477
    • /
    • 2009
  • Parameter estimation methods such as maximum likelihood estimation method, probability weighted moments method, regression method have been popularly applied to various extreme value models in numerous literature. Among three methods above, the performance of regression method has not been rigorously investigated yet. In this paper the regression method is compared with the other methods via Monte Carlo simulation studies for estimation of parameters of the Generalized Extreme Value(GEV) distribution and the Generalized Pareto(GP) distribution. Our simulation results indicate that the regression method tends to outperform other methods under small samples by providing smaller biases and root mean square errors for estimation of location parameter of the GEV model. For the scale parameter estimation of the GP model under small samples, the regression method tends to report smaller biases than the other methods. The regression method tends to be superior to other methods for the shape parameter estimation of the GEV model and GP model when the shape parameter is -0.4 under small and moderately large samples.

Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression (Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석)

  • Kim, Sang-Ug;Lee, Kil-Seong;Sung, Jin-Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

Multivariate Analysis for Clinicians (임상의를 위한 다변량 분석의 실제)

  • Oh, Joo Han;Chung, Seok Won
    • Clinics in Shoulder and Elbow
    • /
    • v.16 no.1
    • /
    • pp.63-72
    • /
    • 2013
  • In medical research, multivariate analysis, especially multiple regression analysis, is used to analyze the influence of multiple variables on the result. Multiple regression analysis should include variables in the model and the problem of multi-collinearity as there are many variables as well as the basic assumption of regression analysis. The multiple regression model is expressed as the coefficient of determination, $R^2$ and the influence of independent variables on result as a regression coefficient, ${\beta}$. Multiple regression analysis can be divided into multiple linear regression analysis, multiple logistic regression analysis, and Cox regression analysis according to the type of dependent variables (continuous variable, categorical variable (binary logit), and state variable, respectively), and the influence of variables on the result is evaluated by regression coefficient${\beta}$, odds ratio, and hazard ratio, respectively. The knowledge of multivariate analysis enables clinicians to analyze the result accurately and to design the further research efficiently.

Flood Damage Estimation Using Regional Regression Analysis (지역회귀분석을 이용한 홍수 피해금액 추정)

  • Jang, Ock-Jae;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.74-78
    • /
    • 2009
  • 우리 사회가 발전함에 따라 재해의 위험으로부터도 안전하게 살고자 하는 대중들의 욕구 또한 증가하고 있다. 하지만 최근의 기후변화와 이상홍수의 사례에서 볼 때 현재 우리가 처해 있는 자연재해로부터의 위협은 과거와는 상이하다는 것을 알 수 있다. 이러한 위협에 대처하기 위해서는 우리에게 노출된 재해의 특성을 평가하는 과정이 무엇보다 선행되어져야 한다. 홍수로 인한 피해는 대부분이 인명이나 재산피해가 주를 이루기 때문에 홍수위험도의 평가결과도 발생 가능한 인명이나 재산피해로 표현되는 것이 적절하다고 판단된다. 따라서 본 연구에서는 지역회귀분석을 적용하여 가능 홍수 피해금액을 추산하고, 이를 통해 각 지역별 홍수위험도를 평가하는 방법을 제안하였다. 지역회귀분석은 강우유출모형이나 확률분포모형의 매개변수들을 유역 특성인자들로 표현하기 위해 수문학 분야에서 사용되어져 왔으며 본 연구에서는 이 방법을 홍수 피해금액 추정에 응용하였다. 지역회귀방법의 절차는 먼저 계측지역에서는 홍수 피해금액과 시강우량 자료를 바탕으로 비선형회귀분석을 실시한 후 이 회귀식의 계수를 다시 해당 지역의 인문 사회 경제학적 인자들로 표현하였다. 이러한 방법을 통해 지역적 인자들이 홍수 피해에 미치는 영향을 정량적으로 분석할 수 있었으며 궁극적으로 미계측지역에서도 지역적 인자들을 통해 특정 빈도에 발생 가능한 홍수 피해금액을 추정할 수 있었다. 최종적으로 추정된 홍수 피해금액과 지역 총 자산의 비를 통해 홍수위험지도를 작성하였다. 본 연구결과를 수자원장기종합계획에서 홍수위험도 평가를 위해 사용된 홍수피해잠재능(Potential Flood Damage; PFD)과 비교해 보면 PFD에서는 각 인자들의 가중치 산정에서 전문가의 주관이 개입될 수 있다는 단점이 있었으나 과거 피해금액과의 상관관계를 분석한 본 연구에서는 이러한 단점을 극복할 수 있었다.

  • PDF