• Title/Summary/Keyword: 회귀 방법

Search Result 4,282, Processing Time 0.033 seconds

Statistical Matching Techniques Using the Robust Regression Model (로버스트 회귀모형을 이용한 자료결합방법)

  • Jhun, Myoung-Shic;Jung, Ji-Song;Park, Hye-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.6
    • /
    • pp.981-996
    • /
    • 2008
  • Statistical matching techniques whose aim is to achieve a complete data file from different sources. Since the statistical matching method proposed by Rubin (1986) assumes the multivariate normality for data, using this method to data which violates the assumption would involve some problems. This research proposed the statistical matching method using robust regression as an alternative to the linear regression. Furthermore, we carried out a simulation study to compare the performance of the robust regression model and the linear regression model for the statistical matching.

Check for regression coefficient using jackknife and bootstrap methods in clinical data (잭나이프 및 붓스트랩 방법을 이용한 임상자료의 회귀계수 타당성 확인)

  • Sohn, Ki-Cheul;Shin, Im-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.4
    • /
    • pp.643-648
    • /
    • 2012
  • There are lots of analysis to determine the relation between dependent variable and explanatory variables. Often the regression analysis is used to do this, and we can analyze the how much the explanatory variable can be related with dependent variable and how much the regression model can explain the data. But the validation check of regression model is usually determined by coefficient of determination. We should check the validation of regression coefficient with different methods. This paper introduces the method for validation check the regression coefficient using the jackknife regression and bootstrap regression in clinical data.

A study on semi-supervised kernel ridge regression estimation (준지도 커널능형회귀모형에 관한 연구)

  • Seok, Kyungha
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.2
    • /
    • pp.341-353
    • /
    • 2013
  • In many practical machine learning and data mining applications, unlabeled data are inexpensive and easy to obtain. Semi-supervised learning try to use such data to improve prediction performance. In this paper, a semi-supervised regression method, semi-supervised kernel ridge regression estimation, is proposed on the basis of kernel ridge regression model. The proposed method does not require a pilot estimation of the label of the unlabeled data. This means that the proposed method has good advantages including less number of parameters, easy computing and good generalization ability. Experiments show that the proposed method can effectively utilize unlabeled data to improve regression estimation.

Dynamic graphic approach for regression diagnostics system (REDS) (동적그래픽스에 의한 회귀진단시스템(REDS)의 구현)

  • 유종영;안기수;허문열
    • The Korean Journal of Applied Statistics
    • /
    • v.10 no.2
    • /
    • pp.241-251
    • /
    • 1997
  • Several studies have bee down on the work of dynamic graphical methods for regression diagnostics. The main propose of the methods were to investigate (1) the effects of change of data, or (2) the effects of change of regression coefficients on the regression models. But, by contrast, we can also investigate the effects of change of regression residuals on the regression model. This method can be used in fitting better a certain set of observations to a regression model than the other observations. Our research team approaches regression diagnostics by using dynamic graphics (REDS), and we introduce REDS in this thesis.

  • PDF

A Study on the Recursive Identification of Modal Parameters (회귀적 방법에 의한 모우드 변수 규명에 관한 연구)

  • 고장욱;이재응
    • Proceedings of the Korean Society for Noise and Vibration Engineering Conference
    • /
    • 1995.04a
    • /
    • pp.147-152
    • /
    • 1995
  • 실험에 의한 모우드 해석 방법들은 1980년대부터 활발히 연구되어 많은 새로운 방법들이 개발되어 발표되었다. 그러나 개발된 대부분의 방법들은 측정된 데이타를 일괄처리하는 밸치(또는 off-line) 방법들이다. 최근에는 시간에 따라서 변하는 구조물의 동특성을 규명하는 분야에 모우드 해석 방법이 응용되어 사용되고 있다. 이러한 응용분야에서는 모우드 변수들의 변화되는 값을 새로운 데이타가 샘플링 될 때마다 그 값들을 수정하면서 추정할 수 있는 회귀적인(recursive 또는 on-line) 방법을 사용하여야 한다. Davies와 Hammond[1]는 회귀적 선형 자승법(Recursive Least Squares : RLS)을 이용하여 모우드 변수를 구하고 이를 벧치방법인 Instrumental Variable 방법과 Fourier 방법의 결과와 비교하였다. 그러나, 그 결과에서 보여준것처럼 RLS 방법은 잡음 대 시호비가 낮을 때에만 모우드 변수 값들을 정확하게 추정할 수 있었다. Sundararajan과 Montgomrey[2]는 회귀적 선형 최소자승 격자필터(lattice filter)를 이용하여 구조물의 차수(order)와 고유진동형, 그리고 진폭을 결정한 후 이를 토대로 회귀적 gradient형태의 방정식 오차 규명 방법(equation-error identification algorithm)에 의하여 모우드 변수들을 추정하였다. 이 방법은 2차원 격자구조물의 모우드 변수 추정에 사용되었으며, 또한 적응모우드제어에도 성공적으로 이용되었다. 그러나, 이 방법도 잡음 대 신호비가 낮은 환경에서만 사용할 수 있다는 단점이 있다. 위에서 언급한 방법들은 모두 RLS 방법을 기초로 하여 개발되었으나, RLS 방법은 전형적인 결정적(deterministic)방법으로서 잡음이 섞인 데이타를 처리하기에는 부적절한 방법임이 널리 알려진 사실이다[3]. 최근에 Ben Mrad와 Fassois[4]는 신호에 잡음이 존재하여도 이를 잘 처리할 수 있는 확률적(stochastic) 방법을 개발하여 기존의 결정적 방법들과 그 결과를 비교하였다. 그러나, 개발된 방법은 응답 신호에 백색잡음(white noise)이 섞이는 특수한 경우에만 사용할 수 있게 만들어져서 이 방법의 실질적인 적용에는 어려움이 있다. 본 연구에서는 기존의 방법들의 단점을 극복할 수 있는 새로운 회귀적 모우드 변수 규명 방법을 개발하였다. 이는 Fassois와 Lee가 ARMAX모델의 계수를 효율적으로 추정하기 위하여 개발한 뱉치방법인 Suboptimum Maximum Likelihood 방법[5]를 기초로 하여 개발하였다. 개발된 방법의 장점은 응답 신호에 유색잡음이 존재하여도 모우드 변수들을 항상 정확하게 구할 수 있으며, 또한 알고리즘의 안정성이 보장된 것이다.

  • PDF

Predicting Financial Success of a Movie Using Multiple Regression Analysis (다중회귀 분석을 이용한 영화 흥행 예측)

  • Jeong, Hoe-Yun;Yang, Hyung-Jeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.07a
    • /
    • pp.275-278
    • /
    • 2013
  • 영화의 흥행 요소를 파악하여 영화의 흥행 여부를 예측하는 것은 영화의 수익성 부분에서 아주 중요하다. 영화 시장이 과거와는 다르게 증가함에 따라, 다양한 영화 흥행에 관한 예측 연구들이 개발되었다. 본 논문에서는 영화 흥행 요소들을 수집하고 다중회귀 분석을 통해서 유의수준을 만족하는 흥행 요소들을 선택한다. 그 후, 이러한 요소들을 예측 방법들의 입력값으로 사용하여 영화 흥행을 예측한다. 성능을 비교하기 위해 본 논문에서 제안한 방법과 현재 개발된 영화 흥행 예측 방법(다중회귀, 의사결정트리, 인공신경망)들을 정확도와 평균제곱근오차를 통해 예측 모형의 성능을 비교한다. 그 결과, 다중 회귀 분석을 통해 유의한 흥행요소들만을 고려한 예측 방법의 정확도가 모든 흥행 요소들을 고려한 예측 방법보다 평균 8.2% 향상되었고, 현재까지 개발된 영화 흥행 예측 방법보다 더 높은 예측 성능을 보여준다.

  • PDF

Nonparametic Kernel Regression model for Rating curve (수위-유량곡선을 위한 비매개 변수적 Kernel 회귀모형)

  • Moon, Young-Il;Cho, Sung-Jin;Chun, Si-Young
    • Journal of Korea Water Resources Association
    • /
    • v.36 no.6
    • /
    • pp.1025-1033
    • /
    • 2003
  • In common with workers in hydrologic fields, scientists and engineers relate one variable to two or more other variables for purposes of predication, optimization, and control. Statistics methods have improved to establish such relationships. Regression, as it is called, is indeed the most commonly used statistics technique in hydrologic fields; relationship between the monitored variable stage and the corresponding discharges(rating curve). Regression methods expressed in the form of mathematical equations which has parameters, so called parametric methods. some times, the establishment of parameters is complicated and uncertain. Many non-parametric regression methods which have not parameters, have been proposed and studied. The most popular of these are kernel regression method. Kernel regression offer a way of estimation the regression function without the specification of a parametric model. This paper conducted comparisons of some bandwidth selection methods which are using the least squares and cross-validation.

Fuzzy Theil regression Model (Theil방법을 이용한 퍼지회귀모형)

  • Yoon, Jin Hee;Lee, Woo-Joo;Choi, Seung-Hoe
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.4
    • /
    • pp.366-370
    • /
    • 2013
  • Regression Analysis is an analyzing method of regression model to explain the statistical relationship between explanatory variable and response variables. This paper introduce Theil's method to find a fuzzy regression model which explain the relationship between explanatory variable and response variables. Theil's method is a robust method which is not sensive to outliers. Theil's method use medians of rate of increment based on randomly chosen pairs of each components of ${\alpha}$-level sets of fuzzy data in order to estimate the coefficients of fuzzy regression model. We propose an example to show Theil's estimator is robust than the Least squares estimator.

Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data (근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교)

  • Baek, Seung Hyun
    • Journal of the Korea Safety Management & Science
    • /
    • v.15 no.4
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

Nonlinear feature extraction for regression problems (회귀문제를 위한 비선형 특징 추출 방법)

  • Kim, Seongmin;Kwak, Nojun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.86-88
    • /
    • 2010
  • 본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.

  • PDF