• 제목/요약/키워드: 회귀분석 방법

검색결과 3,610건 처리시간 0.032초

공간자료 주성분분석 (Principal component regression for spatial data)

  • 임예지
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.311-321
    • /
    • 2017
  • 주성분 분석은 통계학 뿐만 아니라 기상학에서 널리 사용되는 방법론이며, 고차원 자료에 대한 차원축소 역할 뿐만아니라 기상자료에서의 의미있는 패턴을 찾아내기 위해 사용되는 방법론이다. 또한 주성분분석에 기반을 둔 주성분 회귀분석 방법론은 기후예측이 가능하므로 미래 시점의 기후값 예측에 사용될 수 있다. 본 논문에서는 Wang과 Huang (2016) 논문에서 제안한 제한된 공간 주성분 분석을 기반으로 한 주성분 회귀분석 방법론을 개발하였다. 이를 시뮬레이션을 통하여 확인하였고, 실제 자료인 동아시아 지역 온도예측에 적용하여 기존의 주성분 회귀분석 예측 값에 비해 예측력이 높아짐을 확인하였다.

준지도 커널능형회귀모형에 관한 연구 (A study on semi-supervised kernel ridge regression estimation)

  • 석경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.341-353
    • /
    • 2013
  • 데이터마이닝과 기계학습의 응용분야에서는 라벨 없는 자료를 이용하는 연구가 많이 진행되고 있다. 이러한 연구는 분류문제에 집중되었다가 최근에 회귀분석문제로 관심이 모아지고 있다. 본 연구에서는 커널능형회귀모형 형태의 준지도 회귀분석 방법을 제시한다. 제안된 방법은 기존의 전환적 방법과는 달리 라벨 없는 자료의 라벨을 추정하는 과정을 필요로 하지 않기 때문에 선택해야 할 모수의 수도 적고, 계산과정도 단순할 뿐 아니라 일반화에 강점이 있다. 모의실험과 실제 자료 분석을 통해 제안된 방법이 라벨 없는 자료를 잘 활용하여 라벨 있는 자료만 이용하는 방법보다 더 우수한 추정을 하는 것을 볼 수 있었다.

로지스틱 회귀분석 및 AHP 기법을 이용한 산사태 위험지역 분석 (Analysis of Landslide Hazard Area using Logistic Regression Analysis and AHP (Analytical Hierarchy Process) Approach)

  • 이용준;박근애;김성준
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.861-867
    • /
    • 2006
  • 본 연구에서는 안성시($520km^2$)를 대상으로 Logistic 회귀분석 방법과 AHP 기법을 이용하여, GIS와 RS 자료를 활용한 산사태 위험지를 분석하였다. Logistic 회귀분석과 AHP 기법에는 6개의 인자(경사, 경사향, 고도, 토양배수, 토심, 토지이용)를 사용하여, 7등급으로 산사태 위험도를 분류하였다. Logistic 회귀분석 방법과 AHP 기법을 이용한 산사태 위험지도를 표본 자료와 비교하면 산사태가 발생한 표본에서 산사태 위험성이 높은(1-2등급)지역이 Logistic 회귀분석에서는 46.1% AHP 기법은 48.7%로 분류되어 AHP 기법이 분류도가 높다고 분석되었다. Logistic 회귀분석과 AHP 기법은 서로 분석 과정의 차이를 가지고 있기 때문에 Logistic 회귀분석과 AHP기법을 적용한 결과에 동일 가중치를 부여한 후 7개 등급으로 재분류(reclass)하여 산사태 위험지역을 추출할 수 있는 방법론을 본 연구에서 제시하였다. 그 결과 산사태가 발생한 표본에서 1-2 등급지역이 58.9%로 분석되어 분류정확도를 높일 수 있었다.

다중추정방법에 의한 전자상거래 에이전트 (Electronic Commerce Agent using Multi-Estimation Method)

  • 김우정;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.310-312
    • /
    • 2000
  • 추정을 위한 방법으로는 K-NN과 회귀분석, 신경망 등의 다양한 방법을 적용할 수 있다. 그러나 K-NN의 경우 거리에 의해서만 결과를 추정하므로 각 속성에 대한 가중치가 속성 값들의 간격에 의해 결정되고, 회귀분석은 하나의 선으로 데이터의 경향을 표현하므로 속성의 가중치는 고려되지만, 데이터의 분포가 넓을 경우에는 많은 오차를 포함하게 되는 데이터에 의존적인 문제가 존재한다. 따라서 본 연구에서는 이러한 방법들을 혼합하여 데이터에 의존적인 문제를 보안할 수 있는 다중분석방법을 제안한다.

  • PDF

회귀분석을 위한 로버스트 신경망

  • 황창하;김상민;박희주
    • Communications for Statistical Applications and Methods
    • /
    • 제4권2호
    • /
    • pp.327-332
    • /
    • 1997
  • 다층 신경망은 비모수 회귀함수 추정의 한 방법이다. 다충 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있다. 그러나 이 알고리즘은 이상치에 매우 민감하여 이상치를 포함하고 있는 자료에 대하여 원하지 않는 회귀함수를 추정한다. 본 논문에서는 통계물리에서 자주 사용하는 방법을 이용하여 로버스트 역전파 알고리즘을 제안하고 수학적으로 신경망과 매우 유사한 PRP(projection pursuit regression) 방법, 일반적인 역전파 알고리즘과 모의실험을 통해 비교 분석한다.

  • PDF

회귀분석을 이용한 Data Editing

  • 허문열
    • 한국경영과학회지
    • /
    • 제5권1호
    • /
    • pp.89-90
    • /
    • 1980
  • 원래 다량자료의 정리(Large Scale Data Screening)는 어떤 정립된 이론에 의해 수행되는 것보다는 그 자료자체가 가지는 성격과 자원의 Availability 등을 고려하여 수행되는 것이 상례이다. 여기서는 여러 방법 중 자료가 모두 수치로 나타나는 경우 자료정리의 한 유용한 방법으로 회귀분석을 사용하는 방법에 대해 설명코자 한다.

  • PDF

극단치 분포의 모수 추정방법 비교 연구(회귀 분석법을 기준으로) (Comparison Study of Parameter Estimation Methods for Some Extreme Value Distributions (Focused on the Regression Method))

  • 우지용;김명석
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.463-477
    • /
    • 2009
  • 극단치 분포의 모수 추정방법으로 최우추정법, 확률가중적률법, 회귀분석법은 기존 연구에서 활발하게 적용되어져 왔다. 그러나 이들 세 가지 추정방법 가운데, 회귀분석법의 우수성은 엄격하게 평가되어진 적이 없다. 본 논문에서는 몬테칼로 시뮬레이션을 통하여 Generalized Extreme Value(GEV) 분포와 Generalized Pareto(GP) 분포의 모수 추정에 회귀분석법 및 다른 추정방법을 적용하여 비교 연구한다. 시뮬레이션 결과, 표본의 크기가 작은 경우 회귀분석 법은 GEV 분포의 위치모수 추정시 편의 측면과 효율성 측면에서 다른 방법보다 우수한 경향을 나타내었다. GP 분포의 규모모수 추정시에는 표본의 크기 가 작을 경우 회귀분석법이 다른 방법보다 작은 편의를 나타내었다. 회귀분석법은 표본의 크기 가 작거나 적당히 큰 경우에도 GEV 분포나 GP 분포의 형태모수 추정시에 형태모수의 값이 -0.4일 경우, 다른 방법보다 우수한 경향을 나타내었다.

Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석 (Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression)

  • 김상욱;이길성;성진영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

임상의를 위한 다변량 분석의 실제 (Multivariate Analysis for Clinicians)

  • 오주한;정석원
    • Clinics in Shoulder and Elbow
    • /
    • 제16권1호
    • /
    • pp.63-72
    • /
    • 2013
  • 임상 의학의 연구에 사용되는 대표적 다변량 분석 방법은 다중 회귀 분석 방법인데, 이는 인과 관계를 토대로 여러 개의 변수에 의한 한꺼번에의 영향력을 분석하기 위한 방법이다. 다중 회귀 분석은 기본적으로 회귀 분석의 기본 가정을 만족해야 함은 물론, 여러 개의 독립 변수들이 포함되기 때문에 변수들을 모형에 포함시키는 방법 및 다중 공선성 문제에 대한 고려가 필요하다. 다중 회귀 분석 모형의 설명력은 결정 계수 $R^2$으로 표현되어 1에 가까울수록 설명력이 크며, 각 독립 변수들의 결과에의 영향력은 회귀 계수인 ${\beta}$값으로 표현된다. 다중 회귀 분석은 종속 변수의 형태에 따라 다중 선형 회귀 분석, 다중 로지스틱 회귀 분석, 콕스 회귀 분석으로 나눌 수 있다. 종속 변수가 연속 변수인 경우 다중 선형 회귀 분석, 범주형 변수인 경우 다중 로지스틱 회귀 분석, 시간의 영향을 고려한 상태 변수인 경우는 콕스 회귀 분석을 시행해야 하며, 각각 결과에의 영향력은 회귀 계수 ${\beta}$, 교차비, 위험비로 평가한다. 이러한 다변량 분석에 대한 이해는 연구를 계획하고 결과를 분석하고자 하는 임상 의사에게 있어 보다 효율적인 연구를 위해 필수적인 소양이라고 할 수 있다.

지역회귀분석을 이용한 홍수 피해금액 추정 (Flood Damage Estimation Using Regional Regression Analysis)

  • 장옥재;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.74-78
    • /
    • 2009
  • 우리 사회가 발전함에 따라 재해의 위험으로부터도 안전하게 살고자 하는 대중들의 욕구 또한 증가하고 있다. 하지만 최근의 기후변화와 이상홍수의 사례에서 볼 때 현재 우리가 처해 있는 자연재해로부터의 위협은 과거와는 상이하다는 것을 알 수 있다. 이러한 위협에 대처하기 위해서는 우리에게 노출된 재해의 특성을 평가하는 과정이 무엇보다 선행되어져야 한다. 홍수로 인한 피해는 대부분이 인명이나 재산피해가 주를 이루기 때문에 홍수위험도의 평가결과도 발생 가능한 인명이나 재산피해로 표현되는 것이 적절하다고 판단된다. 따라서 본 연구에서는 지역회귀분석을 적용하여 가능 홍수 피해금액을 추산하고, 이를 통해 각 지역별 홍수위험도를 평가하는 방법을 제안하였다. 지역회귀분석은 강우유출모형이나 확률분포모형의 매개변수들을 유역 특성인자들로 표현하기 위해 수문학 분야에서 사용되어져 왔으며 본 연구에서는 이 방법을 홍수 피해금액 추정에 응용하였다. 지역회귀방법의 절차는 먼저 계측지역에서는 홍수 피해금액과 시강우량 자료를 바탕으로 비선형회귀분석을 실시한 후 이 회귀식의 계수를 다시 해당 지역의 인문 사회 경제학적 인자들로 표현하였다. 이러한 방법을 통해 지역적 인자들이 홍수 피해에 미치는 영향을 정량적으로 분석할 수 있었으며 궁극적으로 미계측지역에서도 지역적 인자들을 통해 특정 빈도에 발생 가능한 홍수 피해금액을 추정할 수 있었다. 최종적으로 추정된 홍수 피해금액과 지역 총 자산의 비를 통해 홍수위험지도를 작성하였다. 본 연구결과를 수자원장기종합계획에서 홍수위험도 평가를 위해 사용된 홍수피해잠재능(Potential Flood Damage; PFD)과 비교해 보면 PFD에서는 각 인자들의 가중치 산정에서 전문가의 주관이 개입될 수 있다는 단점이 있었으나 과거 피해금액과의 상관관계를 분석한 본 연구에서는 이러한 단점을 극복할 수 있었다.

  • PDF