• 제목/요약/키워드: 회귀분석방법

검색결과 3,630건 처리시간 0.033초

방향성 공간적 조건부 자기회귀 모형의 베이즈 분석 방법 (Bayesian analysis of directional conditionally autoregressive models)

  • 경민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1133-1146
    • /
    • 2016
  • 공간통계 방법 중 지역에 대한 어떤 집합체 자료나 평균자료들을 분석하는데 일반적으로 공간적 자기회귀 (conditionally autoregressive) 모형을 사용한다. 공간적 자기회귀 모형에 정의되는 공간적 이웃 소지역들은 중점의 거리나 근접성으로 정의된다. Kyung과 Ghosh (2009)는 방향에 따라서 이웃간 자기상관성의 크기가 다른 확장된 공간 모형을 제시하였다. 제안된 방향적 조건부 자기회귀 (directional conditionally autoregressive) 모형은 고유 이방성을 모형화하여 기존의 CAR과정을 일반화한다. 제시한 방향적 조건부 자기회귀모형의 모수추정으로 마르코프 체인 몬테 카를로 방법을 기반으로 한 베이즈 추정법을 제시한다. 제시한 모형을 스코틀랜드 그레이터 글래스고우의 로그변환된 부동산 가격에 적용하여 조건부 자기회귀모형과 비교하였다.

주성분회귀분석을 이용한 한국프로야구 순위 (Predicting Korea Pro-Baseball Rankings by Principal Component Regression Analysis)

  • 배재영;이진목;이제영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.367-379
    • /
    • 2012
  • 야구경기에서 순위를 예측하는 것은 야구팬들에게 관심의 대상이 된다. 이러한 순위를 예측하기 위해서 2011년 한국프로야구 기록 자료를 바탕으로 산술평균방법, 가중평균방법, 주성분분석방법, 주성분회귀분석 방법을 제시한다. 표준화를 통한 산술평균, 상관계수를 이용한 가중평균과 주성분 분석을 이용해서 순위를 예측하고, 최종모형으로 주성분회귀분석 모형이 선택되었다. 주성분 분석으로 축약된 변수를 이용해서 회귀분석을 실시하여, 투수부분, 타자부분, 투수와 타자부분의 순위예측 모형을 제안한다. 예측된 회귀모형을 통해서 2012년도 순위 예측이 가능하다.

가중치 부여 방법에 따른 가중 비선형 회귀 쌍곡선법의 침하 예측 정확도 분석 (Settlement Prediction Accuracy Analysis of Weighted Nonlinear Regression Hyperbolic Method According to the Weighting Method)

  • 곽태영;우상인;홍성호;이주형;백성하
    • 한국지반공학회논문집
    • /
    • 제39권4호
    • /
    • pp.45-54
    • /
    • 2023
  • 설계 단계에서의 침하 예측은 주로 이론적 침하 예측 방법에 의해 수행되지만, 정확도의 문제로 인해 시공 단계에서는 주로 시간에 따른 침하량 계측 결과를 토대로 장래 침하량을 예측하는 계측 기반 침하 예측 방법을 적용하고 있다. 계측 기반 침하 예측 방법 중에서도 쌍곡선법이 주로 쓰이고 있으나 기존의 쌍곡선법은 정확도가 떨어지며 통계적 측면에서 한계점이 명확하기 때문에, 가중 비선형 회귀 분석 기반의 쌍곡선법이 제안된 바 있다. 본 연구에서는 가중 비선형 회귀 쌍곡선법에 두 가지 가중치 부여 방식을 적용하여 침하 예측 정확도를 비교 분석하였다. 부산 신항에 위치한 두 현장에서 측정한 지표침하판 데이터를 활용했으며, 회귀분석 구간을 전체 데이터에 30, 50, 70%로 설정해 나머지 구간의 침하를 예측했다. 그 결과, 가중치 부여 방식과 무관하게 쌍곡선법 기반의 침하 예측 방법은 모두 회귀 분석 구간이 증가할수록 정확도가 높게 나타났으며, 가중 비선형 회귀 쌍곡선법을 통해 기존 선형 회귀 쌍곡선법 보다 정확하게 침하를 예측할 수 있었다. 특히 더 작은 회귀분석 구간이 적용되었음에도 가중 비선형 회귀 쌍곡선법이 기존 선형 회귀 쌍곡선법에 비해 높은 침하 예측 성능을 보여, 가중 비선형 회귀 쌍곡선법을 통해 훨씬 빠르고 정확하게 침하량을 예측할 수 있음을 확인했다.

다중추정방법에 의한 전자상거래 에이전트 (Electronic Commerce Agent using Multi-Estimation Method)

  • 김우정;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.310-312
    • /
    • 2000
  • 추정을 위한 방법으로는 K-NN과 회귀분석, 신경망 등의 다양한 방법을 적용할 수 있다. 그러나 K-NN의 경우 거리에 의해서만 결과를 추정하므로 각 속성에 대한 가중치가 속성 값들의 간격에 의해 결정되고, 회귀분석은 하나의 선으로 데이터의 경향을 표현하므로 속성의 가중치는 고려되지만, 데이터의 분포가 넓을 경우에는 많은 오차를 포함하게 되는 데이터에 의존적인 문제가 존재한다. 따라서 본 연구에서는 이러한 방법들을 혼합하여 데이터에 의존적인 문제를 보안할 수 있는 다중분석방법을 제안한다.

  • PDF

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.

독립변수의 차원 감소에 의한 일반회귀 신경망의 성능개선 (Performance Improvement of General Regression Neural Network by Reducing Dimensionality of Independent Variables)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제10권6호
    • /
    • pp.533-541
    • /
    • 2000
  • 본 논문에서는 독립변수들의 차원을 감소시켜 일반회귀 신경망의 성능을 개선하는 방법을 제안하였다. 제안된 방법에서는 적응적 학습 알고리즘의 주요성분분석 기법을 이용하여 독립변수 패턴의 특징을 추출하고 이를 일반회귀 신경망의 학습데이터로 이용하였다. 이는 주요성분분석 기법이 가지는 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 일반회귀 신경망이 가지는 제약을 해결하기 위함이다. 제안된 기법의 일반회귀 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 일반회귀 신경망에 의한 결과와 비교할 때 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 그리고 커널함수의 평활요소 설정 면에서도 우수한 특성이 있음을 확인할 수 있었다.

  • PDF

베이지안 회귀분석을 이용한 수위-유량 관계곡선의 불확실성 분석 (Identification of Uncertainty in Fitting Rating Curve with Bayesian Regression)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권9호
    • /
    • pp.943-958
    • /
    • 2008
  • 본 연구는 수위-유량 관계곡선식의 매개변수 추정을 수행하기 위하여 Bayesian 회귀분석을 적용하였다. 또한 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 최소자승법(ordinary least square, OLS)에 의한 회귀분석의 추정치를 각각 산정하여 산정결과의 신뢰구간을 비교분석 하였다. 등분산케이스의 통계적 실험결과 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 회귀분석에 의한 평균 추정치는 크게 다르지 않았으나, 비등분산 케이스의 경우에는 Bayesian 회귀분석이 참값에 가까운 추정치를 산정함을 알 수 있었다. 또한 불확실성 측면에서 평가해 볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 작은 것으로 나타났으며, 이로부터 수위-유량 관계곡선식의 매개변수를 추정하는 경우 Bayesian 회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 적용된 두 가지의 추정방법은 비등분산성을 고려한 통계적 실험을 통하여 장점과 단점이 비교되었으며, 안양천 유역의 5개 지점으로부터 얻어진 유량측정성과를 이용하여 적용성을 알아보았다. 현장 적용결과는 참값을 알지 못하므로 정량적 우수성은 평가할 수 없었으나, 기존에 사용되는 불확실성 산정방법보다 Bayesian 회귀 분석 불확실성은 감소시켜 나타냄을 알 수 있었다.

Support Vector Machines을 이용한 개인신용평가 : 중국 금융기관을 중심으로 (An Application of Support Vector Machines to Personal Credit Scoring: Focusing on Financial Institutions in China)

  • 딩쉬엔저;이영찬
    • 산업융합연구
    • /
    • 제16권4호
    • /
    • pp.33-46
    • /
    • 2018
  • 개인신용평가는 은행이 대출을 승인할 때 수익성 있는 의사결정을 적절히 유도할 수 있는 효과적인 도구이다. 최근 많은 분류 알고리즘 및 모델이 개인신용평가에 사용되고 있다. 개인신용평가 기법은 대체로 통계적 방법과 비 통계적 방법으로 구분된다. 통계적 방법에는 선형회귀분석, 판별분석, 로지스틱 회귀분석, 의사결정나무 등이 포함된다. 비 통계적 방법에는 선형계획법, 신경망, 유전자 알고리즘 및 Support Vector Machines 등이 포함된다. 그러나 신용평가모형 개발을 위해 어떠한 방법이 최선인지에 관해서는 일관된 결론을 내리기는 어렵다. 본 논문에서는 중국 금융기관의 개인 신용 데이터를 사용하여 가장 대표적인 신용평가 기법인 로지스틱 회귀분석, 신경망 그리고 Support Vector Machines의 성능을 비교하고자 한다. 구체적으로, 세 가지 모형을 각각 구축하여 고객을 분류하고 분석 결과를 비교하였다. 분석결과에 따르면, Support Vector Machines이 로지스틱 회귀분석과 신경망보다 더 나은 성능을 가지는 것으로 나타났다.

반복측정된 포아송 자료의 GEE 분석에서 산포모수의 역할에 관한 연구

  • 박태성;신민웅
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.155-165
    • /
    • 1995
  • 반복측정자료의 분석을 위해 제안된 Liang and Zeger(1986)의 회귀모형은 일반화추정식(generalized estimationg equations, GEE)을 이용하여 모형의 모수를 추정한다. 이 모형은 반복측정된 반응변수와 설명변수들과의 관계를 추정하는 것이 주된 목적이기 때문에 회귀모수는 중요한 모수로 간주되나 산포모수는 중요하지 않은 장애모수(nuisance parameters)로 간주된다. 일반적으로 GEE 분석에서 회귀모수의 추정량은 산포모수에 상관없이 일치적(consistent)으로 얻어진다고 알려져 있다. 그러나 본 논문에서는 포아송분포를 따르는 반복측정자료에 대한 사례연구와 모의 실험을 통해서 일반적으로 믿어져왔던 것과는 달리 GEE 방법이 산포모수에 민감하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법이 산포모수에 민감 하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법에서 밝혀진 회귀모수 추정량의 일치성에도 문제가 발생할 수 있음을 보였다.

  • PDF

미계측 유역의 기후변화 영향평가를 위한 수문모형 매개변수의 지역회귀분석 적용 (Applying regional regression analysis of the hydrologic model parameters for assessing climate change impacts in the ungaged watershed)

  • 김영일;서승범;김성진;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.219-219
    • /
    • 2017
  • 상대적으로 유역의 관측 자료가 충분하지 못하거나 검증되지 않았을 경우 미계측 유역으로 정의되며 수문모형의 매개변수 검정을 할 수 없으므로 다른 방법을 고안해야 한다. 이를 위해 기존 연구에서는 지역적 특성을 고려한 지역회기분석을 통해 미계측 유역의 유량을 산정하였는데, 대부분 유역의 특성과 연 평균 유출량 자료의 관계를 이용한 회귀식으로 실시간 유량의 변화를 고려하기 어려웠다. 본 연구에서는 개념적 강우-유출모형으로 많이 사용되고 있는 개념적 수문모형인 GR4J의 매개변수에 대해 미계측 유역의 특성을 고려한 변수들을 이용하여 회귀식을 구하고 그 적용성을 평가하였다. 이를 통해 미계측 유역의 유량 시계열 자료를 생성할 수 있었다. 또한 IPCC에서 발간한 AR5의 RCP 4.5 시나리오를 적용하여 미래 유출량을 산정하였다. 우선 지역회귀분석을 적용하기 위해 수문모형을 이용한 계측 유역의 유출량을 구하였으며 22개의 전국 댐 상류 지점을 기준으로 SCE 알고리즘을 이용하여 GR4J의 최적 매개변수를 구하고 각 유역별로 물리적, 지형적, 기상학적 특성을 고려하여 11개의 변수를 선택하였다. 각 변수간 다중공선성(Multicollinearity)를 고려하기 위해 VIF(Variation Inflation Factor) test를 적용하여 최종 7개의 변수를 선정하고 단계별 회귀방법(Stepwise regression)을 이용하여 GR4J의 매개변수별 회귀식을 생성하였다.

  • PDF