• 제목/요약/키워드: 선형회귀모형

검색결과 638건 처리시간 0.026초

비선형 앙상블 모형을 이용한 수문량 예측 (Hydrologic Variable Prediction Using Nonlinear Ensemble Model)

  • 권현한;김민지;김장경;나봉길
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.359-359
    • /
    • 2011
  • 기존 수자원계획에 있어서 수문량 예측은 매우 제한적으로 활용되고 있는 실정으로서 최근 기후변화 및 이상기후로 기인하는 기상학적 불확실성 증가에 대해서 효과적으로 대응 하기가 어렵다. 본 연구에서는 기상인자를 활용한 수문변량 예측기법을 개발하고자 하며 국내에 수문자료가 충분한 지역에 대해서 모형의 적합성과 타당성을 평가하고자 한다. 대부분의 수문변량은 해수면온도, 해수면기압, 바람장 등 Large Scale의 기상학적 특성과 연관성을 가지고 있으며 선행시간을 가지고 수문순환에 영향을 주고 있다. 수문변량과 기상학적 변량사이에는 일반적으로 비선형 관계를 가지고 있는 것으로 알려지고 있으며 이러한 비선형 관계를 효과적으로 예측하기 위해서 본 연구에서는 비선형 예측모형을 개발 하고자 한다. 최근 비선형 예측모형에서 불확실성을 고려한 모형에 대한 연구가 활발히 진행되고 있으며 특히, 다중 모형을 사용한 Ensemble 개념의 예측모형 도입이 이루어지고 있다. 본 연구에서는 국내 다목적댐 유입량 및 강수량에 대해서 최적 기상변량을 도출하고 이를 활용한 비선형 Ensemble 예측모형을 개발하였다. 일반적인 선형 회귀분석 모형에 비해 기상현상과 수문현상에 비선형성을 효과적으로 재현할 수 있는 장점을 확인할 수 있었으며 이와 더불어 예측결과에 대한 불확실성을 제공함으로서 신뢰성 있는 수자원 계획을 위한 기초자료로서 활용이 가능할 것으로 판단된다.

  • PDF

순위회귀모형의 새로운 스코어 함수의 효율성 연구 (Asymptotic Relative Efficiency for New Score Functions in Rank Regression Models)

  • 최영훈
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.269-280
    • /
    • 2004
  • 본 연구를 통하여 순위를 이용한 선형회귀모형의 가정된 분포형태가 우리가 실질적으로 많이 접하게 되는 비대칭분포이면서 만일 가정된 분포가 오른쪽으로 늘어진 경우일 때에는, 본 논문에서 제안된 스코어의 가능한 한 0 보다 크고 1 보다 작은 r 및 1 보다 큰 s 를 선택 (0 〈 r 〈 1, s 〉 1) 하는 것이 윌콕슨 스코어보다 높은 효율성을 나타낸다. 이와 반대로 만일 가정된 비대칭분포가 왼쪽으로 늘어진 경우일 때에는, 제안된 스코어의 가능한 한 1 보다 큰 r 및 0 보다 크고 1 보다 작은 s 를 선택 (r 〉 1, 0 〈 s 〈 1) 하는 것이 윌콕슨 스코어보다 높은 효율성을 나타낸다. 아울러 바람직한 r 과 s 를 결정하기 위한 가정된 분포의 대칭성 검정기법도 제시한다.

소지역 추정을 위한 M-분위수 커널회귀 (M-quantile kernel regression for small area estimation)

  • 심주용;황창하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.749-756
    • /
    • 2012
  • 소지역 추정을 위해 널리 사용되고 있는 방법 중 하나는 선형혼합효과모형이다. 그러나 종속변수와 독립변수 사이의 관계가 비선형일 때 이 모형은 소지역 관련 모수에 대해 편의된 추정값을 초래한다. 본 논문에서는 M-분위수 커널회귀를 사용하여 소지역의 평균을 추정하는 방법을 제안한다. 그리고 모의실험을 통하여 서포트벡터분위수회귀와 성능을 비교함으로써 제안된 방법의 우수성을 보인다.

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

다중선형 회귀분석을 이용한 고속도로 터널구간의 교통사고 예측모형 개발 (Development of Accident Forecasting Models in Freeway Tunnels using Multiple Linear Regression Analysis)

  • 박주환;김상구
    • 한국ITS학회 논문지
    • /
    • 제11권6호
    • /
    • pp.145-154
    • /
    • 2012
  • 본 논문은 고속도로 터널구간을 대상으로 교통사고특성을 다각적으로 분석하여 다양한 독립변수를 선정하고 종속변수를 건, 건/km, 건/백만대km로 다양화하여 다중선형회귀모형을 개발하였다. 그리고 개발된 모형들은 상호 비교 검토하여 최종적으로 교통사고영향요인으로 구성된 신뢰성 있는 교통사고예측모형을 결정하였다. 교통사고예측모형은 모형의 $R^2$, F값 등 검정통계량 수준, 다중공선성, 잔차분석 등 모형검증과정이 수행되었고 터널구간의 교통사고특성 반영여부 등을 검토하여 최종적으로 터널길이에 따라 총 2개의 모형을 선정하였다. 선정된 종속변수는 ln(건/백만대km)이며, 독립 변수는 연평균일교통량(AADT), 종단구배, 터널높이로 구성되었다. 추정모형은 RMSE, MAE를 이용하여 예측한 값과 실제 관측값과의 차이를 분석하여 터널구간의 교통사고를 설명하는데 적합한 모형으로 파악되었다.

왜도정규분포 기반의 측정오차모형 (Measurement Error Model with Skewed Normal Distribution)

  • 허태영;최정순;박만식
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.953-958
    • /
    • 2013
  • 본 연구에서는 정규분포 기반이 아닌 왜도정규분포 기반의 측정오차모형을 제시하고 단순선형회귀모형에서의 기울기 계수에 대하여 특성을 파악하였다. 모의실험을 통해 측정오차모형에서 단순선형회귀모형에서의 기울기 계수의 과소추정 및 감쇠의 정도를 보였다.

가산자료모형을 기초로 한 통행행태의 한계효과분석 (Marginal Effect Analysis of Travel Behavior by Count Data Model)

  • 장태연
    • 대한교통학회지
    • /
    • 제21권3호
    • /
    • pp.15-22
    • /
    • 2003
  • 교통수요예측의 통행발생단계에서 일반적으로 선형회귀모형이 활용되고 있다. 이러한 선형회귀모형은 여러가지 방법론적 한계성과 실용적 지속성을 가지지 못하는 경향을 보인다. 첫째, 종속변수로 이용되는 통행발생의 경우 비음정수(non-negative integer : 0, 1, 2 등)의 이산분포특징을 보이나, 선형회귀모형에서는 종속변수가 연속확률분포 인 정규분포의 특징을 가진 것으로 가정한다. 둘째, 모형이 자료측정에 적용되었을 때 음(-)의 결과를 산정 할 수 있으며, 독립변수의 증감에 따라 결과 값을 너무 높게 혹은 낮게 예측하는 경우가 있다 셋째, 예측된 값이 정상적인 범위 내에 있을 지라도 예측된 통행수만을 제시 할 뿐, 통행발생빈도에 대한 이산확률분포는 제공하지 않는다. 이같은 한계점을 극복하기 위해 주로 활용되어온 가산자료모형이 포와송모형이다. 그러나 포와송모형의 경우 자료의 평균과 분산이 동일하다는 가정하에 활용되고 있어 자료상에 과산포가 존재할 경우 오차를 과소평가 할 경향이 높아 모형의 신뢰성에 문제가 발생됨으로 기타 다른 가산자료모형의 적용을 고려해야한다. 연구에서는 과산포검정을 통해 통행발생빈도상에 과산포 존재를 밝혀내고 포와송모형의 부적합함을 제시하였으며 Vuong 검정을 통해 최적의 모형을 선정하였다. 선정된 모형을 대상으로 우도비검정과 Theil 부등계수에 의해 모형의 신뢰도와 정확성을 조사하였다. 최종적으로 가구의 사회경제적 속성의 변화에 따른 통행발생의 변화를 측정하기 위한 민감도 분석을 실시하였다.

비선형 회귀분석과 구조방정식을 이용한 지방부 4지 신호교차로의 사고요인분석 (A Causation Study for car crashes at Rural 4-legged Signalized Intersections Using Nonlinear Regression and Structural Equation Methods)

  • 오주택;권일;황정원
    • 대한교통학회지
    • /
    • 제31권1호
    • /
    • pp.65-76
    • /
    • 2013
  • 사고발생의 주요지점인 신호교차로 교통사고 발생건수는 해마다 증가하고 있어 교통사고를 감소시키기 위한 원인 규명이 매우 필요하다. 국내에서 연구되어진 기존의 교통사고예측 모형들은 대부분 Poisson 모형 등의 비선형 회귀분석을 이용한 사고원인분석이 주를 이루고 있다. 비선형 Econometrics 분석기법들이 사고의 성격을 분석하는데 가장 중요한 통계적 기법이기는 하지만, 도로에서 발생하는 교통사고의 원인분석적 차원에서 접근하면 이런 사고예측 모형들만 가지고 사고발생의 설명변수들을 규명하는데 구조적인 한계가 발생한다. 이는 이러한 통계적 방법들이 사고의 예측력을 높이는데 중점을 두고, 이를 위해 소수의 유효한 설명변수들만을 모형식에 포함시키기 때문이다. 따라서 사고에 대해 보다 구체적인 원인규명을 위해서는 비선형회귀분석모형의 개발과 동시에 비선형 Econometrics 분석기법의 단점을 보완하는 또 다른 통계적 노력이 필요하다. 이에 본 연구에서는 Poisson기법을 이용하여 지방부 4지 신호교차로의 사고예측모형을 개발하였고, 동시에 복합적인 인과관계를 증명하는데 다중변수관계를 포괄적으로 측정하여 탐색하는 구조방정식을 이용하여 사고모형을 개발하여 Poisson 모형의 결과값과 비교 분석하였다.

ANN과 회귀모형의 오차 수정을 통한 댐 유입량 예측 향상 (Improving Forecasts of Dam Inflow Using Rescaling Errors From ANN and Regression Model)

  • 장선우;유지영;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1164-1168
    • /
    • 2010
  • 수자원이 우리 생활의 전반적으로 중요한 역할을 차지하면서 댐의 효율적인 운영과 안정적인 용수공급에 대한 연구는 지속적으로 수행되어지고 있다. 1990년대 이후 비선형적인 특성을 잘 모의하는 장점을 가진 인공신경망(ANN)을 이용하여 유입량 예측에 대한 많은 연구가 수행되었다. 하지만 ANN 모형을 포함한 회귀모형은 월 강우 및 유입량의 예측에 대해 간편하게 사용을 할 수 있지만, 예측의 정확성에 한계를 가지고 있다. 본 연구에서는 ANN 모형과 회귀모형의 예측오차를 후처리 과정을 통하여 오차를 줄임으로써 예측모형의 성과를 향상시키는 방법을 제안하였다. 연구지역은 금강수계의 대청댐 유역으로, 1982년 9월부터 2005년 12월에 해당하는 유역 내 11개 지점의 강우관측소에서 관측한 월 강우와 댐 유입량을 수집하여 모형을 구축하였다. 강우량과 유입량 자료에 대해 자기상관함수와 교차상관함수를 이용하여 입력변수를 결정하였고, 정규화를 통한 전처리 과정을 거쳐 ANN 모형과 회귀모형을 이용한 예측모형을 구축하였으며, 예측성과의 향상을 위하여 군집 분석을 이용하여 오차를 재조정하였다. 이러한 오차 후처리 과정을 포함한 모형은 RMSE와 상관계수를 이용하여 비교 평가한 결과, 예측성과를 약 40% 정도 향상시켰다.

  • PDF