• 제목/요약/키워드: 회귀분석방법

검색결과 3,630건 처리시간 0.036초

Quantile Regression을 활용한 우리나라 극치강수량 경향성 분석 (Trend analysis of extream precipitation in Korea using Quantile Regression)

  • 소병진;권현한;박래건
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.369-370
    • /
    • 2012
  • 일반적으로 회귀분석의 최적화는 평균적인 개념을 확장하여 사용되어지고 있다. 평균은 관찰값들에 관한 모든 정보와 관련된 통계량으로써 많은 연구에 이용되어지고 있다. 정규분포를 이루는 모집단의 경우 평균을 사용한 추정이 바람직하지만, 이상치로 인한 분포의 꼬리가 두꺼워지는 경우 중위수(median)를 사용하는 것이 바람직하다고 알려져 있다. 강수량의 분포형태는 꼬리(tail)가 두꺼운 왜곡된 형태를 갖고 있으므로 robust 통계량인 Quantile을 이용한 강수량의 분석 및 평가를 실시하였다. 본 연구에서는 Quantile에 따른 회귀선의 변화를 이용하여 강수량의 경향성을 평가하고, 극치강수량의 변화를 보여줄 수 있는 Quantle값을 추출해 보고자 한다. 또한 bootstrap 방법을 이용하여 Quantile에 따른 회귀계수의 신뢰구간을 분석하여 회귀인자의 신뢰성을 평가하였다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 이상값의 영향을 저감시키는 평균과 달리 이상값의 영향을 효과적으로 분리 및 재현시킬 수 있어 극치값에 따른 변화를 효과적으로 평가할 수 있으며, robust 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있다.

  • PDF

생활용수 회귀수량 산정방법의 개선연구 -중랑천 유역을 대상으로- (A Study on Improving Estimation of Recurrence Rate of Public Water -Jungnangcheon Watershed-)

  • 정충길;안소라;조형경;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.509-509
    • /
    • 2015
  • 물 수요관리측면에 대한 정책을 수립하기 위해서는 현재 또는 장래에 대한 용수수급의 정확한 이해를 필요로 한다. 이를 위해서는 용수 수요량 및 공급량뿐만 아니라 여러 산정요소를 필요로 하는데, 그 중 회귀수량은 물이 이용되고 다시 하천으로 회귀되어 이용될 가능성이 있는 수량으로 정의되며, 용수수급 및 용수절약 측면에서 회귀 수량은 중요한 요소라 할 수 있다. 회귀수량 조사는 유역조사 사업 이래, 10년간 생?공용수를 중심으로 미시적, 거시적으로 조사를 시행하였으나, 측정 자료의 신뢰도, 조사방법 및 지점선정 등의 문제로 인하여 조사 성과의 활용성이 매우 낮은 실정이다. 수자원장기종합계획등에서는 수자원관련 계획 수립시 생?공용수의 회귀율을 65 %로 적용하고 있으나, 이는 1970년대 말의 사회적 여건 및 경제적 상황이 반연된 결과로 현재 상황에 적용되기 곤란하다. 따라서, 현재 실정에 맞는 회귀율 산정은 반드시 필요하게 된다. 본 연구에서는 기존 생활용수 회귀수량 산정 연구 한계를 보완하고 유역조사 시행을 위한 개선된 회귀수량을 산정하고자 한다. 본 연구는 서울시 중랑물재생센터 처리구역을 기반으로 중랑천유역을 시험유역으로 선정하였다. 기존 회귀수량 산정방법을 개선하기 위해 시험유역 회귀수량 산정을 위한 가용 자료 분석 및 용수흐름 네트워크 공간분석을 추가로 진행하였다. 가용자료로 시험 유역내 상수공급자료(정수장 공급량, 상수계통도, 유수 및 누수율), 하수처리자료(하수처리구역도, 하수처리계통도, 유입량 및 방류량) 및 기상자료(기상청 지점 및 AWS 강우자료)를 구축하였고 각각의 상수계통도 및 하수처리계통도로부터 용수 흐름 네트워크망을 구축하였다. 상수공급자료로부터 상수계통도 공급지역을 구분하여 월별 유수율에 따른 월별 실 공급량을 산정하였다. 하수처리자료로부터 시험유역에서의 월별하수처리 유입량 및 방류량을 산정하였다. 최종적으로 회귀율(하수처리 방류량/실 공급량)을 산정한 결과 연평균 회귀율은 각각 93.97 %(2011년), 95.02%(2012년)로 과잉 추정 되었으며 7 ~ 9월의 회귀율은 110 ~ 120 %로 유입량을 초과하였다. 이는, 하수처리로 유입되는 유입량의 하수관거는 합류식으로 구축되어 7 ~ 9월에 많은 양의 강우량이 우수관을 통해 하수처리장으로 이송되어 생활용수 이외에 자연적인 공급량으로 인한 것으로 분석되었다. 따라서, 월별 회귀율 산정을 위해서는 불투수층에서의 면적강우량(mm)을 유입량(m3/s)으로 환산된 값을 고려하여 회귀율을 재산정하였다. 그 결과 연평균 회귀율은 각각 78.27 %(2011년), 77.58 %(2012년)로 나타났다.각각의 월별 회귀율도 매우 유사하게 나타났으며 과거 관용적으로 사용된 65 % 회귀율보다 약 12 ~ 13%로 증가하였으며 이는, 하수처리시설 구축 및 처리효율의 증가와 상수처리시설의 관로시설의 개량으로 인한 유수율 및 누수율 감소로 회귀율이 증가한 것으로 판단된다.

  • PDF

기운 일반화 t 분포를 이용한 이진 데이터 회귀 분석 (Binary regression model using skewed generalized t distributions)

  • 김미정
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.775-791
    • /
    • 2017
  • 이진 데이터는 일상 생활에서 자주 접할 수 있는 데이터이다. 이진 데이터를 회귀 분석하는 방법으로 로지스틱(Logistic), 프로빗(Probit), Cauchit, Complementary log-log 모형이 주로 쓰이는데, 이 방법 이외에도 Liu(2004)가 제시한 t 분포를 이용한 로빗(Robit) 모형, Kim 등 (2008)에서 제시한 일반화 t-link 모형을 이용한 방법 등이 있다. 유연한 분포를 이용하면 유연한 회귀 모형이 가능해지는 점에 착안하여, 이 논문에서는 Theodossiou(1998)에서 제시된 기운 일반화 t 분포 (Skewed Generalized t Distribution)의 이용하여 우도 함수를 최대로 하는 이진 데이터 회귀 모형을 소개한다. 기운 일반화 t 분포를 R glm 함수, R sgt 패키지를 연결하여 이 논문에서 제시한 방법을 R로 분석할 수 있는 방법을 소개하고, 피마 인디언(Pima Indian) 데이터를 분석한다.

부동산 매매지수와 전세지수 예측: 독립성분분석을 활용한 분석 (Forecasting Korean housing price index: application of the independent component analysis)

  • 박노진
    • 응용통계연구
    • /
    • 제30권2호
    • /
    • pp.271-280
    • /
    • 2017
  • 우리나라 뉴스에서 매일 빠지지 않는 내용은 아마도 부동산 경제에 관한 것이라고 생각된다. 많은 사람들은 부동산 가격의 변동에 관한 전문가들의 예측에 관심을 갖고 있다. 매매가격 혹은 전세가격을 예측하기위해 일반적으로 많이 사용되는 방법은 박스-젠킨스에 기반을 둔 자기회귀이동평균모형이다. 본 논문에서는 자기회귀모형과 다변량 자료분석에서 사용하는 독립성분분석을 결합하여 예측하는 방법을 시도하여 보았다. 매매가격과 전세가격을 두 개의 독립성분으로 재설정하고 독립성분들을 이용하여 예측한 후 역변환을 통해 매매가격과 전세가격을 예측하는 방법을 시도하였다. 그 결과 일반적인 자기회귀이동평균모형을 사용할 때 보다 독립성분을 활용한 예측이 실제 지수에 더 유사한 값들을 얻을 수 있음을 보였다.

RSSI 측정값의 회귀분석을 이용한 무선센서노드의 위치관리 (Wireless Sensor Node Location Management By Regression Analysis of RSSI)

  • 최준영;김현중;양현호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.308-311
    • /
    • 2008
  • WSN(Wireless Sensor Network)의 기술 요소 중의 하나는 센서노드의 위치에 관한 정보를 추적하고 관리하는 것으로 GPS, 초음파, RSSI 등을 이용하는 방법이 대표적이다. 본고에서는 RSSI에 기반의 무선 센서 노드 위치 측정 방법의 정확도를 향상시키기 위하여 사하기 위하여 무선센서노드의 위치를 판정하기 위하여 전파수신강도(RSSI)의 측정값의 정확도를 향상하기 위하여 을 회귀분석을 이용하는 방법에 대해 고찰하였다. 또한 Friis 공식을 이용 송신기와 수신기 사이에서의 전파의 경로 손실과 한 위치 측정하는 기존의 방식과 RSSI 값에 기반하여 회귀분석을 이용한 위치 측정 방식을 비교 분석한 결과 회귀분석을 이용한 방식이 RSSI를 이용하여 거리를 측정하는 측면에서 좀 더 향상된 정확도를 나타내었다.

  • PDF

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.

수위-유량관계식에 새로운 양방향 회귀모형의 적용 (An Application of a New Two-Way Regression Model for Rating Curves)

  • 이창해
    • 한국수자원학회논문집
    • /
    • 제41권1호
    • /
    • pp.17-25
    • /
    • 2008
  • 수위-유량관계식의 유도와 실무적용에 있어 통상적으로 회귀분석의 특성을 간과하고 사용하는 경우가 종종 발생한다. 예를 들어 실무에서는 관측수위로부터 관측유량으로 회귀분석되어 만들어진 수위-유량관계식을 홍수모형으로부터 모의된 설계홍수유출량으로부터 설계홍수위를 환산하는데 사용되기도 한다. 그러나 독립과 종속변수가 서로 바뀌면, 관측치와 회귀식간 연직거리의 잔차들로부터 유도된 기존의 회귀분석에 의하여, 회귀식이 서로 달라지기 때문에 역으로 적용하여서는 안 된다. 본 연구에서는 이런 문제점을 해결하기위해 회귀식의 변수들을 상호 교환할 수 있는 최소자승 회귀분석의 새로운 알고리즘을 제안하였다. 새로운 방법을 낙동강유역의 본류 5개 수위표지점의 수위-유량관계식에 대하여 적용하였다. 3가지 회귀식이 유도되었는데, 이들은 각각 수위로부터 유량으로(model 1), 유량으로부터 수위로(model 2) 그리고 양방향(model 3)으로 유도된 수위-유량관계식을 비교하여 실무에서 잘못 적용되는 실수를 줄일 수 있는 새로운 방법을 제시하였다.

미계측 중소유역의 월유출량 산정을 위한 다중회귀모형 연구 (A Multiple Regression Model for the Estimation of Monthly Runoff from Ungaged Watersheds)

  • 윤용남;원석연
    • 물과 미래
    • /
    • 제24권3호
    • /
    • pp.71-82
    • /
    • 1991
  • 수질원 부존량의 평가를 위한 월유출량의 추정방법은 통상 경험식에 의한 방법, 물수지분석에 의한 방법 그리고 회귀분석에 의한 방법등이 있다. 본 연구는 수위계측지점의 유출자료를 사용하여 다중회귀분석으로 회귀모형을 수립함으로서, 장기 수자원 개발계획의 수립에 필요한 월유출량의 추정을 가능토록하였다. 사용한 자료는 총 48개 수위관측소의 월유출량 및 기상,지상 인자 이며 이중 43개 지점은 모형의 개발에, 나머지 5개 지점은 모형의 검증에 이용하였다. 또한 모형을 유역별모형과 전체모형, 평균치모형과 개별자료모형으로 구분하여 모형-1, 모형-2, 모형-3 그리고 모형-4의 4개 모형을 수립하였으며, 검증결과 모형-2가 가장 적절한 모형으로 판단되었다. 선정된 회귀모형과 기존의 가지야마공식의 적용성을 통계적 방법에 의해 비교한 결과 본 다중회귀모형이 연유출량 뿐아니라 월별유출량의 변화성향을 매우 잘 나타내고 있으며, 적용 또한 용이함이 입증되었다.

  • PDF

비모수 퍼지회귀모형

  • 최승회;김해경;성나영
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.199-201
    • /
    • 2003
  • 본 연구에서는 크리스프자료(crisp data)인 독립변수와 퍼지자료(fuzzy data)인 종속변수 사이의 관계가 특정한 함수로 표현되지 않는 비모수 퍼지회귀모형을 분석하기위하여 퍼지수 순위와 퍼지순위변환방법을 소개하고, 모의실험을 통하여 퍼지순위변환방법의 효율성을 조사한다.

  • PDF

회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델 (A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis)

  • 김채현;류의림;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.