• Title/Summary/Keyword: 다중 회귀

검색결과 3,951건 처리시간 0.029초

다중회귀분석을 이용한 미계측 유역의 갈수유량 산정에 관한 연구 (A Study on Estimation of Lowflow Ungauged Basin Using Multiple Regression Analysis)

  • 임가균;정세진;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.133-133
    • /
    • 2020
  • 갈수량이란 1년 중 355일은 유지되는 유량을 말하며 물 공급 계획 및 관리, 저수지 설계, 관개용수의 수량과 수질 관리, 생태계 보존 등에 있어서 갈수량의 크기와 빈도를 파악하는 것은 매우 중요한 과정이다. 갈수량 산정을 위해서는 오랜 기간의 관측 일유량 자료가 필요하지만 우리나라의 경우 관측 유량 자료의 결측자료가 많아 갈수량 산정에 필요한 장기간의 자료가 부족하다. 따라서 본 연구에서는 전국 40개 중권역 유역을 대상으로 갈수 빈도별 갈수량 산정 회귀식 개발을 수행하였다. 갈수량 산정에 적용할 수 있는 18개의 유역인자와 4개의 수문 인자를 상관분석을 통해 다중공선성을 고려하였으며 상관분석 결과를 토대로 미계측 유역에 적용 가능한 인자를 선정하였다. 갈수 빈도 분석과 단계적 회귀분석을 통하여 미계측 유역에 적용할 수 있는 갈수 빈도별 갈수량 산정 회귀식을 개발하였다. 또한 계측 유역을 미계측 유역으로 가정하여 개발된 갈수량 산정 회귀식을 이용하여 갈수량을 산정하고 분석 결과와 실제 갈수량을 비교하여 개발된 회귀식의 적정성을 검토하였다.

  • PDF

시간-종속적 공변량이 포함된 이분형 반복측정자료의 GEE를 이용한 분석에서 결측 체계에 따른 회귀계수 추정방법 비교 (Comparison of GEE Estimation Methods for Repeated Binary Data with Time-Varying Covariates on Different Missing Mechanisms)

  • 박보람;정인경
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.697-712
    • /
    • 2013
  • 다시점 자료 연구에서 일반화추정방정식은 가상관행렬을 잘못 가정하더라도 모수의 일치추정량을 도출하므로 많이 이용된다. 하지만, 결측 체계가 완전임의결측이 아닌 경우에는 편의추정량을 제공하고, 시간-종속적 공변량이 포함된 경우에는 가상관행렬에 따라 회귀계수 추정값이 다르게 도출될 수 있는 문제점이 있다. 결측 체계가 임의결측인 경우에 발생하는 문제를 해결하기 위해 가중 방법과 다중대체 방법을 사용하는 것이 제안되었다. 본 논문에서는 시간-종속적 공변량이 포함된 이분형 반복측정자료를 GEE를 이용하여 분석할 때 다양한 결측 체계에서 일반화추정방정식 방법, 가중 방법, 다중대체 방법의 회귀계수 추정에 대한 로버스트성과 정확성을 모의실험을 통하여 비교해 보았다. 세 가지 방법 모두에서 시간-종속적 공변량의 회귀계수가 시간-독립적 공변량의 회귀계수에 비해 가상관행렬에 따라 추정값의 차이가 크게 나타났다. 다른 두 방법에 비해 다중대체 방법이 가상관행렬의 형태에 대해 더 로버스트하고 편의도 작은 추정치를 도출하였다.

로지스틱모형에서의 주성분회귀 (Principal Components Regression in Logistic Model)

  • 김부용;강명욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.571-580
    • /
    • 2008
  • 로지스틱회귀분석은 고객관계관리나 신용위험관리 등의 분야에서 많이 사용되는 기법인데, 이러한 분야에서의 로지스틱회귀모형에는 연관성이 높은 설명변수들이 다수 포함되어 다중공선성의 문제를 유발하는 경우가 있다. 다중공선성이 존재하는 상황에서 최우추정량은 심각한 결함을 갖는다는 사실은 잘 알려졌다. 이 문제를 해결하기 위하여 로지스틱주성분회귀를 연구하되, 분석상의 주요 과정인 주성분 선정을 위한 방법을 새롭게 제안하였다. 추정량의 분산을 최소가 되게 하는 상태지수 값을 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준을 결정하는 모형을 구축하였다. 제안된 방법은 다중공선성 문제를 적절히 해결하면서도 모형의 적합성을 향상시킨다는 사실이 모의실험을 통하여 확인되었다.

저류함수법의 매개변수 산정식 개발 (Development of Empirical Formulas for Storage Function Method)

  • 최종남;안원식;김태균;정건희
    • 한국방재학회 논문집
    • /
    • 제9권5호
    • /
    • pp.125-130
    • /
    • 2009
  • 한강의 홍수예경보에 자주 사용되고 있는 저류함수법은 강우-유출관계의 비선형성을 고려한 적용성이 뛰어난 모형이지만, 우리나라의 지형특성을 고려한 매개변수 산정식이 존재하지 않아 실무에서 유역별, 사상별 매개변수 추정에 많은 노력과 시간을 투자하고 있는 실정이다. 그러므로 본 연구에서는 다중회귀분석을 이용하여 한강유역의 저류함수법 매개변수를 계산하기 위한 공식을 유도하여 저류함수법의 적용성을 높이고자 하였다. 상관분석을 통하여 다중회귀분석의 독립변수로는 유역의 유역면적, 하천경사, 유로연장이 사용되도록 결정되었으며, 다중공선성을 가지고 있는 독립변수들을 제거하고, 독립변수의 수를 달리하면서 한강유역 내 30개 소유역에 대해 일반화된 매개변수 산정식을 유도하였다. 제안된 회귀식은 모형의 개발에 사용되지 않은 한강유역 내 다른 지점인 문막수위표의 강우에 적용하여 그 적용성을 검증하였다. 제안된 회귀식을 한강공식이라고 명하고, 이는 한강유역 내에 홍수예경보나 유출계산에 저류함수법 적용 시 유용한 자료로 활용하고자 하였다.

기후요소와 생산성간의 상관관계 분석에 관한 연구 - 공동주택 철근콘크리트 골조공사를 중심으로 - (Relationship Between Construction Productivity and the Weather Elements in the Reinforced Concrete Structure for the High-rise Apartment Buildings)

  • 김신태;김예상;진상윤
    • 한국건설관리학회논문집
    • /
    • 제5권6호
    • /
    • pp.80-89
    • /
    • 2004
  • 건설생산성에 영향을 미치는 많은 요소 중에서, 외부공사가 많은 건축공사는 기후의 영향을 많이 받는다. 지난 30년에 걸쳐 기후요소와 건설생산성간의 관계에 대한 많은 연구가 진행되어 왔지만, 대한민국의 지리적 특징을 잘 반영하는 연구는 미비하였다. 본 논문에서는 같은 유형의 공동주택 4개동($16\~18$층)의 데이터를 이용하여 골조공사의 건설생산성과 5가지 기후요소(온도, 습도, 낮 길이, 강수, 풍속)와의 관계를 단순회귀분석과 다중회귀분석을 통해 규명하였다. 단순회귀분석 결과, 기후요소 중 온도, 낮 길이가 건설생산성에 가장 큰 영향을 미치는 것으로 나타났고, 다중회귀분석으로부터는 기후요소에 의해 생산성을 예측할 수 있는 회귀식을 도출하였으며, 이러한 분석결과에 대한 검증과 활용 방안을 제시하였다. 본 연구의 결과는 공사관리의 기획단계 혹은 공정관리의 기초 자료로 사용될 수 있을 것으로 기대된다.

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.327-344
    • /
    • 2007
  • 다중공선성의 데이터에 사용되는 대표적인 편향회귀방법은 능형회귀(RR), 주성분회귀(PCR), 부분최소제곱회귀(PLS) 등이다. 이 회귀방법들은 계수베거 추정량의 놈(norm)이 모두 보통 최소제곱회귀(OLS)의 추정량의 놈보다 작아진다는 의미에서 축소회귀라 부른다. 새로운 회귀방법으로 RR과 PCR을 결합한 능형주성분회귀(RPCR)가 있고 RR과 PLS를 결합한 능형부분최소제곱회귀(RPLS)가 있으며 이들도 또한 축소회귀이다. 이들 추정량은 X'X의 고유벡터들의 선형결합으로 나타낼 수 있고 따라서 각 고유방향에서 OLS에 비해 얼마나 축소되는지를 연구할 수 있다. 본 논문에서는 먼저 이들 추정량을 일반적인 축소인자의 식으로 나타내고 이를 이용하여 MSE의 일반식을 구하였으며 PLS 추정량의 MSE 식도 구하였다. 그리고 RPLS의 축소인자 식을 두 가지 다른 형태로 유도하였다. RPLS의 경우도 이 축소인자 식을 MSE의 일반식에 대입하면 MSE 식이 바로 얻어진다. 그러나 PLS나 RPLS의 축소인자는 y의 복잡한 비선형이 되어 결정적이 아니므로 이들 추정량의 MSE는 근사적인 식이라 할 수 있다. 따라서 PLS나 RPLS를 평가하기 위해 이 MSE를 사용하는 것은 제한적이며, 경험적인 방법으로 이들 회귀의 수행성을 평가하는 것이 필요하다. 다중공선성의 대표적인 데이터인 근적외선 분광 데이터를 이용하여 이 유도된 회귀의 축소인자 값이 인자수에 따라 어떻게 변화하는지와 전체적인 축소 비율도 살펴보았다. 이들의 축소 형태를 잘 이해하면 회귀방법들의 예측력과 안정성을 파악하는데 많은 도움이 되리라 판단된다.

  • PDF

다중회귀 분석을 이용한 소프트웨어 개발노력추정 (The Estimation of Software Development Effort Using Multiple Regression Method)

  • 정혜정;양해술;신석규;이상운
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1483-1490
    • /
    • 2004
  • 소프트웨어분야에서 성공적인 프로젝트를 완수하기 위해서는 프로젝트를 완수하는데 필요한 개발노력이 정확히 추정되어야 한다. 그러나 이러한 개발노력은 소프트웨어의 크기나 여러 가지 운영환경의 영향으로 인해 프로젝트에 따라서 총 개발 노력의 규모는 차이가 있다. 일반적으로 기존의 연구는 개발노력을 추정하기 위하여 소프트웨어 규모인 기능점수(FP ; Function Point)를 이용하였다. 본 연구를 위해서 1990년대에 개발된 789개의 소프트웨어 개발 프로젝트들에 관련된 데이터를 이용하였다. 실험을 통해서 개발노력에 영향을 미치는 변수를 조사하였다. 또한 변수사이에 선형적인 관계를 조사하기 위하여 다중회귀분석을 실시하였다. 이 경우 전체의 데이터를 이용하는 것이 아니라 프로젝트 인도비율(PDR ; Project Delivery Rate : Hours/FP)을 다단계로 나누어서 각 단계별로 개발노력에 영향을 미치는 변인을 찾아내고 가장 이상적인 회귀식으로 도출하였다.

패널자료의 무응답 대체법 (Non-Response Imputation for Panel Data)

  • 박기덕;신기일
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.899-907
    • /
    • 2010
  • 무응답 대체(non-response imputation) 방법에 관한 많은 이론과 방법이 제안되었으며 실제 자료 분석에 이용되고 있다. 흔히 횡단면 무응답 대체를 위하여 다중대체법(multiple imputation)이 사용되고 있으며 2차년도 이상의 패널자료에는 종시점회귀대체법(cross-wave regression imputation)이 사용되고 있다. 본 연구에서는 패널자료 분석을 위하여 종시점회귀대체법의 일반형태인 시계열 대체법과 횡단면 무응답 대체법을 결합한 시계열-횡단면 다중 대체법을 제안하였다. 노동부의 매월노동통계 자료를 이용하여 제안한 방법과 기존의 종시점회귀대체법을 비교하여 우수함을 보였다.

다중회귀모형을 활용한 일 단위 융설 깊이 예측 모형 개발 (Development of a Daily Snowmelt Depth Model using Multiple Linear Regression)

  • 오영록;이규민;신형진;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.374-374
    • /
    • 2021
  • 최근 우리나라에도 대설로 인한 피해가 발생하고 있으며, 피해의 대부분은 강설 발생 이후 남아 있는 적설량이 주된 원인이 되고 있다. 적설량에 대한 예측은 대설피해에 대응하기 위한 중요한 정보이다. 따라서 본 연구에서는 융설량에 영향을 미칠것으로 판단되는 적설량, 기온, 습도, 일사량을 반영하여 일일 융설량을 모의하는 다중회귀모형을 구성하였다. 모형은 2000년부터 2020년까지의 강설 사상을 대상으로 구축하였으며, 2021년에 발생한 광주, 대관령, 목포, 서산, 전주 지역의 강설 사상에 적용하였다. 분석 대상 지역의 평균 적설량은 7.41 cm로 나타났으며, 평균 RMSE는 1.64 cm가 발생하였다. 오차의 원인으로는 적설량이 1 cm 미만 감소했을 경우, 바람이나 승화의 영향이 상대적으로 크게 작용할 수 있으나, 본 연구에 이용된 함수는 바람과 증발산 등이 고려되지 않았다. 또한, 회귀계수 결정에서 급격한 온도 변화를 능동적으로 반영하기 어려워 급상승한 온도나 매우 낮은 온도에 오차가 더 크게 나타난다. 따라서, 본 함수를 통하여 융설 깊이를 예측하기 위해서는 매우 높은 온도나, 매우 낮은 온도에서의 영향을 통제할 수 있는 변수 또는 상수를 추가할 필요가 있는 것으로 판단된다. 또한 초기 강설 당시의 기온과 습도 등에 따라, 눈의 결정이 달라지고, 이에 따라 융설에도 영향을 미칠 수 있다는 점을 이해하여, 초기 적설에 대한 변수도 고려되어야 할 것이다.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.