• 제목/요약/키워드: 회귀분석 방법

검색결과 3,652건 처리시간 0.036초

수량화 분석과 AHP를 이용한 산사태 예측모형 개발

  • 남은미;전경호;유혜경;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.114-119
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 달리 AHP(Analytic Hierarchy Process) 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

  • PDF

한계강우량 산정을 위한 로지스틱 회귀분석 (Logistic regression analysis for Critical Rainfall Estimation)

  • 이창현;이강원;금호준;김병현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

도시인구분포모형 개발을 위한 GA모형과 회귀모형의 적합성 비교연구 (A Comparative Study on the Genetic Algorithm and Regression Analysis in Urban Population Surface Modeling)

  • 최내영
    • Spatial Information Research
    • /
    • 제18권5호
    • /
    • pp.107-117
    • /
    • 2010
  • 본 연구는 최근 다수 도시개발사업들이 활발히 진행되고 있는 화성시 동부권을 사례대상지로하여 행정구역 단위 인구데이터를 격자형 인구분포자료로 변환한 후 인구유인을 유발할 것으로 예상되는 주요 도시계획관련 공간변수들을 GIS로 측정 대입하여 제네틱 알고리즘기법과 회귀분석기법 두 가지 방법으로 일종의 도시인구분포모형을 구축하였다. 두 가지 모형의 분석결과를 통해 도시환경 해석에 있어서의 두 기법의 성능상 특장점을 비교해 보았으며, 분석결과 GA기법은 변수 설명력에 관한 변별력에 있어 일반회귀분석보다 우월한 특징이 있음을 알 수 있었고 따라서 회귀분석과 병행할 경우 매우 직관적이며 보완적인 도시분석기법이 될 수 있음을 확인할 수 있었다.

생활용수 회귀수량 산정방법의 개선연구 -중랑천 유역을 대상으로- (A Study on Improving Estimation of Recurrence Rate of Public Water -Jungnangcheon Watershed-)

  • 정충길;안소라;조형경;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.509-509
    • /
    • 2015
  • 물 수요관리측면에 대한 정책을 수립하기 위해서는 현재 또는 장래에 대한 용수수급의 정확한 이해를 필요로 한다. 이를 위해서는 용수 수요량 및 공급량뿐만 아니라 여러 산정요소를 필요로 하는데, 그 중 회귀수량은 물이 이용되고 다시 하천으로 회귀되어 이용될 가능성이 있는 수량으로 정의되며, 용수수급 및 용수절약 측면에서 회귀 수량은 중요한 요소라 할 수 있다. 회귀수량 조사는 유역조사 사업 이래, 10년간 생?공용수를 중심으로 미시적, 거시적으로 조사를 시행하였으나, 측정 자료의 신뢰도, 조사방법 및 지점선정 등의 문제로 인하여 조사 성과의 활용성이 매우 낮은 실정이다. 수자원장기종합계획등에서는 수자원관련 계획 수립시 생?공용수의 회귀율을 65 %로 적용하고 있으나, 이는 1970년대 말의 사회적 여건 및 경제적 상황이 반연된 결과로 현재 상황에 적용되기 곤란하다. 따라서, 현재 실정에 맞는 회귀율 산정은 반드시 필요하게 된다. 본 연구에서는 기존 생활용수 회귀수량 산정 연구 한계를 보완하고 유역조사 시행을 위한 개선된 회귀수량을 산정하고자 한다. 본 연구는 서울시 중랑물재생센터 처리구역을 기반으로 중랑천유역을 시험유역으로 선정하였다. 기존 회귀수량 산정방법을 개선하기 위해 시험유역 회귀수량 산정을 위한 가용 자료 분석 및 용수흐름 네트워크 공간분석을 추가로 진행하였다. 가용자료로 시험 유역내 상수공급자료(정수장 공급량, 상수계통도, 유수 및 누수율), 하수처리자료(하수처리구역도, 하수처리계통도, 유입량 및 방류량) 및 기상자료(기상청 지점 및 AWS 강우자료)를 구축하였고 각각의 상수계통도 및 하수처리계통도로부터 용수 흐름 네트워크망을 구축하였다. 상수공급자료로부터 상수계통도 공급지역을 구분하여 월별 유수율에 따른 월별 실 공급량을 산정하였다. 하수처리자료로부터 시험유역에서의 월별하수처리 유입량 및 방류량을 산정하였다. 최종적으로 회귀율(하수처리 방류량/실 공급량)을 산정한 결과 연평균 회귀율은 각각 93.97 %(2011년), 95.02%(2012년)로 과잉 추정 되었으며 7 ~ 9월의 회귀율은 110 ~ 120 %로 유입량을 초과하였다. 이는, 하수처리로 유입되는 유입량의 하수관거는 합류식으로 구축되어 7 ~ 9월에 많은 양의 강우량이 우수관을 통해 하수처리장으로 이송되어 생활용수 이외에 자연적인 공급량으로 인한 것으로 분석되었다. 따라서, 월별 회귀율 산정을 위해서는 불투수층에서의 면적강우량(mm)을 유입량(m3/s)으로 환산된 값을 고려하여 회귀율을 재산정하였다. 그 결과 연평균 회귀율은 각각 78.27 %(2011년), 77.58 %(2012년)로 나타났다.각각의 월별 회귀율도 매우 유사하게 나타났으며 과거 관용적으로 사용된 65 % 회귀율보다 약 12 ~ 13%로 증가하였으며 이는, 하수처리시설 구축 및 처리효율의 증가와 상수처리시설의 관로시설의 개량으로 인한 유수율 및 누수율 감소로 회귀율이 증가한 것으로 판단된다.

  • PDF

Bayesian 회귀분석과 변동점 분석을 이용한 수위-유량 관계곡선 불확실성 분석 (Uncertainty Analysis of Stage-Discharge Curve Based on Bayesian Regression Model Coupled with Change-Point Analysis)

  • 권현한;김장경
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.364-364
    • /
    • 2012
  • 수자원 연구의 주요 목적인 효과적인 홍수 및 가뭄관리를 하기 위해서는 그 연구의 기초가 되는 자료를 관측하고 정도(accuracy, 精度)를 향상시키는 연구 또한 매우 중요한 부분이라고 볼 수 있다. 이러한 점에서 수위-유량측정의 경우, 관측자의 숙련도와 계측기 오차에 따라 관측값에 미치는 영향이 큰 특징을 갖고 있어 유량측정의 정확성을 높이고자 진보된 계측기의 개발 및 분석 방법에 관한 연구는 꾸준히 진행되고 있다. 일반적으로 유량을 추정하기 위해서 특정 단면에서의 수위를 측정하여 이를 수위-유량 관계곡선을 통해서 유량으로 환산하고, 수위-유량 관계를 측정한 후 이를 회귀분석 방법으로 내삽 및 외삽을 실시하여 유량을 측정하게 된다. 그러나 수위-유량 관계곡선에서 저수위와 고수위를 하나의 곡선식으로 하게 되는 경우 정도가 낮아지게 되므로 많은 경우에 있어서 저수위, 고수위를 각각의 곡선으로 구하여 사용하고 있다. 문제는 이러한 경우 정량적으로 변곡점을 구하기보다는 경험적으로 저수위와 고수위를 구분하고 있으며, 수위-유량관계를 회귀식에 의해서 추정하게 되므로 이에 대한 불확실성이 발생하게 된다. 따라서 본 연구에서는 불확실성을 정량화시키기 위한 방법으로 Bayesian MCMC 기법을 활용하며 수위-유량 관계곡선식의 매개변수들의 사후분포를 추정하여 매개변수의 최적화 및 불확실성을 평가하였다. 앞서 언급되었듯이 저수위 및 고수위로 분리하여 수위-유량 곡선식을 도출하고 있으나 저수위 및 고수위를 분리하는 기준이 경험적이기 때문에 신뢰성이 저해되는 문제점이 발생한다. 본 연구에서는 수위-유량 곡선식의 매개변수들을 최적화 하는 동시에 Poisson 분포 기반의 변동점 분석이 연동되어 저수위 및 고수위를 분리할 수 있는 Bayesian 기반 통합 수위-유량 곡선 해석 방법을 개발하고자 한다.

  • PDF

Quantile 회귀분석을 이용한 극대강수량 자료의 경향성 분석 (Trend Analysis of Extreme Precipitation Using Quantile Regression)

  • 소병진;권현한;안정희
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.815-826
    • /
    • 2012
  • 기존 Ordinary Regression (OR) 방법을 이용한 경향성 분석은 경향성을 과소평가하는 문제점을 나타낸다. 이러한 점에서 본 연구에서는 자료의 정규분포 가정과 평균을 중심으로 경향성 평가가 이루어지는 기존 Ordinary Regression (OR) 방법을 개선한 Quantile Regression (QR) 방법을 제안하였다. 본 연구에서는 64개 강우 관측지점의 연 최대 극대강수량 자료에 대하여 QR 방법과 OR 방법에 대하여 통계적 성능을 평가하였다. QR 방법의경향성 분석결과 47개 지점에서 5% 오차수준 내에서 t-검정을 통과한 반면 OR 방법에서는 13개 지점 만이 통계적 유의성을 가지는 것으로 나타났다. 이는 OR 방법이 자료의 평균을 중심으로 경향성을 평가하는 기법인데 반해 QR은 자료의 다양한 분위에서 경향성을 평가함으로써 극대 및 극소 부분에서의 경향성을 보다 유연하게 감지하는 이유로 판단된다. QR 방법을 통한 경향성 평가는 평균 중심의 해석문제점을 개선할 수 있으며 자료가 정규분포를 따르지 않거나 왜곡된 분포형태를 갖는 자료의 수문학적 경향성 평가에 유용하게 사용될 수 있을 것으로 판단된다.

기운 일반화 t 분포를 이용한 이진 데이터 회귀 분석 (Binary regression model using skewed generalized t distributions)

  • 김미정
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.775-791
    • /
    • 2017
  • 이진 데이터는 일상 생활에서 자주 접할 수 있는 데이터이다. 이진 데이터를 회귀 분석하는 방법으로 로지스틱(Logistic), 프로빗(Probit), Cauchit, Complementary log-log 모형이 주로 쓰이는데, 이 방법 이외에도 Liu(2004)가 제시한 t 분포를 이용한 로빗(Robit) 모형, Kim 등 (2008)에서 제시한 일반화 t-link 모형을 이용한 방법 등이 있다. 유연한 분포를 이용하면 유연한 회귀 모형이 가능해지는 점에 착안하여, 이 논문에서는 Theodossiou(1998)에서 제시된 기운 일반화 t 분포 (Skewed Generalized t Distribution)의 이용하여 우도 함수를 최대로 하는 이진 데이터 회귀 모형을 소개한다. 기운 일반화 t 분포를 R glm 함수, R sgt 패키지를 연결하여 이 논문에서 제시한 방법을 R로 분석할 수 있는 방법을 소개하고, 피마 인디언(Pima Indian) 데이터를 분석한다.

The Changing Point Analysis of Annual Maximum Rainfall

  • 성장현;강현석;박수희;조천호;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.22-22
    • /
    • 2011
  • 기존의 빈도해석(frequency analysis) 방법은 자료의 정상성(stationarity)을 가정하고 있다. 즉, 자료 분포가 기상에 영향을 받는 정도가 통계적으로 유의하지 않다는 것을 의미하는데 최근의 관측값들은 주기를 나타내거나 증가, 감소하는 경향을 자주 보이고 있고 이는 정상성에 대한 가정이 더 이상 유효하지 않음을 의미한다. 본 연구는 최근 증가경향이 두드러지게 나타나고 있는 관측 연최대 일강우량을 대상으로 증가 변동점(changing point)을 탐색하였다. 이를 위하여 Barry and Hartigan이 1999년에 제안한 BCP (Bayesian Change Point) 방법을 우리나라 전체 강우 관측지점에 적용하였다. 적용 결과, 2000년대를 기준으로 이전의 관측값과 통계적 특성이 다른 관측값들이 많이 발생하는 것을 알 수 있었다. 향후, 매개변수와 시간의 회귀분석(regression analysis)으로 확률분포형의 미래 매개변수를 구하는 비정상성 빈도해석 방법 적용시, BCP 결과로 얻은 변동점을 바탕으로 회귀분석의 구간을 적절하게 선택한다면 계산된 결과의 신뢰성이 더욱 향상되리라 본다.

  • PDF

패널무응답의 가중수정 방법

  • 신민웅;윤연옥
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2002년도 춘계학술대회 발표논문집
    • /
    • pp.157-162
    • /
    • 2002
  • 패널 무응답자(panel nonrespondent)란 처음 조사에서는 응답을 하였으나 나중 조사에서는 응답을 하지 않은 사람을 의미한다. 패널조사에서는 앞 단계에서의 응답으로부터 뒷 단계의 무응답에 대한 정보를 얻을 수 있다. 무응답에 대한 수정 방법은 어떤 보조 변수들을 선택하고, 그 변수들이 수정하는 데 어떻게 사용하는 가를 결정하는 것이다. 우리는 가중 수정을 패널 무응답자에 대해서만 생각한다. 이러한 가중은 패널 무응답자에 대하여 보상하기 위하여 패널 무응답의 가중값을 수정한다. 종속 변수로서 패널응답 상태(status)는 로지스틱 회귀분석으로 패널 무응답에 대한 모형을 선택하는 방법이다. 로지스틱 회귀분석에서 패널무응답과 상관이 있는 변수들은 패널무응답 편향을 감소시키기 위하여 가중 수정에서 사용하기 위한 변수들이다.

  • PDF

로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구 (Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model)

  • 진수봉;이종우
    • 한국철도학회논문집
    • /
    • 제20권4호
    • /
    • pp.482-490
    • /
    • 2017
  • 본 연구는 사고심각도 분류 및 예측을 위한 철도사고조사 통계기법에 관한 연구이다. 그동안의 선형 회귀분석은 사고 심각도 분석에 어려움이 있었으나 로지스틱회귀분석은 이를 보완할 수 있었다. 데이터마이닝 기법인 로지스틱회귀분석을 활용, 서울지하철(5~8호선) 역사 내 전도사고 중 에스컬레이터 전도사고 발생에 영향을 주는 사고예측 모형 변수는 사고자 연령, 음주여부, 사고 당시상황 및 행동, 핸드레일 잡음 여부였다. 분석의 정확도는 76.7%로 설명되었고 분석방법 결과에 따르면 정확도와 유의수준 측에서 로지스틱회귀분석 방법이 도시철도 사상사고 예측모형을 개발하는데 유용한 데이터마이닝 기법으로 판단된다.