• 제목/요약/키워드: 비선형회귀식

검색결과 215건 처리시간 0.029초

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

비선형회귀분석을 위한 통계소프트웨어 NLIN2000 (Introduction of a Nonlinear Regression Analysis System NLIN2000)

  • 강근석;심규호
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.173-184
    • /
    • 2004
  • Window환경 하에서 사용이 간편하면서도 다양한 통계량을 제공하는 비선형회귀분석을 위 한 통계소프트웨어 NLIN2000을 소개한다. 기존의 DOS용 프로그램을 업그레이드한 것으로 다른 통계 팩키지들에 비하여 모형식의 설정 및 적합과정이 간편하고, 모형식 저장 및 삭제, 모형식 형태 보기 등의 기능을 제공한다. NLIN2000은 비선형회귀분석에 대한 통계적 이론을 연구하는 통계전공자들에게 필수적인 각종 통계량을 제공해줄 뿐만 아니라, 실제 현장에서 비선형모형을 사용하여 분석하는 다른 학문분야의 연구자들에게도 유용하게 사용될 수 있다.

뉴럴 네트워크 및 선형 회귀식을 이용한 줄눈 콘크리트 포장의 한계 응력 계산 (Calculation Of Critical Stress On Jointed Concrete Pavement By Using Neural Networks & Linear Regression Models)

  • 강태욱;류성우;김성민;조윤호
    • 한국도로학회논문집
    • /
    • 제10권3호
    • /
    • pp.129-138
    • /
    • 2008
  • 기존 콘크리트 포장의 단면 설계 시 발생하는 문제점을 해결하기 위해 유한 요소법(FEM)을 이용하여 것이 하나의 방법론으로 부각되었으며 현재 한국형 포장 설계법 개발 연구에서도 적용 중에 있다. 본 연구에서는 ABAQUS와 포트란 해석 프로그램을 이용하여 콘크리트 포장의 한계 응력을 계산하였고, 그 결과를 뉴럴 네트워크와 선형 회귀식을 이용하여 비교 분석하였다. 입력 변수가 많지만 다양한 해석을 하지 못하는 경우(입력변수 6개에 대해 81 경우 수 해석)에 대해 구조해석 결과를 뉴럴 네트워크(이하 NN: Neural Networks)와 선형 회귀식으로 비교한 결과, 구조해석 결과와 다소 차이가 있음을 확인하였다. 반면 입력 변수를 줄이되 다양한 경우에 해석한 경우(입력 변수 3개에 대해 343 경우의 수)의 분석 결과, NN과 선형 회귀식이 구조해석 결과와 매우 유사한 결과가 나타나는 것을 알 수 있었다. 하지만 그래프의 (0,0), (1,1) 부분에서 NN이 선형 회귀식에 비해 더 정확한 것을 확인하였다. 이와 같은 연구 결과를 통해서 한국형 포장 설계법의 핵심인 응력 계산 모듈을 선형 회귀식보다 좀 더 정확한 NN으로 해석하는 것을 제안하였다.

  • PDF

유량측정시 불확실성의 검토와 수위-유량곡선식의 개발 (Investigating Uncertainty in Flow Measurement and Developing Rating Curves)

  • 이길성;이경호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1242-1246
    • /
    • 2004
  • 본 연구에서는 유속계와 봉부자를 동한 측정값의 불확실성를 검토한 후, 한강의 7개 지류의 실측 자료들의 불확실성을 ISO 규정을 통하여 추정하였다. Simulated Annealing 기법과 황금비 분할법을 이용한 비선형회귀식을 적용하여 기존의 수위-유량 곡선식자 비교해보았다. 불확실성 추정결과 유량 측정치들의 불확실성이 ISO 규정의 기준에 비해 높게 추정되었으며, 특히 무작위 오차와 계통 오차 중에 무작위 오차의 불착실성이 높게 나타났다. 또한, 기존 수위-유량곡선식과 Simulated Annealing 기법과 황금비 분할법을 이용한 방법을 비교해본 결과 황금비 분할법이 가장 좋은 결과를 얻었다. 이때 수위-유량곡선식의 영수위값을 황금비 분할법을 이용해 구한 후 비교해 본 결과는 기존의 선형회귀방법과 비선형방법에서 큰 차이를 보이지 않았다. 또한 곡선 분리시에는 하나의 수위-유량곡선일때보다 오차가 줄어드는 경향을 보였다.

  • PDF

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.327-344
    • /
    • 2007
  • 다중공선성의 데이터에 사용되는 대표적인 편향회귀방법은 능형회귀(RR), 주성분회귀(PCR), 부분최소제곱회귀(PLS) 등이다. 이 회귀방법들은 계수베거 추정량의 놈(norm)이 모두 보통 최소제곱회귀(OLS)의 추정량의 놈보다 작아진다는 의미에서 축소회귀라 부른다. 새로운 회귀방법으로 RR과 PCR을 결합한 능형주성분회귀(RPCR)가 있고 RR과 PLS를 결합한 능형부분최소제곱회귀(RPLS)가 있으며 이들도 또한 축소회귀이다. 이들 추정량은 X'X의 고유벡터들의 선형결합으로 나타낼 수 있고 따라서 각 고유방향에서 OLS에 비해 얼마나 축소되는지를 연구할 수 있다. 본 논문에서는 먼저 이들 추정량을 일반적인 축소인자의 식으로 나타내고 이를 이용하여 MSE의 일반식을 구하였으며 PLS 추정량의 MSE 식도 구하였다. 그리고 RPLS의 축소인자 식을 두 가지 다른 형태로 유도하였다. RPLS의 경우도 이 축소인자 식을 MSE의 일반식에 대입하면 MSE 식이 바로 얻어진다. 그러나 PLS나 RPLS의 축소인자는 y의 복잡한 비선형이 되어 결정적이 아니므로 이들 추정량의 MSE는 근사적인 식이라 할 수 있다. 따라서 PLS나 RPLS를 평가하기 위해 이 MSE를 사용하는 것은 제한적이며, 경험적인 방법으로 이들 회귀의 수행성을 평가하는 것이 필요하다. 다중공선성의 대표적인 데이터인 근적외선 분광 데이터를 이용하여 이 유도된 회귀의 축소인자 값이 인자수에 따라 어떻게 변화하는지와 전체적인 축소 비율도 살펴보았다. 이들의 축소 형태를 잘 이해하면 회귀방법들의 예측력과 안정성을 파악하는데 많은 도움이 되리라 판단된다.

  • PDF

해성점토의 물리적 특성과 압축지수의 상관성 (Relationship Between Physical Properties and Compression Index for Marine Clay)

  • 김동후;김기웅;백영식
    • 한국지반공학회논문집
    • /
    • 제19권6호
    • /
    • pp.371-378
    • /
    • 2003
  • 한반도 서, 남해안 해성점토에 대하여 초기간극비와 자연함수비 및 액성한계의 물리적 특성과 압축지수와의 상관성을 규명하기 위해 비교적 신뢰성이 크다고 볼 수 있는 대형 항만 공사용 최근자료를 분석하였다. 시료교란의 정도를 분석하기 위하여 각 표본별 실내압밀시험을 실시하고 Schmertmann이 제안한 방법으로 보정하여 수정압축지수를 산정하였다. 또한 이들 자료를 토대로 실내압밀시험으로부터 얻어진 압축지수를 경험적 방법에 의하여 보정한 후 현장 처녀압축곡선과의 관계를 분석하고, 단순회귀분석, 다중회귀분석 및 비선형 회귀분석을 실시하여 최적의 회귀모델을 구한 후 해성점토에 적용할 수 있는 토질특성과 시료교란의 영향을 고려한 압축지수와의 상관 관계식을 제안하였다. 분석 결과, 시료교란의 영향을 경험적 방법으로 평가해 본 결과 현장 압축지수는 실험실 압축지수의 1.16배정도 크게 평가되었다. 해성점토의 물리적 특성과 압축지수의 상관성에 대한 최적의 회귀모형은 토질정수의 누승식 또는 지수승식 형태의 비선형회귀식이 가장 적합한 것으로 나타났다. 또한, 설계 및 실무에 보다 쉽게 적용할 수 있도록 하기 위하여 선형관계식을 사용하는 경우에는 압축지수의 상관식을 물성치의 구간에 따라 구분하여 사용하는 것이 바람직하다.

비선형 회귀식을 이용한 강우-홍수피해액 추정 함수 개발 (Development of Rainfall-Flood Damage Estimation Function using Nonlinear Regression Equation)

  • 어규;김경태;김연수;이종소;김형수
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2015년 정기학술대회
    • /
    • pp.259-260
    • /
    • 2015
  • 재해가 발생하기 전에 피해규모와 이에 따른 영향 및 피해액을 신속하게 추정하는 것은 효율적인 재난 관리를 하는데 있어 중요하고, 더불어 정책결정자들이 의사결정을 할 때 도움이 될 수 있다. 하지만 기존의 연구는 단순 재해 피해발생 후에 그 피해액 혹은 복구액을 산정하는 수준이며, 현재 피해액 추정에 대한 연구는 전무 하며 그 기술개발에 또한 초기단계에 있다. 이에 피해액 추정에 대한 연구가 시급한 실정이다. 실질적으로 자연재해 정보에 대한 수요가 급증하고 있는 반면에 체계적이고 일관된 통계기반의 정보체계는 미흡하다. 이에 국가에서도 재해에 대한 피해액 및 복구비 산정 등 예산편성에 있어 큰 어려움을 겪고 있다. 기존통계 방식에 대한 개선의 필요성 인식과 더불어 본 연구의 목적은 재해 발생 전에 그 피해규모와 영향을 고려하여 이에 따른 피해액을 신속하게 추정하기 위함에 있다. 본 연구에서는 비선형 회귀식을 이용하여 강우-홍수피해액에 대한 함수를 제시하고자 한다.

  • PDF

Annual Cycle of PCBs Concentration in the Atmosphere

  • Kang, Byung-Wook;Shin, Eun-Sang;Yeo, Hyun-Gu
    • 환경위생공학
    • /
    • 제22권2호
    • /
    • pp.61-73
    • /
    • 2007
  • PCBs의 대기 중 농도는 고용량 PUF sampler를 이용하여 2000년부터 2002년까지 주 1회 수도권 인근지역인 경기도 안성에서 측정하였다. 본 논문은 비선형 회귀모델을 이용하여 대기 중 가스상 PCBs의 연간, 월간 사이클을 평가 하고자 한다. Clausius-Clepeyron 식을 이용한 가스상 PCBs의 기울기는 고분자로 갈수록 증가하는 경향이었다. 이는 고분자 PCBs는 저분자 PCBs에 비해 온도 의존성이 크다는 것을 의미한다. 다시 말해, 고분자 PCBs는 다른 지역에서 장거리 이송되어 오는 오염물질의 영향 보다는 지역적인 오염원(예, 토양, 수계 등)에 의해 영향을 크게 받고 있다는 것을 시사한다. Lorentzian 모델을 이용한 총 PCBs의 일별, 월별 회귀식의 결정계수($R^2$)는 각각 0.62(p<0.0001), 0.88(p<0.0001)로 나타나 유의한 결과를 보였다. 또한, 비선형 회귀식 모델을 활용하여 구한 가스상 PCBs의 일별, 월별 싸이클을 모사한 방정식도 매우 유의한 결과(p<0.0001)를 나타내었다.

Gumbel 분포를 이용한 전국의 비정상성 빈도 해석 (National Nonstationary Frequence Analysis Using for Gumbel Distribution)

  • 김광섭;이기춘
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.379-379
    • /
    • 2011
  • 본 연구는 우리나라 전국 기상관측소 중 1973년부터 2009년까지의 시 강수자료가 구축되어 있는 기상관측소 55개 지점에 대하여 비정상성 빈도해석을 수행하였다. 각 지점에 대하여 지속시간 1시간, 24시간에 대한 연 최대 강수량 자료를 구축하여 초기 20년을 기준으로 1년씩 추가한 연 최대 강수량 누적 자료를 생성하고, 생성된 기간별 자료의 평균, 위치매개변수, 축척매개변수를 산정하였으며, 위치매개변수와 축척매개변수는 확률가중모멘트법을 사용하여 산정하였다. 산정된 연 최대 평균 누적 강수량과 연도와의 선형 회귀식을 산정하여 목표연도별(2040, 2070, 2100년) 평균 강수량을 산정하였고, 위치매개변수와 축척매개변수도 평균 누적 강수량과의 선형 회귀식을 산정함으로써, 목표연도에 해당하는 각 매개변수를 산정하였다. 또한 산정된 목표연도별 평균 강수량, 위치매개변수와 축척매개변수를 이용해 확률강수량을 산정하였다. 비정상성 빈도해석을 수행하여 산정된 55개 지점에 대한 목표연도별 확률강수량을 Inverse Distance Weighted(IDW) 보간법을 사용하여 전국의 확률강수량을 공간적으로 표현하였다. 전국단위의 비정상성 빈도해석을 실시한 결과, 전체적으로 각 목표연도별 확률강수량이 증가하는 것으로 나타났으나, 일부 감소하는 지역도 나타났다. 경기도와 강원도 등 중부지역에서 확률강수량의 증가가 큰 것으로 나타났으며, 특히 강원도(강릉, 인재 등) 지역에서 확률강수량의 증가폭이 가장 크게 나타났다. 또한 남해지역에서는 대부분 확률강수량이 감소하는 것으로 나타났고, 그중에서 전라남도 남해안 부근(장흥 등)에 확률강수량의 감소가 가장 크게 나타났으며, 경북지역과 전북지역 부근에서는 증가 또는 감소의 차이가 미비하게 나타났다. 하지만 목표연도 2070년과 2100년에 대하여 산정된 확률강수량으로부터 선형 회귀식을 통해 목표연도별 평균 강수량, 위치매개변수, 축척매개변수를 추정하여 확률강수량을 산정하는 것에 한계가 있음을 보여주었다.

  • PDF

지역가중다항식을 이용한 예측모형 (Locally Weighted Polynomial Forecasting Model)

  • 문영일
    • 한국수자원학회논문집
    • /
    • 제33권1호
    • /
    • pp.31-38
    • /
    • 2000
  • 수문변량 사이의 관계는 대부분 비선형 관계를 보이고 있다. 일반적으로 이런 비선형 관계는 어떤 선행하는 명백한 하나의 함수적인 형태로 표현할 수 없는 것이 일반적이다. 본 논문에서는, 비매개변수적 다변량 회귀분석 방법을 지역적으로 가중된 다항식을 이용하여 비선형 예상 함수를 추정하였다. 지역적으로 가중된 다항식은 추정치 각 점에서의 인접한 이웃자료를 가지고 목적 함수를 테일러 급수 확장을 통하여 고려하였다. 이런 비매개변수적 회귀분석을 실용성을 Great Salt Lake의 격주 체적자료에 대한 단기간 예측을 통하여 보여주었다.

  • PDF