• 제목/요약/키워드: 선형 회귀 모델식

검색결과 97건 처리시간 0.029초

다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가 (Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient)

  • 이선미;박인환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Annual Cycle of PCBs Concentration in the Atmosphere

  • Kang, Byung-Wook;Shin, Eun-Sang;Yeo, Hyun-Gu
    • 환경위생공학
    • /
    • 제22권2호
    • /
    • pp.61-73
    • /
    • 2007
  • PCBs의 대기 중 농도는 고용량 PUF sampler를 이용하여 2000년부터 2002년까지 주 1회 수도권 인근지역인 경기도 안성에서 측정하였다. 본 논문은 비선형 회귀모델을 이용하여 대기 중 가스상 PCBs의 연간, 월간 사이클을 평가 하고자 한다. Clausius-Clepeyron 식을 이용한 가스상 PCBs의 기울기는 고분자로 갈수록 증가하는 경향이었다. 이는 고분자 PCBs는 저분자 PCBs에 비해 온도 의존성이 크다는 것을 의미한다. 다시 말해, 고분자 PCBs는 다른 지역에서 장거리 이송되어 오는 오염물질의 영향 보다는 지역적인 오염원(예, 토양, 수계 등)에 의해 영향을 크게 받고 있다는 것을 시사한다. Lorentzian 모델을 이용한 총 PCBs의 일별, 월별 회귀식의 결정계수($R^2$)는 각각 0.62(p<0.0001), 0.88(p<0.0001)로 나타나 유의한 결과를 보였다. 또한, 비선형 회귀식 모델을 활용하여 구한 가스상 PCBs의 일별, 월별 싸이클을 모사한 방정식도 매우 유의한 결과(p<0.0001)를 나타내었다.

시스템 수준의 전력 예측을 위한 회귀분석에 기반하는 분석 방법 (Mixed Approach for Fast System-Level Power Analysis based on Regression Analysis)

  • 김희석;임채석;하순회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.694-696
    • /
    • 2002
  • 이 논문에서는 시스템 수준의 전력 소모를 분석하는 방법론을 설명한다. 응용의 시스템 수준 전력 모델을 구하기 위해서, 시스템을 이루는 각 부분들을 선형적으로 모델링하고, 이를 모두 더한다. 선형적으로 모델링된 식의 파라메터들을 구하기 위해서, 회귀분석에 기반한 분석을 한다. 이를 위해서 다양한 벤치마크들을 준비하고, 응용에 대해서 측정을 한 것과 수정된 시뮬레이터에서 필요한 정보를 얻어야 한다. 이렇게 분석한 전력 모델의 예측치는 5% 내의 정확도를 가짐을 확인하였다.

  • PDF

원형 철근콘크리트 교각의 강성 및 강도감소지수 결정 (Determination of the Strength and Stiffness Degradation Factor for Circular R/C Bridge Piers)

  • 이대형;정영수
    • 한국지진공학회논문집
    • /
    • 제4권2호
    • /
    • pp.73-82
    • /
    • 2000
  • 본연구의 목적은 반복하중을 받는 철근콘크리트 교량 교각의 비선형 이력거동을 해석적으로 예측하는 것이다 이를 위해서 반복적인 횡하중이 작용하는 경우에 실험결과와 일치하는 교각의 하중-변위 이력곡선을 도출하고자 수정된 trilinar 이력거동모델을 이용하였다 철근과 콘크리트의 비선형 거동특성과 각 하중단계에 따른 교각의 중립축을 구하여 소성힌지부의 모멘트와 변형률을 구하고 반복하중하에서의 강성의 변화를 해석적으로 모형화하기 위하여 각기 다른 강성을 갖는 5가지 지선을 갖춘 형태의 이력거동모델식을 제안하였다 본 연구에서는 실험적으로 구한 하중-변위 이력곡선을 이용하여 축하중비 주철근비 및 구속철근비에 따른 강도감소지수와 강성감소지수의 영향을 회귀분석을 이용하여 일반식으로 제안하였다 새로운 이력거동 해석 모델을 프로그램 SARCF III에 적용함으로써 기존 철근콘크리트 교각에 강도 및 강성감소 현상을 정확하게 예측하였다

  • PDF

선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용 (Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application)

  • 김동일;박정술;백준걸;김성식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.137-148
    • /
    • 2009
  • 본 논문의 목적은 신뢰성 있는 선형회귀모델을 구축하기 위하여 후보독립변수 중 유효변수를 선택하는 알고리즘을 구현하는 것이다. 선형회귀모델을 구축하는데 있어서 데이터 상의 모든 후보독립변수를 포함하는 것은 모델의 통계적 유의성을 감소시킬 수 있으며, 차원의 저주(Curse of dimensionality)를 유발할 수 있고, 데이터의 개수보다 변수의 개수가 많을 경우 모델의 구축이 불가능한 문제점 등이 있다. 이와 같은 문제점을 해결하기 위하여 변수선택의 문제를 조합최적화의 문제로 보고 유전 알고리즘(Genetic Algorithm)을 활용하였다. 일반적으로 선형회귀모델의 통계적 유의성을 평가하는 대표적인 통계량으로는 종속변수에 대한 독립변수의 설명력을 나타내는 결정계수($R^2$), 회귀식의 통계적 유의성을 검정하는 F통계량, 회귀계수의 통계적 유의성을 검정하는 t통계량, 잔차의 표준오차 등이 있다. 모델의 통계적 유의성은 하나의 통계량으로 표현될 수 없으므로 다양한 기준을 고려한 다중목적식(Multi-objective function)을 가지는 유전 알고리즘을 설계하였다. 설계한 알고리즘의 성능평가를 위하여 다양한 조건을 가정한 시뮬레이션 데이터에 적용하였다. 그 결과 구축한 알고리즘이 유효변수를 판단함에 있어 기존의 대표적인 변수선택 알고리즘인 LARS(Least Angle Regression)에 비해 우수한 성능을 보임을 확인할 수 있었다. 또한, 주가 데이터를 이용한 포트폴리오 선택에 적용해 본 결과 우수한 응용문제 해결 능력이 있음을 확인할 수 있었다.

인공지능 모델의 지하수위 모의결과 적절성 판단을 위한 허용가능 예측오차 범위 제안 (Proposal of allowable prediction error range for judging the adequacy of groundwater level simulation results of artificial intelligence models)

  • 신문주;류호윤;강수연;이정한;강경구
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.449-449
    • /
    • 2022
  • 제주도는 용수의 대부분을 지하수에 의존하므로 지하수위의 예측 및 관리는 매우 중요한 사항이다. 제주도의 지층은 화산활동에 의한 현무암이 겹겹이 쌓여있는 형태를 나타내며 육지의 지층구조와 매우 다른 복잡한 형태를 나타낸다. 이에 따라 제주도 지하수위의 예측은 매우 난해하며, 최근에는 딥러닝 인공지능 모델을 활용하여 지하수위를 예측하는 연구사례가 증가하고 있다. 기존의 연구들은 인공지능 모델들이 지하수위를 적절히 예측한다고 보고하고 있으나 예측의 적절성에 대한 판단기준을 제시하지 못하였으므로 이에 대한 명확한 제시가 필요하다. 본 연구의 목표는 인공지능을 활용한 지하수위 예측오차가 허용 가능한지 판단할 수 있는 기준을 제시함에 있다. 이를 위해 전 세계의 과거 20년 동안 관련 연구결과들을 수집 및 분석하였으며, 분석 결과 인공지능 모델의 지하수위 예측오차는 지하수위 변동성이 큰 지역일수록 증가하는 것을 확인하였다. 이것은 지하수위의 변동형태가 크고 복잡할수록 인공지능 모델의 지하수위 예측성능은 낮아진다는 것을 의미한다. 이 관계를 명확하게 나타내기 위해 지하수위 최대변동폭과 평균제곱근오차 및 최대오차와의 관계를 선형회귀식으로 도출하여 허용가능한 예측오차 기준을 제시하였다. 그리고 기존 연구들에서 제시한 Nash-Sutcliffe 효율성지수와 결정계수를 분석하여 선형회귀식에 의한 기준을 보완할 수 있는 추가적인 기준을 제시하였다. 본 연구에서 제시한 인공지능 모델에 의한 지하수위 예측결과의 적절성 판단기준은 향후 지속적으로 증가하는 인공지능 예측연구에 유용하게 사용될 수 있다.

  • PDF

풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선 (Improvement of Search Method of Genetic Programing for Wind Prediction MOS)

  • 오승철;서기성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

  • PDF

반복선형회귀를 이용한 수신 신호 세기와 이동성 정보에 기반한 1차원 위치 추정 (One-dimensional Positioning using Iterative Linear Regression Based on Received Signal Strength and Mobility Information)

  • 이동준;김다영;이은혜
    • 한국항행학회논문지
    • /
    • 제24권2호
    • /
    • pp.128-133
    • /
    • 2020
  • 본 연구에서는 위치추정을 하는 경우 선형회귀법을 반복적으로 적용하여 신호의 경로 손실을 추정하는 방법을 제안한다. 제안한 방식에서는 단말이 이동하면서 여러 위치에서 측정한 수신신호세기와 가속도계로 구한 측정 위치들 사이의 거리 정보를 이용하여 전송 비콘부터의 경로 손실을 선형회귀를 이용하여 추정한다. 전송 비콘과 특정 위치사이의 거리에 대하여 여러 잠정값들을 가정하고, 각 잠정값에 대하여 선형회귀식을 구한다. 이 선형회귀식들 중에서, 기준 수신 세기에 가장 가까운 식을 이용하여 송신 비콘와 목표 위치사이 거리를 구한다. 테스트 결과, 제안 방식은 단순 경로 손실 모델보다 훨씬 더 높은 정확도를 보인다.

다짐 풍화토의 Duncan & Chang 모델 매개변수-초기접선계수와 극한축차응력 산정에 관한 연구 (Study on the Estimation of Duncan & Chang Model Parameters-initial Tangent Modulus and Ultimate Deviator Stress for Compacted Weathered Soil)

  • 유건선
    • 한국지반환경공학회 논문집
    • /
    • 제19권12호
    • /
    • pp.47-58
    • /
    • 2018
  • Duncan & Chang(1970)는 던컨-창 모델을 제안하면서 흙시료의 초기 접선계수와 극한 축차응력을 구하기 위하여 쌍곡선이론을 사용하여 삼축압축시험의 응력-변형률의 비선형관계를 변환된 변형률/축차응력-변형률의 선형관계로 재구성하였다. 그러나 변환된 응력-변형률 관계는 이론적으로 선형관계를 나타내지만, 실제로는 시험이 시작되는 변형률이 작은 구간과 시료가 파괴에 이르는 변형률이 큰 구간에서는 비선형관계를 보인다. 이러한 현상은 삼축압축시험의 응력-변형률 곡선이 완전한 쌍곡선 형태가 아님을 나타낸다. 따라서 변환된 응력-변형률 곡선의 전 구간에 대하여 선형 회귀분석을 실시하여 직선의 식을 구하게 되면, 비선형관계를 나타내는 구간의 범위에 따라 선형관계식의 산정에 편차가 발생하게 된다. 이러한 편차를 줄이기 위하여 본 연구에서는 변환응력-변형률 관계에서 비선형을 나타내는 초반과 종반 구간을 제외한 구간에 대하여 선형회귀분석을 실시함으로써 초기접선계수와 극한 축차응력을 산정하는 수정회귀분석법을 제안하였다. 수정회귀분석법을 검증하기 위하여, 풍화토의 다짐시료에 대하여 압밀-배수 삼축압축시험을 실시하였다. 삼축압축시험의 응력-변형률 곡선으로부터 구한 변환응력-변형률 관계에 대해서 수정회귀분석을 실시하여 Duncan et al.(1980)이 제안한 2점법으로 구한 결과와 비교하였다. 분석결과 수정회기분석법에 비해 Duncan의 2점법으로 산정한 초기 접선계수는 4.0% 크게, 그리고 극한 축차응력은 2.9% 작게 평가되었다.

해성점토의 물리적 특성과 압축지수의 상관성 (Relationship Between Physical Properties and Compression Index for Marine Clay)

  • 김동후;김기웅;백영식
    • 한국지반공학회논문집
    • /
    • 제19권6호
    • /
    • pp.371-378
    • /
    • 2003
  • 한반도 서, 남해안 해성점토에 대하여 초기간극비와 자연함수비 및 액성한계의 물리적 특성과 압축지수와의 상관성을 규명하기 위해 비교적 신뢰성이 크다고 볼 수 있는 대형 항만 공사용 최근자료를 분석하였다. 시료교란의 정도를 분석하기 위하여 각 표본별 실내압밀시험을 실시하고 Schmertmann이 제안한 방법으로 보정하여 수정압축지수를 산정하였다. 또한 이들 자료를 토대로 실내압밀시험으로부터 얻어진 압축지수를 경험적 방법에 의하여 보정한 후 현장 처녀압축곡선과의 관계를 분석하고, 단순회귀분석, 다중회귀분석 및 비선형 회귀분석을 실시하여 최적의 회귀모델을 구한 후 해성점토에 적용할 수 있는 토질특성과 시료교란의 영향을 고려한 압축지수와의 상관 관계식을 제안하였다. 분석 결과, 시료교란의 영향을 경험적 방법으로 평가해 본 결과 현장 압축지수는 실험실 압축지수의 1.16배정도 크게 평가되었다. 해성점토의 물리적 특성과 압축지수의 상관성에 대한 최적의 회귀모형은 토질정수의 누승식 또는 지수승식 형태의 비선형회귀식이 가장 적합한 것으로 나타났다. 또한, 설계 및 실무에 보다 쉽게 적용할 수 있도록 하기 위하여 선형관계식을 사용하는 경우에는 압축지수의 상관식을 물성치의 구간에 따라 구분하여 사용하는 것이 바람직하다.