• 제목/요약/키워드: 다중 선형회귀분석

검색결과 357건 처리시간 0.028초

다중선형 회귀분석을 이용한 고속도로 터널구간의 교통사고 예측모형 개발 (Development of Accident Forecasting Models in Freeway Tunnels using Multiple Linear Regression Analysis)

  • 박주환;김상구
    • 한국ITS학회 논문지
    • /
    • 제11권6호
    • /
    • pp.145-154
    • /
    • 2012
  • 본 논문은 고속도로 터널구간을 대상으로 교통사고특성을 다각적으로 분석하여 다양한 독립변수를 선정하고 종속변수를 건, 건/km, 건/백만대km로 다양화하여 다중선형회귀모형을 개발하였다. 그리고 개발된 모형들은 상호 비교 검토하여 최종적으로 교통사고영향요인으로 구성된 신뢰성 있는 교통사고예측모형을 결정하였다. 교통사고예측모형은 모형의 $R^2$, F값 등 검정통계량 수준, 다중공선성, 잔차분석 등 모형검증과정이 수행되었고 터널구간의 교통사고특성 반영여부 등을 검토하여 최종적으로 터널길이에 따라 총 2개의 모형을 선정하였다. 선정된 종속변수는 ln(건/백만대km)이며, 독립 변수는 연평균일교통량(AADT), 종단구배, 터널높이로 구성되었다. 추정모형은 RMSE, MAE를 이용하여 예측한 값과 실제 관측값과의 차이를 분석하여 터널구간의 교통사고를 설명하는데 적합한 모형으로 파악되었다.

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

다중회귀분석을 이용한 3축 가속도 센서기반 활동량 추정 방법 (Calorie Burn Estimation Algorithm from a Accelerometer using Multiple Regression Analysis)

  • 최선탁;이규필;김준호;조위덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.953-955
    • /
    • 2016
  • 본 논문은 다중 회귀 분석을 이용하여 3축 가속도센서기반의 활동량을 추정하는 방법을 제안한다. 본 연구를 위해 총 59명의 피 실험자가 자체 제작한 활동량계를 착용한 뒤 트레드밀에서 일정한 속도로 걷는/뛰는 동작을 수행한 신호를 수집하였다. 수집한 3축 가속도 신호의 에너지 값에서 사전에 정의한 특징들을 산출한다. 그 다음 각 특징별로 선형, 지수, 로지스틱 회귀 분석을 적용하여 적합도가 높은 특징을 선정한다. 마지막으로 산출된 회귀식들을 사용하여 다중 회귀 분석 방법으로 활동량을 추정한다. 호흡가스 대사 분석기(K4B2)를 착용한 뒤 동일한 방법으로 실험을 수행 하고 제안한 방법과 정확도를 비교한 결과 제안한 방법의 정확도는 86.38 %로 산출되었다. 이는 기존의 Kim 외 3인의 연구결과[1]보다 2.70 %, Actical의 정확도보다 4.31 % 높은 수치이다.

순수 성분의 물성 자료를 이용한 2성분계 혼합물의 인화점에 대한 다변량 통계 분석 및 예측 (Multivariate Statistical Analysis and Prediction for the Flash Points of Binary Systems Using Physical Properties of Pure Substances)

  • 이범석;김성영
    • 한국가스학회지
    • /
    • 제11권3호
    • /
    • pp.13-18
    • /
    • 2007
  • 다변량 통계 분석법(Multivariate statistical analysis method)의 대표적 방법인 다중 선형 회귀법(Multiple linear regression. MLR)을 이용하여 2성분계 혼합물의 인화점을 회귀 분석하고 예측하였다. 가연성 물질의 인화점에 대한 예측은 실제 화학 공정 설계에서 화재 및 폭발 위험성을 판단하는 중요한 부분 중의 하나이다. 본 연구에서는 순수 성분의 물성 자료만을 이용하여 2성분계 혼합물의 인화점 실험 자료에 대해 다중 선형 회귀법(MLR)을 수행하였고, 이를 이용하여 새로운 혼합물에 대한 인화점을 예측하였다. 2성분계 혼합물의 인화점에 대한 MLR의 회귀 성능과 새로운 혼합물에 대한 예측 성능을 알아보기 위해, 기존의 인화점 추정 방법인 Raoult의 법칙과 Van Laar식에 의한 추정값과 비교해 보았다.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

지방부 신호교차로 사고특성분석 및 모형개발 (청주.청원을 중심으로) (Analysis of Accident Characteristics and Development of Accident Models in the Signalized Intersections of Cheongju and Cheongwon)

  • 박병호;유두선;양정모;이영민
    • 대한교통학회지
    • /
    • 제26권2호
    • /
    • pp.35-46
    • /
    • 2008
  • 본 연구는 지방부의 교통사고 특성을 분석하고 사고모형을 개발하는데 그 목적이 있다. 이를 위해 본 연구에서는 청주시와 청원군의 신호교차로를 중심으로 다중선형, 포아송 및 음이항회귀모형을 개발하는데 중점을 두고 있다. 분석된 주요 연구결과는 다음과 같다. 첫째, 사고특성 분석을 통해 지방부 교통사고의 특성이 요인별로 파악되었다. 둘째, 통계적으로 설명력이 높은 4개의 사고모형이 개발되었다. 마지막으로 평균차로폭차($X_2$)와 교차로간거리 ($X_{11}$)가 지방부의 특성을 반영할 수 있는 특정변수로 밝혀졌다.

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.

인공신경망 기법을 이용한 사면의 내진성능평가 모델 제안 (A Propose on Seismic Performance Evaluation Model of Slope using Artificial Neural Network Technique)

  • 곽신영;함대기
    • 한국전산구조공학회논문집
    • /
    • 제32권2호
    • /
    • pp.93-101
    • /
    • 2019
  • 이 연구의 목적은 인공신경망 기법을 이용하여 사면의 내진 성능을 비교적 정확하면서도 효율적으로 예측하는 모델을 도출하는데 있다. 사면의 내진 성능은 지진입력 및 사면모델의 무작위성 및 불확실성으로 인하여 정량화하기 쉽지 않다. 이러한 배경 아래 사면에 대한 확률론적 지진 취약도 분석이 몇몇 연구자에 의해 수행되었고, 이를 기반으로 다중 선형회귀분석을 통하여 사면 내진성능에 대한 닫힌식이 제안된 바 있다. 그러나 전통적인 통계학적 선형회귀분석은 다양한 조건의 사면과 이에 따른 내진 성능 사이의 비선형적 관계를 정확하게 표현하지 못하는 한계를 보였다. 이에 따라 본 연구에서는 이러한 문제점을 극복하고자 인공신경망 기법을 사면 내진성능 예측 모델을 생성하는데 적용하였다. 도출된 모델의 유효성은 기존의 다중 선형 및 다중 비선형 회귀분석을 통한 모델과 비교하여 검증하였다. 결과적으로 이전 연구의 전통적인 통계학적 회귀 분석을 통한 모델과 비교 결과, 기본적으로 인공신경망 기법을 통하여 도출된 모델이 사면의 내진성능을 예측하는데 있어 우수한 성능을 보여주었다. 이러한 정확도 높은 모델은 향후 확률에 기반한 사면의 지진취약도 지도를 개발하고, 주요 구조물의 인근 사면으로 인한 리스크를 효과적으로 평가하는데 활용될 수 있을 것이라 기대된다.

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중선형 회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Linear Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;김다래;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.103-104
    • /
    • 2017
  • 본 연구에서는 다중회귀분석모형(MLRM)과 MODIS (MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상 관측지점에서 관측한 실측 LST와 MODIS LST의 R2는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 R2는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 68개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중회귀분석 모형은 각각의 입력자료를 독립인자로서 조합하여 12개의 시나리오를 만들었다. 시공간적 경향을 고려하기 위하여 계절별, 토양 토성(soil texture)를 구분하여 회귀분석을 실시하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.80 (철원), 0.90 (춘천), 0.80 (수원), 0.63 (서산), 0.77 (청주), 0.82 (전주), 0.52 (순천), 0.63 (진주), 0.99 (보성)로 높은 상관성을 보였다. 본 연구에서는 토양수분을 예측하기 위한 인자 중 가장 민간함 LST를 보정하지 않는 토양수분 예측 방법은 상당한 오차를 포함하게 되어 실측 토양수분 결과와 크게 차이가 나타남을 보여주었다.

  • PDF