• 제목/요약/키워드: 단계적 회귀분석

검색결과 917건 처리시간 0.031초

단계적 회귀분석과 인공신경망 모형을 이용한 광양항 석탄·철광석 물동량 예측력 비교 분석 (A Comparative Analysis of the Forecasting Performance of Coal and Iron Ore in Gwangyang Port Using Stepwise Regression and Artificial Neural Network Model)

  • 조상호;남형식;류기진;류동근
    • 한국항해항만학회지
    • /
    • 제44권3호
    • /
    • pp.187-194
    • /
    • 2020
  • 항만의 주요 정책 및 향후 운영계획 수립 시 정확한 물동량 예측에 관한 연구는 매우 중요하며 이러한 중요성으로 인해 관련 연구가 활발히 수행되고 있다. 본 논문에서는 국내 최대 석탄 및 철광석 처리 항만인 광양항을 대상으로 단계적 회귀분석과 인공신경망모형을 활용하여 모형간 예측력을 비교하였다. 2009년 1월부터 2019년 1월까지 총 121개월의 월별자료를 활용하였으며 석탄 및 철광석 물동량에 영향을 주는 요인을 선정하여 공급관련요인과 시장·경제관련요인으로 분류하였다. 단계적 회귀분석 결과, 광양항 석탄 물동량 예측모형의 경우, 입항선박 톤수, 석탄가격 및 대미환율이 최종변수로 선정되었고 철광석 물동량 예측모형의 경우, 입항선박 톤수, 철광석가격이 최종변수로 선정되었다. 인공신경망모형의 경우, 모델 성능에 영향을 미치는 다양한 Hyper-parameters를 조정하며 최적 모델을 선정하는 시행착오법을 사용하였다. 분석결과 인공신경망모형이 단계적 회귀분석에 비해 우수한 예측성능을 나타내었으며 예측 모형별 예측값과 실측값을 그래프 상 비교 시에도 인공신경망모형이 단계적 회귀분석에 비해 고·저점을 유사하게 나타냈다.

단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발 (Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis)

  • 정민의;유성진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.598-604
    • /
    • 2014
  • 본 연구는 주요변수를 선정하는 기법을 개발하기 위해서 단계적 회귀와 변수들의 효율성을 평가하기 위해 사용되는 자료봉합분석을 결합한 새로운 방법을 제안하였다. 이를 위해서 먼저 단계적 회귀를 이용하여 중요 변수들을 일차적으로 선정하고, 선정된 각 변수들의 중요도를 이해하기 위해 귀무가설을 세웠고, 중요 변수를 선택하기 위해 Kruskal-Wallis 검정을 사용했다. 또한 해당되는 변수를 Conover-Inman 검정을 사용하여 변동이 발생하는 각 변수들의 우선순위를 결정하였다. 따라서 그 결과, 많은 변수들과 DEA(Data Envelopment Analysis)의 한계를 극복하기 위해 원래 계획된 변수들 중 기준에 의해 원래 유지된 변수와 높은 연관성을 가진 변수들을 남기는 방식으로 변수를 선정하는 기법을 개발한 Jenkins의 기존연구에서는 I2, I4, I5, I6 변수가 누락되었고 I1, I3 변수만이 DEA에 사용되었지만, 본 논문에서 제안된 모델의 효율성 결과로는 I2와 I4 변수를 각각 유지하였다. 본 연구는 다른 문헌에서 단계적 변수의 선택을 보여주기 위해 같은 데이터 집합을 사용하였는데, 여기서 Jenkins의 연구와 같이 변수 I6과 I1, I2를 삭제하였고, I3, I4, I5는 유지하였다. 결론적으로 단계적 회귀 DEA 모델을 사용하여 긴 계산적 절차 없이 변수 선택이 가능함을 발견했으며 기존 연구의 데이터를 적용하여 제안된 모델을 검증하였다. 개발한 DEA모델 결과는 상호 변수에 따라 포함되거나 생략할 수 있기 때문에 실제 현실 상황에서의 지식과 경영적 판단에 매우 유용할 것이다.

다중회귀분석을 이용한 미계측 유역의 갈수유량 산정에 관한 연구 (A Study on Estimation of Lowflow Ungauged Basin Using Multiple Regression Analysis)

  • 임가균;정세진;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.133-133
    • /
    • 2020
  • 갈수량이란 1년 중 355일은 유지되는 유량을 말하며 물 공급 계획 및 관리, 저수지 설계, 관개용수의 수량과 수질 관리, 생태계 보존 등에 있어서 갈수량의 크기와 빈도를 파악하는 것은 매우 중요한 과정이다. 갈수량 산정을 위해서는 오랜 기간의 관측 일유량 자료가 필요하지만 우리나라의 경우 관측 유량 자료의 결측자료가 많아 갈수량 산정에 필요한 장기간의 자료가 부족하다. 따라서 본 연구에서는 전국 40개 중권역 유역을 대상으로 갈수 빈도별 갈수량 산정 회귀식 개발을 수행하였다. 갈수량 산정에 적용할 수 있는 18개의 유역인자와 4개의 수문 인자를 상관분석을 통해 다중공선성을 고려하였으며 상관분석 결과를 토대로 미계측 유역에 적용 가능한 인자를 선정하였다. 갈수 빈도 분석과 단계적 회귀분석을 통하여 미계측 유역에 적용할 수 있는 갈수 빈도별 갈수량 산정 회귀식을 개발하였다. 또한 계측 유역을 미계측 유역으로 가정하여 개발된 갈수량 산정 회귀식을 이용하여 갈수량을 산정하고 분석 결과와 실제 갈수량을 비교하여 개발된 회귀식의 적정성을 검토하였다.

  • PDF

공간가중회귀분석을 이용한 통행발생모형 (Trip Generation Model based on Geographically Weighted Regression)

  • 김진희;박일섭;정진혁
    • 대한교통학회지
    • /
    • 제29권2호
    • /
    • pp.101-109
    • /
    • 2011
  • 대다수의 현대 도시들은 집적의 이익을 극대화하기 위해 군집을 형성하고 각 지역 간에 다양한 공간적 영향을 주고받는다. 그러나 전통적 4단계 수요예측방법의 첫 단계인 통행발생단계에서 주로 적용되는 선형회귀분석모형은 공간적 영향을 반영할 수 없다는 단점이 있다. 이러한 문제를 해결하기 위해서 공간적 상관성을 반영할 수 있는 통행 발생모형을 구축하는 것이 필요하다. 본 연구에서는 공간적 상관성을 고려할 수 있는 통행발생모형으로 공간가중회귀모형(Geographically Weighted Regression)을 제안한다. 공간가중회귀모형은 공간적 상관성을 고려할 수 있는 가중치 행렬을 추정하고 이를 이용하여 회귀식의 계수를 각 존별로 추정하는 것이다. 본 연구에서는 대구광역권 통행자료를 이용하여 공간가중회귀모형을 적용하였다. 공간가중회귀모형의 우수성을 평가하기 위하여 일반적인 회귀모형과 적합도, RMSE 등을 비교분석하였다. 또한 국지적 공간상관성을 측정하는 척도인 LISA(Local Indicator of Spatial Association) 지표를 각 모형별로 산출하였다. LISA 지표를 통하여 현재 분석대상지역은 국지적 공간상관성이 존재함을 확인할 수 있으며 공간가중회귀모형을 적용함으로써 공간상관성으로 인한 오차가 크게 개선됨을 확인할 수 있다.

회귀분석에 기초한 균등화 방법에 관한 연구 (A study on equating method based on regression analysis)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.513-521
    • /
    • 2010
  • 대부분의 대학들은 교수업적평가를 위해 강의평가제도를 실시하고 있다. 그러나 강의평가의 결과는 강좌규모, 강의형태, 개설학년, 이수구분, 평균평점 등과 같은 개설강좌의 특성에 많은 영향을 받게 된다. 따라서 이러한 각 강좌특성들이 강의평가 결과에 영향을 미치는 효과를 제거하지 않는다면, 담당교수가 강의평가 결과에 대한 공정성과 객관성을 신뢰할 수 없게 만들 정도로 심각한 편의를 갖게 된다. 따라서 강의평가의 공정성을 위해 강좌특성에 따른 편의를 제거하기 위한 사후조정된 점수가 요구된다. 따라서 본 연구에서는 단계적 변수선택법에 의한 회귀분석을 이용하여 강의평가 결과에 대한 균등화 방법을 이용하여 사후조정된 점수를 계산하는 방법을 제안한다. 그리고 제안된 방법은 기존의 방법과 비교를 하였다.

나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발 (Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data)

  • 김진욱;정충길;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

케이프선 시장 운임의 결정요인 및 운임예측 모형 분석 (An Analysis on Determinants of the Capesize Freight Rate and Forecasting Models)

  • 임상섭;윤희성
    • 한국항해항만학회지
    • /
    • 제42권6호
    • /
    • pp.539-545
    • /
    • 2018
  • 운임시장의 심한 변동성과 시계열 데이터의 불안정성으로 해운시황 예측에 대한 연구가 큰 성과를 내지 못하고 있지만 최근 대표적인 비선형 모델인 기계학습모델을 적용한 연구들이 활발히 진행되고 있다. 대부분의 기존 연구가 계량모델의 설계단계에서 입력변수에 해당하는 요인들을 기존 문헌연구와 연구자의 직관에 의존하여 선정했기 때문에 요인선정에 대한 체계적인 연구가 필요하다. 본 연구에서는 케이프선 운임을 대상으로 단계적 회귀모형과 랜덤포레스트모델을 이용하여 중요 영향요인을 분석하였다. 해운시장에서 비교적 단순한 수급구조를 가져 요인파악이 용이한 케이프선 운임을 대상으로 하였으며 총 16개의 수급요인들을 사전 추출하였다. 요인간의 상호관련성을 파악하여 단계적 회귀는 8개 요인, 랜덤포레스트는 10개 요인을 분석대상으로 선정하였으며 선정된 변수를 입력변수로 하여 예측한 결과를 비교하였다. 랜덤포레스트의 예측성능이 아주 우수하였는데 수요요인이 주로 선정된 단계적 회귀분석과는 달리 공급요인이 비중 있게 선정되었기 때문인 것으로 판단된다. 본 연구는 운임예측 연구에 있어 운임결정요인에 대한 과학적인 근거를 마련하였으며 이를 위해 기계학습 기반의 모델을 활용하였다는데 연구적 의의가 있다. 또한 시장정보의 분석에 있어 실무자들이 어떤 변수에 중점을 두어야 하는지에 대해 합리적 근거를 제시한 측면에서 해운기업의 의사결정에 실질적 도움이 될 것으로 기대된다.

도시인구분포모형 개발을 위한 GA모형과 회귀모형의 적합성 비교연구 (A Comparative Study on the Genetic Algorithm and Regression Analysis in Urban Population Surface Modeling)

  • 최내영
    • Spatial Information Research
    • /
    • 제18권5호
    • /
    • pp.107-117
    • /
    • 2010
  • 본 연구는 최근 다수 도시개발사업들이 활발히 진행되고 있는 화성시 동부권을 사례대상지로하여 행정구역 단위 인구데이터를 격자형 인구분포자료로 변환한 후 인구유인을 유발할 것으로 예상되는 주요 도시계획관련 공간변수들을 GIS로 측정 대입하여 제네틱 알고리즘기법과 회귀분석기법 두 가지 방법으로 일종의 도시인구분포모형을 구축하였다. 두 가지 모형의 분석결과를 통해 도시환경 해석에 있어서의 두 기법의 성능상 특장점을 비교해 보았으며, 분석결과 GA기법은 변수 설명력에 관한 변별력에 있어 일반회귀분석보다 우월한 특징이 있음을 알 수 있었고 따라서 회귀분석과 병행할 경우 매우 직관적이며 보완적인 도시분석기법이 될 수 있음을 확인할 수 있었다.

섬진강 유역의 도달시간 및 저류상수 산정공식 개발 (A Development of Formula on Time of Concentration and Storage Constant in Sumjin River Basin)

  • 이신재;박양래;김명수;박상우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.1193-1197
    • /
    • 2004
  • 본 연구는 강우에 내한 유역의 반응시간에 관한 연구로써 우리나라 자연하천유역에 적합한 도달시간 및 저류상수 산정공식을 개발하기 위하여 섬진강 유역을 대상으로 유역특성인자 및 강우 특성인자를 분석하고, 이를 다중회귀분석방범 중 최적의 회귀모형을 추출하기 위한 단계별 회귀분석방법을 이용하여 산정공식을 개발하였다. 그리고 개발된 산정공식으로부터의 도달시간 및 저류 상수들을 기존 경험공식의 값들과 비교하였으면, 또한 이를 Clark 모형에 적용하여 실제 호우사상들에 대한 유출수문곡선을 분석하여 관측수문곡선과 비교 검토하였다. 그 걸과 계산된 유출수문곡선과 관측수문곡선은 첨두유량 및 첨두발생시간에서 비교적 적은 오차를 보였으며, 유출수문곡선의 양상에서도 상호 높은 상관성을 보여 개발된 산정공식에 대한 적합성을 잘 나타내주고 있다.

  • PDF

학교분위기가 중학생의 또래폭력 피해경험에 미치는 영향 (The Effects of School Climate on Peer Victimization for Junior High School Students)

  • 김은영
    • 한국아동복지학
    • /
    • 제26호
    • /
    • pp.87-111
    • /
    • 2008
  • 본 연구는 중학생의 또래폭력피해 실태를 살펴보고, 우리나라에서 지금까지 진행되지 않은 또래폭력에 영향을 미치는 학교분위기의 다양한 요인을 파악하고 그 상대적인 영향력을 밝히는 것이다. 연구의 목적을 위해 서울지역에 있는 11개의 중학교를 편의표집 하여 선정된 중학생들이며 최종적으로 1,204부의 설문조사지를 분석하였다. 분석방법으로 빈도분석, 기술통계, 피어슨의 상관분석, 위계적 회귀분석을 사용하였다. 분석결과, 중학생의 또래폭력피해 행위 중 언어폭력의 피해행위가 상대적으로 높게 나타났다. 2단계로 구분하여 위계적 회귀분석을 실시하였다. 1단계 모델보다 2단계 모델에서는 설명 변량이 19.6% 증가하였다. 또래폭력 피해 행위에 교사와 학생간의 상호작용(${\beta}=.130$), 학교건물의 유지보수(${\beta}=.067$), 교내환경의 안전성(${\beta}=.331$)의 변수들과 통제변수 중 성별과 경제력이 유의미한 변수였으며 전체모델의 23.0%를 설명하고 있었다. 이와 같은 연구결과에 근거하여 학교분위기를 개선시키기 위한 실천적, 정책적 제언들을 제시하였다.