• 제목/요약/키워드: Stepwise 회귀분석

검색결과 445건 처리시간 0.039초

단계적 회귀분석과 인공신경망 모형을 이용한 광양항 석탄·철광석 물동량 예측력 비교 분석 (A Comparative Analysis of the Forecasting Performance of Coal and Iron Ore in Gwangyang Port Using Stepwise Regression and Artificial Neural Network Model)

  • 조상호;남형식;류기진;류동근
    • 한국항해항만학회지
    • /
    • 제44권3호
    • /
    • pp.187-194
    • /
    • 2020
  • 항만의 주요 정책 및 향후 운영계획 수립 시 정확한 물동량 예측에 관한 연구는 매우 중요하며 이러한 중요성으로 인해 관련 연구가 활발히 수행되고 있다. 본 논문에서는 국내 최대 석탄 및 철광석 처리 항만인 광양항을 대상으로 단계적 회귀분석과 인공신경망모형을 활용하여 모형간 예측력을 비교하였다. 2009년 1월부터 2019년 1월까지 총 121개월의 월별자료를 활용하였으며 석탄 및 철광석 물동량에 영향을 주는 요인을 선정하여 공급관련요인과 시장·경제관련요인으로 분류하였다. 단계적 회귀분석 결과, 광양항 석탄 물동량 예측모형의 경우, 입항선박 톤수, 석탄가격 및 대미환율이 최종변수로 선정되었고 철광석 물동량 예측모형의 경우, 입항선박 톤수, 철광석가격이 최종변수로 선정되었다. 인공신경망모형의 경우, 모델 성능에 영향을 미치는 다양한 Hyper-parameters를 조정하며 최적 모델을 선정하는 시행착오법을 사용하였다. 분석결과 인공신경망모형이 단계적 회귀분석에 비해 우수한 예측성능을 나타내었으며 예측 모형별 예측값과 실측값을 그래프 상 비교 시에도 인공신경망모형이 단계적 회귀분석에 비해 고·저점을 유사하게 나타냈다.

Stepwise 다중회귀분석을 이용한 최대전력수요와 기상과의 상관관계 분석 (The Relationship between Daily Peak Load and Weather Conditions Using Stepwise Multiple Regression)

  • 차지원;이동건;김현진;주성관
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.475-476
    • /
    • 2015
  • 전력수요는 다양한 외부요인으로부터 영향을 받으므로 전력수요 예측 시 각 요인과의 상관관계를 고려할 필요가 있다. 본 논문은 Stepwise 다중회귀분석법을 이용한 일일 최대전력수요 예측 방법을 제시하였다. 사례연구에서는 2014년 평일 전력수요데이터를 이용하여 제안된 예측방법을 적용하고 그 결과를 평가하였다.

  • PDF

저류함수모형의 매개변수 보정과 홍수예측 (2) 홍수예측방법의 비교 연구 (Parameter Calibration of Storage Function Model and Flood Forecasting (2) Comparative Study on the Flood Forecasting Methods)

  • 김범준;송재현;김형수;홍일표
    • 대한토목학회논문집
    • /
    • 제26권1B호
    • /
    • pp.39-50
    • /
    • 2006
  • 홍수를 예측하기 위해서 국내 5대강 유역의 홍수통제소는 저류함수모형을 사용하고 있으며 현재까지 홍수예측에 대한 많은 연구가 이루어지고 있다. 이에 본 논문에서는 현재 홍수통제소에서 사용되고 있는 저류함수모형과 과거의 강우-수위 관계를 이용한 회귀분석(regression analysis), 그리고 인공신경망(artificial neural network)을 이용하여 홍수를 예측하고 이를 비교, 분석하고자 하였다. 저류함수모형의 경우는 홍수통제소의 대표매개변수와 보정된 최적(평균)매개변수를 적용하였다. 그리고 회귀분석과 인공신경망은 1995~2001년까지의 홍수사상 중 4개의 홍수사상을 선택하여 회귀계수를 구하고 역전파(backpropagation) 알고리즘을 사용하여 학습을 시켰다. 그 결과 저류함수모형의 경우 최적 매개변수를 이용하였을 때 기존의 홍수통제소에서 사용하고 있는 대표매개변수보다 예측이 개선되었으며, 회귀분석의 방법인 다중회귀분석, Robust 회귀분석, Stepwise 회귀분석을 이용한 홍수예측은 비교적 정확한 결과를 얻을 수 있었다. 역전파 알고리즘을 사용한 인공신경망의 경우도 회귀분석을 이용한 홍수예측보다는 다소 못하였지만 정확한 결과를 얻을 수 있었다.

회귀분석에 기초한 균등화 방법에 관한 연구 (A study on equating method based on regression analysis)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.513-521
    • /
    • 2010
  • 대부분의 대학들은 교수업적평가를 위해 강의평가제도를 실시하고 있다. 그러나 강의평가의 결과는 강좌규모, 강의형태, 개설학년, 이수구분, 평균평점 등과 같은 개설강좌의 특성에 많은 영향을 받게 된다. 따라서 이러한 각 강좌특성들이 강의평가 결과에 영향을 미치는 효과를 제거하지 않는다면, 담당교수가 강의평가 결과에 대한 공정성과 객관성을 신뢰할 수 없게 만들 정도로 심각한 편의를 갖게 된다. 따라서 강의평가의 공정성을 위해 강좌특성에 따른 편의를 제거하기 위한 사후조정된 점수가 요구된다. 따라서 본 연구에서는 단계적 변수선택법에 의한 회귀분석을 이용하여 강의평가 결과에 대한 균등화 방법을 이용하여 사후조정된 점수를 계산하는 방법을 제안한다. 그리고 제안된 방법은 기존의 방법과 비교를 하였다.

단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발 (Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis)

  • 정민의;유성진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.598-604
    • /
    • 2014
  • 본 연구는 주요변수를 선정하는 기법을 개발하기 위해서 단계적 회귀와 변수들의 효율성을 평가하기 위해 사용되는 자료봉합분석을 결합한 새로운 방법을 제안하였다. 이를 위해서 먼저 단계적 회귀를 이용하여 중요 변수들을 일차적으로 선정하고, 선정된 각 변수들의 중요도를 이해하기 위해 귀무가설을 세웠고, 중요 변수를 선택하기 위해 Kruskal-Wallis 검정을 사용했다. 또한 해당되는 변수를 Conover-Inman 검정을 사용하여 변동이 발생하는 각 변수들의 우선순위를 결정하였다. 따라서 그 결과, 많은 변수들과 DEA(Data Envelopment Analysis)의 한계를 극복하기 위해 원래 계획된 변수들 중 기준에 의해 원래 유지된 변수와 높은 연관성을 가진 변수들을 남기는 방식으로 변수를 선정하는 기법을 개발한 Jenkins의 기존연구에서는 I2, I4, I5, I6 변수가 누락되었고 I1, I3 변수만이 DEA에 사용되었지만, 본 논문에서 제안된 모델의 효율성 결과로는 I2와 I4 변수를 각각 유지하였다. 본 연구는 다른 문헌에서 단계적 변수의 선택을 보여주기 위해 같은 데이터 집합을 사용하였는데, 여기서 Jenkins의 연구와 같이 변수 I6과 I1, I2를 삭제하였고, I3, I4, I5는 유지하였다. 결론적으로 단계적 회귀 DEA 모델을 사용하여 긴 계산적 절차 없이 변수 선택이 가능함을 발견했으며 기존 연구의 데이터를 적용하여 제안된 모델을 검증하였다. 개발한 DEA모델 결과는 상호 변수에 따라 포함되거나 생략할 수 있기 때문에 실제 현실 상황에서의 지식과 경영적 판단에 매우 유용할 것이다.

케이프선 시장 운임의 결정요인 및 운임예측 모형 분석 (An Analysis on Determinants of the Capesize Freight Rate and Forecasting Models)

  • 임상섭;윤희성
    • 한국항해항만학회지
    • /
    • 제42권6호
    • /
    • pp.539-545
    • /
    • 2018
  • 운임시장의 심한 변동성과 시계열 데이터의 불안정성으로 해운시황 예측에 대한 연구가 큰 성과를 내지 못하고 있지만 최근 대표적인 비선형 모델인 기계학습모델을 적용한 연구들이 활발히 진행되고 있다. 대부분의 기존 연구가 계량모델의 설계단계에서 입력변수에 해당하는 요인들을 기존 문헌연구와 연구자의 직관에 의존하여 선정했기 때문에 요인선정에 대한 체계적인 연구가 필요하다. 본 연구에서는 케이프선 운임을 대상으로 단계적 회귀모형과 랜덤포레스트모델을 이용하여 중요 영향요인을 분석하였다. 해운시장에서 비교적 단순한 수급구조를 가져 요인파악이 용이한 케이프선 운임을 대상으로 하였으며 총 16개의 수급요인들을 사전 추출하였다. 요인간의 상호관련성을 파악하여 단계적 회귀는 8개 요인, 랜덤포레스트는 10개 요인을 분석대상으로 선정하였으며 선정된 변수를 입력변수로 하여 예측한 결과를 비교하였다. 랜덤포레스트의 예측성능이 아주 우수하였는데 수요요인이 주로 선정된 단계적 회귀분석과는 달리 공급요인이 비중 있게 선정되었기 때문인 것으로 판단된다. 본 연구는 운임예측 연구에 있어 운임결정요인에 대한 과학적인 근거를 마련하였으며 이를 위해 기계학습 기반의 모델을 활용하였다는데 연구적 의의가 있다. 또한 시장정보의 분석에 있어 실무자들이 어떤 변수에 중점을 두어야 하는지에 대해 합리적 근거를 제시한 측면에서 해운기업의 의사결정에 실질적 도움이 될 것으로 기대된다.

임목(林木)((해송(海松)) 적지선정(適地選定)에 관한 연구(硏究) (The Selection of the Suitable Site for Forest Tree(Pinus thunbergii))

  • 정영관;박남창;손영모
    • 한국산림과학회지
    • /
    • 제82권4호
    • /
    • pp.420-430
    • /
    • 1993
  • 우리나라 남부지방의 주요 수종(樹種)인 해송임분(海松林分)의 지위지수(地位指數)에 영향하리라 예상되는 토양(土壤)의 이화학적(理化學的) 성질(性質)과 환경인자(環境因子)중 18개 인자(因子)를 218개 표준지(標準地)에서 측정(測定)하여 설명변수로 하고, 해송(海松)의 수고생장량(樹高生長量), 즉 임분(林分)의 지위지수(地位指數)를 반응변수로 하여 상관분석, 편상관분석, 회귀분석 및 요인분석을 실시하여 해송(海松)의 적지선정(適地選定), 생장량(生長量) 추정 및 비배관리 등에 대한 기초적 지침을 제시하고자 이 연구(硏究)를 실시하였으며, 그 결과를 요약하면 다음과 같다. 1. 해송임분(海松林分)의 지위지수(地位指數)와 토양(土壤) 및 환경인자(環境因子)간의 상관에 있어서, 지위지수(地位指數)와 유효토심간의 상관계수 r=0.6498로 약간 높게 나타났고(p<0.01), 다음으로 경사도, 유기물함량, 전질소함량 순으로 상관이 나타났다. 2. 각종 인자간의 내부상관을 배제한 해송임분(海松林分)의 지위지수(地位指數)와 영향인자간의 편상관에 있어서는 유효토심(r=0.6270), 경사도(r=-0.5423), 염기포화도(r=0.3278) 순으로 해송임분(海松林分)의 지위지수(地位指數)에 영향을 미치고 있었다. 3. 단계적회귀분석 결과, 해송임분(海松林分)의 지위지수(地位指數)에 영향을 미치는 인자군(因子群)은 유효토심, 경사도, 유기물함량, 염기포화도, 토양산도, 미사함량 및 치환성 $Ca^{{+}{+}}$ 군(群)으로 나타났다. 4. 토양(土壤) 및 환경인자(環境因子)에 의한 해송임분(海松林分)의 지위지수(地位指數) 추정식은 $Y=13.2691+0.0242\;X_2-1.2244\;X_4+0.6142\;X_5-0.3472\;X_{11}+0.0355\;X_{13}+0.1552\;X_{15}-0.1002\;X_{17}$으로 도출되었고, 추정식에 대한 적합도는 77%로 나타났다. 5. 해송임분(海松林分)의 지위지수(地位指數)에 영향하는 인자들을 요인분석한 결과, eigenvalue 1.0 이상의 주성분은 6개였으며, 이들의 누적기여율(累積奇與率)은 71.1%였다. 6. 요인분석(要因分析)에 의하여 산출된 6개의 요인점수(要因點數)와 해송임분(海松林分)의 지위지수(地位指數)와의 관계를 단계적회귀분석한 결과, 5개의 요인점수(要因點數)를 갖는 추정모델이 도출되었다. 이 해송임분(海松林分)의 지위지수(地位指數) 추정모델에 대한 $R^2=0.8481$로 높은 설명력을 가지며, 회귀계수에 대한 유의성을 검정한 결과 1% 수준에서 유의성이 인정되었다. 따라서 해송(海松)의 수고생장(樹高生長)에 관여하는 인자(因子)를 선정하는 방법은 요인분석(要因分析)에 의한 회귀분석(回歸分析)이 가장 유리한 것으로 나타났다. 그리고 해송임분(海松林分)의 경영은 이상과 같은 방법에 의하여 선정된 임목생장(林木生長)에 관여하는 인자(因子)를 고려하여 실행되어야 할 것으로 사료된다.

  • PDF

도시인구분포모형 개발을 위한 GA모형과 회귀모형의 적합성 비교연구 (A Comparative Study on the Genetic Algorithm and Regression Analysis in Urban Population Surface Modeling)

  • 최내영
    • Spatial Information Research
    • /
    • 제18권5호
    • /
    • pp.107-117
    • /
    • 2010
  • 본 연구는 최근 다수 도시개발사업들이 활발히 진행되고 있는 화성시 동부권을 사례대상지로하여 행정구역 단위 인구데이터를 격자형 인구분포자료로 변환한 후 인구유인을 유발할 것으로 예상되는 주요 도시계획관련 공간변수들을 GIS로 측정 대입하여 제네틱 알고리즘기법과 회귀분석기법 두 가지 방법으로 일종의 도시인구분포모형을 구축하였다. 두 가지 모형의 분석결과를 통해 도시환경 해석에 있어서의 두 기법의 성능상 특장점을 비교해 보았으며, 분석결과 GA기법은 변수 설명력에 관한 변별력에 있어 일반회귀분석보다 우월한 특징이 있음을 알 수 있었고 따라서 회귀분석과 병행할 경우 매우 직관적이며 보완적인 도시분석기법이 될 수 있음을 확인할 수 있었다.

인성 데이터를 활용한 조기 퇴사자 예측 (Predicting Early Retirees Using Personality Data)

  • 김영박;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.141-147
    • /
    • 2018
  • 본 연구는 기업에서 채용 전형 시 진행되는 인성시험 결과 데이터를 기반으로, 입사 3년 미만의 조기 퇴사자를 분석하였다. 예측 모형은 적합성 및 향후 활용성을 고려하여 제조(manufacture)직군과 R&D직군 2개 그룹으로 구분하여 분석하였으며, 독립변수 선택은 전진(stepwise)선택법에 따라 직군별로 유의미한 독립변수를 선택하였다. 예측 모형은 지도학습(supervised learning) 방법 중 로지스틱 회귀분석 알고리즘을 선택하였으며, 과잉적합(overfitting) 또는 과소적합(underfitting)을 방지하고자 교차 검증(cross validation)을 통해 예측 모형을 훈련시켰다. 혼동행렬(confusion matrix)을 통해 2개 그룹의 정확도(accuracy)를 확인하였으며, 조기 퇴직에 가장 영향을 많이 미치는 요인으로 제조직군에서는 '몰입', R&D직군에서는 '반사회성' 항목으로 확인되었다. 기존 퇴직 관련 연구는 설문 방식으로 데이터를 수집하고, 퇴직과 관련성이 높은 요인을 확인하는데 집중하였다면, 본 연구는 채용 전형 시 진행되는 인성 결과 분석을 통해 향후에도 지속 가능한 조기 퇴직 예측 모형을 제시했다는 면에서 의의를 갖는다.