• 제목/요약/키워드: 회귀분석 모델

검색결과 1,503건 처리시간 0.026초

학생 중도탈락 예측 모델에 관한 연구 (A Study on the Prediction Model for Student Dropout)

  • 이종혁;김대학;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.37-40
    • /
    • 2018
  • 빅데이터 산업 부상과 함께 교육 데이터 분석 분야가 새롭게 주목받고 있다. 교육 현장에서 학습 데이터의 양과 종류는 꾸준히 증가하고 있고 이를 분석하기 위한 정보기술도 계속 발전하고 있다. 한편, 학교 교육은 사회적 성취와 밀접한 관련이 있어 사회이동의 중요한 수단이 되는 만큼 학교 교육으로부터 이탈할 위험이 있는 학생들을 조기에 발견하여 이탈을 방지하는 것은 매우 중요하다. 본 논문은 대학생의 중도탈락을 예방하기 위해 로지스틱 회귀분석과 다층 퍼셉트론 기법을 이용해 학습 데이터를 분석하여 예측 모델을 생성하고 해당 모델을 평가한다. 평가 결과, 다층 퍼셉트론 모델이 로지스틱 회귀분석 모델에 비해 정확도와 재현율은 우수하였지만 정밀도는 약간 저조하였다.

시스템 수준의 전력 예측을 위한 회귀분석에 기반하는 분석 방법 (Mixed Approach for Fast System-Level Power Analysis based on Regression Analysis)

  • 김희석;임채석;하순회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.694-696
    • /
    • 2002
  • 이 논문에서는 시스템 수준의 전력 소모를 분석하는 방법론을 설명한다. 응용의 시스템 수준 전력 모델을 구하기 위해서, 시스템을 이루는 각 부분들을 선형적으로 모델링하고, 이를 모두 더한다. 선형적으로 모델링된 식의 파라메터들을 구하기 위해서, 회귀분석에 기반한 분석을 한다. 이를 위해서 다양한 벤치마크들을 준비하고, 응용에 대해서 측정을 한 것과 수정된 시뮬레이터에서 필요한 정보를 얻어야 한다. 이렇게 분석한 전력 모델의 예측치는 5% 내의 정확도를 가짐을 확인하였다.

  • PDF

비선형 모델에 있어서의 다양한 종류의 잔차들에 관한 연구 (The Different Types of Residuals in Nonlinear Regression Models)

  • Kang, Chang Wook
    • 산업경영시스템학회지
    • /
    • 제12권19호
    • /
    • pp.31-37
    • /
    • 1989
  • 본 논문은 비선형 회귀분석 모델(Nonlinear Regression Models)에서의 추산잔차(Recursive Residuals)를 정의하기 위한 것을 목적으로 한다. 선형 회귀분석 모델(Linear Regression Models)에서는 추산잔차가 우리가 측정할 수 없는 진짜 오차(True Error)와 같은 확률 분포를 갖는데 이의 평균은 0이고 분산은 ${sigma}^2$이다. 그러나 비선형 회귀분석에서는 이와 같은 정확한 분포를 알 수가 없기 때문에, 여러 종류의 잔차들을 연구 검토하고 나아가서 시뮬레이션(Simulation)을 통하여 분석.비교한 뒤 추산잔차를 정의하기로 한다.

  • PDF

수로교 개보수를 위한 개략공사비 산정 모델 개발 - 회귀분석과 사례기반추론의 비교를 중심으로 - (Development of Approximate Cost Estimate Model for Aqueduct Bridges Restoration - Focusing on Comparison between Regression Analysis and Case-Based Reasoning -)

  • 전건영;조재용;허영
    • 대한토목학회논문집
    • /
    • 제33권4호
    • /
    • pp.1693-1705
    • /
    • 2013
  • 국내의 수로교는 쌀문화로 상징되는 농업용수를 공급하는 교량으로서 수로교를 개보수하기 위해서는 기본설계를 실시하는 것이 바람직하나 현재 생략되고 있는 실정이므로 이에 소요되는 공사비를 산정할 필요가 있다. 이 연구에서는 2003년 이후 교체한 RC구조 수로교에 대한 실적자료를 기초로 개략공사비 산정 회귀분석(RA) 모델과 사례기반추론(CBR) 모델을 개발하였다. RA 모델의 경우 단순회귀 모델이 다중회귀 모델보다 오차율이 낮았다. CBR 모델의 경우 유전 알고리즘을 이용하였으며 영향요인의 가중치, 편차, 순위조건을 최적화 대상으로 하였고 특히 영향요인 가중치의 범위를 제한하여 수로교 개보수 공사비의 예측 정확도를 제고하였다. RA 모델과 CBR 모델 사이의 오차율은 통계적 차이를 보이지 않았다. 본 논문에서 제시된 수로교 개보수 개략공사비 산정방법은 개보수사업의 시행에 따른 신속한 의사결정을 하는데 활용될 수 있을 것으로 기대된다.

상황변수의 조절효과 차이에 관한 연구 (SPSS와 AMOS프로그램을 중심으로) (The Study on the Different Moderation Effect of Contingency Variable (Focused on SPSS statistics and AOMS program))

  • 최창호;유연우
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.89-98
    • /
    • 2017
  • 본 연구는 인과관계 분석에서 주로 활용되는 SPSS statistics(회귀분석)과 구조방정식모델을 구현하는 프로그램 중 하나인 AMOS 프로그램을 각각 활용하여 동일한 데이터에 대하여 조절효과 검정을 위한 실증분석을 실시하였다. 실증분석 결과, SPSS statistics을 활용한 회귀분석에서 상황변수가 범주형데이터인 성별과 연속형데이터인 컨설팅만족도 모두에서 조절효과가 없는 것으로 나타난 반면, AMOS 프로그램을 활용한 구조방정식모델에서는 10% 유의수준에서 컨설턴트의 능력 및 태도가 컨설팅재구매에 미치는 영향관계를 컨설팅만족도가 부분적으로 조절하고 있는 것으로 나타났다. 결국, 조절효과 분석은 AMOS 프로그램을 활용한 구조방정식모델과 SPSS statistics을 활용한 회귀분석모델이 전혀 다른 접근방법을 사용하고 있어 얼마든지 상이한 결과가 나올 수 있음을 보여준다.

로지스틱 회귀분석 기법을 이용한 강원도 산사태 취약성 평가 및 분석 (Evaluation and Analysis of Gwangwon-do Landslide Susceptibility Using Logistic Regression)

  • 연영광
    • 한국지리정보학회지
    • /
    • 제14권4호
    • /
    • pp.116-127
    • /
    • 2011
  • 본 논문에서는 로지스틱 회귀분석 기법을 이용하여 산사태 취약성 분석을 수행하였다. 예측모델의 성능은 모델의 적합도 검증을 통해 사용된 데이터가 모델에 얼마나 잘 반영되어 구축되었는지에 대한 적합도 평가뿐만 아니라 예측성능에 대한 평가가 필요하다. 따라서 이 논문에서는 모델에 대한 객관적인 결과를 얻기 위해 이와 같은 두 가지 측면에 대하여 예측성능 평가를 적용하였다. 연구지역은 2006년도 집중 호우로 많은 산사태가 발생한 강원도 인제 일대를 대상으로 하였다. 산사태 관련인자들은 지형도, 토양도, 임상도로부터 추출하였다. 예측모델에 대한 평가는 누적이득차트 곡선의 하부영역을 계산하였다. 예측모델의 적합도 평가에서는 87.9% 교차검증을 통한 예측정확도 평가 결과 84.8%로 두 평가 결과간의 큰 차이를 보이지 않으며 좋은 성능의 결과를 산출하였다. 이는 산사태와 관련성이 높은 유발인자와 예측모델 성능에서 기인된 결과로 해석 될 수 있다.

항공 LiDAR 자료를 이용한 산림재적추정 모델 개발 - 봉화군 춘양면 애당리 혼효림을 대상으로 - (Development of Forest Volume Estimation Model Using Airborne LiDAR Data - A Case Study of Mixed Forest in Aedang-ri, Chunyang-myeon, Bonghwa-gun -)

  • 조승완;김용구;박주원
    • 한국지리정보학회지
    • /
    • 제20권3호
    • /
    • pp.181-194
    • /
    • 2017
  • 본 연구의 목적은 산림재적 현장자료와 항공 LiDAR 자료 기반의 산림재적 추정을 위한 회귀모델의 개발이다. 추정 모델은 경상북도 봉화군 지역에서 임의추출법에 의해 선정된 30개의 원형 표본지로부터 산출한 표본지별 산림재적을 반응변수로 하고, 항공 LiDAR 원자료로부터 개별 표본지의 고도분포 백분위수(Height Percentiles, HP) 및 층위 단위 점 개체수 백분율(Height Bin, HB)을 추출하여 예측변수로 사용하여 구성하였다. 단순선형회귀분석, 이차 다항회귀분석 및 단계적 회귀분석 방법을 이용한 다중회귀분석을 실시하여 적합모델들의 후보들을 도출하였으며, 검증을 위하여 각 모델별로 교차 타당성 검증을 실시하여 PRESS 통계치를 구하였다. 모델의 $R^2$ 및 PRESS을 비교하여 적합성을 검토한 결과, $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$의 다중회귀모델의 $R^2$이 0.509로 가장 높고, $HP_{25}$ 단순회귀모델의 PRESS 값이 122.352으로 가장 낮은 것으로 나타났다. 수직구조가 복잡한 우리나라 산림재적을 추정하는 모델로는 다양한 수직적 정보를 포함하고 있는 $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$이 상대적으로 보다 적합하다고 사료된다.

회귀 분석 모델을 이용한 고리 1호기 해체 비용 추정 (Decommissioning Cost Estimation of Kori Unit 1 Using a Multi-Regression Analysis Model)

  • 주한영;김재욱;정소윤;문주현
    • 방사성폐기물학회지
    • /
    • 제18권2_spc호
    • /
    • pp.247-260
    • /
    • 2020
  • 본 논문에서는 고리 1호기 해체 비용 추정을 위해 외국 원자력발전소 해체 비용 데이터를 현가화한 후 원자력발전소 해체 비용 추정 회귀 분석모델을 개발하였다. 이 모델 개발에 사용된 데이터는 해체 또는 진행 중인 BWR 13기, PWR 16기의 해체 비용 데이터이다. 회귀 분석모델 도출을 위해, 해체 비용을 종속변수로 정하고, 해체 원전의 운전 특성을 반영할 수 있게 고안된 Contamination factor와 해체 기간을 독립변수로 선정하였다. 빅데이터 분석 도구인 R language의 통계패키지를 이용하여 회귀 분석모델을 도출하였다. 이 회귀 분석 모델을 적용하여 고리 1호기 해체 비용을 예측한 결과, 미화 663.40~928.32백만 달러, 한화 약 7,828.12억~1조 954.18억 원이 소요될 것으로 예측되었다.

풍속 예측을 위한 선형회귀분석과 비선형회귀분석 기법의 비교 및 인자분석 (Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction)

  • 김동연;서기성
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.477-482
    • /
    • 2015
  • 단기풍속 예측을 위한 진화적 선형 및 비선형 회귀분석 기반의 보정 기법을 비교한다. 모델의 체계적 오류를 교정하기 위한 효율적인 MOS(Model Output Statistics)의 개발이 필요하나, 기존의 선형회귀분석 기반의 보정기법은 다양한 기상요소의 복잡한 비선형 특성을 반영하기 힘들다. 이를 개선하기 위해서 유전 프로그래밍을 사용하여 풍속 예측에 대한 비선형 보정 수식을 생성하는 기법을 제안하고 기본 다중선형회귀분석법 및 Ridge, Lasso 회귀분석법과 비교한다. 더불어, 선형회귀분석법과 진화적 비선형회귀분석 기법의 인자 선택의 차이와 유사성을 비교하고 분석한다. 2007년~2013년의 KLAPS(Korea Local Analysis and Prediction System) 재분석자료를 사용하여 제주도와 부산지역의 격자점에 대한 실험을 수행한다.

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF