• 제목/요약/키워드: dropout prediction

검색결과 28건 처리시간 0.022초

Development of the Drop-outs Prediction Model for Intelligent Drop-outs Prevention System

  • Song, Mi-Young
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권10호
    • /
    • pp.9-17
    • /
    • 2017
  • The student dropout prediction is an indispensable for many intelligent systems to measure the educational system and success rate of all university. Therefore, in this paper, we propose an intelligent dropout prediction system that minimizes the situation by adopting the proactive process through an effective model that predicts the students who are at risk of dropout. In this paper, the main data sets for students dropout predictions was used as questionnaires and university information. The questionnaire was constructed based on theoretical and empirical grounds about factor affecting student's performance and causes of dropout. University Information included student grade, interviews, attendance in university life. Through these data sets, the proposed dropout prediction model techniques was classified into the risk group and the normal group using statistical methods and Naive Bays algorithm. And the intelligence dropout prediction system was constructed by applying the proposed dropout prediction model. We expect the proposed study would be used effectively to reduce the students dropout in university.

시프트 시그모이드 분류함수를 가진 로지스틱 회귀를 이용한 신입생 중도탈락 예측모델 연구 (A Study of Freshman Dropout Prediction Model Using Logistic Regression with Shift-Sigmoid Classification Function)

  • 김동형
    • 디지털산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.137-146
    • /
    • 2023
  • The dropout of university freshmen is a very important issue in the financial problems of universities. Moreover, the dropout rate is one of the important indicators among the external evaluation items of universities. Therefore, universities need to predict dropout students in advance and apply various dropout prevention programs targeting them. This paper proposes a method to predict such dropout students in advance. This paper is about a method for predicting dropout students. It proposes a method to select dropouts by applying logistic regression using a shift sigmoid classification function using only quantitative data from the first semester of the first year, which most universities have. It is based on logistic regression and can select the number of prediction subjects and prediction accuracy by using the shift sigmoid function as an classification function. As a result of the experiment, when the proposed algorithm was applied, the number of predicted dropout subjects varied from 100% to 20% compared to the actual number of dropout subjects, and it was found to have a prediction accuracy of 75% to 98%.

앙상블 기법을 활용한 대학생 중도탈락 예측 모형 개발 (A Study on the Development of University Students Dropout Prediction Model Using Ensemble Technique)

  • 박상성
    • 디지털산업정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.109-115
    • /
    • 2021
  • The number of freshmen at universities is decreasing due to the recent decline in the school-age population, and the survival of many universities is threatened. To overcome this situation, universities are seeking ways to use big data within the school to improve the quality of education. A study on the prediction of dropout students is a representative case of using big data in universities. The dropout prediction can prepare a systematic management plan by identifying students who will drop out of school due to reasons such as dropout or expulsion. In the case of actual on-campus data, a large number of missing values are included because it is collected and managed by various departments. For this reason, it is necessary to construct a model by effectively reflecting the missing values. In this study, we propose a university student dropout prediction model based on eXtreme Gradient Boost that can be applied to data with many missing values and shows high performance. In order to examine the practical applicability of the proposed model, an experiment was performed using data from C University in Chungbuk. As a result of the experiment, the prediction performance of the proposed model was found to be excellent. The management strategy of dropout students can be established through the prediction results of the model proposed in this paper.

학생 중도탈락 예측지수에 관한 사후검증 연구 (Post-Examination Analysis on the Student Dropout Prediction Index)

  • 이지은
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.175-183
    • /
    • 2019
  • 학습자 중도탈락은 사이버대학이 해결해야 할 과제 중 하나이다. 2019년도 기준으로 사이버대학의 전체 학생 수는 13만여 명에 달하고 있으나, 중도탈락 비율도 매우 높은 편이다. 중도탈락율을 낮추기 위해 사이버대학은 학습 분석에 많은 투자를 하고 있다. 특히 일부 사이버대학에서는 중도탈락 가능성을 정량적으로 분석하여 중도탈락이 우려되는 학생에 대한 지원을 강화하고 있다. 본 논문의 목적은 중도탈락 예측지수에 영향을 미치는 학습데이터를 규명하는데 있다. 분석 결과, 수강 차시(진도율), 이수학점, 평점, 휴학 횟수가 중도탈락에 유의미한 영향을 미치는 것으로 확인되었다. 사이버대학은 학생 중도탈락 예측지수에 관한 사후검증을 통해 예측 모델의 정확도를 높여나가야 할 것이다.

  • PDF

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

Prediction of golden time for recovering SISs using deep fuzzy neural networks with rule-dropout

  • Jo, Hye Seon;Koo, Young Do;Park, Ji Hun;Oh, Sang Won;Kim, Chang-Hwoi;Na, Man Gyun
    • Nuclear Engineering and Technology
    • /
    • 제53권12호
    • /
    • pp.4014-4021
    • /
    • 2021
  • If safety injection systems (SISs) do not work in the event of a loss-of-coolant accident (LOCA), the accident can progress to a severe accident in which the reactor core is exposed and the reactor vessel fails. Therefore, it is considered that a technology that provides recoverable maximum time for SIS actuation is necessary to prevent this progression. In this study, the corresponding time was defined as the golden time. To achieve the objective of accurately predicting the golden time, the prediction was performed using the deep fuzzy neural network (DFNN) with rule-dropout. The DFNN with rule-dropout has an architecture in which many of the fuzzy neural networks (FNNs) are connected and is a method in which the fuzzy rule numbers, which are directly related to the number of nodes in the FNN that affect inference performance, are properly adjusted by a genetic algorithm. The golden time prediction performance of the DFNN model with rule-dropout was better than that of the support vector regression model. By using the prediction result through the proposed DFNN with rule-dropout, it is expected to prevent the aggravation of the accidents by providing the maximum remaining time for SIS recovery, which failed in the LOCA situation.

머신러닝 기반 대학생 중도 탈락 예측 모델의 성능 비교 (Performance Comparison of Machine Learning based Prediction Models for University Students Dropout)

  • 정석봉;김두연
    • 한국시뮬레이션학회논문지
    • /
    • 제32권4호
    • /
    • pp.19-26
    • /
    • 2023
  • 전국 대학생의 중도 탈락 비율의 증가는 학생 개인 뿐만 아니라 대학과 사회에 심각한 부정적 영향을 끼친다. 본 연구에서는 중도 탈락이 예상되는 학생을 사전에 식별하기 위하여, 각 대학의 학사관리 시스템에서 손쉽게 얻을 수 있는 학적 데이터를 기반으로 머신러닝 분야의 결정트리, 랜덤 포레스트, 로지스틱 회귀 및 딥러닝 기반의 중도 탈락 예측 모델을 구축하고, 그 성능을 비교·분석하였다. 분석 결과 로지스틱 회귀 기반 예측 모델의 재현율이 가장 높았으나 f-1 및 auc 값이 낮은 한계를 보였고, 랜덤 포레스트 기반의 예측 모델의 경우 재현율을 제외한 다른 모든 지표에서 가장 우수한 성능을 보였다. 또한 예측 기간에 따른 예측 모델의 성능을 확인하기 위하여 예측 기간을 단기(1개 학기 이내), 중기(2개 학기 이내) 및 장기(3개 학기 이내)로 나누어 분석해 본 결과, 장기 예측 시 가장 높은 예측력을 보였다. 본 연구를 통해 각 대학은 중도 탈락이 예상되는 학생들을 조기에 식별하고, 이들에 대한 집중 관리를 통해 중도 탈락 비율을 줄이며 나아가 대학 재정 안정화에 기여할 수 있을 것으로 기대된다.

정형 데이터와 비정형 데이터를 동시에 고려하는 기계학습 기반의 직업훈련 중도탈락 예측 모형 (A Machine Learning-Based Vocational Training Dropout Prediction Model Considering Structured and Unstructured Data)

  • 하만석;안현철
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.1-15
    • /
    • 2019
  • 직업훈련 교육 현장에서 느끼는 가장 큰 어려움 중 하나는 중도탈락 문제이다. 훈련과정마다 많은 수의 학생들이 중도탈락을 하게 되어 국가 예산 낭비 및 청년 취업률 개선에 장애 요인이 되고 있다. 본 연구에서는 중도탈락의 원인을 주로 분석한 기존 연구들과 달리, 각종 수강생 정보를 활용하여 사전에 중도탈락을 예측할 수 있는 기계학습 기반 모형을 제안하고자 한다. 특히 본 연구의 제안모형은 수강생 관련 정형 데이터 뿐 아니라 비정형 데이터인 강사의 상담일지 정보까지 동시에 고려하여 모형의 예측정확도를 제고하고자 하였다. 이 때 비정형 데이터에 대한 분석은 최근 주목받고 있는 텍스트 분석 기술인 Word2vec과 합성곱 신경망을 이용해 수행하였다. 국내 한 직업훈련기관의 실제 데이터에 제안모형을 적용해 본 결과, 정형데이터만을 사용하여 중도탈락을 예측할 때보다 비정형 데이터를 함께 고려했을 때 예측의 정확도가 최대 20%까지 향상됨을 확인할 수 있었다. 아울러, Support Vector Machine을 기반으로 정형 데이터와 비정형 데이터를 결합해 분석했을 때, 검증용 데이터셋 기준으로 90% 후반대의 높은 예측 정확도를 나타냄을 확인하였다.

Performance Comparison of Neural Network and Gradient Boosting Machine for Dropout Prediction of University Students

  • Hyeon Gyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.49-58
    • /
    • 2023
  • 학생들의 중도 탈락은 대학의 재정적 손실 뿐 아니라, 학생 개개인 및 사회적으로도 부정적인 영향을 끼친다. 이러한 문제를 해결하기 위해 기계 학습을 이용하여 대학생들의 중도 탈락 여부를 예측하고자 하는 다양한 시도가 이루어지고 있다. 본 논문에서는 대학생들의 중도 탈락 여부를 예측하기 위해 DNN(Deep Neural Network)과 LGBM(Light Gradient Boosting Machine)을 이용한 모델을 구현하고 성능을 비교하였다. 학습 데이터로는 서울 소재 중소규모 4년제 대학인 A 대학의 20,050명의 학생을 대상으로 수집된 학적 및 성적 데이터를 학습에 이용하였다. 원본 데이터의 140여개의 속성 중 중도 탈락 여부를 나타내는 속성과의 상관계수가 0.1 이상인 속성들만 추출하여 학습하였다. 두 모델의 성능 실험 결과, DNN과 LGBM의 F1-스코어는 0.798과 0.826이었으며, LGBM이 DNN에 비해 2.5% 나은 예측 성능을 보였다.

머신러닝을 이용한 학업중단 위기학생 관리시스템의 설계 (Design of the Management System for Students at Risk of Dropout using Machine Learning)

  • 반재훈;김동현;하종수
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1255-1262
    • /
    • 2021
  • 학업을 중단하는 학생들의 비율이 해마다 증가하고 있어 대학은 학업중단을 막기 위하여 위험요소를 파악하고 이를 사전에 제거하기 위해 노력하고 있다. 그러나 특정 위험요소의 단변수 분석을 통해 위기학생을 관리하고 있어 예측이 부정확한 문제가 발생하고 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 학업중단 위험요소를 파악하고 학업중단 예측을 위해 머신러닝 방법을 통해 다변수 분석을 실시한다. 또한 다양한 예측방법별로 성능평가를 수행하여 최적화 방법을 도출하고 학업중단을 발생시키는 위험요소간의 연관성과 기여도를 평가한다.