• 제목/요약/키워드: dropout prediction

검색결과 29건 처리시간 0.03초

머신러닝을 이용한 학업중단 위기학생 관리시스템의 설계 (Design of the Management System for Students at Risk of Dropout using Machine Learning)

  • 반재훈;김동현;하종수
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1255-1262
    • /
    • 2021
  • 학업을 중단하는 학생들의 비율이 해마다 증가하고 있어 대학은 학업중단을 막기 위하여 위험요소를 파악하고 이를 사전에 제거하기 위해 노력하고 있다. 그러나 특정 위험요소의 단변수 분석을 통해 위기학생을 관리하고 있어 예측이 부정확한 문제가 발생하고 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 학업중단 위험요소를 파악하고 학업중단 예측을 위해 머신러닝 방법을 통해 다변수 분석을 실시한다. 또한 다양한 예측방법별로 성능평가를 수행하여 최적화 방법을 도출하고 학업중단을 발생시키는 위험요소간의 연관성과 기여도를 평가한다.

사이버대학 중도탈락 개선을 위한 예측모형 개발 (Development of Prediction Model to Improve Dropout of Cyber University)

  • 박철
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.380-390
    • /
    • 2020
  • 사이버대학교는 20대 중심의 일반대학교 학생보다 사회적 배경, 경제적 요인, IT 지식 및 활용능력 등. 복잡한 교육환경의 변화 요인으로 신입생들의 중도탈락이 높은 실정이다. 따라서 사이버대학교 학생은 일반대학교와 다른 중도탈락 방지 대책과 개선 방법이 필요하다. 본 연구에서는 A 사이버대학의 2017년 및 2018년 1학기 중도탈락에 영향을 미치는 요인을 추출하고 '의사결정트리모델'을 통하여 중점관리 및 상담기준을 분류하여 주요 요인을 도출하였다. 각 주요 요인에 대하여 의사결정 적용기준과 주차별 추진방법을 제시하여 '중도탈락개선모형'으로 구현하였다. 그리고 2019년 1학기 신입생을 대상으로 실제로 운영되고 있는 사이버대학 강의운영에 적용하였다. 그 결과 '중도탈락개선모형'을 적용한 신입생의 중도탈락률은 4.2% 감소하였고 학업지속비율은 11.4% 증가하였다. 본 연구의 주요한 의미는 설문지 조사와 사이버대학 LMS(Learning Management System) 학습활동 결과를 동시에 적용하여 객관적인 분석을 하였다는 것이다. 그러나 학생 자료에 대한 정량적인 요인분석은 되었지만, 정성적인 요인분석이 반영되지 못하였고 연구의 구조적인 한계점이 있어 후속연구가 필요하다. 본 연구에서 구현된 개선모형은 사이버대학의 중도탈락률 및 학업지속비율 개선에 유효하게 적용될 것으로 기대한다.

일반대학에서 교양 e-러닝 강좌의 중도탈락 예측모형 개발과 조기 판별 가능성 탐색 (Dropout Prediction Modeling and Investigating the Feasibility of Early Detection in e-Learning Courses)

  • 유지원
    • 컴퓨터교육학회논문지
    • /
    • 제17권1호
    • /
    • pp.1-12
    • /
    • 2014
  • e-러닝 환경에서는 학습자의 학습행동이 학습관리시스템(LMS)에 자동으로 기록되며, 최근에는 이러한 데이터를 분석하여 수업과 학습성과 향상에 활용하는 학습분석학(learning analytics)적 접근이 증가하고 있다. 중도탈락은 e-러닝에서 지속되어 온 문제로, 본 연구는 일반대학 e-러닝 강좌에서 LMS에 기록된 데이터로부터 중도탈락 예측 모형을 구축하여 e-러닝 중도탈락 처방에 기초 자료를 제공하고자 하였다. 국내 일반대학에서 운영되는 교양 e-러닝 강좌를 편의표집하고, 이 강좌를 수강하는 578명의 자료로 중도탈락을 예측하는 로지스틱 회귀분석을 실시한 결과, 주차별로 계획된 학습을 규칙적으로 완료하는 출석과 총 학습시간이 중도탈락 예측에 유의한 선행요인으로 분석되었고, 이 로지스틱 회귀모형은 전체적으로 96%의 정확도로 수강완료자와 중도탈락자를 구분하였다. 또한 학습자가 중도탈락을 결정하기 이전 시점에서 이 모형을 적용하여 중도탈락 조기 판별 가능성을 탐색하고, 본 연구결과를 토대로 시사점과 이 모형의 잠재적 활용가치를 논의하였다.

  • PDF

전문대학 학생의 학업중단 예측에 관한 연구: 초기 학업 성적의 중요성 (A Study on Predicting Student Dropout in College: The Importance of Early Academic Performance)

  • 오상조;심지환
    • 산업융합연구
    • /
    • 제22권2호
    • /
    • pp.23-32
    • /
    • 2024
  • 본 연구에서는 서울 소재 한 전문대학 학생들을 대상으로 하여 최소한의 인구통계학적 변수와 1학년 1학기 성적을 활용하여 학생들의 최종 학적 상태를 예측하고자 하였다. XGBoost와 LightGBM 모델을 사용한 결과, 이러한 변수들이 학생들의 제적 여부 예측에 유의미한 것을 발견하였다. 이는 학업 시작 초기의 성적이 학업 중단의 중요한 지표가 될 수 있음을 시사한다. 또한, 전문대학의 학제가 최종 학적에 영향을 미칠 가능성을 확인하였으며, 이는 학업 기간이 학생들의 학업 중단 결정에 중요한 요소임을 나타낸다. 전문대학에서 조기 학업 중단 의도를 파악하는 데 있어 심리적, 사회적, 경제적 요인에 의존하지 않고 학업 성취도만을 기준으로 모델링을 시도하였다. 이는 향후 학업 중단에 대한 조기 경보 시스템 구축에 도움이 될 것으로 기대된다.

양방향 LSTM과 데이터 조합탐색 및 딥러닝 관련 기법을 활용한 철근 가격 단기예측에 관한 실험적 연구 (Experimental Study on the Short-Term Prediction of Rebar Price using Bidirectional LSTM with Data Combination and Deep Learning Related Techniques)

  • 이용성;김경환
    • 한국건설관리학회논문집
    • /
    • 제21권6호
    • /
    • pp.38-45
    • /
    • 2020
  • 본 연구는 양방향 LSTM, Random Search, 데이터 조합, Dropout을 이용한 철근 가격 단기예측 딥러닝 모델을 개발하는 체계적인 절차를 제시한다. 일반적으로 사용자가 직관적으로 이러한 값을 결정하여 예측성능이 우수한 결과를 탐색하는데 시간이 많이 걸리고 반복적인 시도를 하게 되는데, 이러한 시도로 찾아낸 결과가 우수하다고 보장할 수 없다. 본 연구에서 제시하는 제안된 접근방식으로 단기 가격예측의 평균 정확도는 약 98.32%이다. 그리고 이 방식은 철근 이외의 건축재료를 비롯하여 통계기반의 시계열 데이터로 가격을 예측하는 연구에서 본 연구에서 제시한 내용이 우수한 예측결과를 도출하기 위한 기초적 자료로 활용될 수 있을 것이다.

이진 분류문제에서의 딥러닝 알고리즘의 활용 가능성 평가 (Feasibility of Deep Learning Algorithms for Binary Classification Problems)

  • 김기태;이보미;김종우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.95-108
    • /
    • 2017
  • 최근 알파고의 등장으로 딥러닝 기술에 대한 관심이 고조되고 있다. 딥러닝은 향후 미래의 핵심 기술이 되어 일상생활의 많은 부분을 개선할 것이라는 기대를 받고 있지만, 주요한 성과들이 이미지 인식과 자연어처리 등에 국한되어 있고 전통적인 비즈니스 애널리틱스 문제에의 활용은 미비한 실정이다. 실제로 딥러닝 기술은 Convolutional Neural Network(CNN), Recurrent Neural Network(RNN), Deep Boltzmann Machine (DBM) 등 알고리즘들의 선택, Dropout 기법의 활용여부, 활성 함수의 선정 등 다양한 네트워크 설계 이슈들을 가지고 있다. 따라서 비즈니스 문제에서의 딥러닝 알고리즘 활용은 아직 탐구가 필요한 영역으로 남아있으며, 특히 딥러닝을 현실에 적용했을 때 발생할 수 있는 여러 가지 문제들은 미지수이다. 이에 따라 본 연구에서는 다이렉트 마케팅 응답모델, 고객이탈분석, 대출 위험 분석 등의 주요한 분류 문제인 이진분류에 딥러닝을 적용할 수 있을 것인지 그 가능성을 실험을 통해 확인하였다. 실험에는 어느 포르투갈 은행의 텔레마케팅 응답여부에 대한 데이터 집합을 사용하였으며, 전통적인 인공신경망인 Multi-Layer Perceptron, 딥러닝 알고리즘인 CNN과 RNN을 변형한 Long Short-Term Memory, 딥러닝 모형에 많이 활용되는 Dropout 기법 등을 이진 분류 문제에 활용했을 때의 성능을 비교하였다. 실험을 수행한 결과 CNN 알고리즘은 비즈니스 데이터의 이진분류 문제에서도 MLP 모형에 비해 향상된 성능을 보였다. 또한 MLP와 CNN 모두 Dropout을 적용한 모형이 적용하지 않은 모형보다 더 좋은 분류 성능을 보여줌에 따라, Dropout을 적용한 CNN 알고리즘이 이진분류 문제에도 활용될 수 있는 가능성을 확인하였다.

비트코인 가격 예측을 위한 LSTM 모델의 Hyper-parameter 최적화 연구 (A Study on the Hyper-parameter Optimization of Bitcoin Price Prediction LSTM Model)

  • 김준호;성한울
    • 한국융합학회논문지
    • /
    • 제13권4호
    • /
    • pp.17-24
    • /
    • 2022
  • 비트코인은 정부나 금융기관에 의존되어 있지 않은 전자 거래를 지향하며 만들어진 peer-to-peer 방식의 암호화폐이다. 비트코인은 최초 발행 이후 거대한 블록체인 금융 시장을 생성했고, 이에 따라 기계 학습을 이용한 비트코인 가격 데이터를 예측하는 연구들이 활발해졌다. 그러나 기계 학습 연구의 비효율적인 Hyper-parameter 최적화 과정이 연구 진행에 있어 비용적인 측면을 악화시키고 있다. 본 논문은 LSTM(Long Short-Term Memory) 층을 사용하는 비트코인 가격 예측 모델에서 가장 대표적인 Hyper-parameter 중 Timesteps, LSTM 유닛의 수, 그리고 Dropout 비율의 전체 조합을 구성하고 각각의 조합에 대한 예측 성능을 측정하는 실험을 통해 정확한 비트코인 가격 예측을 위한 Hyper-parameter 최적화의 방향성을 분석하고 제시한다.

DNN을 활용한 강도예측모델의 손실함수 최소화 기법 비교분석 (Comparison on of Minimization of Loos function for strength Prediction Model using DNN)

  • 한준희;김수호;백성진;한수환;김종;한민철
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 봄 학술논문 발표대회
    • /
    • pp.182-183
    • /
    • 2022
  • In this study, compared and analyzed various loss function minimization techniques to present a methodology for developing a natural intelligence-based prediction system. As a result of the analysis, He Initialization was the best with RMSE: 3.78, R2: 0.94, and the error rate was 6%. However, it is considered desirable to construct a prediction system by combining each technique for optimization.

  • PDF

Prediction of ship power based on variation in deep feed-forward neural network

  • Lee, June-Beom;Roh, Myung-Il;Kim, Ki-Su
    • International Journal of Naval Architecture and Ocean Engineering
    • /
    • 제13권1호
    • /
    • pp.641-649
    • /
    • 2021
  • Fuel oil consumption (FOC) must be minimized to determine the economic route of a ship; hence, the ship power must be predicted prior to route planning. For this purpose, a numerical method using test results of a model has been widely used. However, predicting ship power using this method is challenging owing to the uncertainty of the model test. An onboard test should be conducted to solve this problem; however, it requires considerable resources and time. Therefore, in this study, a deep feed-forward neural network (DFN) is used to predict ship power using deep learning methods that involve data pattern recognition. To use data in the DFN, the input data and a label (output of prediction) should be configured. In this study, the input data are configured using ocean environmental data (wave height, wave period, wave direction, wind speed, wind direction, and sea surface temperature) and the ship's operational data (draft, speed, and heading). The ship power is selected as the label. In addition, various treatments have been used to improve the prediction accuracy. First, ocean environmental data related to wind and waves are preprocessed using values relative to the ship's velocity. Second, the structure of the DFN is changed based on the characteristics of the input data. Third, the prediction accuracy is analyzed using a combination comprising five hyperparameters (number of hidden layers, number of hidden nodes, learning rate, dropout, and gradient optimizer). Finally, k-means clustering is performed to analyze the effect of the sea state and ship operational status by categorizing it into several models. The performances of various prediction models are compared and analyzed using the DFN in this study.

Deep Neural Network 기반 프로야구 일일 관중 수 예측 : 광주-기아 챔피언스 필드를 중심으로 (Deep Neural Network Based Prediction of Daily Spectators for Korean Baseball League : Focused on Gwangju-KIA Champions Field)

  • 박동주;김병우;정영선;안창욱
    • 스마트미디어저널
    • /
    • 제7권1호
    • /
    • pp.16-23
    • /
    • 2018
  • 본 연구는 Deep Neural Network(DNN)을 이용하여 광주-기아 챔피언스 필드의 일일 관중 수를 예측함으로써 이를 통해 구단과 관련기업의 마케팅 자료제공 및 구장 내 부대시설의 재고관리에 자료로 쓰임을 목적으로 수행 되었다. 본 연구에서는 Artificial Neural Network(ANN)의 종류인 DNN 모델을 이용하였으며 DNN 모델의 과적합을 막기 위해 Dropout과 Batch normalization 적용한 모델을 바탕으로 총 4종류를 설계하였다. 각각 10개의 DNN을 만들어 예측값의 Root Mean Square Error(RMSE)와 Mean Absolute Percentage Error(MAPE)의 평균값을 낸 모델과 예측값의 평균으로 RMSE와 MAPE를 평가한 Ensemble 모델을 만들었다. 모델의 학습 데이터는 2008년부터 2017년까지의 관중 수 데이터를 수집하여 수집된 데이터의 80%를 무작위로 선정하였으며, 나머지 20%는 테스트 데이터로 사용하였다. 총 100회의 데이터 선정, 모델구성 그리고 학습 및 예측을 한 결과 Ensemble 모델은 DNN 모델의 예측력이 가장 우수하게 나왔으며, 다중선형회귀 모델 대비 RMSE는 15.17%, MAPE는 14.34% 높은 예측력을 보이고 있다.