• 제목/요약/키워드: 중도 탈락 예측

검색결과 35건 처리시간 0.031초

학생 중도탈락 예측지수에 관한 사후검증 연구 (Post-Examination Analysis on the Student Dropout Prediction Index)

  • 이지은
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.175-183
    • /
    • 2019
  • 학습자 중도탈락은 사이버대학이 해결해야 할 과제 중 하나이다. 2019년도 기준으로 사이버대학의 전체 학생 수는 13만여 명에 달하고 있으나, 중도탈락 비율도 매우 높은 편이다. 중도탈락율을 낮추기 위해 사이버대학은 학습 분석에 많은 투자를 하고 있다. 특히 일부 사이버대학에서는 중도탈락 가능성을 정량적으로 분석하여 중도탈락이 우려되는 학생에 대한 지원을 강화하고 있다. 본 논문의 목적은 중도탈락 예측지수에 영향을 미치는 학습데이터를 규명하는데 있다. 분석 결과, 수강 차시(진도율), 이수학점, 평점, 휴학 횟수가 중도탈락에 유의미한 영향을 미치는 것으로 확인되었다. 사이버대학은 학생 중도탈락 예측지수에 관한 사후검증을 통해 예측 모델의 정확도를 높여나가야 할 것이다.

  • PDF

일반대학에서 교양 e-러닝 강좌의 중도탈락 예측모형 개발과 조기 판별 가능성 탐색 (Dropout Prediction Modeling and Investigating the Feasibility of Early Detection in e-Learning Courses)

  • 유지원
    • 컴퓨터교육학회논문지
    • /
    • 제17권1호
    • /
    • pp.1-12
    • /
    • 2014
  • e-러닝 환경에서는 학습자의 학습행동이 학습관리시스템(LMS)에 자동으로 기록되며, 최근에는 이러한 데이터를 분석하여 수업과 학습성과 향상에 활용하는 학습분석학(learning analytics)적 접근이 증가하고 있다. 중도탈락은 e-러닝에서 지속되어 온 문제로, 본 연구는 일반대학 e-러닝 강좌에서 LMS에 기록된 데이터로부터 중도탈락 예측 모형을 구축하여 e-러닝 중도탈락 처방에 기초 자료를 제공하고자 하였다. 국내 일반대학에서 운영되는 교양 e-러닝 강좌를 편의표집하고, 이 강좌를 수강하는 578명의 자료로 중도탈락을 예측하는 로지스틱 회귀분석을 실시한 결과, 주차별로 계획된 학습을 규칙적으로 완료하는 출석과 총 학습시간이 중도탈락 예측에 유의한 선행요인으로 분석되었고, 이 로지스틱 회귀모형은 전체적으로 96%의 정확도로 수강완료자와 중도탈락자를 구분하였다. 또한 학습자가 중도탈락을 결정하기 이전 시점에서 이 모형을 적용하여 중도탈락 조기 판별 가능성을 탐색하고, 본 연구결과를 토대로 시사점과 이 모형의 잠재적 활용가치를 논의하였다.

  • PDF

머신러닝 기반 대학생 중도 탈락 예측 모델의 성능 비교 (Performance Comparison of Machine Learning based Prediction Models for University Students Dropout)

  • 정석봉;김두연
    • 한국시뮬레이션학회논문지
    • /
    • 제32권4호
    • /
    • pp.19-26
    • /
    • 2023
  • 전국 대학생의 중도 탈락 비율의 증가는 학생 개인 뿐만 아니라 대학과 사회에 심각한 부정적 영향을 끼친다. 본 연구에서는 중도 탈락이 예상되는 학생을 사전에 식별하기 위하여, 각 대학의 학사관리 시스템에서 손쉽게 얻을 수 있는 학적 데이터를 기반으로 머신러닝 분야의 결정트리, 랜덤 포레스트, 로지스틱 회귀 및 딥러닝 기반의 중도 탈락 예측 모델을 구축하고, 그 성능을 비교·분석하였다. 분석 결과 로지스틱 회귀 기반 예측 모델의 재현율이 가장 높았으나 f-1 및 auc 값이 낮은 한계를 보였고, 랜덤 포레스트 기반의 예측 모델의 경우 재현율을 제외한 다른 모든 지표에서 가장 우수한 성능을 보였다. 또한 예측 기간에 따른 예측 모델의 성능을 확인하기 위하여 예측 기간을 단기(1개 학기 이내), 중기(2개 학기 이내) 및 장기(3개 학기 이내)로 나누어 분석해 본 결과, 장기 예측 시 가장 높은 예측력을 보였다. 본 연구를 통해 각 대학은 중도 탈락이 예상되는 학생들을 조기에 식별하고, 이들에 대한 집중 관리를 통해 중도 탈락 비율을 줄이며 나아가 대학 재정 안정화에 기여할 수 있을 것으로 기대된다.

정형 데이터와 비정형 데이터를 동시에 고려하는 기계학습 기반의 직업훈련 중도탈락 예측 모형 (A Machine Learning-Based Vocational Training Dropout Prediction Model Considering Structured and Unstructured Data)

  • 하만석;안현철
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.1-15
    • /
    • 2019
  • 직업훈련 교육 현장에서 느끼는 가장 큰 어려움 중 하나는 중도탈락 문제이다. 훈련과정마다 많은 수의 학생들이 중도탈락을 하게 되어 국가 예산 낭비 및 청년 취업률 개선에 장애 요인이 되고 있다. 본 연구에서는 중도탈락의 원인을 주로 분석한 기존 연구들과 달리, 각종 수강생 정보를 활용하여 사전에 중도탈락을 예측할 수 있는 기계학습 기반 모형을 제안하고자 한다. 특히 본 연구의 제안모형은 수강생 관련 정형 데이터 뿐 아니라 비정형 데이터인 강사의 상담일지 정보까지 동시에 고려하여 모형의 예측정확도를 제고하고자 하였다. 이 때 비정형 데이터에 대한 분석은 최근 주목받고 있는 텍스트 분석 기술인 Word2vec과 합성곱 신경망을 이용해 수행하였다. 국내 한 직업훈련기관의 실제 데이터에 제안모형을 적용해 본 결과, 정형데이터만을 사용하여 중도탈락을 예측할 때보다 비정형 데이터를 함께 고려했을 때 예측의 정확도가 최대 20%까지 향상됨을 확인할 수 있었다. 아울러, Support Vector Machine을 기반으로 정형 데이터와 비정형 데이터를 결합해 분석했을 때, 검증용 데이터셋 기준으로 90% 후반대의 높은 예측 정확도를 나타냄을 확인하였다.

대학 신입생 중도탈락 예측 요인 분석: S대학 사례를 중심으로 (A Exploratory Study on the Determinants Predicting Student Depature of Freshmen: Focusing on the Case of S University)

  • 이은정;이정훈
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.317-330
    • /
    • 2021
  • 본 연구의 목적은 대학 신입생의 중도탈락을 예측하는 주요 요인을 도출하여, 대학 차원에서 중도탈락을 예방하기 위한 정책 수립의 근거를 제시하는데 있다. 이를 위해 서울에 위치한 S대학교의 2018학번 신입생들을 대상으로 입학 이후 2년 동안 관찰한 데이터를 활용하여 랜덤포레스트 중도탈락 예측 모형을 구축하였다. 예측모형에는 대학생활적응 요인 6개 변수, 교육만족요인 12개 변수, 총 18개 변수를 투입하였다. 분석결과, 정서안정성, 경제적 여건, 전공진로에 대한 확신, 대학 선택 만족도, 교육방법(교육 내용의 체계성), 교육방법(전공 교육 내용의 효과성)이 중도탈락을 예측하는 중요도 상위 6개 변수인 것으로 확인되었다. 본 연구의 결과를 토대로 대학 신입생이 대학생활에 적응하고 안정적으로 학업을 지속할 수 있도록 지원하는 제도 설계의 방향과 필요성에 대해 제언하였다.

Performance Comparison of Neural Network and Gradient Boosting Machine for Dropout Prediction of University Students

  • Hyeon Gyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.49-58
    • /
    • 2023
  • 학생들의 중도 탈락은 대학의 재정적 손실 뿐 아니라, 학생 개개인 및 사회적으로도 부정적인 영향을 끼친다. 이러한 문제를 해결하기 위해 기계 학습을 이용하여 대학생들의 중도 탈락 여부를 예측하고자 하는 다양한 시도가 이루어지고 있다. 본 논문에서는 대학생들의 중도 탈락 여부를 예측하기 위해 DNN(Deep Neural Network)과 LGBM(Light Gradient Boosting Machine)을 이용한 모델을 구현하고 성능을 비교하였다. 학습 데이터로는 서울 소재 중소규모 4년제 대학인 A 대학의 20,050명의 학생을 대상으로 수집된 학적 및 성적 데이터를 학습에 이용하였다. 원본 데이터의 140여개의 속성 중 중도 탈락 여부를 나타내는 속성과의 상관계수가 0.1 이상인 속성들만 추출하여 학습하였다. 두 모델의 성능 실험 결과, DNN과 LGBM의 F1-스코어는 0.798과 0.826이었으며, LGBM이 DNN에 비해 2.5% 나은 예측 성능을 보였다.

사이버대학 중도탈락 개선을 위한 예측모형 개발 (Development of Prediction Model to Improve Dropout of Cyber University)

  • 박철
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.380-390
    • /
    • 2020
  • 사이버대학교는 20대 중심의 일반대학교 학생보다 사회적 배경, 경제적 요인, IT 지식 및 활용능력 등. 복잡한 교육환경의 변화 요인으로 신입생들의 중도탈락이 높은 실정이다. 따라서 사이버대학교 학생은 일반대학교와 다른 중도탈락 방지 대책과 개선 방법이 필요하다. 본 연구에서는 A 사이버대학의 2017년 및 2018년 1학기 중도탈락에 영향을 미치는 요인을 추출하고 '의사결정트리모델'을 통하여 중점관리 및 상담기준을 분류하여 주요 요인을 도출하였다. 각 주요 요인에 대하여 의사결정 적용기준과 주차별 추진방법을 제시하여 '중도탈락개선모형'으로 구현하였다. 그리고 2019년 1학기 신입생을 대상으로 실제로 운영되고 있는 사이버대학 강의운영에 적용하였다. 그 결과 '중도탈락개선모형'을 적용한 신입생의 중도탈락률은 4.2% 감소하였고 학업지속비율은 11.4% 증가하였다. 본 연구의 주요한 의미는 설문지 조사와 사이버대학 LMS(Learning Management System) 학습활동 결과를 동시에 적용하여 객관적인 분석을 하였다는 것이다. 그러나 학생 자료에 대한 정량적인 요인분석은 되었지만, 정성적인 요인분석이 반영되지 못하였고 연구의 구조적인 한계점이 있어 후속연구가 필요하다. 본 연구에서 구현된 개선모형은 사이버대학의 중도탈락률 및 학업지속비율 개선에 유효하게 적용될 것으로 기대한다.

학생 중도탈락 예측 모델에 관한 연구 (A Study on the Prediction Model for Student Dropout)

  • 이종혁;김대학;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.37-40
    • /
    • 2018
  • 빅데이터 산업 부상과 함께 교육 데이터 분석 분야가 새롭게 주목받고 있다. 교육 현장에서 학습 데이터의 양과 종류는 꾸준히 증가하고 있고 이를 분석하기 위한 정보기술도 계속 발전하고 있다. 한편, 학교 교육은 사회적 성취와 밀접한 관련이 있어 사회이동의 중요한 수단이 되는 만큼 학교 교육으로부터 이탈할 위험이 있는 학생들을 조기에 발견하여 이탈을 방지하는 것은 매우 중요하다. 본 논문은 대학생의 중도탈락을 예방하기 위해 로지스틱 회귀분석과 다층 퍼셉트론 기법을 이용해 학습 데이터를 분석하여 예측 모델을 생성하고 해당 모델을 평가한다. 평가 결과, 다층 퍼셉트론 모델이 로지스틱 회귀분석 모델에 비해 정확도와 재현율은 우수하였지만 정밀도는 약간 저조하였다.

메이저리그 타자들의 명예의 전당 입성과 탈락에 대한 Mahalanobis-Taguchi System의 적용과 비교 (Implementation of Mahalanobis-Taguchi System for the Election of Major League Baseball Hitters to the Hall of Fame)

  • 김수환;박창순
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.223-236
    • /
    • 2013
  • 미국 프로야구(Major League Baseball) 명예의 전당의 입성과 탈락을 예측할 수 있는 여러 가지 통계적인 분류분석법을 실시하고 그 결과의 정확성을 비교하였다. 이를 위해 명예의 전당 가입 조건을 만족하는 타자들 중 1980년 이후 기록된 데이터의 17개의 독립변수를 사용하여 분류분석에서 널리 사용되는 기준으로 판별분석, 로지스틱 회귀분석과 상대적으로 최근에 제안된 Mahalanobis-Taguchi System(MTS)을 실시하여 비교하였다. 이 세 가지 방법 중 MTS가 상대적으로 더 나은 효율을 보였으며 이는 다변량 관측 값이 방향성이 없어 속성에 따른 도형적 그룹을 형성하지 못하는 경우에 효율적인 MTS의 특성에 의한 것으로 판단된다.

4~6세 일반아동 및 언어발달지연 아동의 음운인식 및 음운처리 능력이 언어 능력에 미치는 영향 (Effects of phonological awareness and phonological processing on language skills in 4- to 6-year old children with and without language delay)

  • 김신영;손진경;임동선
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.51-63
    • /
    • 2020
  • 음운인식은 음운론 영역의 상위언어인식 능력으로, 읽기 및 어휘력 등의 언어능력을 예측하는 것으로 알려져 있다. 본 연구는 음운인식 능력과 기타 음운처리 능력, 그리고 언어능력 간의 관계를 일반아동 집단과 언어발달지연 아동 집단 간 비교를 통해 살펴보고자 하였다. 4~6세의 언어발달지연 아동(n=15)과 일반아동(n=18)을 대상으로 음운인식 능력을 평가하기 위하여 음절수세기, 음절탈락, 음절변별 과제를 실시하였다. 또한 비단어 따라말하기, 숫자 거꾸로 회상하기의 두 가지 음운처리 과제와 수용 및 표현어휘력, 문법성판단 과제와의 상관관계를 분석하고, 언어능력을 예측하는 음운인식 하위과제가 무엇인지 검토하였다. 음운인식 하위과제 중 음절수세기를 제외한 음절탈락, 음절변별 과제 수행력의 집단 간 차이가 유의하였다. 또한 일반아동 집단은 음절탈락과 숫자 거꾸로 회상하기, 음절변별과 수용어휘력 과제 수행력 간 상관관계가 유의하였으며, 언어발달지연 아동 집단은 음절수세기 과제와 숫자 거꾸로 회상하기, 수용어휘력, 표현어휘력, 문법성판단 과제의 수행력 간 상관관계가 유의하였다. 그리고 단계적 중다회귀분석 결과 일반아동 집단은 음절변별 과제가 수용어휘력 및 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났으며, 언어발달지연 아동 집단은 음절수세기 과제가 수용어휘력, 표현어휘력, 문법성판단 과제 수행력을 유의하게 예측하는 것으로 나타났다. 언어발달지연 아동 집단은 일반아동 집단에 비해 음절수세기를 제외한 나머지 음절 수준의 음운인식 과제의 수행력이 저조하였으며, 이러한 특징이 상관관계 분석 및 회귀분석 결과에도 반영되었다. 또한 각 집단에서 음운인식 과제 수행력이 언어능력을 유의하게 예측하는 것으로 나타난 결과는 음운론 영역의 상위언어인식 능력의 중요성을 시사한다.