DOI QR코드

DOI QR Code

A study on the analysis of unstructured data for customized education of learners in small learning groups

소규모학습그룹의 학습자 맞춤형 교육을 위한 비정형데이터분석 연구

  • 민연아 (한양사이버대학교 응용소프트웨어공학과 조교수) ;
  • 임동균 (한양사이버대학교 응용소프트웨어공학과 교수)
  • Received : 2020.09.01
  • Accepted : 2020.10.09
  • Published : 2020.10.31

Abstract

As the e-learning market expands, interest in customized education for learners based on artificial intelligence is increasing. Customized education for learners requires essential components such as a large amount of data and learning contents for learner analysis, and it requires time and cost efforts to collect such data. In this paper, to enable efficient learner-tailored learning even in small learning groups, unstructured learner data was analyzed using python modules, and a learning algorithm was presented based on this. Through the analysis of the unstructured learning data presented in this paper, it is possible to quantify and measure the unstructured data related to learning, and the accuracy of more than 80% was confirmed when analyzing keywords for providing customized education for learners.

이러닝 시장이 확대됨에 따라 인공지능 기반의 학습자 맞춤형 교육에 대한 관심이 높아지고 있다. 학습자 맞춤형 교육은 학습자 분석을 위한 대량의 데이터 및 학습 콘텐츠 등의 필수 구성요소가 필요하며 이러한 데이터 수집을 위한 시간과 비용 측면의 노력이 필요하다. 본 논문에서는 소규모 학습그룹에서의 효율적으로 학습자 맞춤형 학습이 가능하도록, python 모듈들을 사용하여 비정형 학습자 데이터를 분석하였으며 이를 토대로 제시된 학습알고리즘을 통하여 학습자의 학습연속성을 유지하도록 하였다. 본 논문을 통하여 제시된 비정형 학습데이터분석을 통하여 학습관련 비정형 데이터를 정량화 하여 측정 가능하도록 하였으며 학습자 맞춤교육 제공을 위한 키워드 분석 시 90% 이상 데이터가 유의미함을 확인하였다.

Keywords

Ⅰ. 서론

스마트 디바이스의 보급이 확대되고 인터넷 기술의 활용 범위가 넓어짐에 따라 온라인 기반 교육시장의 비율이 높아지고 있다. 미국 시장조사업체인 GIA에서 2016년 조사한 세계 이러닝 산업의 시장규모에 따르면 전 세계 에듀테크(edutech)의 비중이 2017년 246조원에서 2020년에는 481조원까지 성장할 것으로 보고하였으며 한국의 이러닝(l-learning)시장 역시 같은 기간에 6조원 정도의 성장할 것을 예측하였다.[1]

최근에는 전통적인 교수자 주도 방식의 교육방식을 넘어 첨단 기술을 활용한 학습자 중심의 맞춤형 교육관련 연구가 활발하게 진행되고 있다.[1][2]

학습자 맞춤형 교육을 Adaptive Learning이라 하며 학습자별로 학습수준과 동기를 고려하여 맞춤형 학습 자료를 제공하고 효율적 학습 환경 및 관리가 가능하도록 도와주는 것을 의미한다.[2][3]

인공지능 기술 발달에 힘입은 머신러닝기술 기반의 학습자 맞춤형 교육을 통하여 인공지능이 스스로 다양한 학습관련 데이터를 학습하고 학습자 및 학습 진행현황에 대한 다양한 추론을 고려함으로써 학습자의 맞춤형 학습이 가능하도록 한다.[2][3]

인공지능 기반의 학습자 맞춤형 시스템을 설계 및 개발하기 위해서는 고품질의 대규모 학습자 데이터와 다량의 학습 콘텐츠가 필요하며 변동요인(Noise)이 없는 정제된 데이터의 명확한 설명이 요구된다.[3][4]

하지만 실제 교육환경의 대부분은 소규모학습자그룹임을 고려할 때 해당 그룹을 통하여 발생하는 비정형 학습데이터의 효율적 분석과 이를 통한 학습 맞춤형 교육이 학습자의 학습연속성 유지에 중요한 요인이 될 것이다.[5]

Ⅱ. 연구 배경

본 장에서는 연구 내용의 제안에 앞서 인공지능 기반의 학습자 맞춤형 교육 시스템의 개요와 종류 및 해당 시스템을 통한 학습알고리즘 적용에 대한 제한점을 살펴본다.

1. 학습자 맞춤형 교육 개념

학습자 맞춤형 교육이란 학습자의 데이터를 기반으로 학습자별 최적의 맞춤형 서비스를 제공하는 학습 기법이다.[2][3][4]

전통적인 학습방법의 경우 교수자 중심의 일방적 전달 교육인 경우가 많다[5]. 비대면 학습환경이 확산될 경우 학습자의 특성을 고려한 개개인의 맞춤형 학습의 필요성이 증가할 것이다.[7][8]

이러한 이유로 인공지능 기술을 기반으로 한 학습자 맞춤형 교육에 대한 연구가 활발하게 진행되고 있으며 학습자 맞춤형 교육을 위하여 다음의 세 가지 필수요소가 필요하다.[8][9]

표 1과 같이 학습자 맞춤형 교육을 위하여 대용량의 다양한 학습관련 데이터와 콘텐츠, 알고리즘과 머신러닝 기반의 기술이 필하며 이러한 요소를 갖추기 위해서는 시간적, 비용적인 노력이 필요하다.

표 1. 학습자 맞춤형 학습을 위한 필수요소[8][9]

Table 1. Essentials for customized learning

OTNBBE_2020_v20n5_89_t0001.png 이미지

2. 학습자 맞춤형 교육의 사례

학습자 맞춤형 교육을 위한 기존의 사례로 국내 학습지 회사인 웅진 씽크빅의 AI코칭 서비스와 뤼이드의 산타토익, 맥그로힐의 ALEKS를 살펴볼 수 있다.[11][12][13]

가. 웅진 AI 코칭 서비스

방문 학습지도 및 디지털 학습지를 통하여 2년에 동안 수집한 50만명의 회원에 대한 정보 및 매일 17만명의 학습자가 학습하는 디지털 콘텐츠를 기반으로 학습자의 학습실패사례 및 자기주도 학습을 위한 동기 등에 대한 분석을 실시하였고 인공지능을 통한 학습 코칭 서비스를 실시하였다.[11][14]

나. 뤼이드 산타토익

santAInside라 불리는 인공지능기술을 기반으로 2017년부터 학습 데이터를 생성하여 2018년 12월 기준 71백만건의 학습데이터를 생성하였다.

인공지능 기술을 적용하여 학습자에게 필요한 내용과 불필요한 내용을 필터링하고 학습자 맞춤형 학습맵을 제공하여 약 28시간정도의 학습시간을 절약해줄 수 있다고 보고하였다.[12][14]

다. ALEKS

ALEKS는 맥그로힐의 플랫폼 중 수학 중심의 학습자 맞춤형 교육 플랫폼으로 약 500만명 이상의 학습자 중심으로 학습 데이터를 수집하고 활용한다.[14]

ALEKS시스템을 통하여 학습자는 플립 러닝(flipped learning)이 가능하며 학습자와의 지속적 상호작용을 통하여 최적의 학습자 맞춤형 교육을 가이드 한다.[13][14]

OTNBBE_2020_v20n5_89_f0001.png 이미지

그림 1. ALEKS 사용자 화면[13]

Fig. 1. ALEKS learner screen

위의 사례에 대한 공통적 특징은 대용량의 데이터 및 학습 콘텐츠를 기반으로 다수의 학습자 대상 학습 코칭을 제시하였다는 것이며 이러한 시스템을 준비하기 위한 내부적 콘텐츠 및 데이터 등 내적 노력과 인공지능기술 기반의 차별화된 학습 알고리즘 개발 등 외적 노력이 필수적으로 필요하다는 것을 알 수 있다.

Ⅲ. 소규모학습그룹을 위한 비정형 학습자 데이터분석의 필요성

일반적인 학습 환경의 경우 인공지능 기반 학습자 맞춤형 교육을 위한 다음의 제한점이 발생할 수 있다.

첫 번째는 고품질의 정제된 데이터의 부재 가능성이다. 학습알고리즘 구현을 위한 충분한 데이터 부재의 경우 인공지능 기술의 필요요소인 레이블링 불가할 수 있다.[15][16]

두 번째는 소규모 데이터만이 있는 학습 환경에서 발생 가능한 데이터 분석의 오류 가능성이다. 샘플데이터가 전체 데이터를 반영하지 못할 경우 의미 없는 데이터가 될 수 있으며 이 경우 샘플데이터로 분석한 데이터는 오류 데이터일 가능성이 높다.[14][15][16]

셋째는 학습자 그룹의 특징을 반영하지 못할 경우이다. 일반적인 수치 데이터에 의한 분석만으로는 학습자 그룹만이 지닌 특이점을 반영하지 못할 수 있다.[14][16]

학습자 맞춤형 교육을 위한 인공지능 기술 기반의 학습자 맞춤형 교육 기술이 제안되고 있으나 다양한 환경에서 효율적으로 활용 가능한 기술적 부담이 적고 효율적인 학습자 데이터 분석방법을 통한 학습알고리즘이 필요하다.

표 2. AI기술기반 adaptive learning 개발의 제한사항[14][16]

Table 2. Limitations of AI technology-based adaptive leaning development

OTNBBE_2020_v20n5_89_t0002.png 이미지

Ⅳ. 실험 및 결과

본 논문에서는 소량의 비정형 학습자 데이터를 효율적으로 분석하기 위하여 Python의 Mecab 및 Konlpy 모듈을 활용하였다. 또한 비정형 데이터 분석내용을 중심으로 학습자에게 맞춤형 컨텐츠 및 학습 단계를 유도함으로써 학습 선호도를 높일 수 있도록 학습알고리즘을 제안하였다.

1. 비정형 학습자 데이터 분석을 위한 설계

본 논문에서는 소량의 비정형 데이터에 대하여 학습자가 데이터를 통하여 의도하고자 하는 키워드를 필터링하기 위하여 비정형 데이터에 대한 중복적인 분석코드를 설계하였다. 학습자가 중복적으로 제시한 키워드를 통하여 학습자의 학습의도 및 동기부여 요인 및 학습 실패요인을 파악할 수 있다. 설계를 위하여 Python의 다양한 모듈을 사용하도록 한다.

표 3은 비정형 학습자 데이터 분석 과정이다.

표 3. 비정형 학습자 데이터 분석과정

Table 3. Atypical learner data analysis process

OTNBBE_2020_v20n5_89_t0003.png 이미지

표 3의 분석과정을 위하여 표 4와 같이 개발환경을 구축한다. 이때 활용 버전은 제시한 버전 이상으로 구현하여도 관계없다.

표 4 개발환경

Table 4. Development environment

OTNBBE_2020_v20n5_89_t0004.png 이미지

표 4의 개발환경 구축 후 실험을 위한 학습자 데이터의 샘플을 준비한다. 해당 데이터가 저장된 cvs 파일에 대하여 각 행을 기준으로 행 크기를 구한 후 식별자 단위로 비정형 데이터를 구분한다.

본 논문에서는 학습자가 표(,) 또는 역슬래시(‘\’) 또는 블랭크(Blank)나 탭키(Tab Key)를 단위로 언어를 구분하여 작성한다는 가정하여 데이터를 구분하였으며 구분된 데이터 대하여 pymssql 모듈을 사용하여 필터링 및 문서를 저장하도록 하였다.

표 5는 1,000,000개 이하의 소량의 학습자 데이터를 샘플로 하여 비정형 데이터를 행 단위로 저장하도록 하는 Python 코드의 일부이다.

표 5. 소량의 비정형 데이터 DB구축 코드

Table 5. A small amount of unstructured data DB construction code

OTNBBE_2020_v20n5_89_t0005.png 이미지

표 5를 통한 학습데이터의 DB구축 후 konlpy.tag와 konlpy.utils를 사용하여 저장된 데이터 중 비정형 데이터에 대하여 형태소별로 분석하고 분석된 데이터 중 중복되어 확인되는 데이터에 대하여 빈도수를 확인한다.

표 6은 해당 코드의 일부이다.

표 6. 비정형 데이터의 형태소별 분석 및 빈도분석 코드

Table 6. Morphological analysis and count code of unstructured data

OTNBBE_2020_v20n5_89_t0006.png 이미지

2. 학습알고리즘 설계 및 실험

비정형 학습자 데이터 분석을 통하여 학습자 맞춤형 학습알고리즘을 표 7과 같이 설계할 수 있다.

표 7. 학습 알고리즘 도식 및 슈도 코드

Table 7. Learning algorithm schematic and pseudocode

OTNBBE_2020_v20n5_89_t0007.png 이미지

표 7의 학습 알고리즘에 학습자의 학습참여 전, 후 비정형 데이터 수집하고 분석된 데이터의 평균 빈도수 이상의 데이터에 대한 상황인지를 실시한다. 대부분의 경우 명사일 경우 인지된 데이터가 포함된 학습 콘텐츠 추천에 활용하고 형용사나 부사일 경우 인지된 데이터에 대항 긍·부정 성향 파악 및 학습의 난이도 및 학습동기 부여를 위한 다양한 문제해결 환경 조성에 활용되도록 한다.

학습 이후 발생하는 평가 등을 통하여 학습자가 제시한 알고리즘에 대하여 능동적 학습 환경 조성 및 자기주도 기반의 학습연계가 가능하였는지 분석하고 향후 동일 학습자의 학습참여 시 이전 학습을 통하여 분석된 비정형 데이터 기반 학습 데이터를 토대로 학습 컨텐츠 추천 및 퀴즈 등 문제해결 단계 조정할 수 있다.

비정형 데이터 분석을 통하여 수치화된 정형화된 분석 데이터를 토대로 학습 예측 및 학습자 맞춤형 추천이 가능하며 수치화 시 벡터 데이터인지 시계열 또는 시퀀스가 있는 데이터인지 구분하여 인덱스 부여하여 벡터 데이터의 경우 학습자의 연령 및 선수학습 레벨 등에 대하여 2D Tensor 크기의 벡터데이터로 변환 후 데이터 훈련 신경망을 통한 데이터 분석에 사용된다.

또한 시계열 또는 시퀀스가 있는 데이터는 학습시간 및 문제해결 시간 등에 대하여 시간축을 포함하여 3D Tensor로 저장 후 데이터 훈련 및 데이터 분석하도록 한다. 이 모든 정에서 발생하는 학습 데이터에 대하여 베이지안 네트워크(Bayesian Network) 구축 및 학습 가능성 및 방향성 예측 및 가이드가 가능하다.

학습 알고리즘을 기반으로 실제 학습 환경에서의 샘플 데이터를 표 8과 같이 실험하였다. ‘Y’ 채널을 통하여 기존 회원 대상 간단한 학습동영상을 제시하고 100여개의 댓글을 샘플데이터로 수집하여 표 9의 분석 결과를 얻을 수 있다.

표 8. 샘플 데이터 환경

Table 8. sample data environment

OTNBBE_2020_v20n5_89_t0008.png 이미지

표 9. 분석 결과

Table 9. Analysis

OTNBBE_2020_v20n5_89_t0009.png 이미지

표 9에 대한 수치 시각화하기 위하여 matplotlib를 통해 그림 2와 같이 나타낼 수 있다.

OTNBBE_2020_v20n5_89_f0002.png 이미지

그림 2. 빈도분석에 대한 시각화

Fig. 2. Visualization for frequency analysis

형태소별 분석에 대하여 본 샘플 데이터에서는 ‘역행렬’과 ‘어렵다’에 대한 빈도가 높음을 알 수 있으며 해당 학습에 대한 상세 가이드가 필요함을 파악할 수 있다.

3. 학습자 설문을 통한 성능 분석

비정형 학습자 데이터 및 학습 알고리즘을 통한 학습자 맞춤형 교육의 효율성을 분석하기 위하여 표 9와 같이 동일 학습자 대상 설문을 실시하였다.

해당 설문은 비정형 학습자 데이터의 형태소 분석에 따른 학습자의 학습 키워드와 학습자의 실제 학습 설계 시 고려사항의 일치정도를 분석하기 위한 것이며 설문 응답데이터 및 비정형 데이터에 대하여 오자 및 탈자가 있는 데이터는 제외하였다.

표 10에서의 모집단 크기가 100이고 신뢰수준(%)을 95로 설정하고 표본 오차는 8%정도로 집게 되었을 때 샘플사이즈는 61로 설정된다. 이를 통하여 표본오차는 7.8%임을 알 수 있으며 해당 오차를 토대로 본 논문에서 제안한 비정형 데이터분석을 통한 학습자 맞춤형 교육의 키워드가 유의미함을 알 수 있다.

표 10. 분석데이터의 유의미 정도

Table 10. The degree of significance of the analysis data

OTNBBE_2020_v20n5_89_t0010.png 이미지

본 논문에서 제시한 비정형 학습자 데이터 분석을 통하여 다음과 같은 기대가치를 예측할 수 있다.

1) 학습 지속성 : 학습 지속성을 해하는 학습 난이도, 문제 해결 시간 등에 대하여 조정이 가능함으로 학습자의 학습 지속성이 높아질 수 있다.

2) 학습 적합성 유지 : 학습자 개개인에 대하여 맞춤형 학습 환경을 조성할 수 있다.

3) 합리적 학습 환경 : 인공지능 기술 기반 시스템 조성을 위한 시간과 용의 부담을 줄이고 학습 알고리즘 오차에 대한 빠른 대처가 가능하다.

Ⅴ. 결론

스마트 디바이스 및 인터넷의 발전에 힘입어 교육의 형태도 다양하게 변하고 있다. 인공지능 기술 기반 학습자 맞춤형 교육을 통하여 학습자 맞춤형 교육이 가능하게 되었으나 학습자 맞춤형 교육을 성공적으로 수행하기 위하여 필요한 필수요소에 대한 부담이 높아 소규모 그룹의 학습자 대상으로 학습자 맞춤형 교육을 하기 위한 효율적 방법이 필요하다.

본 논문에서는 소규모학습그룹의 비정형 학습자 데이터에 대한 언어 형태소 분석을 통하여 학습알고리즘을 제시하고 학습자의 학습의지와 학습동기를 분석하여 학습자 맞춤형 교육을 제시하는 것을 목적하였다. 본 논문의 제안내용을 통하여 소량의 비정형 데이터을 통하여 학습자의 능동적 학습연계를 가능하게 할 수 있으며 자기주도 기반의 맞춤형 교육제시가 가능한 것으로 분석되었다.

향후 비정형 데이터에 대한 수치변환 데이터를 토대로 신경망 분석을 통한 자동 학습자 맞춤형 학습 환경을 연구할 예정이다.

References

  1. Yvette Gelogo, Hye-jin Kim,"Educational Paradigm Shift from E-Learning to Mobile Learning Toward Ubiquitous Learning",IJIBC, Vol.4, No.1, pp.3-7, 2013. DOI:https://doi.org/10.5762/KAIS.2011.12.11.4788
  2. Oztekin Asil, Delen Dursun, Turkyilmaz Ali, Zaim Selim, "A machine learning-based usability evaluation method for eLearning systems", Decision Support Systems, Vol. 56, pp.63-73, 2013. DOI:10.1016/j.dss.2013.05.003
  3. Yan-Jun Liu, Jing Li, Shaocheng Tong, C. L. Philip Che,"eural Network Control-Based Adaptive Learning Design for Nonlinear Systems With Full-State Constraints", IEEE Transactions on Neural Networks and Learning System, Vol. 23, No. 7, pp.1562-1571, 2016. DOI: 10.1109/TNNLS.2015.2508926
  4. Intelligent Adaptive Learning: An Essential Element of 21st Century Teaching and Learning, https://www.dreambox.com/white-papers
  5. K.M.Kim, H.S.Kim, "A Study on Customized Software Education method using Flipped Learning in the Digital Age", Digital Convergence Research, Vol. 15, No.7, pp. 55-64, 2017. DOI: http://dx.doi.org/10.14400/JDC.2017.15.7.55
  6. E-Learning Industry Status and Edu-Tech Industry Promotion, Report of Korea e-Learning Industry Association, 2016
  7. Peter Brusilovsky , "Adaptive and Intelligent Web-based Educational Systems", International Journal of Artificial Intelligence in Education. Vol. 13, pp.159-172, 2003. DOI: https://doi.org/10.1007/3-540-45108-0_1
  8. Mathias Bauer, "Evaluation of Learning Motivation within an Adaptive e-Learning Platform for Engineering Science",Proceedings of the 12th International Conference on Computer Supported Education,Vol. 2, pp.64-73, 2020. DOI: https://doi.org/10.5220/0009350600640073
  9. ASU(Arizona State University) 2016 Annual Report , http://www.asu.edu
  10. Han, Ji-Woo, "A Study on Effects of AR and VR Assisted Lessons on Immersion in Learning and Academic Stress", IJIBC, Vol.10, No.2, pp.19-24, 2018. DOI:https://data.doi.or.kr/cite/10.7236/IJIBC.2018.10.2.4
  11. Woongjin Think Big, https://www.wjbookclub.co.kr/
  12. AI provides learning solutions, https://www.mk.co.kr/news/special-edition/view/2018/02/87059/
  13. santaToeic, https://aitutorsanta.com/review
  14. Youngsun Kwon, Soonyong Byun, Youngim Cho, Kyungjeon Kim, Minwoo Kim, "Future Education with Artificial Intelligence", Keris Issue Report, Vol.16, pp86-98, 2018.
  15. Chang-Woo Nam and Dong-min Shin, "The Effects of Blended Learning Instructional Strategy and Flip Learning Instructional Strategy on College Students' Social Reality and Group Cohesion", Journal of Creative Information Culture, Vol. 5, No.1, pp.1-13, 2019. DOI:10.32823/jcic.5.1.201904.1
  16. Dami Lim, "Development of a Blended Learning-based Software Maker Training Course", Journal of the Korean Society of Knowledge and Information Technology, Vol.14, No.3, pp.247-256, 2019. DOI:https://doi.org/10.34163/jkits.2019.14.3.004