Classification of Education Video by Subtitle Analysis

자막 분석을 통한 교육 영상의 카테고리 분류 방안

  • Published : 2021.05.03

Abstract

This paper introduces a method for extracting subtitles from lecture videos through a Korean morpheme analyzer and classifying video categories according to the extracted morpheme information. In some cases incorrect information is entered due to human error and reflected in the characteristics of the items, affecting the accuracy of the recommendation system. To prevent this, we generate a keyword table for each category using morpheme information extracted from pre-classified videos, and compare the similarity of morpheme in each category keyword table to classify categories of Lecture videos using the most similar keyword table. These human intervention reduction systems directly classify videos and aim to increase the accuracy of the system.

본 논문은 교육 영상의 자막을 한글 형태소 분석기를 통해 추출하고 추출된 형태소 정보를 바탕으로 영상의 카테고리를 분류하는 방안에 대해 소개한다. 시스템에서 사람의 실수로 잘못된 정보가 입력되어 아이템의 특성으로 반영하게 될 경우 추천 시스템에서 정확도의 문제를 미치는 경우들이 있다. 이를 방지하기 위해 미리 분류된 영상에서 추출한 형태소 정보를 이용하여 각 카테고리에 해당하는 키워드 테이블을 생성하고, 각 카테고리 키워드 테이블과 영상의 형태소의 유사도를 비교하여 가장 유사도가 높은 키워드 테이블을 이용해 교육 영상의 카테고리를 분류한다. 이를 통해서 사람의 개입을 줄이고 시스템이 직접 영상을 분류하여 추천 시스템의 정확도를 높이는 것을 목표로 한다.

Keywords