• Title/Summary/Keyword: 준 지도 학습

Search Result 217, Processing Time 0.029 seconds

The Analysis of Semi-supervised Learning Technique of Deep Learning-based Classification Model (딥러닝 기반 분류 모델의 준 지도 학습 기법 분석)

  • Park, Jae Hyeon;Cho, Sung In
    • Journal of Broadcast Engineering
    • /
    • v.26 no.1
    • /
    • pp.79-87
    • /
    • 2021
  • In this paper, we analysis the semi-supervised learning (SSL), which is adopted in order to train a deep learning-based classification model using the small number of labeled data. The conventional SSL techniques can be categorized into consistency regularization, entropy-based, and pseudo labeling. First, we describe the algorithm of each SSL technique. In the experimental results, we evaluate the classification accuracy of each SSL technique varying the number of labeled data. Finally, based on the experimental results, we describe the limitations of SSL technique, and suggest the research direction to improve the classification performance of SSL.

Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning (준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델)

  • Seo, Jaehyung;Oh, Dongsuk;Eo, Sugyeong;Park, Sungjin;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

High Efficiency Adaptive Facial Expression Recognition based on Incremental Active Semi-Supervised Learning (점진적 능동준지도 학습 기반 고효율 적응적 얼굴 표정 인식)

  • Kim, Jin-Woo;Rhee, Phill-Kyu
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.17 no.2
    • /
    • pp.165-171
    • /
    • 2017
  • It is difficult to recognize Human's facial expression in the real-world. For these reason, when database and test data have similar condition, we can accomplish high accuracy. Solving these problem, we need to many facial expression data. In this paper, we propose the algorithm for gathering many facial expression data within various environment and gaining high accuracy quickly. This algorithm is training initial model with the ASSL (Active Semi-Supervised Learning) using deep learning network, thereafter gathering unlabeled facial expression data and repeating this process. Through using the ASSL, we gain proper data and high accuracy with less labor force.

Saliency Detection Based on Semi-Supervised Learning (준 지도 학습에 기반한 중요 객체 검출 방법)

  • Hwang, Insung;Lee, Sang Hwa;Park, Jae Sung;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.169-172
    • /
    • 2015
  • 본 논문에서는 준 지도 학습에 기반한 중요 객체 검출 방법을 제안한다. 첫째, 색상과 공간 정보를 활용하여 이미지를 분할한 후, 분할된 영역을 색상의 유사도로 연결하여 그래프를 만든다. 둘째, 색 대비 및 가장자리 사전 지식을 활용하여 중요 객체에 해당하는 씨앗 노드와 배경에 해당하는 씨앗 노드를 추출한다. 끝으로, 중요 객체 및 배경 씨앗 노드를 이용하여 준 지도학습 기법에 적용함으로써 이미지 전체 노드의 중요도를 계산한다. 실험 결과, 제안한 알고리즘이 최신의 다른 알고리즘보다 높은 재현율 구간에서 높은 정밀도를 보임을 확인할 수 있고, 시각적으로도 좋은 성능을 보임을 확인할 수 있다.

  • PDF

A Study on Training Data Selection Method for EEG Emotion Analysis using Semi-supervised Learning Algorithm (준 지도학습 알고리즘을 이용한 뇌파 감정 분석을 위한 학습데이터 선택 방법에 관한 연구)

  • Yun, Jong-Seob;Kim, Jin Heon
    • Journal of IKEEE
    • /
    • v.22 no.3
    • /
    • pp.816-821
    • /
    • 2018
  • Recently, machine learning algorithms based on artificial neural networks started to be used widely as classifiers in the field of EEG research for emotion analysis and disease diagnosis. When a machine learning model is used to classify EEG data, if training data is composed of only data having similar characteristics, classification performance may be deteriorated when applied to data of another group. In this paper, we propose a method to construct training data set by selecting several groups of data using semi-supervised learning algorithm to improve these problems. We then compared the performance of the two models by training the model with a training data set consisting of data with similar characteristics to the training data set constructed using the proposed method.

Fine-grained Sentiment Lexicon Construction via Semi-supervised Learning (준지도학습을 통한 세부감성 어휘 구축)

  • Jo, Yo-Han;Oh, Hyo-Jung;Lee, Chung-Hee;Kim, Hyun-Ki
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.33-38
    • /
    • 2013
  • 소셜미디어를 통한 여론분석과 브랜드 모니터링에 대한 요구가 증가하면서, 빅데이터로부터 감성을 분석하는 기술에 대한 필요가 늘고 있다. 이를 위해, 본 논문에서는 단순 긍/부정 감성이 아닌 20종류의 세분화된 감성을 분석하기 위한 감성어휘 구축 알고리즘을 제시한다. 감성어휘 구축을 위해서는 준지도학습을 사용하였으며, 도메인에 특화되지 않은 일반 감성어휘를 구축하도록 학습되었다. 학습된 감성어휘를 인물, 스마트기기, 정책 등 다양한 도메인의 트위터 데이터에 적용하여 세부감성을 분석한 결과, 알고리즘의 특성상 재현율이 낮다는 한계를 가지고 있었으나, 대부분의 감성에 대해 높은 정확도를 지닌 감성어휘를 구축할 수 있었고, 감성을 직간접적으로 나타내는 표현들을 학습할 수 있었다.

  • PDF

Novel Intent Category Discovery using Contrastive Learning (대조학습을 활용한 새로운 의도 카테고리 발견)

  • Seungyeon Seo;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.107-112
    • /
    • 2023
  • 라벨 데이터 수집의 어려움에 따라 라벨이 없는 데이터로 학습하는 준지도학습, 비지도학습에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 그의 일환으로 Novel Intent Category Discovery(NICD) 문제를 제안하고 NICD 연구의 베이스라인이 될 모델을 소개한다. NICD 문제는 라벨이 있는 데이터와 라벨이 없는 데이터의 클래스 셋이 겹치지 않는다는 점에서 기존 준지도학습의 문제들과 차이가 있다. 제안 모델은 RoBERTa를 기반으로 두 개의 분류기를 추가하여 구성되며 라벨이 있는 데이터셋과 라벨이 없는 데이터셋에서 각각 다른 분류기를 사용하여 라벨을 예측한다. 학습방법은 2단계로 먼저 라벨이 있는 데이터셋으로 요인표현을 학습한다. 두 번째 단계에서는 교차 엔트로피, 이항교차 엔트로피, 평균제곱오차, 지도 대조 손실함수를 NICD 문제에 맞게 변형하여 학습에 사용한다. 논문에서 제안된 모델은 라벨이 없는 데이터셋에 대해 이미지 최고성능 모델보다 24.74 더 높은 정확도를 기록했다.

  • PDF

Investigating Learning Type in Online Problem-Based Learning: Applying Learning Analysis Techniques (온라인 문제기반학습에서의 학습행태 분석: 학습분석 기법을 적용하여)

  • Lee, Sunghye;Choi, Kyoungae;Park, Minseo;Han, Jeongyun
    • The Journal of Korean Association of Computer Education
    • /
    • v.23 no.1
    • /
    • pp.77-90
    • /
    • 2020
  • The purpose of the study is to provide educational implications for more effective Problem-based learning(PBL) by investigating students' learning types based on their online learning behaviors. A total of 1,341 students participated in the study, and they engaged in a six-week-long PBL program run by K University. For the study, participants' online activity data were collected. From the data, a total of 48 variables that represent their various online learning behaviors were extracted. Based on the variables, hierarchical cluster analysis was conducted to analyze learning types. Also, the differences in learning characteristics and achievements were investigated by considering types of learning. As a result, the learning types in online PBL were classified as 'high-level participation (cluster 1)', 'medium-level participation (cluster 2)', and 'low-level participation (cluster 3)'. In addition, the achievement level was found to be highest in 'high-level participation (cluster 1)' and lowest in 'low-level participation (cluster 3)'. Based on the results, the implications for improving online PBL were suggested.

Investigating Online Learning Types Based on self-regulated learning in Online Software Education: Applying Hierarchical Cluster Analysis (온라인 소프트웨어 교육에서 학습자의 자기조절학습 관련 특성에 기반한 온라인 학습 유형 분석: 계층적 군집 분석 기법을 활용하여)

  • Han, Jeongyun;Lee, Sunghye
    • The Journal of Korean Association of Computer Education
    • /
    • v.22 no.5
    • /
    • pp.51-65
    • /
    • 2019
  • This study aims to provide educational implications for more strategic online software education by the types of online learning according to learners' self-regulated learning characteristics in the online software education environment and examining the characteristics of each type. For this, variables related to self-regulated learning characteristic were extracted from the log data of 809 students participating in the online software learning program of K University, and then analyzed using hierarchical cluster analysis. Based on hierarchical cluster analysis learner clusters according to the characteristics of self-regulated learning were derived and the differences between learners' learning characteristics and learning results according to cluster types were examined. As a result, the types of self-regulated learning of online software learners were classified as 'high level self-regulated learning type (group 1)', 'medium level self-regulated learning type (group 2)', and 'low level self-regulated learning type (group 3)'. The achievement level was found to be highest in 'high-level self-regulated learning type (group 1)' and 'low-level self-regulated learning type (group 3)' was the lowest. Based on these results, the implications for effective online software education were suggested.

Active Selection of Label Data for Semi-Supervised Learning Algorithm (준감독 학습 알고리즘을 위한 능동적 레이블 데이터 선택)

  • Han, Ji-Ho;Park, Eun-Ae;Park, Dong-Chul;Lee, Yunsik;Min, Soo-Young
    • Journal of IKEEE
    • /
    • v.17 no.3
    • /
    • pp.254-259
    • /
    • 2013
  • The choice of labeled data in semi-supervised learning algorithm can result in effects on the performance of the resultant classifier. In order to select labeled data required for the training of a semi-supervised learning algorithm, VCNN(Vector Centroid Neural Network) is proposed in this paper. The proposed selection method of label data is evaluated on UCI dataset and caltech dataset. Experiments and results show that the proposed selection method outperforms conventional methods in terms of classification accuracy and minimum error rate.