• Title/Summary/Keyword: 학습 데이터

Search Result 6,225, Processing Time 0.047 seconds

Data selection method for Incremental learning using prior evaluation of data importance (데이터 중요도의 사전 평가를 이용한 증가학습을 위한 데이터 선택 방법)

  • 이선영;조성준;방승양
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.339-341
    • /
    • 1998
  • 다층 퍼셉트론 학습은 학습 데이터의 능동적인 선택 여부에 따라 능동적 학습(Active learning)과 피동적 학습(Passive learning)으로 구분할 수 있다. 기존의 능동적 학습 방법들은 학습 데이터의 중요도를 측정할 수 있는 기준(measure)을 제시하고 이 기준에 따라 학습 데이터를 선택하는 방법을 취하고 있다. 이 방법들은 학습 데이터 선택을 위해 Hessian Approximation과 같은 복잡한 계산이나 학습 데이터를 선택하는 과정에 있어서 데이터의 중요도를 평가하기 위한 반복적인 계산을 필요로 한다. 본 논문에서는 학습 데이터 선택 시 반복적인 계산이 필요하지 않는 비교사 학습을 이용한 능동적 학습 데이터 선택 방법을 제안하고 그 수렴 특성과 일반화 성능을 분석한다. 또한 비교 실험을 통하여 제안된 방법이 기존의 능동적 학습방법보다 간단한 계산만으로 수렴 속도를 향상시키며 일반화에도 뒤떨어지지 않음을 보인다.

  • PDF

Learner Activity Modeling Based on Teaching and Learning Activities Data (교수-학습 활동 데이터기반 학습자 활동 모델링)

  • Kim, Kyungrog
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.9
    • /
    • pp.411-418
    • /
    • 2016
  • Learning analytic has been utilized to helps us to successfully complete the course by using the interaction of the teacher and the learner data generated from the teaching and learning support system. In other words, Learning analytic is a method in order to understand the activities of learners. In the learning analytic, the data model is needed in order to utilize the more useful for teaching and learning activities data. Therefore, in this study, we propose a user centric data model of learning styles and learning objects. This model is expressed by aggregating of user learning style, learning objects, and learning activities. The proposed model is significant that laid the foundation for analyzing the activities of the learners in course units.

Synchronizing Learning Data in Educational Games (교육용 게임에서의 학습 데이터 동기화 처리)

  • Jeon, Seong-Sik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.100-104
    • /
    • 2008
  • 교육용 소프트웨어 산업이 급속히 발전하면서 온라인 게임을 플랫폼으로 하는 다양한 교육용 게임이 개발되고 있다. 현재 대부분 교육용 게임 시스템은 온라인 게임의 학습도구와 웹을 기반으로 하는 부가적 교육 학습도구로 이중화 되어 개발되고 있다. 하지만 온라인 게임의 학습 데이터 결과와 웹의 학습 데이터 결과가 일치화 되지 않아 학습자에게 올바른 학습 결과를 줄 수 없을 뿐만 아니라 게임 시스템의 학습과정에 따른 레벨 시스템을 적용하기가 어렵다. 본 논문에서는 이러한 비동기적 데이터 처리방식을 온라인 게임 시스템과 웹의 학습과정의 분기 조건에 필요한 학습결과 데이터만을 동기화 처리하는 학습 데이터 동기화 처리 방식을 구현하였다. 이러한 학습결과 데이터 동기화 처리는 위와 같은 문제점으로 다양한 학습 콘텐츠들이 온라인화 하지 못했던 문제점을 해결하고, 향후 통합 교육용 시스템과 다중 교육용 게임 시스템으로 개발 될 때 좀 더 효과적인 학습 시스템으로 개발될 수 있는 학습 데이터 처리 방식이 될 것이다.

  • PDF

Relation Extraction Model for Noisy Data Handling on Distant Supervision Data based on Reinforcement Learning (원격지도학습데이터의 오류를 처리하는 강화학습기반 관계추출 모델)

  • Yoon, Sooji;Nam, Sangha;Kim, Eun-kyung;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.55-60
    • /
    • 2018
  • 기계학습 기반인 관계추출 모델을 설계할 때 다량의 학습데이터를 빠르게 얻기 위해 원격지도학습 방식으로 데이터를 수집한다. 이러한 데이터는 잘못 분류되어 학습데이터로 사용되기 때문에 모델의 성능에 부정적인 영향을 끼칠 수 있다. 본 논문에서는 이러한 문제를 강화학습 접근법을 사용해 해결하고자 한다. 본 논문에서 제안하는 모델은 오 분류된 데이터로부터 좋은 품질의 데이터를 찾는 문장선택기와 선택된 문장들을 가지고 학습이 되어 관계를 추출하는 관계추출기로 구성된다. 문장선택기는 지도학습데이터 없이 관계추출기로부터 피드백을 받아 학습이 진행된다. 이러한 방식은 기존의 관계추출 모델보다 좋은 성능을 보여주었고 결과적으로 원격지도학습데이터의 단점을 해결한 방법임을 보였다.

  • PDF

Outlier Analysis of Learner's Learning Behaviors Data using k-NN Method (k-NN 기법을 이용한 학습자의 학습 행위 데이터의 이상치 분석)

  • Yoon, Tae-Bok;Jung, Young-Mo;Lee, Jee-Hyong;Cha, Hyun-Jin;Park, Seon-Hee;Kim, Yong-Se
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.524-529
    • /
    • 2007
  • 지능형 학습 시스템은 학습자의 학습 과정에서 수집된 데이터를 분석하여 학습자에게 맞는 전략을 세우고 적합한 서비스를 제공하는 시스템이다. 학습자에게 적합한 서비스를 위해서는 학습자 모델링 작업이 우선시 되며, 이 모델 생성을 위해서 학습자의 학습 과정에서 발생한 데이터를 수집하고 분석하게 된다. 하지만, 수집된 데이터가 학습자의 일관되지 못한 행위나 비예측 학습 성향을 포함하고 있다면, 생성된 모델을 신뢰하기 어렵다. 본 논문에서는 학습자에게서 수집된 데이터를 거리기반 이상치 선별 방법인 k-NN을 이용하여 이상치를 선별한다. 실험에서는 홈 인테리어 컨텐츠 기반에 학습자의 학습 행위에 대한 학습 성향을 진단하기 위한 DOLLS-HI를 이용하여, 수집된 학습자의 데이터에서 이상치를 분류하고 학습 성향 진단을 위한 모델을 생성하였다. 생성된 모델은 이상치 분류전과 비교하여 신뢰가 향상된 것을 확인하였다.

  • PDF

Design and Implementation of a Generic Classification System Based on Incremental Learning Technology (점진적 학습 기술 기반 범용적인 분류기 구조설계 방법의 설계 및 구현)

  • Min, Byung-Won;Oh, Yong-Sun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.425-426
    • /
    • 2019
  • 전통적인 마이닝 기법은 다양한 디지털 매체와 센서 등에서 생산되는 빅데이터를 처리하기 어려울 뿐 아니라 신규 데이터 누적시 전체 데이터를 재분석 해야하는 비효율성과 대용량의 문서를 학습함에 있어 메모리부족 문제, 학습 소요시간 문제 등이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 자질축소 기법에 의존하지 않고 대량의 문서를 자유롭게 학습하고 부분적인 자질 추가 변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법을 설계 및 구현하였다. 점진적 학습 모듈은 일반적인 학습 방법이 데이터의 추가 및 변동시마다 모든 데이터를 재학습하는 데 반해, 기존의 학습 결과에 증분된 데이터만 재처리 없이 추가적으로 학습한다. 재학습을 위해 사용자는 작업 수행 중 자원 관리를 통해 기존에 처리된 데이터를 자유롭게 가져와서 새로운 데이터와 병합이 가능하다. 이러한 점직적 학습 효율성은 빅데이터 기반 데이터 처리에 주요한 특성인 데이터 생산 속도를 극복하기 위한 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

Generating Training Dataset of Machine Learning Model for Context-Awareness in a Health Status Notification Service (사용자 건강 상태알림 서비스의 상황인지를 위한 기계학습 모델의 학습 데이터 생성 방법)

  • Mun, Jong Hyeok;Choi, Jong Sun;Choi, Jae Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.1
    • /
    • pp.25-32
    • /
    • 2020
  • In the context-aware system, rule-based AI technology has been used in the abstraction process for getting context information. However, the rules are complicated by the diversification of user requirements for the service and also data usage is increased. Therefore, there are some technical limitations to maintain rule-based models and to process unstructured data. To overcome these limitations, many studies have applied machine learning techniques to Context-aware systems. In order to utilize this machine learning-based model in the context-aware system, a management process of periodically injecting training data is required. In the previous study on the machine learning based context awareness system, a series of management processes such as the generation and provision of learning data for operating several machine learning models were considered, but the method was limited to the applied system. In this paper, we propose a training data generating method of a machine learning model to extend the machine learning based context-aware system. The proposed method define the training data generating model that can reflect the requirements of the machine learning models and generate the training data for each machine learning model. In the experiment, the training data generating model is defined based on the training data generating schema of the cardiac status analysis model for older in health status notification service, and the training data is generated by applying the model defined in the real environment of the software. In addition, it shows the process of comparing the accuracy by learning the training data generated in the machine learning model, and applied to verify the validity of the generated learning data.

Learning RBF Neural Networks by Active Data Selection (능동적인 데이터 선택에 의한 RBF 신경망의 학습)

  • 박상욱;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.478-480
    • /
    • 2000
  • 본 논문에서는 데이터를 능동적으로 선택하고, 그 데이터에 맞추어 RBF 은닉 뉴런을 증가시키는 신경망을 제안한다. 현재의 신경망에 대해서 가장 학습이 어려운 데이터를 선택해서 신경망을 학습하고, 학습한 신경망에 대해서 다시 에러가 가장 큰 데이터를 뽑아서 학습시키는 과정을 반복한다. 5개의 실세계 데이터에 대해 실험을 해보고, Platt이 제안한 RAN과 성능을 비교한다. 점진적으로 임계 데이터를 선택해서 학습을 함으로써, 전체 데이터를 다 사용하지도 않고도, 전체 데이터를 다 사용한 경우와 비슷한 성능을 보임을 실험을 통해서 알 수 있다.

  • PDF

Implementation and Optimization of Distributed Deep learning based on Multi Layer Neural Network for Mobile Big Data at Apache Spark (아파치 스파크에서 모바일 빅 데이터에 대한 다계층 인공신경망 기반 분산 딥러닝 구현 및 최적화)

  • Myung, Rohyoung;Ahn, Beomjin;Yu, Heonchang
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.201-204
    • /
    • 2017
  • 빅 데이터의 시대가 도래하면서 이전보다 데이터로부터 유의미한 정보를 추출하는 것에 대한 연구가 활발하게 진행되고 있다. 딥러닝은 텍스트, 이미지, 동영상 등 다양한 데이터에 대한 학습을 가능하게 할 뿐만 아니라 높은 학습 정확도를 보임으로써 차세대 머선러닝 기술로 각광 받고 있다. 그러나 딥러닝은 일반적으로 학습해야하는 데이터가 많을 뿐만 아니라 학습에 요구되는 시간이 매우 길다. 또한 데이터의 전처리 수준과 학습 모델 튜닝에 의해 학습정확도가 크게 영향을 받기 때문에 활용이 어렵다. 딥러닝에서 학습에 요구되는 데이터의 양과 연산량이 많아지면서 분산 처리 프레임워크 기반 분산 학습을 통해 학습 정확도는 유지하면서 학습시간을 단축시키는 사례가 많아지고 있다. 본 연구에서는 범용 분산 처리 프레임워크인 아파치 스파크에서 데이터 병렬화 기반 분산 학습 모델을 활용하여 모바일 빅 데이터 분석을 위한 딥러닝을 구현한다. 딥러닝을 구현할 때 분산학습을 통해 학습 속도를 높이면서도 학습 정확도를 높이기 위한 모델 튜닝 방법을 연구한다. 또한 스파크의 분산 병렬처리 효율을 최대한 끌어올리기 위해 파티션 병렬 최적화 기법을 적용하여 딥러닝의 학습속도를 향상시킨다.

  • PDF

Interval Arithmetic Learning Algorithm for Spiking Neural Networks (Spiking Neural Networks 의 구간연산 학습알고리즘)

  • Lee, Kyunghee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.793-795
    • /
    • 2020
  • 본 논문에서는 스파이킹 뉴론(Spiking Neuron)들이 쿨롱에너지 포텐셜 (Coulomb Energy Potential)을 가지는 스파이킹 신경회로망에서의 학습알고리즘을 일반화하여 구간연산(Interval Arithmetic)의 학습이 가능한 학습알고리즘을 제안한다. 제안하는 학습알고리즘은 입력 데이터로서 구간(Interval) 데이터와 포인트(Point) 데이터를 모두 학습 할 수 있는 일반화된 학습알고리즘으로서 간단한 컴퓨터 시뮬레이션을 통하여 범위(Lower bound & Upper bound)를 가지는 구간데이터와 포인트데이터의 통합적인 학습이 가능하고 전문가시스템(expert system)에서의 "don't care attributes"의 학습 등에도 활용이 가능함을 보인다.