• Title/Summary/Keyword: 능동학습

Search Result 527, Processing Time 0.028 seconds

Data selection method for Incremental learning using prior evaluation of data importance (데이터 중요도의 사전 평가를 이용한 증가학습을 위한 데이터 선택 방법)

  • 이선영;조성준;방승양
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.339-341
    • /
    • 1998
  • 다층 퍼셉트론 학습은 학습 데이터의 능동적인 선택 여부에 따라 능동적 학습(Active learning)과 피동적 학습(Passive learning)으로 구분할 수 있다. 기존의 능동적 학습 방법들은 학습 데이터의 중요도를 측정할 수 있는 기준(measure)을 제시하고 이 기준에 따라 학습 데이터를 선택하는 방법을 취하고 있다. 이 방법들은 학습 데이터 선택을 위해 Hessian Approximation과 같은 복잡한 계산이나 학습 데이터를 선택하는 과정에 있어서 데이터의 중요도를 평가하기 위한 반복적인 계산을 필요로 한다. 본 논문에서는 학습 데이터 선택 시 반복적인 계산이 필요하지 않는 비교사 학습을 이용한 능동적 학습 데이터 선택 방법을 제안하고 그 수렴 특성과 일반화 성능을 분석한다. 또한 비교 실험을 통하여 제안된 방법이 기존의 능동적 학습방법보다 간단한 계산만으로 수렴 속도를 향상시키며 일반화에도 뒤떨어지지 않음을 보인다.

  • PDF

Selecting Initial Training Set for Active Learning by Clustering (군집화 기법을 이용한 능동적 학습의 최초학습예제 선정)

  • 강재호;류광렬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.16-18
    • /
    • 2003
  • 기계학습의 분류(classification) 기술을 실제 문제에 적용하기 위해서는 카테고리(category)를 부여한 학습예제를 상당수 준비하여야 한다. 예제에 카테고리를 부여(labeling)하는 작업에는 무시할 수 없는 시간과 인력을 필요로 한다. 능동적 학습(active learning)은 동일한 수의 학습예제로 최대한의 성능을 달성하기 위하여 카테고리를 부여할 학습예제를 선별하는 전략이다. 능동적 학습은 현재까지 파악된 정보에 기반하여 분류기(classifier)를 생성하고, 생성된 분류기를 활용하여 카테고리를 부여받았을 때 가장 이득이 큰 예제들을 선정하여 사용자에게 문의하는 과정을 반복하여 수행한다. 만일 능동적 학습의 첫 학습단계에서 학습에 보다 유용한 예제들을 최초학습예제집합으로 선정한다면 같은 수의 학습예제로 더 나은 성능을 달성할 수 있을 것이다. 본 논문에서는 유사한 예제들은 동일한 카테고리에 속할 가능성이 높다는 일반적인 가정에 기반하여 예제들을 군집화(clustering)한 후, 생성된 각 군집을 대표할 수 있는 예제로 최초학습예제집합으로 구성하는 방안을 제안한다. 제안한 방안을 문서분류 문제를 대상으로 실험해 본 결과 최초학습예제들을 임의로 선정하는 방식보다 정확도가 높은 분류기를 생성할 수 있음을 확인하였다.

  • PDF

Constructing Korean Named Recognition Dataset for Financial Domain Using Active Learning (능동 학습 기법을 활용한 한국어 금융 도메인 개체명 인식 데이터 구축)

  • Jeong, Dong-Ho;Heo, Min-Kang;Kim, Hyung-Chul;Park, Sang-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.82-86
    • /
    • 2020
  • 딥러닝 모델의 성능은 데이터의 품질과 양에 의해 향상된다. 그러나 데이터 구축은 많은 비용과 시간을 요구한다. 특히 전문 도메인의 데이터를 구축할 경우 도메인 지식을 갖춘 작업자를 활용할 비용과 시간이 더욱 제약적이다. 능동 학습 기법은 최소한의 데이터 구축으로 모델의 성능을 효율적으로 상승시키기 위한 방법이다. 다양한 데이터셋이 능동 학습 기법으로 구축된 바 있으나, 아직 전문 도메인의 한국어 데이터를 구축하는 연구는 활발히 수행되지 못한 것이 현실이다. 본 논문에서는 능동학습기법을 통해 금융 도메인의 개체명 인식 코퍼스를 구축하였고, 이를 통해 다음의 기여가 있다: (1) 금융 도메인 개체명 인식 코퍼스 구축에 능동 학습 기법이 효과적임을 확인하였고, (2) 이를 통해 금융 도메인 개체명 인식기를 개발하였다. 본 논문이 제안하는 방법을 통해 8,043문장 데이터를 구축하였고, 개체명 인식기의 성능은 80.84%로 달성되었다. 또한 본 논문이 제안하는 방법을 통해 약 12~25%의 예산 절감 효과가 있음을 실험으로 보였다.

  • PDF

Semi-automatic Construction of Training Data using Active Learning (능동 학습을 이용한 학습 데이터 반자동 구축)

  • Lee, Chang-Ki;Hur, Jeong;Wang, Ji-Hyun;Lee, Chung-Hee;Oh, Hyo-Jung;Jang, Myung-Gil;Lee, Young-Jik
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1252-1255
    • /
    • 2006
  • 본 논문은 정보검색, 정보추출, 번역, 자연어처리 등의 작업을 위한 통계적 방법론에서 필요한 학습 데이터 구축을 효율적으로 하기 위한 학습 데이터 반자동 구축 장치 및 그 방법에 대하여 기술한다. 본 논문에서는 학습 데이터 구축양을 줄이기 위해서 능동 학습을 이용한다. 또한 최근 각광 받고 있는 Conditional Random Fields(CRF)를 능동학습에 이용하기 위해서 CRF를 이용한 Confidence measure를 정의한다.

  • PDF

Active Learning for Prediction of Potential Customers (잠재 고객 예측을 위한 능동 학습 기법)

  • 박상욱;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.96-98
    • /
    • 2000
  • 본 논문에서는 상거래 환경에서 구매자와 비구매자들에 대한 데이터를 학습한 후, 잠재고객들 중에서 구매 확률이 높은 사람을 예측하는 문제에 효율적으로 접근하기 위해 능동적인 데이터 선택 기법을 이용한다. 실험 데이터는 ColL Challenge 2000에서 얻은 데이터로서, 구매자들의 정보보다 비구매자들의 정보가 더 많기 때문에 상당히 균형이 맞지 않는다. 따라서 모든 데이터를 한꺼번에 학습하는 경우에 성능이 좋지 않다. 본 논문에서는 이러한 불균형 분포를 갖는 실제적인 문제에 있어서 성능이 좋지 않다. 본 논문에서는 이러한 불균형 분포를 갖는 실제적인 문제에 있어서 RBF 기반의 신경망을 가지고 능동 학습을 함으로써 기존의 뱃치학습 보다 예측의 정확도를 향상시킬 수 있음을 보인다.

  • PDF

능동적 학습을 위한 군집화 기반 복수 문의 예제 선정

  • Gang, Jae-Ho;Ryu, Gwang-Ryeol;Gwon, Hyeok-Cheol
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.05a
    • /
    • pp.240-249
    • /
    • 2005
  • 사용자 맞춤 서비스를 위하여 온라인상에서 사용자의 관심 분야를 파악하고자 하는 경우에는 적은 수의 훈련 예제로 효율적인 학습이 가능한 능동적 학습이 적절하다. 능동적 학습을 효과적으로 적용하기 위하여 사용자에게 문의할 가치가 높은 예제를 선정하는 것도 중요하지만, 사용자 편의를 위해서는 문의 횟수를 가능한 최소화하여야 한다. 문의 횟수를 줄이면서도 많은 수의 훈련 예제를 획득하기 위해서는 복수의 문의 예제들을 사용자에게 한꺼번에 제시하고 그 관심 여부를 표한하게 하는 것이 효과적이다. 본 논문에서는 능동적 학습 적용 시 사용자에게 문의할 가치가 높은 복수 문의 예제들을 효과적으로 선정하기 위하여 가중치 반영 군집화를 적용하는 방안을 제안한다. 본 제안 방안은 먼저 각 예제의 문의 예제로서의 가치를 파악하고 이를 가중치로 삼아 군집화를 수행하여 상대적으로 유사한 예제들의 집합을 구성한다. 이어서 생성된 각각의 군집에서 가장 보편적인 예제를 문의 예제로 선정하면 선정된 각각의 문의 예지는 문의할 가치가 높으면서 함께 문의하게 될 예제들은 서로 충분히 달라 학습에 보다 유용하게 사용할 수 있는 훈련 예제들을 얻을 수 있다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과, 단순히 문의 가치가 높은 복수의 예제들을 함께 문의할 예제들로 선정하는 방안에 비해 학습 성능이 뛰어났으며, 한 번에 문의하는 예제 수를 증가시키더라도 분류기의 성능 저하가 적음을 확인하였다.

  • PDF

A Preliminary Study on Active Learning Process in Construction Engineering (건설엔지니어링 대학교육의 능동적 학습방식 도입 기초 연구)

  • Cho Chang-Yeon;Lee Jun-Bok
    • Proceedings of the Korean Institute Of Construction Engineering and Management
    • /
    • autumn
    • /
    • pp.610-613
    • /
    • 2003
  • Ensuring technical ability is essential in the construction industry to increase competitiveness in the global market. A new paradigm is coming up in academic education system to cultivate the competent engineers. The major objective of this research is to suggest a positive learning pattern In order to overcome the limitations of the passive learning style. A case study, technical upgrading with a tower crane, us explained in terms of active learning process, results, and evaluation of students' performance.

  • PDF

Active Learning of Mobile Robot Path Planning Using Evolutionary Algorithms (진화 알고리즘을 이용한 이동로봇 경로 계획의 능동적 학습)

  • 김성훈;장병탁
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1997.11a
    • /
    • pp.263-266
    • /
    • 1997
  • 로봇 축구 경기를 위해서는 경기장의 임의의 시작점에서 목표점으로 장애물을 피해 갈 수 있는 능력이 필요하다. 이러한 경로 계획을 학습하기 위해서 다양한 상황을 모두 고려할 경우 학습량이 급격히 증가한다. 그러나 많은 실제적인 학습 문제에 있어서는 가능한 모든 학습 데이터를 사용하지 않고도 원하는 학습 효과를 가져올 수 있음이 알려져 있으며, 이러한 경우 데이터를 스스로 선별하여 학습하는 능동적 학습 방법이 효과적이다. 본 논문에서는 진화 알고리즘을 사용하여 실시간에 경로 계획을 하기 위한 새로운 능동적 학습 방법을 제시한다. 제안되는 방법은 두 개의 진화 알고리즘으로 구성되는데 하나는 주어진 시작점-목표점간의 최적 경로를 찾는데 사용되고 또 다른 하나의 진화 알고리즘은 유용한 시작점-목표점들의 쌍을 탐색하는데 사용된다. 이 방법은 계산 시간의 여유가 있을 때 다양한 문제를 스스로 제시하고 해결하는 법을 학습해 놓고 후에 실제 문제가 주어질 때 기존의 문제와 가장 유사한 문제를 찾아 실시간에 해결함으로써 기존의 진화 알고리즘에 의한 경로 계획법들이 갖는 실시간성에서의 단점을 개선할 수 있다. 실험을 통하\ulcorner 제안된 두 가지 진화 알고리즘의 성능을 실험적으로 검토한다.

  • PDF