• Title/Summary/Keyword: 학습모델

Search Result 5,999, Processing Time 0.038 seconds

On Learning and Structure of Cerebellum Model Linear Associator Network(I) -Analysis & Development of Learning Algorithm- (소뇌모델 선형조합 신경망의 구조 및 학습기능 연구(I) -분석 및 학습 알고리즘 개발-)

  • Hwang, H.;Baek, P.K.
    • Journal of Biosystems Engineering
    • /
    • v.15 no.3
    • /
    • pp.186-198
    • /
    • 1990
  • 인간 소뇌의 구조와 기능을 간략하게 수학적으로 모델링하여 입력에 따른 시스템의 적정 출력을 학습에 의한 적응 제어 방식으로 추출해 내는 소뇌모델 대수제어기(CMAC : Cerebellar Model Arithmetic Controller)가 제안되었다. 본 논문에서는 연구개발된 기존 신경회로망과의 비교 분석에 의거하여, 소뇌모델 대수제어기 대신 네트의 특성에 따라 소뇌모델 선형조합 신경망(CMLAN : Cerebellum Model Linear Associator Network)이라 하였다. 소뇌모델 선형조합 신경망은 시스템의 제어 함수치를 결정하는 데 있어, 기존의 제어방식이 시스템의 모델링을 기초로 하여 알고리즘에 의한 수치해석적 또는 분석적 기법으로 모델 해를 산출하는 것과 달리, 학습을 통하여 저장되는 분산기억 소자들의 함수치를 선형적으로 조합함으로써 시스템의 입출력을 결정한다. 분산기억 소자로의 함수치 산정 및 저장은 소뇌모델 선형조합 신경망이 갖는 고유의 구조적 상태공간 매핑(State Space Mapping)과 델타규칙(Delta Rule)에 의거한 시스템의 입출력 상태함수의 학습으로써 수행된다. 본 논문을 통하여 소뇌모델 선형조합신경망의 구조적 특성, 학습 성질과 상태공간 설정 및 시스템의 수렴성을 규명하였다. 또한 기존의 최대 편차수정 학습 알고리즘이 갖는 비능률성 및 적용 제한성을 극복한 효율적 학습 알고리즘들을 제시하였다. 언급한 신경망의 특성 및 제안된 학습 알고리즘들의 능률성을 다양한 학습이득(Learning Gain)하에서 비선형 함수를 컴퓨터로 모의 시험하여 예시하였다.

  • PDF

BERT-based Document Summarization model using Copying-Mechanism and Reinforcement Learning (복사 메커니즘과 강화 학습을 적용한 BERT 기반의 문서 요약 모델)

  • Hwang, Hyunsun;Lee, Changki;Go, Woo-Young;Yoon, Han-Jun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.167-171
    • /
    • 2020
  • 문서 요약은 길이가 긴 원본 문서에서 의미를 유지한 채 짧은 문서나 문장을 얻어내는 작업을 의미한다. 딥러닝을 이용한 자연어처리 기술들이 연구됨에 따라 end-to-end 방식의 자연어 생성 모델인 sequence-to-sequence 모델을 문서 요약 생성에 적용하는 방법들이 연구되었다. 본 논문에서는 여러 자연어처리 분야에서 높은 성능을 보이고 있는 BERT 모델을 이용한 자연어 생성 모델에 복사 메커니즘과 강화 학습을 추가한 문서 요약 모델을 제안한다. 복사 메커니즘은 입력 문장의 단어들을 출력 문장에 복사하는 기술로 학습데이터에서 학습되기 힘든 고유 명사 등의 단어들에 대한 성능을 높이는 방법이다. 강화 학습은 정답 단어의 확률을 높이기 위해 학습하는 지도 학습 방법과는 달리 연속적인 단어 생성으로 얻어진 전체 문장의 보상 점수를 높이는 방향으로 학습하여 생성되는 단어 자체보다는 최종 생성된 문장이 더 중요한 자연어 생성 문제에 효과적일 수 있다. 실험결과 기존의 BERT 생성 모델 보다 복사 메커니즘과 강화 학습을 적용한 모델의 Rouge score가 더 높음을 확인 하였다.

  • PDF

Relation Extraction Model for Noisy Data Handling on Distant Supervision Data based on Reinforcement Learning (원격지도학습데이터의 오류를 처리하는 강화학습기반 관계추출 모델)

  • Yoon, Sooji;Nam, Sangha;Kim, Eun-kyung;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.55-60
    • /
    • 2018
  • 기계학습 기반인 관계추출 모델을 설계할 때 다량의 학습데이터를 빠르게 얻기 위해 원격지도학습 방식으로 데이터를 수집한다. 이러한 데이터는 잘못 분류되어 학습데이터로 사용되기 때문에 모델의 성능에 부정적인 영향을 끼칠 수 있다. 본 논문에서는 이러한 문제를 강화학습 접근법을 사용해 해결하고자 한다. 본 논문에서 제안하는 모델은 오 분류된 데이터로부터 좋은 품질의 데이터를 찾는 문장선택기와 선택된 문장들을 가지고 학습이 되어 관계를 추출하는 관계추출기로 구성된다. 문장선택기는 지도학습데이터 없이 관계추출기로부터 피드백을 받아 학습이 진행된다. 이러한 방식은 기존의 관계추출 모델보다 좋은 성능을 보여주었고 결과적으로 원격지도학습데이터의 단점을 해결한 방법임을 보였다.

  • PDF

A Training Feasibility Evaluation of Nuclear Safeguards Terms for the Large Language Model (LLM) (거대언어모델에 대한 원자력 안전조치 용어 적용 가능성 평가)

  • Sung-Ho Yoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.479-480
    • /
    • 2024
  • 본 논문에서는 원자력 안전조치 용어를 미세조정(fine tuning) 알고리즘을 활용해 추가 학습한 공개 거대 언어모델(Large Language Model, LLM)이 안전조치 관련 질문에 대해 답변한 결과를 정성적으로 평가하였다. 평가 결과, 학습 데이터 범위 내 질문에 대해 학습 모델은 기반 모델 답변에 추가 학습 데이터를 활용한 낮은 수준의 추론을 수행한 답변을 출력하였다. 평가 결과를 통해 추가 학습 개선 방향을 도출하였으며 저비용 전문 분야 언어 모델 구축에 활용할 수 있을 것으로 보인다.

  • PDF

(Tuning Learning Rate in Neural Network Using Sugeno Fuzzy Model) (Sugeno 퍼지 모델을 이용한 신경망의 학습률 조정)

  • 라혁주;서재용;김성주;전흥태
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.77-80
    • /
    • 2003
  • 신경망의 퍼셉트론 학습법에는 이진 또는 연속 활성화 함수가 사용된다. 초기 연결강도는 임의의 값으로 설정하며, 목표치와 실제 출력과의 차이를 이용하는 것이 주된 특징이다. 즉 구해진 오차는 학습률에 따라서 다음 단계의 연결강도에 영향을 주게 된다. 이런 경우 학습률이 너무 크면 수렴성을 보장할 수 없으며, 반대로 너무 작게 선정하면 학습이 매우 느리게 진행되는 단점이 발생한다. 이런 이유로 능동적인 학습률의 변화는 신경망의 퍼셉트론 학습법에 중요한 관건이 리며, 주어진 문제를 최적으로 학습을 위해서는 결국 상황에 따른 적절한 학습률 조정이 필요하다. 본 논문에서는 학습률 조정에 퍼지 모델을 적용하는 신경망 학습 방법을 제안하고자 한다. 제안한 방법에 의한 학습은 오차의 변화에 따라 학습률을 조정하는 방식을 사용하였고, 그 결과 연결강도를 능동적으로 변화시켜 효과적인 학습 결과를 얻었다. 학습률 변화는 'Sugeno 퍼지 모델'을 이용하여 구현하였다.

  • PDF

Application of transfer learning to develop radar-based rainfall prediction model with GAN(Generative Adversarial Network) for multiple dam domains (다중 댐 유역에 대한 강우예측모델 개발을 위한 전이학습 기법의 적용)

  • Choi, Suyeon;Kim, Yeonjoo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.61-61
    • /
    • 2022
  • 최근 머신러닝 기술의 발달에 따라 이를 활용한 레이더 자료기반 강우예측기법이 활발히 개발되고 있다. 기존 머신러닝을 이용한 강우예측모델 개발 관련 연구는 주로 한 지역에 대해 수행되며, 데이터 기반으로 훈련되는 머신러닝 기법의 특성상 개발된 모델이 훈련된 지역에 대해서만 좋은 성능을 보인다는 한계점이 존재한다. 이러한 한계점을 해결하기 위해 사전 훈련된 모델을 이용하여 새로운 데이터에 대해 모델을 훈련하는 전이학습 기법 (transfer learning)을 적용하여 여러 유역에 대한 강우예측모델을 개발하고자 하였다. 본 연구에서는 사전 훈련된 강우예측 모델로 생성적 적대 신경망 기반 기법(Generative Adversarial Network, GAN)을 이용한 미래 강우예측모델을 사용하였다. 해당 모델은 기상청에서 제공된 2014년~2017년 여름의 레이더 이미지 자료를 이용하여 초단기, 단기 강우예측을 수행하도록 학습시켰으며, 2018년 레이더 이미지 자료를 이용한 단기강우예측 모의에서 좋은 성능을 보였다. 본 연구에서는 훈련된 모델을 이용해 새로운 댐 유역(안동댐, 충주댐)에 대한 강우예측모델을 개발하기 위해 여러 전이학습 기법을 적용하고, 그 결과를 비교하였다. 결과를 통해 새로운 데이터로 처음부터 훈련시킨 모델보다 전이학습 기법을 사용하였을 때 좋은 성능을 보이는 것을 확인하였으며, 이를 통해 여러 댐 유역에 대한 모델 개발 시 전이학습 기법이 효율적으로 적용될 수 있음을 확인하였다.

  • PDF

Reinforcement learning model for water distribution system design (상수도관망 설계에의 강화학습 적용방안 연구)

  • Jaehyun Kim;Donghwi Jung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.229-229
    • /
    • 2023
  • 강화학습은 에이전트(agent)가 주어진 환경(environment)과의 상호작용을 통해서 상태(state)를 변화시켜가며 최대의 보상(reward)을 얻을 수 있도록 최적의 행동(action)을 학습하는 기계학습법을 의미한다. 최근 알파고와 같은 게임뿐만 아니라 자율주행 자동차, 로봇 제어 등 다양한 분야에서 널리 사용되고 있다. 상수도관망 분야의 경우에도 펌프 운영, 밸브 운영, 센서 최적 위치 선정 등 여러 문제에 적용되었으나, 설계에 강화학습을 적용한 연구는 없었다. 설계의 경우, 관망의 크기가 커짐에 따라 알고리즘의 탐색 공간의 크기가 증가하여 기존의 최적화 알고리즘을 이용하는 것에는 한계가 존재한다. 따라서 본 연구는 강화학습을 이용하여 상수도관망의 구성요소와 환경요인 간의 복잡한 상호작용을 고려하는 설계 방법론을 제안한다. 모델의 에이전트를 딥 강화학습(Deep Reinforcement Learning)으로 구성하여, 상태 및 행동 공간이 커 발생하는 고차원성 문제를 해결하였다. 또한, 해당 모델의 상태 및 보상으로 절점에서의 압력 및 수요량과 설계비용을 고려하여 적절한 수량과 수압의 용수 공급이 가능한 경제적인 관망을 설계하도록 하였다. 모델의 행동은 실제로 공학자가 설계하듯이 절점마다 하나씩 차례대로 다른 절점과의 연결 여부를 결정하는 것으로, 이를 통해 관망의 레이아웃(layout)과 관경을 결정한다. 본 연구에서 제안한 방법론을 규모가 큰 그리드 네트워크에 적용하여 모델을 검증하였으며, 고려해야 할 변수의 개수가 많음에도 불구하고 목적에 부합하는 관망을 설계할 수 있었다. 모델 학습과정 동안 에피소드의 평균 길이와 보상의 크기 등의 변화를 비교하여, 제안한 모델의 학습 능력을 평가 및 보완하였다. 향후 강화학습 모델을 통해 신뢰성(reliability) 또는 탄력성(resilience)과 같은 시스템의 성능까지 고려한 설계가 가능할 것으로 기대한다.

  • PDF

Jointly Learning Model using modified Latent Structural SVM (Latent Structural SVM을 확장한 결합 학습 모델)

  • Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.70-73
    • /
    • 2013
  • 자연어처리에서는 많은 모듈들이 파이프라인 방식으로 연결되어 사용되나, 이 경우 앞 단계의 오류가 뒷 단계에 누적되는 문제와 앞 단계에서 뒷 단계의 정보를 사용하지 못한다는 단점이 있다. 본 논문에서는 파이프라인 방식의 문제를 해결하기 위해 사용되는 일반적인 결합 학습 방법을 확장하여, 두 작업이 동시에 태깅된 학습 데이터뿐만 아니라 한 작업만 태깅된 학습데이터도 동시에 학습에 사용할 수 있는 결합 학습 모델을 Latent Structural SVM을 확장하여 제안한다. 실험 결과, 기존의 한국어 띄어쓰기와 품사 태깅 결합 모델의 품사 태깅 성능이 96.99%였으나, 본 논문에서 제안하는 결합 학습 모델을 이용하여 대용량의 한국어 띄어쓰기 학습데이터를 추가로 학습한 결과 품사 태깅 성능이 97.20%까지 향상 되었다.

  • PDF

A study for classification of students' learning-styles with HMM (Hidden Markov Model을 이용한 학습자 성향 파악에 관한 연구)

  • Jeong Yeong-Mo;Lee Ji-Hyeong;Cha Hyeon-Jin;Park Seon-Hui;Yun Tae-Bok;Kim Yong-Se
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.310-313
    • /
    • 2006
  • 지능형 학습 시스템(ITS, Intelligent Tutoring System)은 학습자의 학습 스타일을 인지하여 학습자에 맞는 학습전략을 세우고 적절한 학습 서비스를 제공하는 시스템이다. 기존의 학습시스템은 학습자의 학습 스타일 보다는 학습 컨텐츠에 중심을 두어 학습자에게 맞는 학습 전략을 적절히 세우는 과정이 부족했다. 이에 본 논문에서는 학습자의 학습과정에서 발생한 데이터를 기반으로 학습자의 학습 스타일을 파악하는 방법을 제안한다. 이를 위해 서양 건축양식 학습을 위한 교육 컨텐츠를 이용하였으며, 수집된 데이터를 분석하여 Folder & Silverman 이 제시한 학습 스타일에 근거한 학습자의 학습 스타일을 추출하였다. 실험에서는 70명의 데이터를 수집하였고, 학습자가 교육 컨텐츠를 학습한 순서에 대한 시계열 데이터를 기반으로 학습자 성향을 알아보기 위하여 은닉 마코프 모델(Hidden Markov Model)을 사용하였다. 은닉 마코프 모델을 적용하여 얻은 분석 결과를 가지고 각 학습자에게 맞는 학습 스타일을 진단하였다. 은닉 마코프 모델에서 얻은 학습 스타일 진단 모델은 향후에 학습자 학습 스타일을 파악하는데 사용할 수 있으며, ITS에 있어 학습자 성향 분석 모듈로 고려해볼 수 있다.

  • PDF

Performance Comparison Between Neural Network Model and Statistical Models (통계적 모델과 신경회로망 모델의 성능 비교에 관한 연구)

  • Han, Seung-Soo;Kim, In-Taek
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2401-2403
    • /
    • 2000
  • 시스템의 특성을 이해하고 신뢰성 있는 제어를 위해서는 시스템에 대한 정확한 모델을 필요로 한다. 이러한 목적을 위해서 많은 연구자들에 의한 다양한 방법의 모델링 방법이 계속되어 연구되어지고 있다. 현재 많이 사용하는 모델링 방법 중에는 통계적 기법을 이용하는 것, first principle 방법을 이용하는 것, 지능형 기법을 이용하는 방법 등이 있다. 본 연구에서는 통계적 방법인 fractional factorial 방법을 이용한 모델, Taguchi 방법을 이용한 모델, 그리고 지능형 방법인 신경회로망을 이용한 모델의 3가지 모델을 사용해서 각 모델의 학습오차와 예측오차 등의 특성을 비교하였다. 모델에 사용된 데이터는 비선형 시스템인 플라즈마 화학 증착 장비(Plasma-Enhnaced Chemical Vapor Deposition : PECVD)에 의해 증착된 산화막 실험 데이터이다. 각 모델에 대해서 PECVD 데이터를 사용하여 모델을 만들었을 때 각 모델의 학습오차와 학습오차 변위, 그리고 예측오차와 예측오차변위를 조사하였다. 세가지 모델 모두 학습오차가 예측오차보다 작았으며 변위 또한 학습오차변위가 예측오차변위보다 작았다. 본 연구 결과는 일반적으로 신경회로망에 의한 오차가 다른 통계적인 방법에 의한 오차보다 작음을 보여준다.

  • PDF