• Title/Summary/Keyword: 학습 정책

Search Result 1,336, Processing Time 0.029 seconds

Solving POMDP problem using Self-organizing state RL (상태 조직화 강화학습을 사용한 POMDP 문제 해결)

  • 이승준;장병탁
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.05a
    • /
    • pp.73-77
    • /
    • 2001
  • 본 논문에서는 부분적으로 관측 가능한 환경에서 사전의 모델 정보 없이 확률적인 행동 정책을 학습하는 상태 조직화 강화 학습 모델을 제안한다. 기존의 강화학습은 환경 모델을 사전에 필요로 하고 상태 전체의 관측이 필요하기 때문에 학습 이전에 문제에 대해 알아야 한다는 제약이 있다. 또한 작은 문제에 대해서는 잘 적용되지만 상태의 수가 매우 많고 부분적으로만 관측한 경우가 많은 실제 문제에는 그대로 적용하기가 불가능하다. 이러한 두 가지 단점을 해결하기 위해 본 논문에서는 사전의 모델 정보 없이 부분적인 관측값으로부터 상태와 행동 정책을 동시에 학습해 나가는 강화 학습 모델을 제안하고, 제안된 방법을 부분적으로만 관측이 가능한 미로 탐색 문제에 적용하였다.

  • PDF

Policy directions for special education teachers to invigorate smart education using AHP (AHP를 활용한 특수교사 관점에서 특수교육의 스마트교육 활성화를 위한 정책 방향 제시)

  • Han, Dong-Wook;Kang, Min-Chae
    • Journal of Digital Convergence
    • /
    • v.10 no.11
    • /
    • pp.681-689
    • /
    • 2012
  • This study shows that the policy directions to invigorate smart education for special education based on the view of special education teachers through AHP methodology. The result shows that development of smart contents, supporting for teaching and learning, smart education networking, establishment of legal foundation and supporting for infrastructure are relatively important policy ordered by weights. The analysis indicates that the contents development policy should be strategic direction for smart education in special education.

The Study of Learning Memory followed with the type of Indirect Advertising Product Placement (간접광고인 제품배치의 유형에 따른 학습기억에 관한 연구 - 명시적 기억과 암묵적 기억을 중심으로 -)

  • Jeong, Jun-Hwa
    • 한국디지털정책학회:학술대회논문집
    • /
    • 2005.06a
    • /
    • pp.89-98
    • /
    • 2005
  • 간접광고의 한형태인 영화나 드라마 속에 제품배치(PPL)는 온셋 배치와 크리에이티브 배치로 분류할 수 있다. 온셋 배치(on-set placement)는 맥락효과 속에 전경(foreground)에 해당되며, 크리에이티브 배치(creative placement)는 배경에 해당되기 때문에 소비자의 정보처리에 의한 기억효과가 다르게 나타난다. 온셋배치의 경우 자극의 현저성으로 인하여 정교화 가능성 모델이론의 설득의 중심경로를 통한 정보처리효과가 나타나기 때문에 명시적 학습을 하게 된다. 반면에 드라마 배경에 해당하는 PPL의 크리에이티브 배치는 정교화의 수단이 낮아서 배경의 여러 단서들과 함께 설득의 주변경로를 통한 정보처리를 할 것이다. 따라서 암묵적 학습을 할 가능성이 높게 나타나게 된다. 이러한 제품배치의 형태에 따른 학습기억의 형태는 조절변수인 관여도에 따라 다르게 나타날 것이다. 제품관여도가 높은 경우에는 크리에이티브 배치를 하여도 명시적 학습을 할 가능성이 많은 반면 제품관여도가 낮은 경우 크리에이티브 배치를 하게 되면, 암묵적 학습효과가 미약하거나 일어나지 않을 가능성이 많다. 그러므로 제품관여도가 낮은 상품의 경우에는 제품배치시 가능한한 크리에이티브 배치피하는 것이 유리 할 것이다.

  • PDF

Continual Multiagent Reinforcement Learning in Dynamic Environments (동적 환경에서의 지속적인 다중 에이전트 강화 학습)

  • Jung, Kyuyeol;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.988-991
    • /
    • 2020
  • 다양한 실세계 응용 분야들에서 공동의 목표를 위해 여러 에이전트들이 상호 유기적으로 협력할 수 있는 행동 정책을 배우는 것은 매우 중요하다. 이러한 다중 에이전트 강화 학습(MARL) 환경에서 기존의 연구들은 대부분 중앙-집중형 훈련과 분산형 실행(CTDE) 방식을 사실상 표준 프레임워크로 채택해왔다. 하지만 이러한 다중 에이전트 강화 학습 방식은 훈련 시간 동안에는 경험하지 못한 새로운 환경 변화가 실전 상황에서 끊임없이 발생할 수 있는 동적 환경에서는 효과적으로 대처하기 어렵다. 이러한 동적 환경에 효과적으로 대응하기 위해, 본 논문에서는 새로운 다중 에이전트 강화 학습 체계인 C-COMA를 제안한다. C-COMA는 에이전트들의 훈련 시간과 실행 시간을 따로 나누지 않고, 처음부터 실전 상황을 가정하고 지속적으로 에이전트들의 협력적 행동 정책을 학습해나가는 지속 학습 모델이다. 본 논문에서는 대표적인 실시간 전략게임인 StarcraftII를 토대로 동적 미니게임을 구현하고 이 환경을 이용한 다양한 실험들을 수행함으로써, 제안 모델인 C-COMA의 효과와 우수성을 입증한다.

Community Business and Collective Learning (커뮤니티 비즈니스와 집합적 학습 -조력 집단에 대한 성찰-)

  • Kim, Jeong Seop
    • Journal of Agricultural Extension & Community Development
    • /
    • v.20 no.3
    • /
    • pp.603-642
    • /
    • 2013
  • Community Business is defined as profit-making enterprise for which a community residents can take to solve their own problems. It is comprised of some sequential activities: identifying problems, collective learning, organization. In rural South Korea, the central and local governments are promoting Community Businesses. However, the related policy programs are missing the very important perspective that self-help approach be essential in Community Business. Therefore, the policy programs should be changed so that they could effectively help community's autonomous practice.

사이버가정학습시대도래

  • So, In-Hwan
    • Digital Contents
    • /
    • no.8 s.147
    • /
    • pp.50-52
    • /
    • 2005
  • 공교육에 본격적으로 e러닝이 접목되는 사이버가정학습 서비스가 4월을 기점으로 전국 16개 시도에서 대대적으로 시작됐다. 이는 선진국에서도 유래를 찾아볼 수 없는 국가단위의 교육정책에 e러닝이 접목된 세계최초의 시도이다. 사이버가정학습의 현황, 준비과정, 성공요인을 분석한다.

  • PDF

Suggestion of Learning Objectives in Social Dental Hygiene: Oral Health Administration Area (사회치위생학의 학습목표 제안: 구강보건행정 영역)

  • Park, Su-Kyung;Lee, Ga-Yeong;Jang, Young-Eun;Yoo, Sang-Hee;Kim, Yeun-Ju;Lee, Sue-Hyang;Kim, Han-Nah;Jo, Hye-Won;Kim, Myoung-Hee;Kim, Hee-Kyoung;Ryu, Da-Young;Kim, Min-Ji;Shin, Sun-Jung;Kim, Nam-Hee;Yoon, Mi-Sook
    • Journal of dental hygiene science
    • /
    • v.18 no.2
    • /
    • pp.85-96
    • /
    • 2018
  • The purpose of this study is to propose learning objectives in social dental hygiene by analyzing and reviewing learning objectives in oral health administration area of the existing public oral health. This study is a cross-sectional study. The subjects of the study selected with convenience extraction were 15 members of the social dental hygiene subcommittee of the Korean Society of Dental Hygiene Science. Data collection was conducted by self-filling questionnaire. The research tool is from 48 items of A division in the book of learning objectives in the dental hygienist national examination, and this study classified each of them into 'dental hygiene job relevance', 'dental hygiene competency relevance', 'timeliness', and 'value discrimination of educational goal setting' to comprise 192 items. Also, to collect expert opinions, this study conducted Delphi survey on 7 academic experts. Statistical analysis was performed using the IBM SPSS Statistics ver. 23.0 program (IBM Co., Armonk, NY, USA). Recoding was performed according to the degree of relevance of each learning objective and frequency analysis was performed. This study removed 18 items from the whole learning objectives in the dental hygienist national examination in the oral health administration area of public oral health. Fifteen revisions were made and 15 existing learning objectives were maintained. Forty-five learning objectives were proposed as new social dental hygiene learning objectives. The topics of learning objectives are divided into social security and medical assistance, oral health care system, oral health administration, and oral health policy. As a result of this study, it was necessary to construct the learning objectives of social dental hygiene in response to changing situation at the time. The contents of education should be revised in order of revision of learning objectives, development of competency, development of learning materials, and national examination.

A Dynamic Asset Allocation Method based on Reinforcement learning Exploiting Local Traders (지역 투자 정책을 이용한 강화학습 기반 동적 자산 할당 기법)

  • O Jangmin;Lee Jongwoo;Zhang Byoung-Tak
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.8
    • /
    • pp.693-703
    • /
    • 2005
  • Given the local traders with pattern-based multi-predictors of stock prices, we study a method of dynamic asset allocation to maximize the trading performance. To optimize the proportion of asset allocated to each recommendation of the predictors, we design an asset allocation strategy called meta policy in the reinforcement teaming framework. We utilize both the information of each predictor's recommendations and the ratio of the stock fund over the total asset to efficiently describe the state space. The experimental results on Korean stock market show that the trading system with the proposed meta policy outperforms other systems with fixed asset allocation methods. This means that reinforcement learning can bring synergy effects to the decision making problem through exploiting supervised-learned predictors.