• Title/Summary/Keyword: 학습 정책

Search Result 1,336, Processing Time 0.028 seconds

Robot Locomotion via RLS-based Actor-Critic Learning (RLS 기반 Actor-Critic 학습을 이용한 로봇이동)

  • Kim, Jong-Ho;Kang, Dae-Sung;Park, Joo-Young
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.7
    • /
    • pp.893-898
    • /
    • 2005
  • Due to the merits that only a small amount of computation is needed for solutions and stochastic policies can be handled explicitly, the actor-critic algorithm, which is a class of reinforcement learning methods, has recently attracted a lot of interests in the area of artificial intelligence. The actor-critic network composes of tile actor network for selecting control inputs and the critic network for estimating value functions, and in its training stage, the actor and critic networks take the strategy, of changing their parameters adaptively in order to select excellent control inputs and yield accurate approximation for value functions as fast as possible. In this paper, we consider a new actor-critic algorithm employing an RLS(Recursive Least Square) method for critic learning, and policy gradients for actor learning. The applicability of the considered algorithm is illustrated with experiments on the two linked robot arm.

An Empirical Study of Effect of Social Network Service on Individual Learning Performance (SNS(Social Network Service)가 개인의 학습 성과에 미치는 영향에 관한 연구)

  • Choi, Sung-Wook;Park, Seung-Ho;Yim, Myung-Seong
    • Journal of Digital Convergence
    • /
    • v.10 no.6
    • /
    • pp.33-39
    • /
    • 2012
  • The purpose of this study is to investigate the effect of SNS(Social Network Service) on individual learning performance. To do this, we distribute and collect data by using a survey method. Research results suggest that online social networking engagement and acculturation have an effect on interaction quality with professors. Interaction quality with professors influences individual learning performance as well as collaborative learning. The conclusion and implications are discussed.

Integrated Management System on Frequently Flooded Areas (상습침수지구 통합관리 시스템)

  • Ko, Jin-Seok;Jee, Hong-Kee;Lee, Soon-Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.223-227
    • /
    • 2011
  • 유역 특히 상습침수지구의 통합관리는 유역이라는 한정된 범위 내에서 물에 영향을 미치거나 물에 의하여 영향을 받는 모든 인간 활동과 자연현상을 통합적으로 고려하는 것이다. 이러한 관점에서 유역관리는 유역 차원에서 물을 경제적이고 공평하게 관리하고 분배하여 수자원에 대한 장기적이고 지속가능한 해결방안을 마련하는 것이다. 여기에는 정부, 시민사회 및 기업 행위자가 사회경제적 개발목표와 정책형성, 집행계획을 수립하는 것으로부터 시작된다. 유역관리를 위한 의사결정들은 행위자들과의 영향으로 수정되며, 이런 과정에서 토지와 수자원에서 분쟁이 발생하며, 수자원 관리자는 자연현상, 물 사용, 재정적, 인적자원 및 외부적인 요인으로 인해 목적을 달성하는데 부합하지 않을 수도 있다. 효과적인 유역관리를 위해서는 제약조건하에서 수자원 관리자가 의사결정에 정보를 주고 주요 행위자들과 협력을 통해서 이루어 질 수 있다. 본 논문에서는 유역관리를 위한 의사결정을 행위자기반모형(Agent based Model, ABM)으로 이해하고자 하며, ABM은 유역관리의 이해당사자간의 정책과정을 도출하고 다양한 유역관리 대안을 평가하고 유역관리의 영향을 설명하는 모델이다. 본 모형은 관측자료를 통해 상향식 접근법으로 가능한 많은 세부사항을 모의할 수 있다. 분석과정은 자료의 수집, 모델 확립, 모델의 개발, 통계자료 수집 및 모델의 결과와 실제 시스템의 보충된 관측자료를 비교하는 검증 순으로 진행되며, 본 모델에서의 행위자는 과거의 행동으로부터 주위 환경의 반응하는 패턴을 확인하고 개발하며, 이러한 패턴은 정책들을 구별하기 위해서 이용되며, 이러한 과정에서 강화학습이 이루어진다. 이를 통해 행위자의 익숙한 방식의 합리적인 행동과 정책들의 상관관계를 평가할 수 있으며, 강화학습을 통해 실제적인 통계적인 모델이 가능하다.

  • PDF

Estimation of Agent Based Model for watershed management (유역관리를 위한 행위자기반모형의 평가)

  • Ko, Jin-Seok;Jee, Hong-Kee;Lee, Soon-Tak
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.851-854
    • /
    • 2010
  • 유역관리는 유역이라는 한정된 범위 내에서 물에 영향을 미치거나 물에 의하여 영향을 받는 모든 인간 활동과 자연현상을 통합적으로 고려하는 것이다. 이러한 관점에서 유역관리는 유역 차원에서 물을 경제적이고 공평하게 관리하고 분배하여 수자원에 대한 장기적이고 지속가능한 해결 방안을 마련하는 것이다. 여기에는 정부, 시민사회 및 기업 행위자가 사회경제적 개발목표와 정책 형성, 집행계획을 수립하는 것으로부터 시작된다. 유역관리를 위한 의사결정들은 행위자들과의 영향으로 수정되며, 이런 과정에서 토지와 수자원에서 분쟁이 발생하며, 수자원 관리자는 자연현상, 물 사용, 재정적, 인적자원 및 외부적인 요인으로 인해 목적을 달성하는데 부합하지 않을 수도 있다. 효과적인 유역관리를 위해서는 제약조건 하에서 수자원 관리자가 의사결정에 정보를 주고 주요 행위자들과 협력을 통해서 이루어 질 수 있다. 본 논문에서는 유역관리를 위한 의사결정을 행위자기반모형(Agent based Model, ABM)으로 이해하고자 하며, ABM은 유역관리의 이해당사자간의 정책과정을 도출하고 다양한 유역관리 대안을 평가하고 유역관리의 영향을 설명하는 모델이다. 본 모형은 관측자료를 통해 상향식 접근법으로 가능한 많은 세부사항을 모의할 수 있다. 분석과정은 자료의 수집, 모델 확립, 모델의 개발, 통계 자료 수집 및 모델의 결과와 실제 시스템의 보충된 관측자료를 비교하는 검증 순으로 진행되며, 본 모델에서의 행위자는 과거의 행동으로부터 주위 환경의 반응하는 패턴을 확인하고 개발하며, 이러한 패턴은 정책들을 구별하기 위해서 이용되며, 이러한 과정에서 강화학습이 이루어진다. 이를 통해 행위자의 익숙한 방식의 합리적인 행동과 정책들의 상관관계를 평가할 수 있으며, 강화학습을 통해 실제적인 통계적인 모델이 가능할 것이다.

  • PDF

Study of the Priority of Baby Boomer Policy: Emotional Psychology through Analytic Hierarchy (AHP 분석방법을 통한 감성심리 기반의 베이비부머 정책 우선순위 결정)

  • Kang, Ju-Ree;Lee, Chung-Real;Hwang, Du-Kyung
    • Science of Emotion and Sensibility
    • /
    • v.22 no.1
    • /
    • pp.77-88
    • /
    • 2019
  • As the social interest of the Baby Boomer generation is increasing, this study derives implications for lifelong education policy through identification of the need and support for lifelong education among baby boomers lifelong learning, taking into account such aspects of quality of life as emotional psychology-based self-development and self-realization. To optimally explore support for lifelong learning for the baby-boomer generation, first-tier (top-level), sixth-tier (bottom-level), and five-other evaluation criteria were available. For the first layer, we examined whether potentiality or realizability was more desirable, and for the second layer, detailed criteria for realizability were set up, dividing them into financial, legal, and administrative feasibility. A study conducted by experts on the policy priority analysis of Baby Boomers showed that their support for lifelong learning places a greater priority on its feasibility (the more feasible alternative) than desire (the more desirable option). Among the six criteria, lifestyle activities had high priority, and the relative importance of the five assessment alternatives for lifetime learning activities was shown to be higher for employment skills education (0.377), civil participation education (0.181), lifestyle activities (0.200), and 'lifetime activities' (06.11). These results are meaningful: they can help shape and refine the needs of lifelong education, assess their relative importance, and prepare basic data for lifelong learning policies for baby boomers who are about to enter their old age.

Policy Reform of Special Education Technology to Expand the Learning Opportunities of the Disabilities (장애학생의 학습기회 확대를 위한 특수교육정보화 정책 개선 방안)

  • Lee, Kyung-Soon
    • The Journal of Korean Association of Computer Education
    • /
    • v.10 no.1
    • /
    • pp.55-66
    • /
    • 2007
  • To improve access to the learning opportunities of students with disabilities, this study is to identify the potential of the information communication technology in education for the disabilities and to suggest the policy reforms for the special education technology. To answer it, the related literatures of other developed countries and Korea were collected and analyzed by desirability and feasibility as criteria. From the view of the desirability, this study found that the policies of special education in Korea were still regarded as subsidiary and separated from the general students. Moreover, from the view of the feasibility, the law and financial support was relatively insufficient than other countries to implement the policy more effectively and stably. To solve these problems, this study suggests the policy reforms in Korea as five areas and seven tasks.

  • PDF

Multidimensional Effects of Learning Motives and Autonomy on Job Creativity and School Satisfaction of Vocational College Students (직업전문학교 재학생의 학습동기와 학습 자율성이 직무창의성과 만족도에 미치는 복합적 영향)

  • Lee, Chull-Young;Lee, So-Young
    • Journal of Digital Convergence
    • /
    • v.15 no.3
    • /
    • pp.99-106
    • /
    • 2017
  • The purpose of the study is to explore the relationship among learning motive, job creativity, major satisfaction and school satisfaction of enrolled students in 2 vocational schools in Seoul. Hypotheses based on the relevant literature are tested. Job creativity was found to be positively influenced by learning motives and autonomy. Intrinsic learning motive and autonomy affect student's major satisfaction, but extrinsic learning motive was found to have negative effects on major satisfaction as autonomy trait was irrelevant to school satisfaction. Vocational college programs offer mainly technical and on-the-job training unlike general colleges. Thus, students are psychologically sensitive to school programs and multidisciplinary approach is needed.

학습 분석 기술 활용 가능성 및 전망 -유즈케이스와 서비스 모델

  • Jo, Yong-Sang
    • Information and Communications Magazine
    • /
    • v.31 no.12
    • /
    • pp.73-80
    • /
    • 2014
  • 본고에서는 교육 분야에서 다양한 데이터를 수집 및 분석하여 개인화된 학습 서비스를 제공하려는 학습 분석(Learning Analytics) 서비스의 개념과 앞으로 기대되는 유즈케이스를 소개한다. 국제적으로 주목 받고 있는 학습 분석 기술은 현재 개념화 수준에 머물러 있지만, 글로벌 기업들이 주축이 된 민간단체에서는 데이터 수집체계와 같은 구체적인 구현 방법에 대한 논의도 추진되고 있어서 관련 현황에 대한 진단도 해본다. 특히 국제 표준화 기구와 단체를 통해 추진되고 있는 내용을 중심으로 소개한다. 다양한 데이터 응용 기술을 융합해서 기대할 수 있는 학습 분석 서비스 모형을 제시하면서 관련 정책과 제품개발에 기여할 수 있을 것으로 기대한다.

Education On Demand System Based on e-Learning Standards (e-Learning 표준에 기반한 주문형 교육 시스템)

  • Hong, Gun Ho;Song, Ha Yoon
    • The Journal of Korean Association of Computer Education
    • /
    • v.6 no.3
    • /
    • pp.99-108
    • /
    • 2003
  • This paper indicates limitations of the existing VOD(Video on Demand)-based on-line education systems and presents the design and implementation of Education on Demand (EOD) system as an alternative. EOD system is based on meta information expressed in XML and component technology. Overall system consists of authoring tool. contents server, learning policy system and contents viewer. which are utilized throughout the learning contents life-cycle. EOD system enables automated contents management using meta information exchange methodology that is conformant to the SCORM meta data presentation scheme. In addition, integrated management of interaction and feedback information along with the learning policy system provides customized learning guide for each individual learner. With the development of EOD system, this paper discusses about advanced on-line education system which surpasses existing content-providing-only systems.

  • PDF

A Dynamic Channel Assignment Method in Cellular Networks Using Reinforcement learning Method that Combines Supervised Knowledge (감독 지식을 융합하는 강화 학습 기법을 사용하는 셀룰러 네트워크에서 동적 채널 할당 기법)

  • Kim, Sung-Wan;Chang, Hyeong-Soo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.5
    • /
    • pp.502-506
    • /
    • 2008
  • The recently proposed "Potential-based" reinforcement learning (RL) method made it possible to combine multiple learnings and expert advices as supervised knowledge within an RL framework. The effectiveness of the approach has been established by a theoretical convergence guarantee to an optimal policy. In this paper, the potential-based RL method is applied to a dynamic channel assignment (DCA) problem in a cellular networks. It is empirically shown that the potential-based RL assigns channels more efficiently than fixed channel assignment, Maxavail, and Q-learning-based DCA, and it converges to an optimal policy more rapidly than other RL algorithms, SARSA(0) and PRQ-learning.