• 제목/요약/키워드: Learning space

검색결과 1,498건 처리시간 0.027초

영향력 분포도를 이용한 Q-학습 (Q-learning Using Influence Map)

  • 성연식;조경은
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.649-657
    • /
    • 2006
  • 강화학습이란 환경에 대한 정보가 주어지지 않았을 때 현재의 상태에서 가능한 행동들을 취한 후 얻어지는 보상값이 가장 큰 행동을 최적의 행동 전략으로 학습하는 것이다. 강화학습에서 가장 많이 사용하는 Q-학습은 환경의 특정 상태에서 가능한 행동 중에 하나를 선택해서 취한 행동으로 얻어지는 보상값으로 구성되는데 실세계 상태를 이산값으로 표현하기에는 많은 어려움이 있다. 상태를 많이 정의하면 그만큼 학습에 필요한 시간이 많아지게 되고 반대로 상태 공간을 줄이면 다양한 환경상태를 한 개의 환경상태로 인지를 하고 그 환경에 맞는 한 가지의 행동만 취하도록 학습하기 때문에 행동이 단순해진다. 본 논문에서는 학습 시간을 단축하기 위해 상태 공간을 줄이는 데서 발생하는 행동의 단순화의 단점을 보완하기 위한 방법으로 영향력 분포도를 이용한 Q-학습 방법을 제안한다. 즉, 영향력 분포도와 인접한 학습 결과를 이용해서 학습하지 못한 중간 상태에 적합한 행동을 취하게 하여 동일한 상태 개수에 대해서 학습 시간을 단축하는 것이다. 동일한 학습 시간 동안에 일반적인 강화학습 방법으로 학습한 에이전트와 영향력 분포도와 강화학습을 이용해서 학습한 에이전트의 성능을 비교해 보았을 때 영향력 분포도와 강화학습을 이용해서 학습한 에이전트가 단지 일반적인 강화학습에 필요한 상태공간의 4.6%만 정의를 하고도 성능 면에서는 거의 비슷한 효과를 볼 수가 있음을 확인하였다. 이는 영향력 분포도와 강화학습을 이용한 학습이 일반적인 강화학습에 비해서 학습 속도가 2.77배정도 빨리 이루어지고 실제 학습해야 할 상태 공간의 개수가 적어져서 발생되는 문제를 영향력 분포도를 이용해서 보완을 하기 때문이다.

  • PDF

지능형 로보트 시스템을 위한 영역기반 Q-learning (Region-based Q-learning for intelligent robot systems)

  • 김재현;서일홍
    • 제어로봇시스템학회논문지
    • /
    • 제3권4호
    • /
    • pp.350-356
    • /
    • 1997
  • It is desirable for autonomous robot systems to possess the ability to behave in a smooth and continuous fashion when interacting with an unknown environment. Although Q-learning requires a lot of memory and time to optimize a series of actions in a continuous state space, it may not be easy to apply the method to such a real environment. In this paper, for continuous state space applications, to solve problem and a triangular type Q-value model\ulcorner This sounds very ackward. What is it you want to solve about the Q-value model. Our learning method can estimate a current Q-value by its relationship with the neighboring states and has the ability to learn its actions similar to that of Q-learning. Thus, our method can enable robots to move smoothly in a real environment. To show the validity of our method, navigation comparison with Q-learning are given and visual tracking simulation results involving an 2-DOF SCARA robot are also presented.

  • PDF

생물다양성 학습을 위한 생물다양성 DB 활용에 관한 연구 (A Study on Using of Biodiversity Database for Learning of Biodiversity)

  • 안부영;조희형;박재홍
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.428-432
    • /
    • 2005
  • 본 논문에서는 국내에 산재한 생물다양성정보를 학습에 활용하기 위하여 KISTI에서 구축한 생물다양성 DB 현황과 e-Learning의 기술요소 등을 조사하였으며, 기존에 구축된 생물다양성정보 DB를 활용하여 일반인과 학생들을 위한 생물다양성 학습 콘텐트를 기획하고 설계하였다. 본 설계를 바탕으로 생물다양성 콘텐트를 개발한다면, 국토가 좁고, 네트워크 인프라가 잘 갖추어져 있는 우리나라의 실정에 맞는 사이버공간상의 학습의 장으로서 일반인과 학생들에게 양질의 생물다양성 학습 콘텐트를 제공할 수 있으리라 기대한다.

  • PDF

RECURRENT NEURAL NETWORKS -What Do They Learn and How\ulcorner-

  • Uchikawa, Yoshiki;Takase, Haruhiko;Watanabe, Tatsumi;Gouhara, Kazutoshi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1993년도 Fifth International Fuzzy Systems Association World Congress 93
    • /
    • pp.1005-1008
    • /
    • 1993
  • Supervised learnmg 01 recurrent neural networks (RNNs) is discussed. First, we review the present state of art, featuring their major properties in contrast of those of the multilayer neural networks. Then, we concisely describe one of the most practical learning algorithms, i.e. backpropagation through time. Revising the basic formulation of the learning algorithms, we derive a general formula to solve for the exact solution(s) of the whole connection weights w of RNNs. On this basis we introduce a novel interpretation of the supervised learning. Namely, we define a multidimensional Euclidean space, by assigning the cost function E(w) and every component of w to each coordinate axis. Since E=E(w) turns up as a hyper surface in this space, we refer to the surface as learning surface. We see that topological features of the learning surface are valleys and hills. Finally, after explicating that the numerical procedures of learning are equivalent to descending slopes of the learning surface along the steepest gradient, we show that a minimal value of E(w) is the intersection of curved valleys.

  • PDF

A Study on the Utilization of Virtual Educational Training Contents

  • Jihan Kim;Jeanhun Chung
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권3호
    • /
    • pp.158-163
    • /
    • 2024
  • Virtual world technology is driving major advances in education, entertainment, and professional training. Metaverse and extended reality (XR) technologies maximize immersion to enhance learning, provide global learning environments, and expose students to situations that are difficult to experience in real life. Career exploration is an important developmental task in adolescence, and virtual training maximizes learning by providing life-like experiences with imagery training. Virtual training overcomes spatial, financial, performance, and situational constraints and is effective in a variety of fields, including military and disaster training. It provides customized learning for various users such as youth, job seekers, and people with disabilities, deepening their understanding of professional activities and improving their problem-solving skills. It also improves the quality of learning through repetitive learning and contributes to the improvement of teamwork and communication skills, and helps to solve financial problems by using unlimited internal resources and space in virtual space, and enables people with disabilities to perform in various professions. This paper investigated the value of virtual training as a comprehensive educational tool through an economical and efficient learning experience.

현대 일본 중학교 건축의 계획특성에 관한 연구 (A Study on the Planning Characteristics of Contemporary Japanese Middle School Architecture)

  • 이정우
    • 한국산학기술학회논문지
    • /
    • 제17권3호
    • /
    • pp.668-676
    • /
    • 2016
  • 본 연구는 국내 중학교 건축 계획 시 참조점을 구하기 위해 관련 연구가 부족했던 일본의 중학교 건축을 대상으로 그 계획특성을 살펴보았다. 이를 위해 1990년대 이후 준공된 14개 학교들을 선별해 이들을 대상으로 교육 및 생활공간, 기타 주요 공간 등의 영역별 계획특성을 분석하였다. 분석대상 학교들의 계획특성을 정리하면 다음과 같다. 1) 분석대상 학교들은 학교 운영방식에 따라 교과교실형 학교와 특별교실형 학교로 크게 구분할 수 있는데 이에 따라 가장 기본적인 공간이 되는 교육 및 생활공간의 계획특성에서 차이가 나타난다. 2) 교과교실형 학교는 교과교실, 홈베이스, 미디어 스페이스, 교사공간 등의 요소로 교육 및 생활공간이 구성되며 홈베이스와 교과교실과의 인접여부에 따라 교실 부속형과 독립형의 두 가지 유형으로 크게 구분된다. 3) 특별교실형 학교는 학급교실과 다목적 공간으로 교육 및 생활공간이 구성되는데, 다목적 공간과 학급교실이 직접 연결되어 있는 유형과 분리되어 있는 두 가지 유형으로 구분된다. 4) 특별교실은 지역개방과 과목별 특성을 강조할 수 있는 계획특성이 나타나며 부속 공간들의 연계로 공간의 분화특성이 나타난다. 5) 도서실은 개별실이 아닌 컴퓨터실, 시청각실, 다목적 홀 등과 연계된 복합구성으로 계획되며 벽으로 구획하지 않고 개방적으로 구성하는 경향이 강하다. 6) 체육시설로는 옥내 체육관이 기본적으로 설치되며 이와 함께 무도장, 옥외 수영장 등의 설치 빈도가 높다. 이들은 체육수업뿐만 아니라 방과 후 활동을 지원하기 위해 설치된 측면도 크다. 7) 테라스, 발코니, 외부계단 등의 적극적인 계획을 통해 외부공간을 입체적으로 확보하고 있으며 이들이 다양한 기능을 가지도록 계획하고 있다.

자질집합선택 기반의 기계학습을 통한 한국어 기본구 인식의 성능향상 (Improving the Performance of Korean Text Chunking by Machine learning Approaches based on Feature Set Selection)

  • 황영숙;정후중;박소영;곽용재;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.654-668
    • /
    • 2002
  • In this paper, we present an empirical study for improving the Korean text chunking based on machine learning and feature set selection approaches. We focus on two issues: the problem of selecting feature set for Korean chunking, and the problem of alleviating the data sparseness. To select a proper feature set, we use a heuristic method of searching through the space of feature sets using the estimated performance from a machine learning algorithm as a measure of "incremental usefulness" of a particular feature set. Besides, for smoothing the data sparseness, we suggest a method of using a general part-of-speech tag set and selective lexical information under the consideration of Korean language characteristics. Experimental results showed that chunk tags and lexical information within a given context window are important features and spacing unit information is less important than others, which are independent on the machine teaming techniques. Furthermore, using the selective lexical information gives not only a smoothing effect but also the reduction of the feature space than using all of lexical information. Korean text chunking based on the memory-based learning and the decision tree learning with the selected feature space showed the performance of precision/recall of 90.99%/92.52%, and 93.39%/93.41% respectively.

함수근사와 규칙추출을 위한 클러스터링을 이용한 강화학습 (Reinforcement Learning with Clustering for Function Approximation and Rule Extraction)

  • 이영아;홍석미;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1054-1061
    • /
    • 2003
  • 강화학습의 대표적인 알고리즘인 Q-Learning은 상태공간의 모든 상태-행동 쌍(state-action pairs)의 평가값이 수렴할 때까지 반복해서 경험하여 최적의 전략(policy)을 얻는다. 상태공간을 구성하는 요소(feature)들이 많거나 요소의 데이타 형태가 연속형(continuous)인 경우, 상태공간은 지수적으로 증가하게 되어, 모든 상태들을 반복해서 경험해야 하고 모든 상태-행동 쌍의 Q값을 저장하는 것은 시간과 메모리에 있어서 어려운 문제이다. 본 논문에서는 온라인으로 학습을 진행하면서 비슷한 상황의 상태들을 클러스터링(clustering)하고 새로운 경험에 적응해서 클러스터(cluster)의 수정(update)을 반복하여, 분류된 최적의 전략(policy)을 얻는 새로운 함수근사(function approximation)방법인 Q-Map을 소개한다. 클러스터링으로 인해 정교한 제어가 필요한 상태(state)는 규칙(rule)으로 추출하여 보완하였다. 미로환경과 마운틴 카 문제를 제안한 Q-Map으로 실험한 결과 분류된 지식을 얻을 수 있었으며 가시화된(explicit) 지식의 형태인 규칙(rule)으로도 쉽게 변환할 수 있었다.

아동 교육 공간의 바이오필릭 디자인 패턴 적용 분석 (A Study on the Application of Biophilic Design Pattern in Educational space)

  • 최주영;박성준
    • 교육시설 논문지
    • /
    • 제27권3호
    • /
    • pp.3-14
    • /
    • 2020
  • The purpose of this study is to discuss the planning direction of educational spaces to support children's healthy and creative learning based on bio_philic theory. This study analyzed the characteristics of the application of biophilic patterns in children's education space through case analysis. The conclusion of this study is summarized as follows. As a result of the analysis of children's classroom space, the pattern of 'A(Visual connection with nature), F(Dynamic & Diffuse Light), K(Prospect)' shows high application rate, but the pattern of 'C(Non-Rhythmic Sensory Stimuli), G(Connection with Natural Systems), I(Material Connection with Nature)' shows low application rate. In particular, there is a lack of connection with patterns such as hearing, smell, touch, taste stimulation and water experience, and curiosity through exploration of nature about 'B(Non-visual connection with nature), E(Presence of Water), N(Risk/Peril)' changes in nature and ecosystem. In the corridor and rest space, the pattern of 'A(Visual connection with nature), D(Thermal & Airflow Variability), F(Dynamic & Diffuse Light), G(Connection with Natural Systems), K(Prospect)' shows high application rate, but 'B(Non-visual connection with nature)' shows low application rate. In addition, the application of patterns related to the stimulation of curiosity through direct exploration of nature and the exploration of the patterns of 'E(Presence of Water), N(Risk/Peril)' is insufficient. Therefore, in the case of classroom spaces, the active use of nature as it is should be considered within the scope that does not cause visual confusion, and it should provide an area that can be experienced through the five senses. And corridors and rest spaces should be designed to introduce more active natural elements as spaces to recover stress caused by learning. In other words, the characteristics of children's education facilities need to be connected between classroom space, corridor, rest space and external space. This study is meaningful in that it analyzes and derives the application characteristics of 'biophilic design' which affects the 'Attention Restoration' of children's educational spaces through foreign cases.

Enhanced Machine Learning Algorithms: Deep Learning, Reinforcement Learning, and Q-Learning

  • Park, Ji Su;Park, Jong Hyuk
    • Journal of Information Processing Systems
    • /
    • 제16권5호
    • /
    • pp.1001-1007
    • /
    • 2020
  • In recent years, machine learning algorithms are continuously being used and expanded in various fields, such as facial recognition, signal processing, personal authentication, and stock prediction. In particular, various algorithms, such as deep learning, reinforcement learning, and Q-learning, are continuously being improved. Among these algorithms, the expansion of deep learning is rapidly changing. Nevertheless, machine learning algorithms have not yet been applied in several fields, such as personal authentication technology. This technology is an essential tool in the digital information era, walking recognition technology as promising biometrics, and technology for solving state-space problems. Therefore, algorithm technologies of deep learning, reinforcement learning, and Q-learning, which are typical machine learning algorithms in various fields, such as agricultural technology, personal authentication, wireless network, game, biometric recognition, and image recognition, are being improved and expanded in this paper.