Search | Korea Science

Hierachical Reinforcement Learning with Exploration Bonus (탐색 강화 계층적 강화 학습)

이승준;장병탁
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10b
- /
- pp.151-153
- /
- 2001
Q-Learning과 같은 기본적인 강화 학습 알고리즘은 문제의 사이즈가 커짐에 따라 성능이 크게 떨어지게 된다. 그 이유들로는 목표와의 거리가 멀어지게 되어 학습이 어려워지는 문제와 비 지향적 탐색을 사용함으로써 효율적인 탐색이 어려운 문제를 들 수 있다. 이들을 해결하기 위해 목표와의 거리를 줄일 수 있는 계층적 강화 학습 모델과 여러 가지 지향적 탐색 모델이 있어 왔다. 본 논문에서는 이들을 결합하여 계층적 강화 학습 모델에 지향적 탐색을 가능하게 하는 탐색 보너스를 도입한 강화 학습 모델을 제시한다.
PDF

A Study on Efficient Machine Learning Method Using Random Search and Genetic Algorithm Search (랜덤 탐색과 유전 알고리즘 탐색을 이용한 효율적 기계학습 방법 연구)

Lee, Kyung-Tae;Kwon, Young-Keun
- Proceedings of the Korea Information Processing Society Conference
- /
- 2020.05a
- /
- pp.494-496
- /
- 2020
기계학습 모델을 이용한 분류 및 회귀 문제해결에는 다양한 전처리 알고리즘 및 기계학습 모델이 활용된다. 하지만 합리적인 성능을 위해서는 주어진 데이터에 따라 적절한 알고리즘 조합에 대한 탐색 및 최적화 과정이 펄수적이다. 본 논문에서는 최적의 알고리즘 조합을 탐색하는 방법 중 랜덤 탐색과 유전 알고리즘 탐색 방법을 구현하고 8가지 데이터에 대한 성능 비교를 통해 여러 기계학습 모델을 고려하는 탐색 방법의 필요성을 보인다.
https://doi.org/10.3745/PKIPS.y2020m05a.494 인용 PDF

Estimation of Distribution Algorithm for Continuous Function Optimization (연속 변수 함수 최적화를 위한 탐색점 분포 학습 알고리즘)

신수용;장병탁
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.51-53
- /
- 2000
기존의 진화 연산의 한계를 극복하기 위해서 탐색점 분포 학습 알고리즘(Estimation of Distribution Algorithm)이 부각되고 있다. 탐색점 분포 학습 알고리즘은 데이터의 분포를 파악하고, 파악된 분포를 이용해서 새로운 학습 데이터를 생성하는 일련의 과정을 통하여 최적화 문제를 해결하는 방법이다. 그런데, 기존의 탐색점 분포 학습 알고리즘들은 대부분 이진 벡터값을 가지는 최적화 문제들만을 대상으로 하고 있다. 본 논문에서는 비감독 확률 신경망 모델인 헬름홀츠 머신을 이용해서 데이터의 분포를 학습하여 연속 함수 최적화 문제를 해결하는 방법을 개발하였다. 테스트 함수들에 대해서 실수 표현형을 사용한 유전자 알고리즘과 결과를 비교하여 제안하는 방법의 우수성을 검증하였다.
PDF

Topic directed Web Spidering using Reinforcement Learning (강화학습을 이용한 주제별 웹 탐색)

Lim, Soo-Yeon
- Journal of the Korean Institute of Intelligent Systems
- /
- v.15 no.4
- /
- pp.395-399
- /
- 2005
In this paper, we presents HIGH-Q learning algorithm with reinforcement learning for more fast and exact topic-directed web spidering. The purpose of reinforcement learning is to maximize rewards from environment, an reinforcement learning agents learn by interacting with external environment through trial and error. We performed experiments that compared the proposed method using reinforcement learning with breath first search method for searching the web pages. In result, reinforcement learning method using future discounted rewards searched a small number of pages to find result pages.
https://doi.org/10.5391/JKIIS.2005.15.4.395 인용 PDF KSCI

Genetic Algorithm based Neural Network and Temporal Difference Learning: Janggi Board Game (유전자기반 신경회로망과 Temporal Difference학습: 장기보드게임)

박인규
- Proceedings of the Korea Multimedia Society Conference
- /
- 2002.05c
- /
- pp.308-314
- /
- 2002
본 논문은 2인용 보드게임의 정보에 대한 전략을 학습할 수 있는 방법을 유전자기반 역전파 신경회로망과 Temporal Difference학습알고리즘을 이용하여 제안하였다. 학습의 과정은 역전파에 의한 초기학습에 이어 국부해의 단점을 극복하기 위하여 미세학습으로 유전자알고리즘을 이용하였다. 시스템의 구성은 탐색을 담당하는 부분과 기물의 수를 발생하는 부분으로 구성되어 있다. 수의 발생부분은 보드의 상태에 따라서 갱신되고, 탐색커널은 αβ탐색을 기본으로 유전자알고리즘을 이용하여 가중치를 최적화하는 유전자기반 역전파 신경회로망과 TD학습을 결합하여 게임에 대해 양호한 평가함수를 학습하였다. 일반적으로 많은 학습을 통하여 평가함수의 정확도가 보장되면 승률이 학습의 양에 비례함을 알 수 있었다.
PDF

Destination Path Search using Reinforcement Learning Technique (강화학습기법을 이용한 목적지 경로 탐색)

Lee, Taekyung;Jeon, Junri
- Proceedings of the Korea Information Processing Society Conference
- /
- 2013.05a
- /
- pp.244-247
- /
- 2013
본 논문에서는 목적지들의 중요도를 이용하여 강화학습에 의한 목적지 경로 탐색을 제안한다. 일반적인 목적지 경로탐색은 목적지의 중요도나 방문빈도를 고려하지 않는 최단경로탐색을 수행한다. 그러므로 방문객들의 요구에는 맞지 않는 경로를 탐색한다. 강화학습의 특징은 관심 대상에 대한 구체적인 지배 규칙의 정보 없이도 최적화된 행동 방식을 학습시킬 수 있는 특징이 있다. 이를 이용하면 주요목적지를 누락시키지 않고 방문객들의 요구에 만족하는 경로를 탐색할 수 있다. 기존에 이용되고 있는 경로탐색 알고리즘과 강화학습기법이 적용된 알고리즘을 서로 분석하여 비교한다.
https://doi.org/10.3745/PKIPS.y2013m05a.244 인용 PDF

The Study on the psychological characteristics of learning types in the e-learning environment (사이버 학습 환경에서의 학습자 유형과 그 특성에 대한 탐색)

Whang, Sang-Min;Kim, Jee-Yeon;Ko, Beom-Seog;Seo, Jeong-Hee
- 한국HCI학회:학술대회논문집
- /
- 2007.02b
- /
- pp.206-212
- /
- 2007
웹을 기반으로 하는 e-러닝에 대한 교육적 수요는 증가하고 있다. 이와 동시에, 학습 공간으로서의 사이버 공간의 활용에 대한 고민도 증가하였다. 전통적인 학습활동을 사이버 공간에 복제하려 했던 고전적 방식이 e-러닝 또는 사이버 학습이 아니라는 사실을 확인하기 시작했기 때문이다. e-러닝의 가치가 강조됨에도 불구하고, 실제 사이버 공간에서 일어나는 학습자의 특성과 학습활동이 구체적으로 어떻게 일어나는 지에 대한 탐색은 미흡하다. 산재한 정보를 스스로 가공한 지식, '학습하는 방법을 학습'하는 것이라는 개념들이 제시됨에도 불구하고, 사이버 공간에 산재한 정보, 학습하는 방법의 학습, 그리고 사이버 공간의 학습특성에 대한 논란은 여전하다. 본 연구에서는 실제 사이버 학습 사이트를 이용하고 있는 학습자들의 행동을 중심으로, 학습자의 특성을 탐색하였다. 사이버 공간에서 보이는 스스로 학습하는 방법이 무엇인지 확인하고 이것이 다양한 학습자 유형으로 구분되는 지를 확인하고자 하였다. 연구대상이 된 사이버 학습 사이트는 서울, 부산, 대구, 광주 교육청에서 운영하는 사이버 가정 학습관이었다. 총 1535명의 사이버 가정 학습관 이용자들의 특성이 분석되었다. 사이버 가정학습관 이용자들의 행동특성은 9개의 요인-놀이 활동, 공동 경험, 현실 정체, 공동 성취, 개인주의, 경쟁 지향, 성취감, 편리성(조작 용이), 생생함-으로 구분되었다. 9개의 활동 요인을 기준으로 하여 확인된 학습자 유형은 4가지로 나타났다. 4가지 학습자 유형은 각각 독야청청형, 동고동락형, 의무방어형, 희희낙낙형으로 명명되었다. 이들 유형은 학습 활동 정도 및 사이트 이용 행동, 학습 스타일(사이버 학습 활동 양식)에서 서로 차이가 있었다. 본 연구는 기존의 이론적인 모델에 기초하여 임의적으로 구분된 사이버 학습자 유형 구분이 아닌, 실제 학습 활동을 탐색하였다는 측면에서 의미가 있다. 특히, 기존의 오프라인 학습 이론 및 학습자 특성 연구를 사이버 학습에 그대로 적용할 것이 아니라 사이버 공간의 특성이 실제 학습 활동에서 어떻게 나타났는지를 밝히려고 했다는데 그 의의가 있다. 향후, 사이버 학습자 유형에 따른, 사이버 학습활동의 촉진방안이나 학습 효과의 차이를 높일 수 있는 구체적인 학습 시스템의 설계 및 운영 모델에 대한 탐색이 필요할 것이다.
PDF

The Effect of 'Learning Strategies and Career Development' Classes for Freshman - Focused on Utilization of the Learning Portfolio - (학습 포트폴리오를 통한 '학습전략과 진로탐색' 교과목의 개선 효과 - A대학교 교양필수과목 사례를 중심으로-)

Han, Ahnna
- Korean Journal of General Education
- /
- v.6 no.1
- /
- pp.241-267
- /
- 2012
The purpose of this study was focused on finding out the effect of "Learning Strategies and Career Development" classes for first year student. To this end, I developed the learning portfolio based instructional method, textbook, learning portfolio, teaching guidebook and teaching materials. For the study, I conducted literature reviews, analysis of domestic and international best practices, expert advices and survey researches. This study implemented on 3,200 freshman and 72 professors of A university that is located at Gyungbuk. The results of applying research findings show that learning portfolio based instruction in "Learning Strategies and Career Development" classes is useful to improve first year students' competency of learning strategies and career search. And instructors can use the learning portfolio, teaching guidebook and teaching materials, therefore they are satisfied with the materials.

Making an Application Profile for Multimedia Instructional Resources (멀티미디어 학습물 탐색을 위한 애플리케이션 프로화일 작성에 관한 연구)

김태문
- Proceedings of the Korean Society for Information Management Conference
- /
- 2002.08a
- /
- pp.185-190
- /
- 2002
웹상의 교육용 학습물에 대한 탐색과 기술을 위한 다수의 표준적 메타데이터들이 개발되어왔다. 그러나 이러한 메타데이터들은 학습물이 지닌 고유한 자료적 특성 및 멀티미디어와 관련한 기술에 있어서 여러 가지 문제들을 지녀왔다. 애플리케이션 프로화일은 기존의 표준적 메타데이터 시스템들이 지닌 경직성에서 벗어나 다양한 응용환경을 지원하기 위한 방편으로 점차 그 이용이 확대되어 가고 있다. 이 연구에서는 교육용 학습물의 기술을 위한 애플리케이션 프로화일 작성을 위하여 웹상에서 이용 가능한 멀티미디어 형식의 학습물에 대한 기술과 탐색에 필수적인 엘리먼트들을 선별하고 이에 상응하는 XML스키마작성를 모색하였다.
PDF

테크놀로지 활용을 통한 수학학습 부진아의 치유 가능성 탐색

Kim, Bu-Yun;Lee, Sun-Ju;Lee, Ji-Seong
- Communications of Mathematical Education
- /
- v.18 no.2 s.19
- /
- pp.411-425
- /
- 2004
본 연구에서는 수학학습 부진아 지도에서 테크놀로지의 활용이 가지는 의미를 분석해 보고, 테크놀로지가 공평성의 원리에 입각하여 구체적 조작물로서 부진아의 수학 학습지도에 어떠한 영향을 미치는가, 부진아의 개별지도에 긍정적인 영향이 있는가, 부진아의 수학에 대한 관심과 흥미의 제고 및 학습 개념과 원리를 이해하는 데에 도움이 되는가에 대하여 살펴봄으로써 수학학습 부진아들에게 테크놀로지의 활용 가능성을 탐색하고자 한다. 또한 선행연구의 분석을 통하여 수학학습 부진아들의 발생요인을 종합하였으며, 선정된 대상의 사전조사에 의거해, 수학학습 부진의 원인을 학습자 요인의 인지적 요인인 학습방법 미숙과 교과 요인 가운데 수업 요인인 직접적 개별학습의 부재에 초점을 맞추었다. 연구반에 대한 총 40시간의 수업 실시 후의 연구결과에 의해 테크놀로지가 수학학습 부진아의 치유에 긍정적인 영향이 있다는 가능성을 탐색하였다.
PDF

Search Result 1,863, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)