• 제목/요약/키워드: Self-Imitation Learning

검색결과 4건 처리시간 0.026초

Self-Imitation Learning을 이용한 개선된 Deep Q-Network 알고리즘 (Improved Deep Q-Network Algorithm Using Self-Imitation Learning)

  • 선우영민;이원창
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.644-649
    • /
    • 2021
  • Self-Imitation Learning은 간단한 비활성 정책 actor-critic 알고리즘으로써 에이전트가 과거의 좋은 경험을 활용하여 최적의 정책을 찾을 수 있도록 해준다. 그리고 actor-critic 구조를 갖는 강화학습 알고리즘에 결합되어 다양한 환경들에서 알고리즘의 상당한 개선을 보여주었다. 하지만 Self-Imitation Learning이 강화학습에 큰 도움을 준다고 하더라도 그 적용 분야는 actor-critic architecture를 가지는 강화학습 알고리즘으로 제한되어 있다. 본 논문에서 Self-Imitation Learning의 알고리즘을 가치 기반 강화학습 알고리즘인 DQN에 적용하는 방법을 제안하고, Self-Imitation Learning이 적용된 DQN 알고리즘의 학습을 다양한 환경에서 진행한다. 아울러 그 결과를 기존의 결과와 비교함으로써 Self-Imitation Leaning이 DQN에도 적용될 수 있으며 DQN의 성능을 개선할 수 있음을 보인다.

SNS상의 범죄행위 설명에 있어 사회학습이론과 보완적 논의의 검증 (An Empirical Test of Social Learning Theory and Complementary Approach in Explanation of University Students' Crimes in Social Network Services)

  • 이성식
    • 정보화정책
    • /
    • 제22권4호
    • /
    • pp.91-104
    • /
    • 2015
  • 이 연구는 SNS상의 범죄행위를 설명하기 위해 기존의 범죄학이론 중 사회학습이론을 중심으로 주 요인인 차별접촉, 정의, 차별강화, 그리고 모방의 영향력을 살펴보았다. 아울러 이 연구에서는 사회학습이론의 보완적 논의로 사회학습요인들이 낮은 자기통제력, 하위문화 환경, 그리고 기회요인들과 함께 작용할때더큰 영향력을 갖게 될 것이라는 점에서 그 상호작용효과를 검증하였다. 서울시 대학생 SNS이용자 486명을 조사한 본 연구에서는 사회학습요인들 중 차별접촉과 차별강화의 영향력은 대체로 유의미하지 않았던 반면 법위반에 호의적 정의와 모방의 경우는 어느 정도 SNS에서의 범죄행위에 유의미한 영향력을 갖는 것을 제시했다. 그리고 상호작용효과의 결과를 보면 어느 정도 본 연구의 가설을 지지하는 것으로 나타났다. 사회학습요인들 중에서 법위반에 대한 정의는 그것을 허용하는 하위문화 환경의 조건에서 범죄에 영향력을 갖는다는 것을 제시했고, 차별강화로서 보상은 기회요인과 함께 상호작용효과를, 그리고 모방은 자기통제력이 낮은 사람에게서 더 영향력을 갖는 것으로 나타났다.

퇴계 『언행록』의 사제관계에서 탐색한 학습법과 그 현대적 이해 (Modern Interpretation of the Method of Learning Reflected in the Teacher-Student Relationship in On Haeng Lok by Toe-gye)

  • 신창호;지준호;이승철;심승우
    • 한국철학논집
    • /
    • 제56호
    • /
    • pp.209-238
    • /
    • 2018
  • 본고는 퇴계의 "언행록"에 나타난 사제관계를 통해 퇴계가 추구했던 교육방법 또는 학습법의 특징을 살펴보고, 그 현대 교육적 의미를 탐색한 것이다. 퇴계는 다양한 저술과 제자 교육을 통해 전통 유학 교육에 충실하게 임했다. 특히, 심득(心得)과 궁행(躬行)으로 제자들을 일깨웠는데, 그것은 전통 유학의 교육방식에 기초하였다. 이런 점에서 퇴계는 유학의 교육관과 교육 방식에 따라 스승으로서의 직분에 성실하려고 노력한 것으로 판단된다. 유학에서 스승은 단순한 지식 전수자이기보다는 인간의 전체적 삶의 문제를 고민한 전인적 교사였다. 때문에 스승은 옛것과 새것의 계승과 창조의 측면을 적절히 조화하려는 온고지신(溫故知新)의 자세와 끊임없이 배우며 가르침에 최선을 다하려는 교육자로서의 태도를 견지했다. 퇴계도 제자마다 개인에 대한 가르침에 성실하게 응대하여 학문의 과정에서 공경과 신뢰를 확보했고, 제자들 또한 그런 학문적 인격에 감화받고 스승의 학맥을 이어나갔다. 그것은 현대적 의미의 교육방법이나 학습법의 측면에서 이해하면 인지학습과 성인학습의 측면에서 대비할 수 있다. 퇴계의 사제관계에 드러난 교육방법이나 학습법은 인지학습의 측면에서는 잠재학습과 통찰학습, 그리고 모방학습과 상통하고, 성인학습의 측면에서는 경험학습과 자기주도학습, 그리고 의사소통학습의 측면으로 이해할 수 있다.

자폐 스펙트럼 장애 학생 대상 증강현실기반 교육 콘텐츠 연구에 대한 고찰 (A Review of Research on Augmented Reality Based Educational Contents for Students with Autism Spectrum Disorders)

  • 손지영
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.35-46
    • /
    • 2017
  • 본 연구는 자폐 스펙트럼 장애 학생을 대상으로 하는 증강현실기반 교육 콘텐츠 연구들을 고찰해 보면서 연구동향과 시사점을 탐색하는 것을 목적으로 하였다. 이를 위해 학술 데이터베이스를 활용하여 2006년에서 2016년까지 발표된 논문들을 수집한 후, 선정기준에 적합한 12편의 국외 연구들을 분석 대상으로 선정하였다. 연구결과, 선행연구들은 초등학생들을 대상으로한 연구가 많았으며, 연구설계는 단일대상연구가 가장 많았다. 연구도구로는 증강현실을 위한 모바일 기기가 다수를 차지하고 있었으며, 측정방법으로는 행동관찰방법을 많이 사용하였다. 증강현실기반 교육콘텐츠 유형은 사물조작형, 자기모델링 관찰조작형, 현장문제해결형, 위치기반 학습안내형으로 구분되었다. 교육적 효과는 사회적 행동, 놀이 및 모방행동, 타인에 대한 감정인식의 향상이 주로 나타났다. 마지막으로, 자폐 스펙트럼 장애 학생을 위한 증강현실기반 교육 콘텐츠 개발과 적용을 위한 고려사항을 도출하여 제시하였다.