• 제목/요약/키워드: Q러닝

검색결과 60건 처리시간 0.025초

미니맥스 알고리즘을 이용한 학습속도 개선을 위한 Q러닝 (Q-learning to improve learning speed using Minimax algorithm)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제18권4호
    • /
    • pp.99-106
    • /
    • 2018
  • 보드게임에서는 많은 경우의 수의 말들과 많은 상태공간들을 가지고 있다. 그러므로 게임은 학습을 오래 하여야 한다. 본 논문에서는 Q러닝 알고리즘을 이용했다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습을 하는 동안에 같은 최선의 값이 있을 때, 게임트리를 고려한 문제영역의 지식을 활용한 휴리스틱을 사용하여 학습의 속도향상을 시도하였다. 기존 구현된 말과 개선하여 구현된 말을 비교하기 위하여 보드게임을 제작했다. 그래서 일방적으로 공격하는 말과 승부를 겨루게 하였다. 개선된 말은 게임트리를 고려하여 상대방 말을 공격하였다. 실험결과 개선하여 구현된 말이 학습속도적인 면에서 향상됨 것을 알 수 있었다.

큐러닝(Q-learning)을 이용한 다중 대기열 패킷 스케쥴링 (Multiple Queue Packet Scheduling using Q-learning)

  • 정현석;이태호;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.205-206
    • /
    • 2018
  • 본 논문에서는 IoT 환경의 무선 센서 네트워크 시스템 상의 효율적인 패킷 전달을 위해 큐러닝(Q-learning)에 기반한 다중 대기열 동적 스케쥴링 기법을 제안한다. 이 정책은 다중 대기열(Multiple queue)의 각 큐가 요구하는 딜레이 조건에 맞춰 최대한 패킷 처리를 미룸으로써 효율적으로 CPU자원을 분배한다. 또한 각 노드들의 상태를 큐러닝(Q-learning)을 통해 지속적으로 상태를 파악하여 기아상태(Starvation)를 방지한다. 제안하는 기법은 무선 센서 네트워크 상의 가변적이고 예측 불가능한 환경에 대한 사전지식이 없이도 요구하는 서비스의 질(Quality of service)를 만족할 수 있도록 한다. 본 논문에서는 모의실험을 통해 기존의 학습 기반 패킷 스케쥴링 알고리즘과 비교하여 제안하는 스케쥴링 기법이 복잡한 요구조건에 따라 유연하고 공정한 서비스를 제공함에 있어 우수함을 증명하였다.

  • PDF

휴리스틱 전략을 이용한 Q러닝의 학습 간단화 (Simple Q-learning using heuristic strategies)

  • 박종철;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.708-710
    • /
    • 2018
  • 강화학습은 게임의 인공지능을 대체할 수 있는 수단이지만 불완전한 게임에서 학습하기 힘들다. 학습하기 복잡한 불완전안 카드게임에서 휴리스틱한 전략을 만들고 비슷한 상태끼리 묶으면서 학습의 복잡성을 낮추었다. 인공신경망 없이 Q-러닝만으로 게임을 5만판을 통해서 상태에 따른 전략을 학습하였다. 그 결과 동일한 전략만을 사용하는 대결보다 승률이 높게 나왔고, 다양한 상태에서 다른 전략을 선택하는 것을 관찰하였다.

'선형대수학' 플립드러닝(Flipped Learning) 강의 모델 설계 및 적용 (Flipped Learning teaching model design and application for the University's "Linear Algebra")

  • 박경은;이상구
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제30권1호
    • /
    • pp.1-22
    • /
    • 2016
  • 본 연구에서는 문헌 및 사례 분석을 통해 효과적인 플립드러닝 강의 모델을 모색해 보고, 그간 대학에서의 '선형대수학' 강좌를 위하여 시도한 다양한 플립드러닝 강의 경험을 정리하여 '선형대수학' 강의 모델을 개발하고 실제 강의 현장에 적용해 플립드러닝의 효과를 연구자의 입장에서 뿐만 아니라 학습자의 관점에서도 그 과정과 결과를 분석하며 검증하였다. 그 결과, 플립드러닝은 학생들이 미리 온라인 동영상 강의를 듣고 수업에 참여하므로 다양한 학습자 중심의 활동으로 구성이 가능하며, 따라서 수학적 지식 습득에 성취감을 고취시킬 뿐 아니라 학생들의 참여도와 자신감 그리고 도전의욕 증가에 유의미한 영향을 준 것을 충분한 데이터와 설문조사를 최신 통계기법을 활용하여 분석함으로 확인하였다.

이러닝 만족도 영향요인으로서의 상호작용과 몰입 (Interaction and Flow as the Antecedents of e-Learner Satisfaction)

  • 문철우;김재현
    • 컴퓨터교육학회논문지
    • /
    • 제14권3호
    • /
    • pp.63-72
    • /
    • 2011
  • 사이버 공간에서 학업을 병행하는 직장인 학생에게 강의만족은 매우 역동적이고 다차원적인 과정으로 개개인의 학업 니즈와 능력을 반영된 결과이기도 하다. 본 연구는 사이버 경영대학원에 재학 중인 직장인 학생을 대상으로 교수 학생 간 상호작용, 학생 상호간 상호작용, 몰입, 콘텐츠의 질과 구조화, 실시간 Q&A와 사이버 강의를 보완하는 수단으로서의 오프라인 보충강의 등이 만족도에 미칠 직 간접적 영향 정도를 분석하는 데 목적이 있다. 인과관계 검증에 집중하기 보다는 수강생 입장에서 흥미롭다고 인지된 과목과 어렵다고 판단된 과목을 중심으로 인과관계의 강약 정도를 그룹 별로 비교하였다. 분석결과, 어렵다고 인지된 과목을 중심으로 답한 그룹의 경우 교수 학생 간 상호작용에서 만족도, 콘텐츠품질에서 몰입, Q&A에서 교수 학생 간 상호작용 그리고 Q&A에서 학생 간 상호작용으로 이어지는 경로계수값이 흥미롭다고 인지된 과목을 택한 그룹의 경우보다 더 높은 것으로 나타났다. 반대로 학생 간 상호작용에서 만족도와 콘텐츠 구조에서 몰입으로 이어지는 경로계수값은 흥미롭다고 인지된 과목을 택한 그룹이 더 높은 것으로 나타났다. 이를 토대로 이러닝 설계상의 시사점도 간략히 제시하였다.

  • PDF

애드혹 센서 네트워크 수명 연장을 위한 Q-러닝 기반 에너지 균등 소비 라우팅 프로토콜 기법 (Equal Energy Consumption Routing Protocol Algorithm Based on Q-Learning for Extending the Lifespan of Ad-Hoc Sensor Network)

  • 김기상;김승욱
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.269-276
    • /
    • 2021
  • 최근 스마트 센서는 다양한 환경에서 사용되고 있으며, 애드혹 센서 네트워크 (ASN) 구현에 대한 연구가 활발하게 진행되고 있다. 그러나 기존 센서 네트워크 라우팅 알고리즘은 특정 제어 문제에 초점을 맞추며 ASN 작업에 직접 적용할 수 없는 문제점이 있다. 본 논문에서는 Q-learning 기술을 이용한 새로운 라우팅 프로토콜을 제안하는데, 제안된 접근 방식의 주요 과제는 균형 잡힌 시스템 성능을 확보하면서 효율적인 에너지 할당을 통해 ASN의 수명을 연장하는 것이다. 제안된 방법의 특징은 다양한 환경적 요인을 고려하여 Q-learning 효과를 높이며, 특히 각 노드는 인접 노드의 Q 값을 자체 Q 테이블에 저장하여 데이터 전송이 실행될 때마다 Q 값이 업데이트되고 누적되어 최적의 라우팅 경로를 선택하는 것이다. 시뮬레이션 결과 제안된 방법이 에너지 효율적인 라우팅 경로를 선택할 수 있으며 기존 ASN 라우팅 프로토콜에 비해 우수한 네트워크 성능을 얻을 수 있음을 확인하였다.

무선 단말기 Fingerprint 식별을 위한 딥러닝 구조 개발 (Development of Deep Learning Model for Fingerprint Identification at Digital Mobile Radio)

  • 정영규;신학철;나선필
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.7-13
    • /
    • 2022
  • RF-Fingerprint 기술은 전송된 파형에서 송신기의 하드웨어 고유 특성을 추출하는 기술로써, 디바이스 보안 분야에 매우 유용한 기술 중의 하나이다. 본 논문은 무선 단말기의 In-phase(I)와 Quadrature(Q) 값을 입력으로 동종 무선 단말기 및 이기종 무선 단말기를 식별할 수 있는 fingerprint 특징을 추출하고 이를 식별할 수 있는 딥러닝 구조를 제안한다. 동종/이기종 무선 단말기를 식별하기 위한 특징으로 I/Q를 극좌표로 변환한 후 크기 값을 시간축으로 배열한 데이터를 무선 단말기의 fingerprinting 특징으로 제안하고 이를 식별하기 위해서 수정된 1차원 ResNet 모델을 제안한다. 실험을 위해서 동일 모델 10대의 두 종류 무선 단말기를 대상으로 제안한 딥러닝 구조의 성능을 분석한다. 제안한 딥러닝 구조 및 fingerprint 특징의 성능 검증을 위해서 4000개의 데이터셋 중에서 20%인 800개 데이터셋을 이용하여 성능 분석한 결과 약 99.5%의 식별 성능을 보였다.

Q-러닝 기반의 선박의 최적 경로 생성 (Generation of Ship's Optimal Route based on Q-Learning)

  • 이형탁;김민규;양현
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 춘계학술대회
    • /
    • pp.160-161
    • /
    • 2023
  • 현재 선박의 항해계획은 항해사의 지식과 경험적인 방법에 의존하고 있다. 그러나 최근에는 선박 자율운항기술이 발전됨에 따라, 항해계획의 자동화 기술도 여러 가지 방법으로 연구되고 있다. 본 연구에서는 강화학습 기법 중 하나인 Q-러닝을 기반으로 선박 최적 항해 경로를 생성하고자 한다. 강화학습은 다양한 상황에 대한 경험을 학습하고, 이를 기반으로 최적의 결정을 내리는 방식으로 적용된다.

  • PDF

유튜브를 활용한 기초조리실습과목의 플립드러닝 적용사례 연구 (A Case Study of Flipped Learning application of Basics Cooking Practice Subject using YouTube)

  • 신승훈;이경수
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.488-498
    • /
    • 2021
  • 본 연구는 유튜브를 활용한 기초조리실습교과목에 플립드러닝 교수학습방법을 적용하여 학습 전과 후에 따른 효과를 파악하고 학습과정을 통해 학습자의 주관적인 인식을 분석하여 교육과정이 적절히 진행되고 있는지에 대해 연구하고자 한다. 조사기간은 2020년 08월 01일부터 09월 10일까지 진행되었으며, Q방법론의 연구 설계에 따라 Q표본 선정, P표본 선정, Q소팅, 코딩과 리쿠르팅, 결론 및 논의로 총 5단계로 구분하여 진행하였다. 분석결과 제 1유형(N=5) : 선행학습 효과(Prior Learning effect), 제 2유형(N=7) : 시뮬레이션실습효과(Simulation practice effect), 제 3유형(N=3) : 자기효능감 효과 (self-efficacy effect)로 각각 고유의 특징을 가진 유형으로 분석되었다. 결과적으로 유튜브를 활용한 기초조리실습과목의 플립드러닝 교수학습방법을 적용함으로서 적극적인 학습자들에게는 수업의 흥미유발, 자신감 상승 등의 긍정적인 효과가 나타났으나 일부 학습자의 경우 수업운영방식의 시스템이해 부족, 타 과목에 비해 실습회수 부족 등은 추후 해결되어야 할 방안으로 사료된다.

Q-learning을 이용한 신뢰성 있는 패킷 스케줄링 (Reliable packet scheduling using Q-learning)

  • 김동현;유승언;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제57차 동계학술대회논문집 26권1호
    • /
    • pp.13-16
    • /
    • 2018
  • 본 논문에서는 무선 센서 네트워크 환경에서 신뢰성 있는 데이터 패킷 전송을 위한 효율적인 스케줄링 기법을 제안한다. 무선 네트워크는 수천 개의 센서노드, 게이트웨이, 그리고 소프트웨어로 구성된다. 큐러닝(Q-learning)을 기반으로 한 스케줄링 기법은 동적인 무선센서 네트워크 환경의 실시간 및 비실시간적인 데이터에 대한 사전 지식을 필요로 하지 않는다. 따라서 최종 결과 값을 도출하기 전에 스케줄링 정책을 구할 수 있다. 제안하는 기법은 데이터 패킷의 종류, 처리시간, 그리고 대기시간을 고려한 기법으로 신뢰성 있는 데이터 패킷의 전송을 보장하고, 전체 데이터 패킷에 공정성을 부여한다. 본 논문에서는 시뮬레이션을 통해 기존의 FIFO 알고리즘과 비교하여 제안하는 스케줄링 기법이 전체 데이터 패킷에 대한 공정성 및 신뢰성 측면에서 우수함을 증명하였다.

  • PDF