• 제목/요약/키워드: Q-Learning

검색결과 432건 처리시간 0.026초

MQTT 기반 IoT 네트워크에서 공유 구독을 위한 비용 관리 최적 전송 방식 (Cost-aware Optimal Transmission Scheme for Shared Subscription in MQTT-based IoT Networks)

  • 이선빈;김영훈;김용은;최재윤;경연웅
    • 사물인터넷융복합논문지
    • /
    • 제10권4호
    • /
    • pp.1-8
    • /
    • 2024
  • 기술이 발전함에 따라 Internet of Things(IoT)기술 또한 빠르게 발전하고 있다. IoT 기술에는 Message Queuing Telemetry Transport(MQTT)를 포함한 다양한 프로토콜이 사용되고 있다. MQTT는 경량 메시지 프로토콜로 제한된 대역폭과 전력을 가진 환경에서도 효율적으로 데이터를 전송할 수 있어 IoT 분야에서 de-facto 표준 프로토콜로 고려되고 있다. 본 논문에서는 MQTT 5.0의 기능인 공유구독에서 메시지 전송 방식을 개선한 방식을 제안하고자 한다. 공유구독에서 메시지 전송 방식 중 대중적으로 사용되는 라운드 로빈 방식은 Client의 현재 상태를 고려하지 않는다는 단점이 있다. 이러한 단점을 보완하기 위해 본 논문에서는 현재 상태를 고려하여 최적의 전송 방식을 선정하는 방법을 제안한다. 이때 Markov decision process(MDP)를 기반으로 모델링을 수행하고, Q-Learning을 이용하여 최적의 전송 방식을 선정하였다. 시뮬레이션 결과를 통해 제안한 방식과 기존에 사용되는 방식들을 비교하여 다양한 환경에서 성능 분석을 진행해 제안한 방식이 기존 방식들보다 더 좋은 성능을 보이는 것을 확인하고, 향후 연구의 방향성을 제시하면서 본 논문을 마무리하고자 한다.

다중 교차로에서 협력적 교통신호제어에 대한 연구 (A Study on Cooperative Traffic Signal Control at multi-intersection)

  • 김대호;정옥란
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1381-1386
    • /
    • 2019
  • 도시의 교통 혼잡 문제가 심각해지면서 지능형 교통신호제어가 활발하게 연구되고 있다. 강화학습은 교통신호제어에 가장 활발하게 사용되고 있는 알고리즘으로 최근에는 심층 강화학습 알고리즘이 관심을 끌고 있다. 또한 심층 강화학습 알고리즘이 다양한 분야에서 높은 성능을 보이면서 심층 강화학습의 확장 버전들이 빠른 속도로 등장했다. 하지만 기존 교통신호제어 연구들은 대부분 단일 교차로 환경에서 진행되었으며, 단일 교차로의 교통 혼잡만 완화하는 방법은 도시 전체의 교통 상황을 고려하지 못한다는 한계가 있다. 본 논문에서는 다중 교차로 환경에서 협력적 교통신호제어를 제안한다. 신호제어 알고리즘에는 심층 강화학습의 확장 버전들이 결합된 알고리즘을 적용했으며 다중 교차로를 효율적으로 제어하기 위해 인접한 교차로의 교통 상황을 고려하였다. 실험에서는 제안하는 알고리즘과 기존 심층 강화학습 알고리즘을 비교하였으며, 더 나아가 협력적 방법이 적용된 모델과 적용되지 않은 모델의 실험 결과를 보여줌으로써 높은 성능을 증명한다.

마이크로그리드에서 강화학습 기반 에너지 사용량 예측 기법 (Prediction Technique of Energy Consumption based on Reinforcement Learning in Microgrids)

  • 선영규;이지영;김수현;김수환;이흥재;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.175-181
    • /
    • 2021
  • 본 논문은 단기 에너지 사용량 예측을 위해 인공지능 기반의 접근법에 대해 분석한다. 본 논문에서는 단기 에너지 사용량 예측 기술에 자주 활용되는 지도학습 알고리즘의 한계를 개선하기 위해 강화학습 알고리즘을 활용한다. 지도학습 알고리즘 기반의 접근법은 충분한 성능을 위해 에너지 사용량 데이터뿐만 아니라 contextual information이 필요하여 높은 복잡성을 가진다. 데이터와 학습모델의 복잡성을 개선하기 위해 다중 에이전트 기반의 심층 강화학습 알고리즘을 제안하여 에너지 사용량 데이터로만 에너지 사용량을 예측한다. 공개된 에너지 사용량 데이터를 통해 시뮬레이션을 진행하여 제안한 에너지 사용량 예측 기법의 성능을 확인한다. 제안한 기법은 이상점의 특징을 가지는 데이터를 제외하고 실제값과 유사한 값을 예측하는 것을 보여준다.

납기 위반 및 셋업 최소화를 위한 강화학습 기반의 설비 일정계획 모델 (Machine Scheduling Models Based on Reinforcement Learning for Minimizing Due Date Violation and Setup Change)

  • 유우식;서주혁;김다희;김관호
    • 한국전자거래학회지
    • /
    • 제24권3호
    • /
    • pp.19-33
    • /
    • 2019
  • 최근 제조업체들은 제품의 생산방식이 고도화 되고, 복잡해지면서 생산 장비를 효율적으로 사용하는데 어려움을 겪고 있다. 제조공정의 효율성을 방해하는 대표적인 요인들로는 작업물 종류 변경(job change)으로 인한 작업 준비 비용(Setup Cost) 등이 있다. 특히 반도체/LCD 공정과 같이 고가의 생산 장비를 사용하는 공정의 경우 장비의 효율적인 사용이 매우 중요한데, 상호 충돌하는 의사결정인 납기 준수를 최대화 하는 것과 작업물 종류 변경으로 인한 작업 준비 비용을 최소화 하는 것 사이에서 균형을 유지하는 것은 매우 어려운 일이다. 본 연구에서는 납기와 작업 준비 비용이 있는 병렬기계에서 강화학습을 활용하여 납기 및 셋업 비용의 최소화 목표를 달성하는 일정계획 모델을 개발하였다. 제안하는 모델은 DQN(Deep Q-Network) 일정계획 모델로 강화학습기반의 모델이다. 제안모델의 효율성을 측정하기 위해 DQN 모델과 기존에 개발하였던 심층 신경망 기반의 일정계획 생성기법과 휴리스틱 원칙의 결과를 비교하였다. 비교 결과 DQN 일정계획 생성기법이 심층신경망 방식과 휴리스틱 원칙에 비하여 납기 및 셋업 비용이 적은 것을 확인할 수 있었다.

밀리미터파 대역 딥러닝 기반 다중빔 전송링크 성능 예측기법 (Deep Learning-Based Prediction of the Quality of Multiple Concurrent Beams in mmWave Band)

  • 최준혁;김문석
    • 인터넷정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.13-20
    • /
    • 2022
  • 차세대 와이파이 표준기술인 IEEE 802.11ay는 밀리미터파 대역에서 AP (Access Point)가 다수의 STA (Station)로 동시에 데이터를 전송하도록 MU-MIMO (Multiple User Multiple Input Multiple Output) 통신을 지원한다. 이를 위해, 주기적으로 MU-MIMO 빔포밍 훈련을 수행해야 하고, 효율적인 빔포밍 훈련을 위해서는 AP가 다수의 안테나로 다수의 빔을 동시에 전송할 때, 각 STA에서 측정되는 신호 세기를 정확히 예측하는 것이 중요하다. 본 논문에서는 딥러닝 기반 다중 빔 전송링크 성능 예측기법을 제안한다. 제안한 예측기법은 특정 실내 또는 실외 환경에서 미리 학습된 딥러닝 모델을 이용하여 다수의 빔이 동시에 전송될 때 STA에서 측정되는 신호 세기 예측의 정확성을 높인다. 이때, 딥러닝의 입력으로 개별 빔이 전송될 때 STA에서 측정되는 신호 세기 정보를 이용하고, 개별 빔의 신호 세기 정보를 얻는 과정은 이미 기존의 빔포밍 훈련에 포함되어 있으므로 정보 수집을 위해 추가적인 비용을 발생하지 않는다. 성능평가를 위해 NIST (National Institute of Standards and Technology)에 의해 개발된 Q-D 채널구현 (Quasi-Deterministic Channel Realization) 오픈소스 소프트웨어를 활용하였고 실측 데이터 기반으로 밀리미터파 채널을 구현하였다. 실험결과에서는 제안한 예측기법이 다른 비교기법보다 향상된 예측성능을 보였다.

일상생활 맥락 정보요구 기반의 이미지 접근점 확장에 관한 연구 (An Approach Toward Image Access Points based on Image Needs in Context of Everyday Life)

  • 정은경;정선영
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.273-294
    • /
    • 2012
  • 세대적 특성과 정보기술의 발달은 이미지의 생산과 이용을 가속화한다. 본 연구는 이미지 이용자의 일상생활 맥락에서 정보요구를 분석하여 이미지 접근점 확장에 관한 논의를 목적으로 하였다. 이를 위하여 소셜 Q&A 서비스인 네이버 지식인에서 이미지를 검색하고자 하는 질문 105건을 추출하였다. 이미지 질문은 이용 목적과 이미지 속성으로 구분한 프레임워크를 이용하여 분석하였다. 분석결과로서 이용 목적은 총 8가지로, 이미지를 데이터로서 이용하고자 하는 목적이 두드러졌으며, 이중에서 '보고그리기'는 기존 연구결과에서 찾아볼 수 없었던 이용 목적으로 새롭게 도출되었다. 이미지 속성에서는 의미, 비시각적, 구성 측면에서 의미와 비시각적 속성이 우세하게 나타났다. 전통적으로 이미지 검색과 접근에서 의미 측면의 속성은 중요하게 인식되어 왔으나, 본 연구의 분석결과에서 보여주는 바와 같이 비시각적 측면 특히, 맥락 요소의 비중은 접근점 제공에 있어서 중요한 시사점으로 볼 수 있다.

'진정한 아름다움'에 대한 주관성 연구 (The Subjectivity Study on the 'Real Beauty')

  • 박희정;김주희;이도희
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.590-597
    • /
    • 2020
  • '아름다움' 즉, '미(美)'에 대한 인간의 열망은 인류의 오랜 역사와 함께한다. 이러한 아름다움에 대하여 오늘날은 과연 어떻게 생각하고 있을지에 대한 의문에서 본 연구는 출발하였다. 연구를 위하여 질적 연구방법인 '주관성 연구'인 'Q방법론'을 활용하여, 오늘날 우리가 일상에서 생각하는 '아름다움', '미'에 대하여 진술문(Q-statements)을 확보하였다. 조사는 2019년 7월 8일부터 7월 31일까지 32명을 대상으로 실시하였고, 조사분석결과 3가지로 유형화하였다. <유형I> 은 '자기계발 노력', '좋은 인간관계', '배우려는 것' 등의 진술문의 표준점수가 높게 나타남으로써, 「자기계발형」으로 명명하였다. <유형II>는 '열정', '젊은 에너지', '건강한 육체' 등의 진술문의 분포가 높게 나타남을 고려하여 「열정형」으로 명명하였다. <유형III>은 '나 다움', '좋은 인간관계', '자기계발 노력' 등의 진술문이 높게 분포하고 있어, 「나 다움형」으로 명명하였다. 더불어 본 연구를 바탕으로, 향후 실증연구로의 확장연구를 기대한다.

TD(${\lambda}$) 기법을 사용한 지역적이며 적응적인 QoS 라우팅 기법 (A Localized Adaptive QoS Routing using TD(${\lambda}$) method)

  • 한정수
    • 한국통신학회논문지
    • /
    • 제30권5B호
    • /
    • pp.304-309
    • /
    • 2005
  • 본 논문에서는 TD(temporal differences) 기법을 사용한 localized QoS 라우팅 기법을 제안하였다. 이 기법은 이웃노드로부터 얻어지는 성공 기댓값을 통해 라우팅 정책을 결정하는 기법이다. 이에 본 논문에서는 라우팅 성공 기댓값을 기반으로 한 다양한 탐색기법으로 경로 선택 시 라우팅 성능을 비교 평가하였으며, 특히 Exploration Bonus를 적용한 탐색 기법이 다른 탐색 기법에 비해 더욱 우수한 성능을 보여주고 있는데, 이는 다른 탐색 기법에 비해 네트워크 상황에 더 적응적으로 경로를 선택할 수 있기 때문이다.

유아기 아동의 신체개념 향상에 관한 연구 (A Study on Improvement of Childhood with the Body Concept)

  • 이효정;송주영
    • The Journal of Korean Physical Therapy
    • /
    • 제14권3호
    • /
    • pp.334-344
    • /
    • 2002
  • This study was to investigate the effects of the sensory-motor training program childhood body concept and to investigate the difference between the control group and experimental group. Subjects of the study were compared with children whose age varied from three to four years old, where I.Q was over 100. The major things of this study was as follows, First, sensory-motor training program was effective with regards to body concept improvement among the three-, four-year-old children. Second, both the experimental group trained by sensory-motor program and the control group trained by cognitive-perceptual training program were revealed a meaningful performance. But, sensory-motor program offering subcognitive sensory body experiences yielded higher mean gains in scores than a cognitive-perceptual program. Sensory-motor learning is more effective than verbal learning is promoting body concept reflected in the ability to draw human figures.

  • PDF

강화학습에 기반한 모델로 게임의 설계 및 구현 (Design and Implementation of Othello game Based on Reinforcement Learning)

  • 이동훈;우종우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.778-780
    • /
    • 2005
  • 최근 인공지능의 기법을 도입한 게임에 관한 연구가 활발히 진행되고 있다. 특히 신경망의 역 전파 알고리즘을 적용한 게임은 구현이 용이하고 학습이 완료되면 비교적 실행이 빨라서 많은 연구가 진행되고 있지만 기본적인 학습시간이 길고 최적화에 관한 문제점이 존재하고 있다. 이러한 문제점을 개선하고자 본 논문에서는 기존의 역 전파 알고리즘과 강화학습의 Q-learning알고리즘을 모델로 게임에 적용하여 비교 분석 하였다. 실험은 단순한 min-max 알고리즘과 각각 대결하여 승수 와 승율을 중심으로 비교하였고 실험의 결과는 강화학습의 알고리즘이 역 전파 알고리즘에 비하여 비교적 우수한 결과를 제시하였다.

  • PDF