• 제목/요약/키워드: Deep Reinforcement Learning

검색결과 210건 처리시간 0.023초

최소가동시간 제약을 고려한 심층 강화학습 기반의 다중 냉동기 운영 모델 (A Multi-chiller Operation Model Based on Deep Reinforcement Learning Considering Minimum Up-time Constraint)

  • 김종은;김관호;김재곤
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.153-168
    • /
    • 2024
  • 여름철 냉동기가 건물의 주 에너지 소비자로 고려됨에 따라 효율적인 냉동기 운영은 매우 중요한 문제로 고려된다. 그러나, 건물의 냉방수요가 건물 내외부 환경, 건물 재실자의 행동 등의 여러 요인에 의해 변동하고 냉동기의 가동제약조건으로 인해 현재 시점의 운영이 미래 시점의 운영에 제약을 발생시킴에 따라 건물의 냉방수요를 정확하게 만족하도록 냉동기를 운영하는 것은 어렵다. 본 연구에서는 이러한 문제를 해결하기 위해 냉동기의 최소가동시간을 고려한 심층 강화학습 기반의 다중 냉동기 운영 모델을 제안한다. 제안한 모델은 외기 정보와 냉방시스템 내부 정보로 구성된 상태에 따른 냉동기 운영 조합이 갖는 가치를 학습하고 실현 가능한 냉동기 운영 중 건물의 냉방수요와 냉동기에 의한 공급 부하 간의 차이를 최소화할 수 있는 냉동기 운영 조합을 결정한다. 냉동기의 최소가동시간 제약을 고려한 훈련 알고리즘을 적용하여 제안한 모델의 현실 적용 가능성을 높였으며 실제 국내 A대학교의 데이터를 바탕으로 실험한 결과, 제안한 다중 냉동기 운영 모델이 최소가동시간을 준수함과 동시에 건물 냉방 부하와의 차이 측면에서 A대학교의 기존 냉동기 운영 로직보다 우수한 성능을 보임을 확인하였다.

차량 환경에서 엣지 커버리지 오버랩을 고려한 강화학습 기반의 엣지 캐싱 (Edge Caching Based on Reinforcement Learning Considering Edge Coverage Overlap in Vehicle Environment)

  • 최윤정;임유진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.110-113
    • /
    • 2022
  • 인터넷을 통해 주위 사물과 연결된 차량은 사용자에게 편리성을 제공하기 위해 다양한 콘텐츠를 요구하는데 클라우드로부터 가져오는 시간이 비교적 오래 걸리기 때문에 차량과 물리적으로 가까운 위치에 캐싱하는 기법들이 등장하고 있다. 본 논문에서는 기반 시설이 밀집하게 설치된 도시 환경에서 maximum distance separable(MDS) 코딩을 사용해 road side unit(RSU)에 캐싱하는 방법에 대해 연구하였다. RSU의 중복된 서비스 커버리지 지역을 고려하여 차량의 콘텐츠 요구에 대한 RSU hit ratio를 높이기 위해 deep Q-learning(DQN)를 사용하였다. 실험 결과 비교 알고리즘보다 hit raito 측면에서 더 높은 성능을 보이는 것을 증명하였다.

심층강화학습에 은닉 상태 정보 활용을 통한 학습 성능 개선에 대한 고찰 (A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning)

  • 최요한;석영준;김주봉;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.528-530
    • /
    • 2022
  • 심층강화학습에 완전 연결 신경망과 합성곱 신경망은 잘 활용되는 것에 반해 순환 신경망은 잘 활용되지 않는다. 이는 강화학습이 마르코프 속성을 전제로 하기 때문이다. 지금까지의 강화학습은 환경이 마르코프 속성을 만족하도록 사전 작업이 필요했다, 본 논문에서는 마르코프 속성을 따르지 않는 환경에서 이러한 사전 작업 없이도 순환 신경망의 은닉 상태를 통해 마르코프 속성을 학습함으로써 학습 성능을 개선할 수 있다는 것을 소개한다.

Markov Chain을 응용한 학습 성과 예측 방법 개선 (Improving learning outcome prediction method by applying Markov Chain)

  • 황철현
    • 문화기술의 융합
    • /
    • 제10권4호
    • /
    • pp.595-600
    • /
    • 2024
  • 학습 성과를 예측하거나 학습 경로를 최적화하는 연구 분야에서 기계학습과 같은 인공지능 기술의 사용이 점차 증가하면서 교육 분야의 인공지능 활용은 점차 많은 진전을 보이고 있다. 이러한 연구는 점차 심층학습과 강화학습과 같은 좀 더 고도화된 인공지능 방법으로 진화하고 있다. 본 연구는 학습자의 과거 학습 성과-이력 데이터를 기반으로 미래의 학습 성과를 예측하는 방법을 개선하는 것이다. 따라서 예측 성능을 높이기 위해 Markov Chain 방법을 응용한 조건부 확률을 제안한다. 이 방법은 기계학습에 의한 분류 예측에 추가하여 학습자가 학습 이력 데이터를 분류 예측에 추가함으로써 분류기의 예측 성능을 향상 시키기 위해 사용된다. 제안 방법의 효과를 확인하기 위해서 실증 데이터인 '교구 기반의 유아 교육 학습 성과 데이터'를 활용하여 기존의 분류 알고리즘과 제안 방법에 의한 분류 성능 지표를 비교하는 실험을 수행하였다. 실험 결과, 분류 알고리즘만 단독 사용한 사례보다 제안 방법에 의한 사례에서 더 높은 성능 지표를 산출한다는 것을 확인할 수 있었다.

Focal loss와 데이터 증강 기법을 이용한 콘크리트 박락 탐지 심층 신경망 알고리즘 (Deep learning algorithm of concrete spalling detection using focal loss and data augmentation)

  • 심승보;최상일;공석민;이성원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권4호
    • /
    • pp.253-263
    • /
    • 2021
  • 콘크리트 구조물은 노후화와 외부 환경에 의한 요인으로 훼손된다. 이 같은 훼손은 가장 먼저 균열로 나타나고 향후에는 박락으로도 진행된다. 이러한 콘크리트 손상은 구조물이 갖는 본래의 설계 지지력을 감소시키는 주된 원인으로 작용할 수 있어 구조물의 안정성에 부정적인 영향을 미친다. 이러한 종류의 손상이 지속되면 안전사고로도 이어질 가능성이 있어 적절한 보수와 보강이 필요하다. 이를 위해서는 구조물에 대한 정확하고 객관적인 상태 점검이 이루어져야 하며 손상 영역을 탐지할 수 있는 센서 기술 또한 필요하다. 따라서 본 논문에서는 박락을 탐지할 수 있는 딥러닝 기반의 영상처리 알고리즘을 제안했다. 연구 과정에서 298장의 박락 영상을 확보하였으며, 이 가운데 253장을 학습용으로 사용했고, 나머지 45장을 테스트용으로 사용하였다. 아울러 본 논문에서는 탐지 성능을 향상하기 위해 향상된 손실함수와 데이트 증강 기법을 적용하였다. 그 결과 콘크리트 박락의 탐지 성능이 80.19%의 평균 중첩 정확도로 나타났다. 본 논문에서는 딥러닝 기반의 영상 처리 기법을 통해 콘크리트 박락을 탐지하는 기술을 개발했고, 향상된 손실 함수와 데이터 증강 기법으로 성능을 향상시키는 방법을 제안했다. 이 같은 기술은 향후 구조물의 정확한 점검과 진단에 활용될 것으로 기대된다.

의료 AI 중추 기술 동향 (Technical Trends of Medical AI Hubs)

  • 최재훈;박수준
    • 전자통신동향분석
    • /
    • 제36권1호
    • /
    • pp.81-88
    • /
    • 2021
  • Post COVID-19, the medical legacy system will be transformed for utilizing medical resources efficiently, minimizing medical service imbalance, activating remote medical care, and strengthening private-public medical cooperation. This can be realized by achieving an entire medical paradigm shift and not simply via the application of advanced technologies such as AI. We propose a medical system configuration named "Medical AI Hub" that can realize the shift of the existing paradigm. The development stage of this configuration is categorized into "AI Cooperation Hospital," "AI Base Hospital," and "AI Hub Hospital." In the "AI Hub Hospital" stage, the medical intelligence in charge of individual patients cooperates and communicates autonomously with various medical intelligences, thereby achieving synchronous evolution. Thus, this medical intelligence supports doctors in optimally treating patients. The core technologies required during configuration development and their current R&D trends are described in this paper. The realization of the central configuration of medical AI through the development of these core technologies will induce a paradigm shift in the new medical system by innovating all medical fields with influences at the individual, society, industry, and public levels and by making the existing medical system more efficient and intelligent.

AI기반 교량설계 프로세스 자동화를 위한 강화학습 알고리즘과 외부 해석프로그램 간 인터페이스 구축 (Interface Establishment between Reinforcement Learning Algorithm and External Analysis Program for AI-based Automation of Bridge Design Process)

  • 김민수;최상현
    • 한국전산구조공학회논문집
    • /
    • 제34권6호
    • /
    • pp.403-408
    • /
    • 2021
  • 현재 교량과 같은 토목구조물의 설계프로세스는 1차 설계 후 구조 검토를 수행하여 기준에 부적합할 경우 재설계하는 과정을 반복하여 최종적인 성과품을 만드는 것이 일반적이다. 이러한 반복 과정은 설계에 소요되는 기간을 연장시키는 원인이 되며, 보다 수준 높은 설계를 위해 투입되어야 할 고급 엔지니어링 인력을 기계적인 단순 반복 작업에 소모하고 있다. 이러한 문제는 설계 과정 자동화를 통하여 해결할 수 있으나, 설계 과정에서 사용되는 해석프로그램은 이러한 자동화에 가장 큰 장애요인이 되어 왔다. 본 연구에서는 기존 설계 과정 중 반복작업을 대체하고자 강화학습 알고리즘과 외부 해석프로그램을 함께 제어할 수 있는 인터페이스를 포함한 교량설계 프로세스에 대한 AI기반 자동화 시스템을 구축하였다. 이 연구를 통하여 구축된 시스템의 프로토타입은 2경간 RC라멘교를 대상으로 제작하였다. 개발된 인터페이스 체계는 향후 최신 AI 및 타 형식의 교량설계 간 연계를 위한 기초기술로써 활용될 수 있을 것으로 판단된다.

A DQN-based Two-Stage Scheduling Method for Real-Time Large-Scale EVs Charging Service

  • Tianyang Li;Yingnan Han;Xiaolong Li
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권3호
    • /
    • pp.551-569
    • /
    • 2024
  • With the rapid development of electric vehicles (EVs) industry, EV charging service becomes more and more important. Especially, in the case of suddenly drop of air temperature or open holidays that large-scale EVs seeking for charging devices (CDs) in a short time. In such scenario, inefficient EV charging scheduling algorithm might lead to a bad service quality, for example, long queueing times for EVs and unreasonable idling time for charging devices. To deal with this issue, this paper propose a Deep-Q-Network (DQN) based two-stage scheduling method for the large-scale EVs charging service. Fine-grained states with two delicate neural networks are proposed to optimize the sequencing of EVs and charging station (CS) arrangement. Two efficient algorithms are presented to obtain the optimal EVs charging scheduling scheme for large-scale EVs charging demand. Three case studies show the superiority of our proposal, in terms of a high service quality (minimized average queuing time of EVs and maximized charging performance at both EV and CS sides) and achieve greater scheduling efficiency. The code and data are available at THE CODE AND DATA.

Enhancing VANET Security: Efficient Communication and Wormhole Attack Detection using VDTN Protocol and TD3 Algorithm

  • Vamshi Krishna. K;Ganesh Reddy K
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.233-262
    • /
    • 2024
  • Due to the rapid evolution of vehicular ad hoc networks (VANETs), effective communication and security are now essential components in providing secure and reliable vehicle-to-vehicle (V2V) and vehicle-to-infrastructure (V2I) communication. However, due to their dynamic nature and potential threats, VANETs need to have strong security mechanisms. This paper presents a novel approach to improve VANET security by combining the Vehicular Delay-Tolerant Network (VDTN) protocol with the Deep Reinforcement Learning (DRL) technique known as the Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm. A store-carry-forward method is used by the VDTN protocol to resolve the problems caused by inconsistent connectivity and disturbances in VANETs. The TD3 algorithm is employed for capturing and detecting Worm Hole Attack (WHA) behaviors in VANETs, thereby enhancing security measures. By combining these components, it is possible to create trustworthy and effective communication channels as well as successfully detect and stop rushing attacks inside the VANET. Extensive evaluations and simulations demonstrate the effectiveness of the proposed approach, enhancing both security and communication efficiency.

Prediction of the shear capacity of reinforced concrete slender beams without stirrups by applying artificial intelligence algorithms in a big database of beams generated by 3D nonlinear finite element analysis

  • Markou, George;Bakas, Nikolaos P.
    • Computers and Concrete
    • /
    • 제28권6호
    • /
    • pp.533-547
    • /
    • 2021
  • Calculating the shear capacity of slender reinforced concrete beams without shear reinforcement was the subject of numerous studies, where the eternal problem of developing a single relationship that will be able to predict the expected shear capacity is still present. Using experimental results to extrapolate formulae was so far the main approach for solving this problem, whereas in the last two decades different research studies attempted to use artificial intelligence algorithms and available data sets of experimentally tested beams to develop new models that would demonstrate improved prediction capabilities. Given the limited number of available experimental databases, these studies were numerically restrained, unable to holistically address this problem. In this manuscript, a new approach is proposed where a numerically generated database is used to train machine-learning algorithms and develop an improved model for predicting the shear capacity of slender concrete beams reinforced only with longitudinal rebars. Finally, the proposed predictive model was validated through the use of an available ACI database that was developed by using experimental results on physical reinforced concrete beam specimens without shear and compressive reinforcement. For the first time, a numerically generated database was used to train a model for computing the shear capacity of slender concrete beams without stirrups and was found to have improved predictive abilities compared to the corresponding ACI equations. According to the analysis performed in this research work, it is deemed necessary to further enrich the current numerically generated database with additional data to further improve the dataset used for training and extrapolation. Finally, future research work foresees the study of beams with stirrups and deep beams for the development of improved predictive models.