통합 검색 | Korea Science

Exploring reward efficacy in traffic management using deep reinforcement learning in intelligent transportation system

Paul, Ananya;Mitra, Sulata
- ETRI Journal
- /
- 제44권2호
- /
- pp.194-207
- /
- 2022
In the last decade, substantial progress has been achieved in intelligent traffic control technologies to overcome consistent difficulties of traffic congestion and its adverse effect on smart cities. Edge computing is one such advanced progress facilitating real-time data transmission among vehicles and roadside units to mitigate congestion. An edge computing-based deep reinforcement learning system is demonstrated in this study that appropriately designs a multiobjective reward function for optimizing different objectives. The system seeks to overcome the challenge of evaluating actions with a simple numerical reward. The selection of reward functions has a significant impact on agents' ability to acquire the ideal behavior for managing multiple traffic signals in a large-scale road network. To ascertain effective reward functions, the agent is trained withusing the proximal policy optimization method in several deep neural network models, including the state-of-the-art transformer network. The system is verified using both hypothetical scenarios and real-world traffic maps. The comprehensive simulation outcomes demonstrate the potency of the suggested reward functions.
https://doi.org/10.4218/etrij.2021-0404 인용 PDF KSCI

멀티 에이전트 기반의 상황 인지 시뮬레이션을 위한 통합 개발 프레임워크의 개발 (Development of Integrated Development Framework for Context-Awareness Simulation based on Multi-Agent System)

김태형;최진우;우종우
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2010년도 추계학술발표대회
- /
- pp.538-541
- /
- 2010
상황인지 시뮬레이션이란 상황자료의 수집, 추론 및 결론 도출의 과정을 실제 환경이 아닌 가상의 시뮬레이션 환경 안에서 실험해 볼 수 있는 것을 말하며, 상황인지 기술과 DEVS(Discrete Event System Specification), 페트리-넷(Petri-Net)등의 기반 기술이 사용된다. 본 논문에서는 사용자들이 보다 편리하게 상황인지 시스템을 구축하고 실제보다 적은 시간으로 구축된 시스템을 실험할 수 있는 시뮬레이션 환경을 제공할 수 있는 통합 개발 프레임워크를 개발하고자 한다. 시뮬레이션 통합 개발 프레임워크 특징으로는, 첫째 상황인지를 위한 추론 기능을 가지는 에이전트와 시뮬레이션 기능들을 플러그인 및 라이브러리로 제공할 수 있고, 둘째, 통합환경 안에서 제공되는 도구들을 사용하여 사용자들이 보다 편리하게 개발 및 실험을 할 수 있다는 장점이 있다. 따라서 본 논문에서는 상황 아키텍처를 위한 모델 표현 계층, 멀티 에이전트 시스템을 위한 연산 계층, 환경과의 상호작용을 위한 인터랙션 계층, 그리고 시뮬레이션 계층인 4-계층구조의 통합개발환경을 연구하였다.
https://doi.org/10.3745/PKIPS.y2010m11a.538 인용 PDF

강화 학습에 기반한 뉴로-퍼지 제어기 (Neuro-Fuzzy Controller Based on Reinforcement Learning)

박영철;심귀보
- 한국지능시스템학회논문지
- /
- 제10권5호
- /
- pp.395-400
- /
- 2000
본 논문에서는 강화학습에 기반한 새로운 뉴로-퍼지 제어기를 제안한다. 시스템은 개체의 행동을 결정하는 뉴로-퍼지 제어기와 그 행동을 평가하는 동적 귀환 신경회로망으로 구성된다. 뉴로-퍼지 제어기의 후건부 소속함수는 강화학습을 한다. 한편, 유전자 알고리즘을 통하여 진화하는 동적 귀환 신경회로망은 환경으로부터 받는 외부 강화신호와 로봇의 상태로부터 내부강화 신호를 만들어낸다. 이 출력(내부강화신호)은 뉴로-퍼지 제어기의 교사신호로 사용되어 제어기가 학습을 지속하도록 만든다. 제안한 시스템은 미지의 환경에서 제어기의 최적화 및 적응에 사용할 수 있다. 제안한 알고리즘은 컴퓨터 시뮬레이션 상에서 자율 이동로봇의 장애물 회피에 적용하여 그 유효성을 확인한다.
PDF

분산 멀티미디어 환경에서 실행되는 오류 복구 시스템의 성능 분석 (Performance Analysis of Error Recovery System on Distributed Multimedia Environment)

고응남
- 디지털콘텐츠학회 논문지
- /
- 제6권1호
- /
- pp.85-88
- /
- 2005
분산 멀티미디어 응용에 대한 요구는 정교한 QoS 관리를 위해서 필요하다. 분산 멀티미디어 시스템 견지에서 보면, QoS의 가장 중요한 범주는 시간성, 볼륨, 신뢰성이다. 본 논문에서는 결함 허용을 통해서 신뢰성을 향상시키는 방법에 대해서 기술한다. ERA는 분산 멀티미디어에서 하나의 소프트웨어 오류를 자동적으로 복구할 수 있는 시스템이다. 본 논문은 규칙-기반 DEVS 모델링과 시뮬레이션 기법을 사용하면서 분산 멀티미디어 상에서의 오류 복구 시스템의 성능 분석을 설명한다. DEVS에서 하나의 시스템은 시간 입력, 상태, 출력 및 함수들을 가지고 있다.
PDF

모바일 애드혹 네트워크를 위한 링 기반 멀티캐스트 라우팅 구조 (A Ring-based Multicast Routing Architecture for Mobile Ad Hoc Networks)

허준;홍충선;양육백
- 정보처리학회논문지C
- /
- 제11C권7호
- /
- pp.895-904
- /
- 2004
예상치 못한 에드혹 망의 접속형태의 변경이 동반되는 멀티캐스트 라우팅 프로토콜에 대한 연구에 많은 과제를 남겨놓고 있으며, 다양한 이동 에드혹 망에 적합한 프로토콜에 대한 연구의 필요성이 제기되고 있다. 본 논문에서는 계층적 Eulerian 링 멀티캐스트 구조를 갖는 새로운 프로토콜을 제안한다. 제안한 구조는 Eulerian 링, 계층구조, 멀티캐스트 에이전트를 갖으며 기존의 방법보다 효율적이며 안전한 특성을 갖는다. 제안한 구조는 트리기반 및 메시기만 멀티캐스트 프로토콜과 비교하여 제어트래픽의 양, 점대점 지연, 패킷전송률 등에 있어 우수함은 시뮬레이션을 통해 입증한다.
https://doi.org/10.3745/KIPSTC.2004.11C.7.895 인용 PDF KSCI

IED를 기반으로 하는 디지털 수배전반의 지적추론기반 운전제어 솔루션 설계 (The Design of Operation and Control Solution with Intelligent Inference Capability for IED based Digital Switchgear Panel)

고윤석
- 대한전기학회논문지:전력기술부문A
- /
- 제55권9호
- /
- pp.351-358
- /
- 2006
In this paper, DSPOCS(Digital Switchgear-Panel Operation and Control Solution) is designed, which is the intelligent inference based operation and control solution to obtain the safety and reliability of electric power supply in substation based on IED. DSPOCS is designed as a scheduled monitoring and control task and a real-time alarm inference task, and is interlinked with BRES(Bus Reconfiguration Expert System) in the required case. The intelligent alarm inference task consists of the alarm knowledge generation part and the real-time pattern matching part. The alarm knowledge generation part generates automatically alarm knowledge from DB saves it in alarm knowledge base. On the other hand, the pattern matching part inferences the real-time event by comparing the real-time event information furnished from IEDs of substation with the patterns of the saved alarm knowledge base.; Especially, alarm knowledge base includes the knowledge patterns related with fault alarm, the overload alarm and the diagnosis alarm. In order to design the database independently in substation structure, busbar is represented as a connectivity node which makes the more generalized graph theory possible. Finally, DSPOCS is implemented in MS Visual $C^{++}$, MFC, the effectiveness and accuracy of the design is verified by simulation study to the typical distribution substation.
PDF KSCI

Development of human-in-the-loop experiment system to extract evacuation behavioral features: A case of evacuees in nuclear emergencies

Younghee Park;Soohyung Park;Jeongsik Kim;Byoung-jik Kim;Namhun Kim
- Nuclear Engineering and Technology
- /
- 제55권6호
- /
- pp.2246-2255
- /
- 2023
Evacuation time estimation (ETE) is crucial for the effective implementation of resident protection measures as well as planning, owing to its applicability to nuclear emergencies. However, as confirmed in the Fukushima case, the ETE performed by nuclear operators does not reflect behavioral features, exposing thus, gaps that are likely to appear in real-world situations. Existing research methods including surveys and interviews have limitations in extracting highly feasible behavioral features. To overcome these limitations, we propose a VR-based immersive experiment system. The VR system realistically simulates nuclear emergencies by structuring existing disasters and human decision processes in response to the disasters. Evacuation behavioral features were quantitatively extracted through the proposed experiment system, and this system was systematically verified by statistical analysis and a comparative study of experimental results based on previous research. In addition, as part of future work, an application method that can simulate multi-level evacuation dynamics was proposed. The proposed experiment system is significant in presenting an innovative methodology for quantitatively extracting human behavioral features that have not been comprehensively studied in evacuation. It is expected that more realistic evacuation behavioral features can be collected through additional experiments and studies of various evacuation factors in the future.
https://doi.org/10.1016/j.net.2023.02.032 인용 PDF

초상자성 나노 입자의 자기이완 특성에 관한 이론적 연구 (The Development of Theoretical Model for Relaxation Mechanism of Sup erparamagnetic Nano Particles)

장용민;황문정
- Investigative Magnetic Resonance Imaging
- /
- 제7권1호
- /
- pp.39-46
- /
- 2003
목적 : 간(liver)과 림프절 특이성 등의 다기능성을 나타내는 미세 초상자성 산화철 입자(ultrasmall superparamagnetic iron oxide: USP IO)의 자기이완(magnetic relaxation)에 대한 이론적 모델을 제시하고 이러한 이론적 모델에 근거한 미세 초상자성 산화철 입자의 자기장의 세기에 따른 자기 이완시간의 변화를 컴퓨터 모의 실험을 통해 연구하였다. 대상 및 방법 : 초상자성 산화철 입자를 조영제로 사용하기 위해서는 생체적합성 고분자로 축약(encapsulation)시키게 되고 따라서 확산(diffusion) 및 전자스핀의 fluctuation 에 기인하여 발생하는 자유 물분자와 간접 상호작용인 "outsphere " 기전에 근거하여 자기이완모델을 개발하였다. 또한 초상자성체의 경우 자기 모멘트가 상자성 입자에 비해 최소 수백배에서 최대 수만배까지 더 크므로 일반적으로 상자성 조영제의 "out sphere" 기전에서 가정하는 저자장 근사치를 사용할 수 없고 따라서 본 연구에서는 Brillouin함수로 표현되는 총자화에 대한 표현을 적용하여 저자장뿐만 아니라 고자장의 경우까지를 모두 포함하는 "out sphere" 기전에 의한 T1 그리고 T2 이완율에 대한 모델을 개발하였다. 이렇게 개발된 자기이완모델을 사용하여 미세 초상자성 산화철 입자의 자기장의 세기에 따른 자기 이완시간의 변화를 symbolic computation tool 인 MathCad(MathCad, USA)를 사용한 컴퓨터 모의 실험을 통해 조사하였다. 결과 : 미세 초상자성 산화철 입자의 T1, T2 자기이완 특성은 먼저, 저자장 영역 (＜1.0 Mhz)에서는 이론적 모델의 spectral density function에 들어 있는 두 개의 correlation time중 $\tau$$_{s1}$ 중 (T2의 경우 ${\tau}_{S2}$)이 주된 역할을 하는 것을 알 수 있었고 이는 결과적으로 이러한 나노자성체 입자들이 낮은 자기장하에서는 열적으로 야기된 자기모멘트들의 재배열이 주된 역할을 하는 것으로 해석할 수 있다. 한편 고자장 영역에서는 correlation time 중 $\tau$가 주된 역할을 담당하는데는 $\tau$는 나노 입자의 크기와 연관되어 있으며 고자장에서 입자 크기에 따른 T1 이완율(R1)과 T2 이완율(R2)의 차이는 이러한 입자크기의 차이에 의해 발생하는 것으로 해석할 수 있다. 나노입자에 포함된 철 원자수를 변화시키는 경우 철 원자수가 증가 할 수록 R1과 R2가 증가하는 결과를 나타내었다. 한편 온도변화에 따른 T1, T2 자기이완시간의 변화는 정상체온 근처의 제한적인 온도범위내에서 저자장 영역에서의 아주 작은 변화를 제외하고는 큰 차이를 보이지 않았으나 T1에 비해 T2에서 이러한 변화가 상대적으로 더 작게 나타났다. 결론 : 임상적 다기능성을 나타낼 가능성이 많은 것으로 보고되고 있는 미세 초상자성 산화철 입자의 자기이완에 대한 이론적 모델을 초상자성 나노입자의 물리적 특성에 기초하여 제시하였고 이러한 이론적 모델에 근거한 미세 초상자성 산화철 입자의 자기장의 세기에 따른 자기 이완시간의 변화를 컴퓨터 모의 실험을 통해 조사하였다.다.
PDF

고고보드를 이용한 능동적 참여 모의실험을 위한 NetLogo 확장 모듈 (NetLogo Extension Module for the Active Participatory Simulations with GoGo Board)

웅홍우;소원호
- 한국통신학회논문지
- /
- 제36권11B호
- /
- pp.1363-1372
- /
- 2011
본 논문에서는 기존 HubNet 기반의 참여 모의실험의 한계를 극복하기 위한 능동형 참여 모의실험 (Active Participatory Simulation; APS) 학습 구조를 제시하고, 이를 위한 고고보도용 NetLogo 확장 모듈을 자바로 개발한다. NetLogo는 복잡하게 보이는 과학현상의 이면에 존재하는 복잡계를 모델링할 수 있는 에이전트 기반 모델링 (Agent Based Modeling) 언어다. 이것과 HubNet을 이용하면 모의실험이 수행되는 동안 학생은 하나의 에이전트로서 이 실험에 참여할 수 있다. 하지만 HubNet에서는 서버만이 외부장치와 연결된다. 따라서 고고보드를 이용한 환경 데이터 및 사용자 입력을 다수의 클라이언트를 통하여 수신할 수 없어 이중초점 모델링 기반 학습이 불가능하다. 이에 클라이언트에 연결된 고고보드의 입력 정보를 TCP/IP 소켓을 이용하여 수신하고 보드를 제어하는 자바 확장 모듈을 개발한다. 또한 HubNet과 이 확장 모듈을 사용한 APS 학습 구조 모델링 방법과 이를 위한 NetLogo 프로그래밍을 소개한다. 마지막으로 다양한 APS 학습 구조에 따른 예시를 제시하고 응답처리지연 시간 관점에서 평가하여 과학분야에 활용될 수 있는 방안을 모색한다.
https://doi.org/10.7840/KICS.2011.36B.11.1363 인용 PDF KSCI

지능형 시뮬레이션 모형을 기반으로 한 정보기술 투자 성과 요인 및 전략 도출에 관한 연구 (A study on the Success Factors and Strategy of Information Technology Investment Based on Intelligent Economic Simulation Modeling)

박도형
- 지능정보연구
- /
- 제19권1호
- /
- pp.35-55
- /
- 2013
최근 기업 경영에 있어 정보기술의 도입 및 전략적인 활용은 선택이 아닌 필수로 자리잡고 있다. 기업의 전략적인 목표와 정보기술 간의 상호 의존은 기업의 생존 및 성장에 중요한 역할을 하고 있으며, 이에 따라 이미 많은 기업이 지속적으로 정보기술에 투자하고 있다. 정보기술 투자 성과 관련해서는 기업 내부의 요인들과 전략들, 기업외부의 고객까지 여러 가지 복합적인 요소들이 서로 상호작용하고 있기 때문에, 각 요인들을 독립적으로 분리하여 정보기술 투자 성과에 미치는 영향력을 분석하는 것이 쉽지 않다. 이에 본 연구는 기존의 연구들을 바탕으로 정보기술 투자성과에 영향을 줄 수 있는 변수들을 도출하여, 각 변수들의 관계를 수리적인 모델링을 통해 단순화시키고, 시뮬레이션 방법론을 이용하여 각 변수들의 변화에 정보기술 투자 성과는 어떻게 달라지는지를 밝혔다. 본 연구의 결과는 정보기술 투자는 서비스의 품질을 증가시켜 경제학적인 성과들에 간접적으로 영향을 주고, 정보기술 투자와 동시에 소비자 잉여는 증가되지만, 큰 투자비용으로 회사의 이익은 감소하게 된다. 그리고 시간이 지남에 따라 품질 증가에 관한 정보가 고객들 사이에 퍼져 나가게 되므로 최종적으로 기업의 수익을 증가시켜준다. 또한, 정보기술 투자 성과 극대화를 위해서는 회사가 제공하는 서비스와 소비자들의 네트워크 효과 등이 고려되어 정보기술 투자 여부를 결정하고, 회사에 맞는 정보기술 투자 전략을 세워야 함을 시뮬레이션 모형을 통해 확인할 수 있었다. 구체적으로, 한 번에 많은 투자를 할 경우는 단기적인 성과는 클 것으로 기대되나, 장기적으로 좋은 성과가 이뤄지지 않는다. 그러나 정보의 확산 속도가 빠르거나 정보의 장벽이 될 수 있는 정보를 받지 못하는 소비자가 적을 경우 단기에 집중 투자 하는 것이 많은 수요를 얻을 수 있다. 또, 여러 번에 걸쳐 투자하는 경우는 적당한 주기를 가지게 될 경우 장기적으로 큰 성과를 낼 수 있음을 확인할 수 있었다. 본 연구는 경제학 모델링과 시뮬레이션을 결합시켜, 각각의 한계를 모두 극복할 수 있는 방법론을 활용했다는 측면과, 정보기술 투자의 성과를 제품 품질의 매개 효과 모형에 적용하여 정보기술 투자와 기업 성과간의 관계를 보여주었다는 측면, 마지막으로 정보기술 투자 전략 및 정보의 확산 효과를 반영하여 정보기술 투자의 성과를 확인할 수 있다는 측면에서 의의가 있다.
https://doi.org/10.13088/jiis.2013.19.1.035 인용 PDF KSCI

검색결과 358건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)