통합 검색 | Korea Science

Cooperative Multi-agent Reinforcement Learning on Sparse Reward Battlefield Environment using QMIX and RND in Ray RLlib

Minkyoung Kim
- 한국컴퓨터정보학회논문지
- /
- 제29권1호
- /
- pp.11-19
- /
- 2024
멀티에이전트는 전장 교전 상황, 무인 운송 차량 등 다양한 실제 협동 환경에 사용될 수 있다. 전장 교전 상황에서는 도메인 정보의 제한으로 즉각적인 보상(Dense Reward) 설계의 어려움이 있어 명백한 희소 보상(Sparse Reward)으로 학습되는 상황을 고려해야 한다. 본 논문에서는 전장 교전 상황에서의 아군 에이전트 간 협업 가능성을 확인하며, 희소 보상 환경인 Multi-Robot Warehouse Environment(RWARE)를 활용하여 유사한 문제와 평가 기준을 정의하고, 강화학습 라이브러리인 Ray RLlib의 QMIX 알고리즘을 사용하여 학습 환경을 구성한다. 정의한 문제에 대해 QMIX의 Agent Network를 개선하고 Random Network Distillation(RND)을 적용한다. 이를 통해 에이전트의 부분 관측값에 대한 패턴과 시간 특징을 추출하고, 에이전트의 내적 보상(Intrinsic Reward)을 통해 희소 보상 경험 획득 개선이 가능함을 실험을 통해 확인한다.
https://doi.org/10.9708/jksci.2024.29.01.011 인용 PDF HTML

Multi-Domain Operation Environment QoS 소요식별 절차 (Process for Identifying QoS Requirements in the Multi-Domain Operations Environment)

박동석;조봉익;박태형;임재성
- 한국군사과학기술학회지
- /
- 제25권2호
- /
- pp.177-186
- /
- 2022
A network QoS model for the joint integrated C4I structure was proposed for the integration of network infrastructure and network operations(NetOps) for NCOE. Detailed QoS requirements process of the joint integrated C4I systems are needs in the Multi-Domain Operation Environment(MDOE). A process is proposed for identifying QoS requirements and establishing in the MDOE using JMT(Joint Mission Thread) reference architecture and solution architecture. Mission analysis identify JCOAs(Joint Critical Operational Activities) and related activities based on JMT & System architecture's OVs, and Information analysis identify QoS attributes using System architecture's SVs. Identifying QoS attributes will be registered at PPS Registry by pre-regulated process, and will be set-up by NetOps. MDOE QoS requirement Process will support efficiently MUM-T and smart defense platform users under the future uncertain battlefield circumstances.
https://doi.org/10.9766/KIMST.2022.25.2.177 인용 PDF KSCI

임무형 지휘에 기초한 우크라이나군의 분권화 전투 연구 (A Study on Decentralized Combats of the Armed Forces of Ukraine Based on Mission Command)

신희현
- 문화기술의 융합
- /
- 제8권4호
- /
- pp.115-120
- /
- 2022
지난 2월 24일 러시아군은 강력한 기계화부대를 앞세워 우크라이나를 침공했다. 하지만 우크라이나군은 예상과는 달리 러시아군의 파상공세를 저지하여 전쟁을 장기화시키고 있다. 주요 싱크탱크와 군사전문가들은 임무형 지휘를 기반으로 한 분권화 전투가 우크라이나군 주요한 선전 요인이라고 평가하고 있다. 특히, 우크라이나군 소부대의 공세적인 분권화 운용은 러시아군의 피해를 가중시켜 공격 기세를 둔화시키는데 큰 역할을 했다. 4차 산업혁명의 주요 기술이 발전함에 따라 한반도는 다영역 전장으로 변모되고, 이로 인해 분권화 전투는 미래 한반도 전장에서 선택이 아닌 필수가 될 것이다. 따라서 이번 우-러 전쟁 초기 우크라이나군이 수행했던 분권화 전투는 한국 육군에게 시사하는 바가 상당하다.
https://doi.org/10.17703/JCCT.2022.8.4.115 인용 PDF KSCI

게임 환경에서의 지능형 다중 에이전트 개발 (Development of Intelligent Multi-Agent in the Game Environment)

김동민;최진우;우종우
- 인터넷정보학회논문지
- /
- 제16권6호
- /
- pp.69-78
- /
- 2015
다중 에이전트 시스템에 대한 연구는 최근 다양한 분야에서 활성화 되고 있으며, 복잡한 시스템의 제어 및 최적화에 관한 연구가 진행되어 왔다. 본 논문에서는 게임 환경에서의 NPC(Non-Player Character) 시뮬레이션을 위한 다중 에이전트 시스템을 개발한다. 시스템 개발의 목적은 동적 이산사건 영역의 상황을 추론하여 신속하고 정확한 판단을 제공하고 에이전트 시스템의 최적화 과정을 보다 손쉽게 도와주는데 있다. 이를 위한 에이전트 시스템의 기본 모델은 페트리넷을 활용하여 구조를 단순화 하고 퍼지 추론엔진을 사용하여 다양한 상황을 결정할 수 있도록 하였다. 본 연구 시스템의 실험은 NPC간의 가상 전장 상황을 묘사하며, 퍼지 규칙이 적용된 에이전트와 유한 상태 기계로 구현된 NPC를 시뮬레이션 하여 에이전트의 승률과 생존율을 산출하였다. 실험 결과 퍼지 규칙 기반 에이전트의 승률과 생존율이 유한 상태 기계로 구현된 NPC보다 더 높은 것으로 나타났다.
https://doi.org/10.7472/jksii.2015.16.6.69 인용 PDF KSCI

효율적인 국방 영상정보 전송을 위한 확장비디오코딩(SVC) 및 균형선택 알고리즘 기반의 피투피(P2P) 비디오 스트리밍 기법 연구 (A Scalable Video Coding(SVC) and Balanced Selection Algorithm based P2P Streaming Technique for Efficient Military Video Information Transmission)

신규용;김경민;이종관
- 융합보안논문지
- /
- 제19권4호
- /
- pp.87-96
- /
- 2019
최근 영상 장비와 기술이 발전함에 따라 우리 군에서도 작전지역에 대한 정보를 획득하고, 효율적인 지휘통제에 활용하기 위해 수많은 영상정보가 생산되어 활용되고 있다. 이때 현재 군내에서 활용하고 있는 영상 재생장비는 저성능의 전술용 다기능 단말기(TMFT)로부터 고성능의 영상서버에 이르기까지 매우 다양하고, 영상이 전송되는 네트워크 또한 저속의 전술정보통신체계(TICN)로부터 초고속의 국방광대역통합망(M-BcN)에 이르기까지 다양하다. 따라서 이기종(異機種) 통신장비 및 네트워크 환경에서 국방 영상정보를 효율적으로 전송할 수 있는 스트리밍 기법이 필요하다. 이 문제를 해결하기 위해 본 논문에서는 확장비디오코딩(SVC) 및 균형선택 알고리즘 기반의 피투피(P2P) 스트리밍 기법을 제안한다. 비토렌트 기반의 시뮬레이터를 활용한 성능분석결과 우리가 제안하는 균형선택 알고리즘 기반의 스트리밍 기법은 순차선택이나 희소선택 알고리즘에 비해 우수한 성능을 보였다.
https://doi.org/10.33778/kcsa.2019.19.4.087 인용 PDF KSCI

자율적인 상황인식을 위한 다중센서 위협데이타의 귀납적 분류 (Inductive Classification of Multi-Spectral Threat Data for Autonomous Situation Awareness)

정용웅;노상욱;고은경;정운섭
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제35권3호
- /
- pp.189-196
- /
- 2008
본 논문은 복잡한 실시간 환경에서 인간의 의사결정을 대체하는 자율적인 에이전트의 구축을 위하여 필수적인 지식베이스의 형성과정을 제안하며, 지식베이스의 형성과정에 대한 방법론을 실질적인 응용 도메인에서 검증한다. 한국형 헬기의 두뇌역할을 수행하는 생존체계장비가 실시간 전장 환경에서 여러 개의 센서로부터 수신하는 위협 데이타를 분석하고, 위협 데이타의 특성과 위협간의 상호 연관성을 컴파일 과정을 통하여 귀납적 모델로 정형화한다. 규범화된 상황-행동 규칙은 헬기가 복잡한 전장 환경에서 실시간 추론 시간을 줄이며, 자율적으로 위협에 대처할 수 있는 능력을 갖추도록 할 것이다. 제안한 방법론의 검증을 위하여 한국형 헬기의 위협을 실험적으로 분류하였으며, 컴파일 과정이 위협을 성공적으로 탐지할 수 있음을 보여주었다.
PDF KSCI

미래 대기동 작전 능력의 발전방안 연구 -살포식지뢰(FASCAM)로부터 지형 조성 장애물(TSO) 전력을 중심으로- (The Future of Countermobility Capability with a Literature Analysis from FASCAM to Terrain Shaping Obstacle(TSO))

박병호;심재성
- 한국산학기술학회논문지
- /
- 제22권6호
- /
- pp.291-298
- /
- 2021
본 연구에서는 지뢰 무기체계를 중심으로 대기동 능력의 발전 배경과 현황을 분석하고 미래 발전 방안을 제시하였다. 2차 대전 후 민간인 피해를 야기한 재래식 지뢰는 CCW 및 오타와 협약 등 국제사회의 규제 대상이 되었다. 기존 지뢰의 비인도성을 감안하여 배치된 살포식지뢰는 자폭 기능이 내장되어 있다. 초기형 지능화 대전차 탄약인 호넷의 도태 원인은 복합 센서로 인한 제작비용 상승 대비 저조한 효과로 분석된다. 2016년 모든 대인지뢰를 금지하는 오바마 정부의 정책이 발표되면서 대기동전력의 계획 지뢰지대 및 종심지역 설치 능력에 공백이 생기게 된다. 이를 대비하여 단기적으로는 기존의 살포식지뢰를 활용할 수 있는 SAVO 전력이 개발되고 관련 수명연장계획(SLEP) 사업이 추진되었다. 장기적으로는 미래 정규전을 위한 다영역작전의 핵심전력으로 지뢰를 선정하고 지형조성장애물(TSO)을 개발하고 있다. TSO 전력은 강화된 센서 및 살상능력을 보유하며, 위성통신 네트워크를 구성함으로 지휘소에서 모든 영역의 지뢰를 개별적으로 제어할 수 있다. TSO 개발에 성공한다면 미군은 2050년까지 전 영역에서 온전하며 강화된 대기동 능력을 발휘할 것으로 분석된다. 우리나라는 특수한 휴전 상황으로 인해 관련 정책의 엄격한 적용은 유예되고 있으나, 단독적인 종심지역 지뢰 살포 능력을 서둘러 갖추어야 하며, 오타와 협약에 적합한 지뢰를 개발할 수 있도록 관련 기술의 선제적인 확보가 필요하다.
https://doi.org/10.5762/KAIS.2021.22.6.291 인용 PDF KSCI

검색결과 7건 처리시간 0.022초

Cooperative Multi-agent Reinforcement Learning on Sparse Reward Battlefield Environment using QMIX and RND in Ray RLlib

Multi-Domain Operation Environment QoS 소요식별 절차 (Process for Identifying QoS Requirements in the Multi-Domain Operations Environment)

임무형 지휘에 기초한 우크라이나군의 분권화 전투 연구 (A Study on Decentralized Combats of the Armed Forces of Ukraine Based on Mission Command)

게임 환경에서의 지능형 다중 에이전트 개발 (Development of Intelligent Multi-Agent in the Game Environment)

자율적인 상황인식을 위한 다중센서 위협데이타의 귀납적 분류 (Inductive Classification of Multi-Spectral Threat Data for Autonomous Situation Awareness)

미래 대기동 작전 능력의 발전방안 연구 -살포식지뢰(FASCAM)로부터 지형 조성 장애물(TSO) 전력을 중심으로- (The Future of Countermobility Capability with a Literature Analysis from FASCAM to Terrain Shaping Obstacle(TSO))

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)