통합 검색 | Korea Science

AI 참모 구축을 위한 의사결심조건의 데이터 모델링 방안 (A Methodology of Decision Making Condition-based Data Modeling for Constructing AI Staff)

한창희;신규용;최성훈;문상우;이치훈;이종관
- 인터넷정보학회논문지
- /
- 제21권1호
- /
- pp.237-246
- /
- 2020
본 논문에서는 의사결심 지원체계인 전장관리체계의 지능화를 위해 의사결심 조건에 기초한 데이터 모델링 방안을 제시하였다. 인간처럼 보고 식별도 하고, 자유롭게 움직임을 통해 원하는 위치에 도달하는 모습은 쉽게 이해되거나 실생활에서 체감하고 있는데 비해, 원하는 위치에 도달한 이후 인간 인지 행위 중 가장 중요한 하나인 의사 결심 판단을 구현했다거나 혹은 그러한 예제를 아직은 찾아 볼 수 없는 실정이다. 도착을 원했던 회의실에 인간을 대신해 에이전트가 오기는 했지만 판단을 도와주거나 대신 해주어야 할 임무인 예컨대, 가격 정책을 올릴 것인지 내릴 것인지, 지휘관이 심사숙고하고 있는 예컨대, 역습을 하는 것이 현명한지 아닌지에 대한 판단을 지원해 주지 못하고 있다. 군 지휘 통제의 현상과 현안을 고찰하였고, 각 상황에 대한 판단을 내릴 때 기계참모의 조언이 가능하게하기 위한 많은 양의 데이터 확보가 가능하도록, 현 지휘통제 체계를 변경시킬 방안으로 의사결심 조건에 기초한 데이터 모델링 방안을 제시하였다. 또한 제시한 방안에 대해 기계가 하는 의사결정의 한 예시로써 의사결정 트리 방법론을 적용하였다. 이를 통해 향후 AI 상황 판단 참모가 어떠한 모습으로 우리에게 다가올지에 대한 혜안을 제공하고자 하였다.
https://doi.org/10.7472/jksii.2020.21.1.237 인용 PDF KSCI HTML

오프 폴리시 강화학습에서 몬테 칼로와 시간차 학습의 균형을 사용한 적은 샘플 복잡도 (Random Balance between Monte Carlo and Temporal Difference in off-policy Reinforcement Learning for Less Sample-Complexity)

김차영;박서희;이우식
- 인터넷정보학회논문지
- /
- 제21권5호
- /
- pp.1-7
- /
- 2020
강화학습에서 근사함수로써 사용되는 딥 인공 신경망은 이론적으로도 실제와 같은 근접한 결과를 나타낸다. 다양한 실질적인 성공 사례에서 시간차 학습(TD) 은 몬테-칼로 학습(MC) 보다 더 나은 결과를 보여주고 있다. 하지만, 일부 선행 연구 중에서 리워드가 매우 드문드문 발생하는 환경이거나, 딜레이가 생기는 경우, MC 가 TD 보다 더 나음을 보여주고 있다. 또한, 에이전트가 환경으로부터 받는 정보가 부분적일 때에, MC가 TD보다 우수함을 나타낸다. 이러한 환경들은 대부분 5-스텝 큐-러닝이나 20-스텝 큐-러닝으로 볼 수 있는데, 이러한 환경들은 성능-퇴보를 낮추는데 도움 되는 긴 롤-아웃 없이도 실험이 계속 진행될 수 있는 환경들이다. 즉, 긴롤-아웃에 상관없는 노이지가 있는 네트웍이 대표적인데, 이때에는 TD 보다는 시간적 에러에 견고한 MC 이거나 MC와 거의 동일한 학습이 더 나은 결과를 보여주고 있다. 이러한 해당 선행 연구들은 TD가 MC보다 낫다고 하는 기존의 통념에 위배되는 것이다. 다시 말하면, 해당 연구들은 TD만의 사용이 아니라, MC와 TD의 병합된 사용이 더 나음을 이론적이기 보다 경험적 예시로써 보여주고 있다. 따라서, 본 연구에서는 선행 연구들에서 보여준 결과를 바탕으로 하고, 해당 연구들에서 사용했던 특별한 리워드에 의한 복잡한 함수 없이, MC와 TD의 밸런스를 랜덤하게 맞추는 좀 더 간단한 방법으로 MC와 TD를 병합하고자 한다. 본 연구의 MC와 TD의 랜덤 병합에 의한 DQN과 TD-학습만을 사용한 이미 잘 알려진 DQN과 비교하여, 본 연구에서 제안한 MC와 TD의 랜덤 병합이 우수한 학습 방법임을 OpenAI Gym의 시뮬레이션을 통하여 증명하였다.
https://doi.org/10.7472/jksii.2020.21.5.1 인용 PDF KSCI HTML

인터렉티브 지식베이스 기반의 계획시스템 (An Interactive Knowledge-based Planning System)

전형배;한은지;엄기현;조경은
- 한국게임학회 논문지
- /
- 제9권3호
- /
- pp.139-150
- /
- 2009
본 논문에서는 가상 에이전트의 행동 계획을 위한 인터렉티브 지식베이스 구축과 인터렉티브 지식베이스를 바탕으로 하는 계획시스템에 관한 방법을 제안한다. 고정적인 지식베이스는 고정적인 계획 수립만 가능하기 때문에 환경의 변화에 잘 대처하지 못한다. 그래서 이 논문에서는 다양한 환경에서 적용이 가능한 인터렉티브한 지식베이스의 구축과 인터렉티브 지식베이스를 활용할 수 있는 인공지능 계획시스템을 제안한다. 본 연구에서 제안한 인터렉티브 지식베이스는 동기, 행동, 사물, 실행의 4가지로 이루어지며 지식베이스의 입력과 지식베이스들 사이의 연관관계는 개발된 자동화 툴을 사용하여 설정한다. 이 툴을 사용하여 사용자는 쉽게 지식베이스에 구성요소들을 추가 또는 수정할 수 있다. 이 지식베이스를 바탕으로 캐릭터는 행동가능한 모든 항목들을 계획을 세우게 되며 이 중 한 가지를 선택하여 행동을 하게 된다. 후에 캐릭터의 환경이 변하게 되더라도 지식베이스의 업데이트를 통해 새로운 행동을 적용시킬 수가 있기 때문에 가상현실 콘텐츠제작자의 입장에서는 상당히 유용하다. 본 논문에서는 확장성이 있는 인터렉티브 지식베이스 구성요소와 구성요소들 사이의 관계설정 그리고 이를 쉽게 입력할 수 있는 툴과 인터렉티브 지식베이스에 적합한 계획시스템의 알고리즘을 제안하여 가상도서관이라는 가상환경에서 실험을 통해 결과를 검증하였다.
PDF

검색결과 153건 처리시간 0.02초

AI 참모 구축을 위한 의사결심조건의 데이터 모델링 방안 (A Methodology of Decision Making Condition-based Data Modeling for Constructing AI Staff)

오프 폴리시 강화학습에서 몬테 칼로와 시간차 학습의 균형을 사용한 적은 샘플 복잡도 (Random Balance between Monte Carlo and Temporal Difference in off-policy Reinforcement Learning for Less Sample-Complexity)

인터렉티브 지식베이스 기반의 계획시스템 (An Interactive Knowledge-based Planning System)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)