초록
자율적인 에이전트들은 이성적인 의사결정을 위하여 상당한 양의 계산자원을 필요로 하며, 실시간 환경에서 항상 최적의 행동을 수행하는 완벽하게 이성적인 에이전트(rational agent)의 구현은 실질적으로 가능하지 않다. 이러한 실시간 문제 해결기법에서의 전통적인 접근 방식은 미리 정의된 규약에 의존한 조건-행동 추론 방식이다. 조건-행동 추론 방식은 주어진 상황에 빠르게 반응하지만, 문제 영역이 다양하거나 문제의 재설계가 필요한 경우에는 아무런 해법을 갖지 못한다. 따라서 이러한 문제점을 해결하기 위해 본 논문에서는 주어진 행동들의 유틸리티를 실시간에 계산하고, 긴급한 정도(urgency)를 측정하여 상황이 긴급할 경우에는 더 이상의 계산을 중단하고 즉각적인 행동을 취하며, 반면에 상황이 긴급하지 않을 경우에는 최선의 의사결정을 위하여 추가적인 정보를 고려하여 더 바람직한 행동을 결정하는 방법론을 제안한다. 제안한 방법론의 평가를 위하여 시간 제약적인 환경에서 최선의 의사결정을 수행하는 실질적이며 유연한 에이전트를 구현하고자 한다.
Autonomous agents need considerable computational resources to perform rational decision-making. The complexity of decision-making becomes prohibitive when large number of agents are present and when decisions have to be made under time pressure. One of approaches in time-critical domains is to respond to an observed condition with a predefined action. Although such a system may be able to react very quickly to environmental conditions, predefined plans are of less value if a situation changes and re-planning is needed. In this paper we investigate strategies intended to tame the computational burden by using off-line computation in conjunction with on-line reasoning. We use performance profiles computed off-line and the notion of urgency (i.e., the value of time) computed on-line to choose the amount of information to be included during on-line deliberation. This method can adjust to various levels of real-time demands, but incurs some overhead associated with iterative deepening. We test our framework with experiments in a simulated anti-air defense domain. The experiments show that the off-line performance profiles and the on-line computation of urgency are effective in time-critical situations.