• 제목/요약/키워드: 근사적 동적계획

검색결과 7건 처리시간 0.02초

주행문제를 위한 최신 근사적 동적계획법의 적용 (Application of Recent Approximate Dynamic Programming Methods for Navigation Problems)

  • 민대홍;정근우;권기영;박주영
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.737-742
    • /
    • 2011
  • 주행문제는 불확실한 외란의 영향을 받는 이동로봇 등의 시스템에 대하여 각종 제약조건들을 만족하도록 하는 제어 입력을 결정하는 과제를 포함한다. 이러한 과제는 제약조건을 갖는 확률 제어 문제로 모델링될 수 있다. 이러한 종류의 제어문제를 풀기 위하여, 최적 가치함수 개념에 의존하는 동적 계획법의 활용을 시도해볼 수 있다. 하지만, 대부분의 실제 문제에서 이러한 시도는 많은 어려움, 예컨대, 시스템의 완벽한 모델이 알려지지 않거나, 최적 제어정책을 구하기 위한 계산이 불가능하거나, 수없이 많은 계산 자원을 필요로 하는 등의 문제점을 안겨줄 수 있다. 이러한 동적 계획법의 어려움을 극복하기 위한 전략으로, 근사적 가치함수에 의존하여 준최적 제어정책을 구하는 근사적 동적 계획법을 사용할 수 있다. 본 논문에서는 최근에 제시된 근사 동적 계획법들을 복잡한 제약조건을 갖는 주행 문제에 적용하여 보고 그 결과로 얻어지는 성능 특성을 관찰해 본다.

근사적 동적계획을 활용한 요격통제 및 동시교전 효과분석 (Approximate Dynamic Programming Based Interceptor Fire Control and Effectiveness Analysis for M-To-M Engagement)

  • 이창석;김주현;최봉완;김경택
    • 한국항공우주학회지
    • /
    • 제50권4호
    • /
    • pp.287-295
    • /
    • 2022
  • 저고도 궤적의 장사정포 위협이 대두됨에 따라 이를 방어할 요격 시스템의 개발이 시작될 예정이다. 이러한 장사정포의 공격을 방어하는 문제는 전형적인 동적 무기 표적 할당 문제다. 동적 무기 표적 할당 문제에서는 한 시점에서의 의사결정 결과가 이후 시점의 의사결정 과정에 영향을 주며, 이는 마코브 의사결정 모형의 특징이기도 하다. 장사정포의 공격을 방어하기 위한 의사결정 과정에 허용되는 시간은 공격자와 방어자의 거리를 고려할 때 저고도 궤적의 동시 다발성 발사체에 대한 대응은 수 초 이내에 결정되어야 하나, 짧은 시간 내에 마코브 의사결정 과정으로 최적해를 구하는 것은 불가능하다. 본 논문에서는 장사정포 공격을 방어하는 동적 무기 표적 할당 문제를 마코브 의사결정 문제로 나타내고, 3가지 시나리오를 작성한 후 근사적 동적계획 방법을 적용하여 요격이 가능 시간 안에 해의 도출이 가능한지를 시뮬레이션을 통하여 확인하였다. 도출된 해의 품질을 검증하기 위하여 각 시나리오에 대하여 근사적 동적계획을 적용한 결과와 Shoot-Shoot-Look 방법을 적용한 결과를 비교하였다. 시뮬레이션 결과, 장사정포의 방어 시나리오에 대하여 근사적 동적계획의 결과가 Shoot-Shoot-Look 방법을 이용한 결과보다 우수함을 보였다.

제약을 갖는 POMDP를 위한 점-기반 가치 반복 알고리즘 (Point-Based Value Iteration for Constrained POMDPs)

  • 김동호;이재송;김기응
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.286-289
    • /
    • 2011
  • 제약을 갖는 부분 관찰 의사결정 과정(Constrained Partially Observable Markov Decision Process; CPOMDP)는 정책이 제약(constraint)를 만족하면서 가치 함수를 최적화하도록 일반적인 부분 관찰 의사결정과정(POMDP)을 확장한 모델이다. CPOMDP는 제한된 자원을 가지거나 여러 개의 목적 함수를 가지는 문제를 자연스럽게 모델링할 수 있기 때문에 일반적인 POMDP에 비해 더 실용적인 장점을 가진다. 본 논문에서는 CPOMDP의 확률적 최적 정책 및 근사 최적 정책을 계산할 수 있는 최적 및 근사 동적 프로그래밍 알고리즘을 제안한다. 최적 알고리즘은 동적 프로그래밍의 각 단계마다 미니맥스 이차 제약 계획 문제를 계산해야 하는 반면에 근사 알고리즘은 선형 계획 문제만을 필요로 하는 점-기반(point-based) 가치 업데이트를 이용한다. 실험 결과, 확률적 정책이 결정적(deterministic) 정책보다 더 나은 성능을 보이며, 근사 알고리즘을 통해 계산 시간을 줄일 수 있음을 보였다.

동적계획법을 이용한 철근가공용 소프트웨어의 구현 (An Implementation of Cutting-Ironbar Manufacturing Software using Dynamic Programming)

  • 김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.1-8
    • /
    • 2009
  • 이 논문에서는 철근 절단 작업의 계획 문제를 동적 계획법으로 해결하여 근사 최적의 절단 계획을 생성하도록 하는 소프트웨어의 구현을 다룬다. 일반적으로 실제 절단 작업에 요구되는 제약사항을 반영하여 최적의 자재 절단문제의 해를 얻는 알고리듬의 설계가 필요하다. 하지만, 이것은 다중 규격의 1차원 자재 절단 문제를 풀어야 하는 것으로, 최적의 해를 얻는 선형계획법은 폭발적인 계산량과 기억용량의 한계로 적용하기 어렵다. 이러한 한계를 해결하기 위하여, 동적계획법에 근거하며 자재 절단 문제를 재구성하고, 휴리스틱을 적용하여 유한 범위의 조합 열에서도 근사 최적의 해를 찾을 수 있는 탐색 기법을 사용한 자재 절단 계획 알고리듬을 제시하였다. 그리고, 자동화된 철근 가공 산업용 소프트웨어는 작업 환경에 맞게 사용이 편리한 그래픽 화면과 사용자 인터페이스가 요구되는데, 공개 소프트웨어를 활용한 GUI 라이브러리 툴킷인 GTK+를 활용하여 이를 구현하였다. 개발된 소프트웨어는 철근 가공의 현장 지식을 바탕으로 휴리스틱 지식을 획득하여 동적계획법에 적용시킨 것으로, 지역 전통 산업과 첨단 IT 산업이 접목된 융합 IT를 시도한 사례 연구이다.

지리정보시스템에서 고속도로 연결 문제의 가변적 근사기법 (An Adaptive Approximation Method for the Interconnecting Highways Problem in Geographic Information Systems)

  • 김준모;황병연
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권2호
    • /
    • pp.57-66
    • /
    • 2005
  • 고속도로 연결문제(Interconnecting Highways problem)는 VLSI 설계, 광 또는 유선 네트워크의 설계, 도로 건설 계획 등의 분야에서 도출되는 여러 가지 배치문제들을 대표하는 추상화 된 문제이다. 도로 건설에 있어 기존의 지점들을 가장 짧은 거리로 상호 연결하는 도로망은 다른 도로망들에 비해 경제적인 면에서 많은 이익을 가져다준다. 즉, 기존의 도로나 도시들을 상호 연결하는 새로운 도로망을 찾는 문제는 중요한 이슈가 된다. 본 논문에서는 NP-hard 문제인 고속도로 연결문제에 대해 '최적에 점근하는 결과치'를 내는 근사방법을 제안한다. 이 방법은 컴퓨팅 자원이 지원되는 한 최적치에 점근하는 근사-결과치를 구할 수 있도록 한다. 따라서 실제 응용에서는 제안된 근사방법에서 산출되는 근사치를 사실상의 최적치로 간주할 수 있게 된다. 선행연구에서의 근사방법과 달리 본 논문에서 제안된 방법은 주어진 문제 인스턴스의 속성에 부합하는 알고리즘을 만들어 낼 수 있도록 하는 큰 장점을 가진다.

  • PDF

선형가속기의 동적쐐기(EDW) 작동에 대한 품질보증 (Quality Assurance of Operation of Enhanced Dynamic Wedges in Linac)

  • 정동혁;김진기;강정구;손광재;이정옥
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제33권2호
    • /
    • pp.133-141
    • /
    • 2010
  • 선형가속기의 동적쐐기(enhanced dynamic wedge: EDW)의 품질보증을 위하여 다양한 방법으로 동적쐐기의 특성을 평가하였다. 본 연구에서는 6 MV와 15 MV 엑스선에 대하여 각각 7종(10, 15, 20, 25, 30, 45, 60도)의 EDW를 평가하였다. EDW 작동에 필요한 STT(segmented treatment table)를 계산으로 구하고 로그파일을 통하여 기계적 작동을 평가하였으며, 이차원배열형검출기와 전리함을 사용하여 팬텀속 선량분포를 측정하고 치료계획시스템(RTP)과 비교하였다. EDW의 기계적 작동은 예상과 잘 일치하였으며, 빔측면도를 포함한 이차원선량분포는 근사적으로 RTP 계산과 일치하였다. 선형가속기 조사량 100 MU에 대한 출력선량은 RTP 계산과 2.9% 이내로 일치하였으며, 측정된 쐐기인자는 RTP 계산과 최대 2.6%를 보였다. 이 결과들은 본 선형가속기에 장착된 EDW의 임상적 적용에 문제가 없음을 의미한다.

데이터 기반 확률론적 최적제어와 근사적 추론 기반 강화 학습 방법론에 관한 고찰 (Investigations on data-driven stochastic optimal control and approximate-inference-based reinforcement learning methods)

  • 박주영;지승현;성기훈;허성만;박경욱
    • 한국지능시스템학회논문지
    • /
    • 제25권4호
    • /
    • pp.319-326
    • /
    • 2015
  • 최근들어, 확률론적 최적제어(stochastic optimal control) 및 강화학습(reinforcement learning) 분야에서는 데이터를 활용하여 준최적 제어 전략을 찾는 문제를 위한 많은 연구 노력이 있어 왔다. 가치함수(value function) 기반 동적 계획법(dynamic programming)으로 최적제어기를 구하는 고전적인 이론은 확률론적 최적 제어 문제를 풀기위해 확고한 이론적 근거 아래 확립된바 있다. 하지만, 이러한 고전적 이론은 매우 간단한 경우에만 성공적으로 적용될 수 있다. 그러므로, 엄밀한 수학적 분석 대신에 상태 전이 및 보상 신호 값 등의 관련 데이터를 활용하여 준최적해를 구하고자 하는 데이터 기반 현대적 접근 방법들은 실용적인 응용분야에서 특히 매력적이다. 본 논문에서는 확률론적 최적제어 전략과 근사적 추론 및 기계학습 기반 데이터 처리 방법을 접목하는 방법론들을 고려한다. 그리고 이러한 고려를 통하여 얻어진 방법론들을 금융공학을 포함한 다양한 응용 분야에 적용하고 그들의 성능을 관찰해보도록 한다.