• 제목/요약/키워드: 상태대응확률

검색결과 42건 처리시간 0.024초

2-stage 마르코프 의사결정 상황에서 Successor Representation 기반 강화학습 알고리즘 성능 평가 (Evaluating a successor representation-based reinforcement learning algorithm in the 2-stage Markov decision task)

  • 김소현;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.910-913
    • /
    • 2021
  • Successor representation (SR) 은 두뇌 내 해마의 공간 세포가 인지맵을 구성하여 환경을 학습하고, 이를 활용하여 변화하는 환경에서 유연하게 최적 전략을 수립하는 기전을 모사한 강화학습 방법이다. 특히, 학습한 환경 정보를 활용, 환경 구조 안에서 목표가 변화할 때 강인하게 대응하여 일반 model-free 강화학습에 비해 빠르게 보상 변화에 적응하고 최적 전략을 찾는 것으로 알려져 있다. 본 논문에서는 SR 기반 강화학습 알고리즘이 보상의 변화와 더불어 환경 구조, 특히 환경의 상태 천이 확률이 변화하여 보상의 변화를 유발하는 상황에서 어떠한 성능을 보이는 지 확인하였다. 벤치마크 알고리즘으로 SR 의 특성을 목적 기반 강화학습으로 통합한 SR-Dyna 를 사용하였고, 환경 상태 천이 불확실성과 보상 변화가 동시에 나타나는 2-stage 마르코프 의사결정 과제를 실험 환경으로 사용하였다. 시뮬레이션 결과, SR-Dyna 는 환경 내 상태 천이 확률 변화에 따른 보상 변화에는 적절히 대응하지 못하는 결과를 보였다. 본 결과를 통해 두뇌의 강화학습과 알고리즘 강화학습의 차이를 이해하여, 환경 변화에 강인한 강화학습 알고리즘 설계를 기대할 수 있다.

기계적인 시정수의 동정을 가지는 Kalman 필터를 사용한 위치-속도 추정자 (Position-Speed Estimator using Kalman Filter with Parameter Identification)

  • 신기상;이제희;허욱열
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1997년도 하계학술대회 논문집 B
    • /
    • pp.434-436
    • /
    • 1997
  • 본 연구에서는 저속에서 발생하는 측정잡음에 대한 문제를 불규칙 확률시스템으로 고려하여 Kalman 필터를 관측자로서 사용하고 고속에서뿐만 아니라 저속에서의 위치와 속도 추정성능을 향상시키고자 한다. Kalman 필터는 확률적 외란을 포함하고 있는 동적시스템에 적용되는 최적상태 추정자이다. 또한 이 Kalman 필터는 외란을 가지는 이산형 실시간 동적 처리 시스템에서 최적의 미지 상태를 추정하기 위해 선형, 불편향, 그리고 최소 오차분산 회귀형 알고리즘을 제공한다. 또한, MRAS(Model Reference Adaptive System) 방법을 이용하여 모터와 부하에 대응되는 기계적 시정수를 동정한다. 이 방법은 기계적인 시정수가 알려지지 않은 시스템에 적용하여 위치와 속도의 추정을 가능하게 하기 위해서이다. 더욱이 동정의 결과를 이용하여 Kalman 필터 알고리즘에 적용한다.

  • PDF

범주형 자료 분석을 활용한 사회경제적 가뭄 피해 발생확률 산정 : 충청북도의 적용사례를 중심으로 (Estimation of Occurrence Probability of Socioeconomic Damage Caused by Meteorological Drought Using Categorical Data Analysis)

  • 유지수;유지영;김민지;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.348-348
    • /
    • 2021
  • 가뭄 연구의 궁극적 목표는 가뭄 발생의 메커니즘에 대한 이해를 높이고, 예측기술을 향상시켜 선제적 대응이 가능하도록 하는 것이다. 일반적으로 가뭄분석에 활용되는 가뭄지표는 연속형 변수로 간주하여 확률모형을 구축하지만, 가뭄상태와 가뭄피해 자료는 순서형 및 이산형 변수이므로 범주형 자료 분석 기법을 적용하는 것이 더 적절하다. 따라서 본 연구에서는 기상학적 가뭄과 피해발생 사이의 관계를 규명하기 위해 범주형 자료 분석 방법 중 로그선형(log-linear) 모형과 로지스틱(logistic) 회귀모형을 활용하였다. 가뭄피해 예측을 위한 가뭄 피해 정보를 수집하는 것은 매우 어려운 일이다. 가뭄의 영향으로 인해 발생할 수 있는 피해의 종류가 다양하며, 여러 분야의 이해관계자가 받아들이는 가뭄의 피해 양상이 다르기 때문이다. 본 연구에서는 국가가뭄정보포털(drought.go.kr)에서 충청북도의 가뭄피해현황 자료를 수집하였다. 30년(1991~2020년)동안 238개 읍면동 중 34개 행정구역에서 총 272건의 가뭄피해가 발생한 것으로 확인되었다. 표준강수지수(SPI)를 이용하여 분석된 지역별 연평균 가뭄발생횟수는 약 8.44회이며, 가뭄이 가장 많이 발생한 해는 2001년(평균 가뭄발생 18.7회)이었다. 강수의 부족으로 인해 발생하는 기상학적 가뭄이 사회경제적 피해를 야기하는 수문학적 가뭄으로 전이되기까지 몇 주에서 몇 달까지 시간이 소요된다. 이러한 관계를 파악하기 위해 가뭄피해 발생 여부를 예측변수, 가뭄피해 발생 이전의 가뭄상태를 설명변수로 설정하여 기상학적 가뭄 발생에 따른 가뭄피해 발생 확률을 산정하였다. 그 결과 가뭄피해 발생 당시의 가뭄상태보다 그 이전에 연속된 가뭄상태가 있을 경우 가뭄피해 발생 확률이 약 2.5배 상승하는 것으로 나타났다.

  • PDF

Nakagami-m 페이딩 채널에서 FSMC 모델에 의한 무선 통신시스템의 성능 분석 (Performance Analysis of Wireless Communication System with FSMC Model in Nakagami-m Fading Channel)

  • 조용범;노재성;조성준
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.1010-1019
    • /
    • 2004
  • 본 논문에서는 Nakagami-m 페이딩 채널을 Finite-State Markov Channel (FSMC)로 모델링하고, 채널 상태 변화에 따른 통신 시스템의 성능을 분석하였다. 고려한 FSMC 모델에서는 수신 신호의 신호 대 잡음 전력비를 유한개의 구간으로 나눠 각각의 구간을 Markov 체인의 상태로 대응한다. 각 상태는 무기억 이진 대칭 통신로로 가정하고, 한 상태에서 다른 상태로의 천이는 Markov 천이를 따른다고 가정한다. 수치 해석을 통해 각 상태에 있어서의 평균 심볼 오율, 정상 상태 확률 그리고 상태 천이 확률을 구하여 FSMC 모델을 구성하였고, 상태 천이 지수를 변경함으로써 여러 페이딩 환경을 FSMC 모델로 나타낼 수 있음을 확인하였다. 상태 천이 지수가 클 경우인 빠른 페이딩 채널에서는 채널이 i.i.d. 특성을 나타내게 되며, 상태 천이 지수가 작을 경우인 느린 페이딩 채널은 인접한 상태로의 천이만 발생하는 간단한 FSMC 모델로 표현될 수 있음을 확인하였다. 마지막으로 제안한 FSMC 모델의 응용 예로써, 여러 채널 환경에서 랜덤 에러 정정 부호의 부호화 이득의 차이를 컴퓨터 시뮬레이션을 통해 비교, 분석하였다.

확률적 투표기반 여과기법에서 가변적 환경을 위한 퍼지 기반 검증 노드 결정 기법 (Fuzzy based Verification Node Decision Method for Dynamic Environment in Probabilistic Voting-based Filtering Scheme)

  • 이재관;남수만;조대호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.11-13
    • /
    • 2013
  • 무선 센서 네트워크는 개방된 환경에서 무작위로 배치되어 악의적인 공격자들에게 쉽게 노출된다. 센서 노드는 한정된 에너지 자원과 손쉽게 훼손된다는 단점을 통해 허위 보고서와 투표 삽입 공격이 발생한다. Li와 Wu는 두 공격을 대응하기 위해 확률적 투표기반 여과기법을 제안하였다. 확률적 투표기반 여과기법은 고정적인 검증 경로를 결정하기 때문에 특정 노드의 에너지 자원고갈 위험이 있다. 본 논문에서는 센서 네트워크에서 보고서 여과 확률 향상을 위하여 퍼지 시스템을 기반으로 다음 노드 선택을 약 6% 효율적인 경로 선택 방법을 제안한다. 제안 기법은 전달 경로 상의 노드 중 상태정보가 높은 노드를 검증 노드로 선택하고, 선택된 검증 노드는 허용 범위 경계 값을 기준으로 공격 유형을 판별하고 여과한다. 실험결과를 통해 제안기법은 기존기법과 비교하였을 때 에너지 효율이 향상되었다.

  • PDF

콜 센터 시스템의 개선된 콜 전략 (A Enhanced Call Strategy for Call Center System)

  • 최동연;이석주;서경룡
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.532-535
    • /
    • 2003
  • 아웃바운드(Outbound) 형 콜 센터는 서비스 지향의 인바운드(Inbound) 형 콜 센터와는 달리 전화를 거는 주체가 고객에게 접촉하고자 하는 목적을 뚜렷하게 가진 상태에서 제품 또는 서비스, 정보제공 등을 전화나 기타 커뮤니케이션 채널을 통해 전달하는 업무를 담담한다. 본 논문에서는 아웃바운드 형 콜 센터 시스템을 예측 다이얼링(Predictive Dial Ing) 방식에 기반하여 개선된 콜 전략을 제안한다 개선된 콜 전략은 콜 센터 업무의 중심 역할인 콜링 리스트(Call ing List)를 데이터 추출 모듈을 사용하여 테이블로 구성한 뒤, 시간 활용을 통한 효율적 대응과 다양한 고객들의 정보를 바탕으로 고객과의 접촉확률을 증가시킬 수 있다.

  • PDF

비정규 혼합분포에서의 최적분류점 (Optimal Thresholds from Non-Normal Mixture)

  • 홍종선;주재선
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.943-953
    • /
    • 2010
  • 신용평가연구에서 확률변수 스코어와 정상과 부도상태의 모수공간으로 정의된 혼합분포에서 확률밀도함수의 관계식으로 최적분류점을 추정하고 이에 대응하는 오류합의 크기를 비교하는 연구가 정규분포의 가정하에 이루어져있는데 본 연구에서는 비정규분포인 와이블, 로지스틱 그리고 감마분포로 확장하여 가설검정을 이용하는 방법과 전체정확도와 진실율을 최대화하는 방법에 의한 최적분류점을 각각 구하고 최적분류점에 대응하는 제I종과 제II종 오류합의 크기를 비교하여 효율성을 비교 토론한다.

비대칭적 정보와 협상지연 (Asymmetric Information and Bargaining Delays)

  • 최창곤
    • 한국산학기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.1683-1689
    • /
    • 2013
  • 협상과정을 Markov 확률과정으로 전제하고 확률과정의 상태별 이행확률의 크기가 협상참가자의 사적인 정보에 의하여 결정된다고 가정한다. 예를 들어, 판매자와 구매자의 가격협상의 예에서 협상상대방의 특징-예를 들어, 유보가격-에 대한 정보가 사적인 정보일 때 협상참가자 모두가 수용가능한 가격을 찾는 과정이 이행확률의 크기에 영향을 받고, 결과적으로 협상지연의 정도를 결정함을 보인다. 또한 협상의 참가자가 모두 교대로 제안을 하는 제안과 대응제안의 방법의 협상에서보다 협상참가자중 어느 한 쪽의 일방에서 제안을 하는 방법의 협상에서 협상지연이 더욱 길어짐을 보인다.

심층혼합처리지반에 설치된 안벽의 신뢰성해석(Part I: 개량지반의 외부안정) (Reliability Analysis of a Quay Wall Constructed on the Deep-Cement-Mixed Ground(Part I: External Stability of the Improved Soil System))

  • 허정원;박옥주;김영상;허동수
    • 한국해안·해양공학회논문집
    • /
    • 제22권2호
    • /
    • pp.79-87
    • /
    • 2010
  • 이 논문은 특수기초에 설치된 안벽의 외부 및 내부 안정성에 대한 신뢰성분석을 각각 다룬 2편의 연속 논문 중 첫 번째 논문이다. 이 논문에서는 심층혼합처리지반-안벽 시스템의 외부안정성에 대한 정량적 위험도를 평가할 수 있는 실용적인 신뢰성해석기법을 새로이 제안하였다. 제안된 기법은 다양한 설계변수들의 불확실성을 명확하게 고려할 수 있다. 외부안정성에 대한 위험도평가를 위해 개량지반-안벽의 활동, 전도 및 지지력 파괴모드에 대응하는 한계상태함수를 2차 확률변수 개념을 도입하여 명확히 정의하였다. 기본 확률변수와 2차 확률변수로 명확히 표현되는 세 한계상태함수에 대하여 대표적 신뢰성기법인 MVFOSM, FORM 및 MCS를 사용하여 파괴확률을 산정하였다. 해석결과로부터 3가지 방법은 일관된 파괴확률을 제공하고, 지진시 활동 파괴모드가 가장 위험한 파괴모드로 밝혀졌다. 또한 동적토압의 위상차를 고려한 신뢰성해석으로부터 위상차 파라메타의 평균과 분산이 파괴확률에 큰 영향을 미치는 것으로 판명되었다.

Chiu 유속분포공식의 하상경사가 변화는 실험실 수로에 적용성 분석 (Application of Chiu's Velocity Distribution Equation to Laboratory Channel with Varied Channel Slope)

  • 추태호;옥치율;제성진;이승관
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 춘계학술발표논문집
    • /
    • pp.99-103
    • /
    • 2007
  • 정확하고 신뢰성 높은 유량 자료는 수자원의 정량적인 계획과 관리에 필수적이다. 이를 위하여 Chiu는 기존의 결정론적인 흐름 방향 유속분포식의 한계를 극복할 수 있는 방법으로 확률통계에서 사용되는 엔트로피 개념을 이용한 3차원 유속분포 식을 제안하였고, 이를 실험실 데이터와 자연하천에 적용하여 신뢰성과 정확성을 지속적으로 증명하여 마침내 이에 대한 활용성이 매우 크게 대두되어 Chiu의 유속공식을 적극적으로 사용하고 있는 실정이다. 그러나 지금까지 이론적인 유속 분포식을 검증하기 위하여 단면 형상이 일정한 직사각형이나 사다리꼴 동의 실험수로에서부터 불규칙한 단면 형상을 갖는 자연 하천에 대한 적용을 거의 이루고 있는 실정이나, 하상경사가 변하는 경우에도 엔트로피 파라미터(M)가 이에 대응하여 평형상태에 도달하려고 하는지에 대한 연구는 전무하다. 본 연구에서는 하상경사를 임의로 변경 가능한 실험수로를 선택하여 정밀법에 의한 유속측정을 실시하였다. 같은 지점의 같은 단면에서 하상경사(${\Theta}$)가 0.000935부터 0.025794까지 28번의 경사변화를 주고 각 경사마다 유량을 측정하여 28개의 유량측정 데이터를, Chiu의 엔트로피 유속공식에 적용하여, 평균유속과 최대유속 사이의 관계가 선형관계, 즉 하상경사가 변하는 경우에도 엔트로피 파라미터(M)가 이에 대응하여 평형상태에 도달함을 증명하였다.

  • PDF