• 제목/요약/키워드: 강화도

검색결과 19,406건 처리시간 0.043초

탐색 강화 계층적 강화 학습 (Hierachical Reinforcement Learning with Exploration Bonus)

  • 이승준;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.151-153
    • /
    • 2001
  • Q-Learning과 같은 기본적인 강화 학습 알고리즘은 문제의 사이즈가 커짐에 따라 성능이 크게 떨어지게 된다. 그 이유들로는 목표와의 거리가 멀어지게 되어 학습이 어려워지는 문제와 비 지향적 탐색을 사용함으로써 효율적인 탐색이 어려운 문제를 들 수 있다. 이들을 해결하기 위해 목표와의 거리를 줄일 수 있는 계층적 강화 학습 모델과 여러 가지 지향적 탐색 모델이 있어 왔다. 본 논문에서는 이들을 결합하여 계층적 강화 학습 모델에 지향적 탐색을 가능하게 하는 탐색 보너스를 도입한 강화 학습 모델을 제시한다.

  • PDF

Cyclic FGS 기반에서 개선된 FMO를 통한 화질 개선 (Advanced FMO for ROI enhancement of the Cyclic-FGS)

  • 이경일;박광훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.853-855
    • /
    • 2005
  • 현재 표준화가 진행중인 SVC(Scalable Video Codec)에는 기존의 FGS방법이 아닌 Cyclic-FGS를 사용하여 영상을 강화하고 있다. 이 Cyclic-FGS 블록간에 Stocking Effect를 줄일 수 있고 넓은 영역을 강화할 수 있다는 장점이 있다. 하지만 널은 영역을 강화하기 때문에 기존의 FGS와 달리 ROI를 강화하는데는 적합하지 않다. 따라서 본 논문에서는 Cyclic-FGS에 적합한 새로운 Ordering 방법을 제안한다. 이 방법을 사용하면 기존의 FGS에서 사용한 Bit-shift방법을 사용하지 않고도 비슷한 효과를 낼 수 있으며, 우리가 원하는 ROI를 강화시킬 수 있다. ROI를 중점적으로 강화를 하다 보면 전체 영상에 대한 화질은 떨어질 수 있다. 그러나 두 가지 모드를 두어서 중점강화 또는 전체영상과 비교해 화질열화가 거의 없는 강화를 할 수 있게 하였다.

  • PDF

효율적인 멀티 에이전트 강화학습을 위한 RBFN 기반 정책 모델 (RBFN-based Policy Model for Efficient Multiagent Reinforcement Learning)

  • 권기덕;김인철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.294-302
    • /
    • 2007
  • 멀티 에이전트 강화학습에서 중요한 이슈 중의 하나는 자신의 성능에 영향을 미칠 수 있는 다른 에이전트들이 존재하는 동적 환경에서 어떻게 최적의 행동 정책을 학습하느냐 하는 것이다. 멀티 에이전트 강화 학습을 위한 기존 연구들은 대부분 단일 에이전트 강화 학습기법들을 큰 변화 없이 그대로 적용하거나 비록 다른 에이전트에 관한 별도의 모델을 이용하더라도 현실적이지 못한 가정들을 요구한다. 본 논문에서는 상대 에이전트에 대한RBFN기반의 행동 정책 모델을 소개한 뒤, 이것을 이용한 강화 학습 방법을 설명한다. 본 논문에서는 제안하는 멀티 에이전트 강화학습 방법은 기존의 멀티 에이전트 강화 학습 연구들과는 달리 상대 에이전트의 Q 평가 함수 모델이 아니라 RBFN 기반의 행동 정책 모델을 학습한다. 또한, 표현력은 풍부하나 학습에 시간과 노력이 많이 요구되는 유한 상태 오토마타나 마코프 체인과 같은 행동 정책 모델들에 비해 비교적 간단한 형태의 행동 정책 모델을 이용함으로써 학습의 효율성을 높였다. 본 논문에서는 대표적이 절대적 멀티 에이전트 환경인 고양이와 쥐 게임을 소개한 뒤, 이 게임을 테스트 베드 삼아 실험들을 전개함으로써 제안하는 RBFN 기반의 정책 모델의 효과를 분석해본다.

  • PDF

2-stage 마르코프 의사결정 상황에서 Successor Representation 기반 강화학습 알고리즘 성능 평가 (Evaluating a successor representation-based reinforcement learning algorithm in the 2-stage Markov decision task)

  • 김소현;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.910-913
    • /
    • 2021
  • Successor representation (SR) 은 두뇌 내 해마의 공간 세포가 인지맵을 구성하여 환경을 학습하고, 이를 활용하여 변화하는 환경에서 유연하게 최적 전략을 수립하는 기전을 모사한 강화학습 방법이다. 특히, 학습한 환경 정보를 활용, 환경 구조 안에서 목표가 변화할 때 강인하게 대응하여 일반 model-free 강화학습에 비해 빠르게 보상 변화에 적응하고 최적 전략을 찾는 것으로 알려져 있다. 본 논문에서는 SR 기반 강화학습 알고리즘이 보상의 변화와 더불어 환경 구조, 특히 환경의 상태 천이 확률이 변화하여 보상의 변화를 유발하는 상황에서 어떠한 성능을 보이는 지 확인하였다. 벤치마크 알고리즘으로 SR 의 특성을 목적 기반 강화학습으로 통합한 SR-Dyna 를 사용하였고, 환경 상태 천이 불확실성과 보상 변화가 동시에 나타나는 2-stage 마르코프 의사결정 과제를 실험 환경으로 사용하였다. 시뮬레이션 결과, SR-Dyna 는 환경 내 상태 천이 확률 변화에 따른 보상 변화에는 적절히 대응하지 못하는 결과를 보였다. 본 결과를 통해 두뇌의 강화학습과 알고리즘 강화학습의 차이를 이해하여, 환경 변화에 강인한 강화학습 알고리즘 설계를 기대할 수 있다.

강화 이론에 근거한 교사 보조 로봇 인터랙션 디자인에 관한 연구 - 로봇에 대한 인상과 선호도 측정을 중심으로 - (The Interaction Design of Teaching Assistant Robots based on Reinforcement Theory - With an Emphasis on the Measurement of the Subjects' Impressions and Preferences -)

  • 곽소나;이동규;이민구;한정혜;김명석
    • 디자인학연구
    • /
    • 제20권3호
    • /
    • pp.97-106
    • /
    • 2007
  • 본 연구는 교사의 교수 방식에서 효과적으로 사용되는 행동주의 학습이론 중 강화 이론이 교사 보조 로봇에도 효과적으로 적용되는지를 검토하는 데 그 목적이 있다. 피험자내 설계 실험(n=36)으로 성적유형에 따른 우등, 열등 피험자가 강화 유형에 따른 세 가지 로봇의 인터랙션(2*3)을 경험케 했다. 즉, 강화이론과 토큰강화 방식에 기초해 '정적 강화'를 제공하는 로봇('칭찬이'), '부적 강화'를 제공하는 로봇('엄벌이'), '정적 강화'와 '부적 강화'를 모두 제공하는 로봇('상벌이')의 인터랙션을 디자인하고 로봇유형과 피험자의 성적유형에 따른 학생들의 로봇에 대한 인상 및 선호도를 알아보았다. 결과적으로 학생들은 정적 강화를 제공하는 로봇을 가장 선호하고, 부적 강화를 제공하는 로봇을 가장 덜 선호함이 검증되었다. 또한, 강화의 자극을 디자인함에 있어서는 우등 학생에게 부적 강화를 제공하는 로봇에서 로봇이 주는 자극수가 낮을수록 로봇에 대한 긍정적 인상이 증가함을 알 수 있었다. 본 연구 결과는 강화 유형에 따른 학생들의 교사 보조 로봇에 대한 인상 및 선호도를 검증하며, 교사 보조 로봇의 인터랙션 디자인에 효과적인 가이드라인으로 적용될 수 있을 것으로 기대된다.

  • PDF

네브라 사암의 강화처리에 미치는 염의 영향 (Influence of Salts on Consolidation of Nebra Sandstone)

  • 도진영
    • 보존과학회지
    • /
    • 제18권
    • /
    • pp.89-96
    • /
    • 2006
  • 염을 함유하고 있는 석조문화재들의 표면층은 대부분 매우 약한 상태이기 때문에 강화처리가 필요하다. 이제까지의 연구들은 강화제의 침투깊이와 강화제가 손상된 조직의 역학적 안정성에 끼치는 영향에 대해 주로 다루었다. 그러나 염을 함유한 석조문화재에 에틸실리케이트를 기반으로 한 강화제를 처리했을 때 성공적이지 못한 결과가 보이고 있다. 본 연구에서는 염이$(CaSO_4\;2H_2O,\;NaNO_3)$ 손상된 석조문화재의(Nationalgalerie, Berlin, Germany) 강화효과에 미치는 영향을 살펴보기 위해서 사암시료를 염용액에 담구어 함염처리를 시킨 후에 에틸실리 케이트를 기반으로 하는 강화제를 함침시켰다. 연구결과, 석조문화재가 함유하고 있는 염들은 암석 내의 공극을 채움으로 해서 강화제가 내부로 충분히 들어가지 못하는 차단작용을 하는 것으로 밝혀졌다. 네브라 사암으로 구성된 Nationalgalerie 건물의 강화처리에 에틸실리케이트 계열의 강화제를 사용하고자 한다면 우선 표면오염층에 함유되어 있는 높은 함량의 염을 줄이거나 없애는 작업을 강화처리 전에 선행하여야만 효율적인 강화효과를 거둘 수 있을 것이다. 염을 함유하고 있는 석조문화재를 손상을 악화시키지 않고 강화시키기 위해서는 우선 정확한 염을 파악하여 그 위해성 여부를 고려하고, 암석, 염과 강화제의 상관관계를 시험한 후 적절한 강화제와 사전처리법을 찾는 일련의 선행연구가 필수적이다.

  • PDF

입력강화와 출력강화 형태초점교수 상황에서의 한국 EFL 학습자들의 언어형태 지식개발에 관한 연구 (A Study on the Korean EFL Learners' Grammatical Knowledge Development under Input-enhanced FFI and Output-enhanced FFI Conditions)

  • 황희정
    • 디지털융복합연구
    • /
    • 제16권5호
    • /
    • pp.435-443
    • /
    • 2018
  • 본 연구의 목적은 형태초점교수법이 학습자의 언어형태에 관한 지식 향상에 미치는 영향을 조사하고, 학습자들이 그 형태에 관한 지식을 출력활동인 글쓰기에 어떻게 활용하는지를 살펴보는 것이다. 연구참여자들은 122명의 대학생들로 3개의 집단 즉 입력강화집단 35명, 출력강화집단 41명, 대조집단 46명으로 나누어 평가시험과 글쓰기 과제를 사전 사후로 실시하였다. 연구결과를 살펴보면, 입력강화 형태초점교수법과 출력강화 형태초점교수법 모두 학습자의 언어형태 학습에 영향을 미치는 것으로 드러났고, 학습자들이 이러한 형태초점교수법으로 습득한 지식을 영어글쓰기에 활용하는데 기여한 것으로 나타났다. 본 연구결과에 의거하여, 학습자의 언어형태 학습의 효과를 극대화할 수 있는 방법으로 입력강화와 출력강화기법을 적절하게 결합한 형태초점교수법을 적용할 것을 제안한다.

중국 공기청정 현황 - 중국의 환경규제 강화와 우리 기업의 대응

  • 한국무역협회 상해지부
    • 공기청정기술
    • /
    • 제28권1호
    • /
    • pp.29-40
    • /
    • 2015
  • 중국의 급속한 산업화로 대기, 수질, 폐기물 등 환경오염문제가 심화, 고착화되면서 이를 개선하기 위해 중국 정부는 환경규제를 지속적으로 강화하고 있다. 또한 외국인 투자유치로 제조업 육성에 어느 정도 성공을 거둠에 따라 외국인 투자 유치와 제조업 경영활동에 있어 환경 이슈를 매우 중요시하고 있어 신규 및 사업확장에 제동이 걸리고 있다. 중국은 신규법인수 기준으로 우리나라의 최대 해외직접투자국이며, 제조업종에 대한 투자금액이 전체 투자금액의 88.3%를 차지하고 있다. 중국에 진출한 기업들은 중소기업이 전체 진출기업의 약 90%로 중국의 환경규제 강화는 중국에 진출한 우리 중소기업들에게 직접적인 영향을 미치고 있다. 중국 정부는 분야별 환경목표를 강화하고 오염물질배출 업체를 퇴출시키는 등 강력한 조치를 전개하고 있으며, 중앙 정부의 환경목표 강화 기조와 더불어 해당 지역민의 친환경에 대한 요구가 점차 커짐에 따라, 각 지방정부는 환경 관련 지역 목표 달성을 위해 업체 관리감독을 대폭 강화하고 있는 추세이다. 이러한 중국의 환경규제 강화는 진출 기업이나 진출을 준비하는 기업들의 설비투자비나 오염배출비용 부담 증가 등 상당한 리스크로 작용하고 있으며 향후에도 중국의 환경규제 강화 기조는 지속될 것으로 전망된다. 실제 중국에 진출한 기업들은 환경규제를 직접적으로 체감하고 있다. 규제집행의 강도가 눈에 띄게 높아져 엄격한 기준을 적용받고 처벌수위 역시 높아졌으며, 과거 관시를 통해 원만한 해결이 가능했다면 이제는 환경규제에 대해 원칙적이고 보수적인 공무원의 태도로 인해 관시로도 해결이 어려운 경우가 다반사이다. 또한, 주민들도 환경규제에 대한 인식수준이 높아짐에 따라 미미한 사안에도 즉각적인 반응을 보여 민원제기 사례가 빈번히 발생하고 환경안전 기준이 점점 높아짐에 따라 이에 대응하기 위해 환경안전 설비추가, 친환경연료 사용 등 추가적인 비용이 발생하고 있다. 이에 이미 진출한 기업들은 소재지 환경규제의 강화 전망 및 이로 인한 손실정도를 사전에 파악하고 다양한 옵션에서 대응전략을 마련해야 하며, 향후 중국 진출계획을 가지고 있는 기업들은 진출에 앞서 지역별로 차별화된 시장기회와 환경규제 강도 등 현지 실사를 통한 현장중심 리스크 분석을 실시해야 한다. 또한 이미 진출한 기업 및 진출예정 기업 모두 환경규제가 강화되고 있는 중국에서 사업을 하기 위해서는 법규와 기본원칙을 반드시 준수하고 규제가 더 강화될 것 이라는 기조를 인식할 필요가 있다.

  • PDF

누적손상모델을 고려한 입자 강화 복합재료에 관한 해석 (Analysis of Particle-Reinforced Composites Incorporating Cumulative Damage)

  • 김봉래;이행기
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.18-20
    • /
    • 2009
  • 입자 강화 복합재료 내에서의 다양한 손상 메커니즘은 복합재료의 전체 거동을 예측에 상당한 영향을 미친다. 이에 본 연구에서는 입자 강화 복합재료 내에서의 누적 손상을 고려한 미세역학 기반 탄소성 모델(Kim and Lee, 2009)을 소개하고자 한다. Kim and Lee (2009)에 의해서 입자 강화 복합재료의 탄소성 모델을 위해 입자 강화 복합재료 내 계면에서의 누적 손상 및 기지재의 연성 거동이 고려되었다. 제안된 모델을 이용한 입자 강화 복합재료의 탄소성 거동 예측값은 관련된 실험값 (Llorca et al., 1991)과의 비교를 통해 수치해석을 수행하였다.

  • PDF

Rheo-compocasting과 Squeeze casting법에 의해 제조된 AI기 복합재료의특성 (A Characteristics of Al Matrix Composites Prepared by Rheo-compocasting and Squeeze Casting)

  • 서영식
    • 한국재료학회지
    • /
    • 제6권12호
    • /
    • pp.1199-1212
    • /
    • 1996
  • 본 연구는 주조성, 내압성, 내열성 등이 우수하여 군용 및 민수용 기계소재로 이용되고 있는 AI-Si-Mg계 AC4C 합금에 세라믹(AI2O3, AI2O3-TiC)을 강화시키는 복합재료제조에 관한 기초연구의 일환으로 수행하였다. 연구내용은 세라믹 강화재의 젖음성을 높이기 위하여 수소환원법에 의한 AI2O3입자의 Ni 피복과 기존의 프리폰 제조방법보다 간단하고 경제적인 자전연소합성법에 의해 AI2O3-TiC 다공성 pellet을 제조하여, 이들 강화재와 AC4C 기지금속을 이용하여 고대-compocasting 및 squeeze casting법으로 복합재료를 제조하고 미세조직, 계면생성물, 기계적 성질, 내마멸성 등의 특성을 조사하였다. 고대-compocasting법에 의해 제조된 AI2O3Ni 입자 강화 복합재료에서 강화재들은 응집체로 존재하지 않고 비교적 균일하게 분산되었고 AI2O3-TiC 강화재를 이용하여 squeeze casting으로 가압주조 하므로써 기지금속과 강화재의 젖음성이 향상되었다.

  • PDF