• 제목/요약/키워드: reward strategy

검색결과 91건 처리시간 0.024초

퍼지 추론 기반의 멀티에이전트 강화학습 모델 (Multi-Agent Reinforcement Learning Model based on Fuzzy Inference)

  • 이봉근;정재두;류근호
    • 한국콘텐츠학회논문지
    • /
    • 제9권10호
    • /
    • pp.51-58
    • /
    • 2009
  • 강화학습은 최적의 행동정책을 구하는 최적화 문제로 주어진 환경과의 상호작용을 통해 받는 보상 값을 최대화하는 것이 목표이다. 특히 단일 에이전트에 비해 상태공간과 행동공간이 매우 커지는 다중 에이전트 시스템인 경우 효과적인 강화학습을 위해서는 적절한 행동 선택 전략이 마련되어야 한다. 본 논문에서는 멀티에이전트의 효과적인 행동 선택과 학습의 수렴속도를 개선하기 위하여 퍼지 추론 기반의 멀티에이전트 강화학습 모델을 제안하였다. 멀티 에이전트 강화학습의 대표적인 환경인 로보컵 Keepaway를 테스트 베드로 삼아 다양한 비교 실험을 전개하여 에이전트의 효율적인 행동 선택 전략을 확인하였다. 제안된 퍼지 추론 기반의 멀티에이전트 강화학습모델은 다양한 지능형 멀티 에이전트의 학습에서 행동 선택의 효율성 평가와 로봇축구 시스템의 전략 및 전술에 적용이 가능하다.

전략, 경영통제시스템, 기업성과와 관리회계담당자 역할의 관계에 대한 연구 (The Empirical Study on Interrelationship between Strategy, MCS, Corporate's Performance and Role of Controller)

  • 손우진
    • 한국융합학회논문지
    • /
    • 제6권5호
    • /
    • pp.303-314
    • /
    • 2015
  • 본 연구는 중 소 섬유제조기업을 중심으로 전략실행과 MCS의 활용에 따른 기업성과와의 관계를 살펴보고자 한다. 특히 본 연구의 차별성이라고 할 수 있는 관리회계담당자 역할의 영향력을 분석하는데 목적이 있다. 연구 모형을 검증하기 위하여 한국의 중 소 섬유제조기업을 대상으로 255개의 설문지를 최종 표본으로 하여 구조방정식모형을 활용하였으며, 이를 위해 AMOS ver 18.0을 사용하였다. 연구결과 원가리더십전략과 차별화전략은 MCS 이용에 긍정적 영향을 미치고 기업성과에 직접적인 영향을 미치지 못하였다. MCS 이용은 기업의 비재무적성과에 긍정적인 영향을 미친다. 차별화전략은 MCS의 이용을 매개로 기업성과에 긍정적 영향을 미치고 원가리더십전략은 기업성과에 영향을 미치는 과정에서 MCS의 이용의 매개효과는 없다. 기업전략, 경영통제시스템의 이용, 기업성과간에 관리회계담당자의 역할수준이 조절변수로서의 효과가 있다.

수강태도를 매개변인으로 한 셀프리더십전략이 IT과목 러닝성과에 미치는 영향: 사회과학분야 학습자중심 (A Study on the Influence between Self-leadership Strategies and Learning Performance at IT Classes mediated by Attitude of Attendance: focused on the Social Science Students in University)

  • 박기호;김연정
    • 디지털융복합연구
    • /
    • 제8권4호
    • /
    • pp.1-17
    • /
    • 2010
  • 리더십과 관련한 연구들은 주로 경영학 분야뿐만 아니라 산업심리 혹은 심리학분야에서도 많은 관심을 보이는 연구 분야다. 종래의 리더십은 조직 내 경영진이나 팀리더 등의 조직책임자들에게 강조되는 개념이었다. 그러나 최근에는 개인의 자유의지를 스스로 통제 혹은 관리하여 자신의 행동을 바람직한 방향으로 이끌고자 하는 셀프리더십(self-leadership)관련 연구에 학계, 산업계의 관심이 모아지고 있다. 본 연구는 정보기술(information technology) 및 엔지니어링 과목을 수강한 학부재학생들의 셀프리더십 전략이 수강태도에 영향을 마치는지, 수강태도가 매개변인의 역할을 하여 학업성과에 어떤 영향을 미치는 지를 연구하였다. 연구 결과는 조직 구성원 혹은 학생들의 센프리더십을 고양함으로써 과업에 임하는 태도나 수업에 임하는 바람직한 태도를 제시하여 기업 생산성이나 학업성과를 촉진할 수 있는 방안수립에 시사점을 줄 수 있을 것이다.

  • PDF

뉴미디어-정보화 정책과 개발주의 패러다임의 문제 (New Media-Informatization Policy and Problems of Developmentalism in Korea)

  • 김평호
    • 한국언론정보학보
    • /
    • 제36권
    • /
    • pp.231-253
    • /
    • 2006
  • IT 기술의 성장에 기초한 우리 사회의 각종 뉴미디어의 개발과 도입의 속도, 보급과 서비스의 확산정도 등은 국제적 관심을 주도할 만큼 폭발적이다. 한편 국가 정보화 차원에서 강력한 정책 드라이브를 바탕으로 추진된 정보 인프라의 확대 역시 그에 못지않다. 그러나 문제는 뉴미디어-정보화 정책이 추구하는 산업경제적 가치창출, 사회문화적 가치창출, 지식기반의 확충을 통한 지식사회/지식국가의 토대구축이라는 정책목표가 '사회의 질적 발전(quality development of society)'보다는 '기술과 산업의 양적 성장(quantity growth of industry and technology)'이라는 편향적 형태로 진전되고 있다는 것이다. 이는 개별 정책의 결과이기도 하지만 보다 근본적으로는 개발주의 패러다임(developmentalism)에 기초하고 있는 뉴미디어-정보화 정책의 구조적인 문제에서 비롯된 것이다. 이를 극복하기 위해서 우선적으로 요구되는 것은 '지식 IT 전략(knowledge IT strategy)'에 기초한 뉴미디어-정보화의 질적 발전, 즉 원천기술과 특허의 확보와 그를 통한 기술표준의 구축, 내용과 수준을 갖춘 콘텐츠의 계발, 사회적 지식 네트워크의 구성 등에 부합하는 정책 패러다임으로의 전환이다.

  • PDF

과학기술자 커뮤니티 사이트를 위한 구전홍보 전략 연구 (A Study on Viral Marketing Strategy for Community Website of Scientists and Engineers)

  • 정혜주;윤정선
    • 정보관리연구
    • /
    • 제43권2호
    • /
    • pp.151-168
    • /
    • 2012
  • 구전홍보는 여러 분야에 있어서 효율적인 마케팅 수단으로 활용되어오고 있다. 본 논문에서는 과학기술자 커뮤니티 사이트(www.kosen21.org)의 운영에 구전홍보 전략을 적용해보았다. 회원들이 손쉽게 홍보메일을 발송하고 홍보 브로셔를 배포할 수 있도록 프로그램을 개발하였으며, 구전홍보에 적극 참여한 회원들에 대한 보상책을 마련하였다. 분석 결과 회원들은 마일리지 적립, 상품권 제공과 같은 보상 전략에 긍정적으로 반응하며, 충성회원이 구전홍보에도 적극적으로 참여한다는 것을 알 수 있었다. 단기적이며 즉각적인 반응을 위해서는 이벤트 실시가 효과적이며, 장기적이며 지속적인 반응을 위해서는 충성회원 관리가 효과적이라는 것도 알 수 있었다. 본 논문의 구전홍보 전략과 분석결과는 인터넷 서비스의 운영과 전략 수립에 활용될 수 있으리라 기대된다.

소모로서의 궁핍: 베케트의 빈궁문학 (Destitution as an Expenditure: Beckett's Literature of Poverty)

  • 박일형
    • 영미문화
    • /
    • 제10권2호
    • /
    • pp.73-97
    • /
    • 2010
  • Representation of destitution may be considered as an expression of a social desire toward forging a bond or solidarity with the impoverished. However, political and ethical demands of the solidarity force the formulaic framework structuring the form of representation to its limits. The thesis aims to examine the responses to such demands within the tradition of modernist literature that can be traced from Charles Baudelaire, Knut Hamsun to Franz Kafka and that somehow culminates with Samuel Beckett, and to analyze how the issue of destitution that weaves through Beckett's works criticizes and inherits such a heritage. Whereas destitution in 19th century Realism is structurally fixed and its potential for change is inherently excluded, for these writers, destitution is no longer the state of rigid reality in which any possibility is limited. It is destitution as an imperative that calls for exploitation of possibilities that can be recuperated from the impoverished condition of destitution. What these writers consistently resist against is destitution that leads to compensation and reward. Since occupying a superior position toward the other as the subject of description or sympathy can be seen as one form of profit or reward, they have persistently pursued absolute solitariness and austere conditions rather than prematurely simulating a sense of solidarity and community. The ultimate goal of destitution as an imperative is to pursue destitution in order to worsen it by identifying and then excluding and expending possessions and assets to a state of penury. This is a paradoxical process that opens up the realm of possibilities of destitution and redefines it as abundance and wealth. Destitution for Beckett as seen in the writers above is the objective of literature. But, what he focuses on is to amplify the shreds of economic world that still remain in a state of poverty and to reveal extreme poverty as a state of odd affluence and to transform it into a pursuit of accumulation and profit. One of his famous axioms, "less is more", contains the essence of such a paradoxical strategy. In a sense, such approach is a twist on the strategy that identifies and uses any remaining potential hidden in destitution as was pursued by other writers. It also expands on the imagination of the destitute described by Hamsun. But Hamsun and Beckett are diametrical opposites. Unlike Hamsun, Beckett does not link imagination with a sense of guilt. Imagination is not intended to overcome the destitute reality nor to culminate in artistic martyrdom as in the case of Kafka's hunger artist. The imagination of the impoverished in Beckett is simply a hilarious game and not an escape that ends in a sense of guilt. This game formulates a "rhetorical question" or derision at the ironical situation where the pursuit of hunger and art as the disinterestedness has been turned into symbolic capital. It is inherently a fundamental critique at the aestheticization of destitution that has been pursued by Modernism. Beckett's efforts at divulging falsehood inherent in non-profit acts such as charity, donation and hospitality are dissections of social fictions in which aestheticization of destitution remains a part of the whole.

실시간 장애물 회피 자동 조작을 위한 차량 동역학 기반의 강화학습 전략 (Reinforcement Learning Strategy for Automatic Control of Real-time Obstacle Avoidance based on Vehicle Dynamics)

  • 강동훈;봉재환;박주영;박신석
    • 로봇학회논문지
    • /
    • 제12권3호
    • /
    • pp.297-305
    • /
    • 2017
  • As the development of autonomous vehicles becomes realistic, many automobile manufacturers and components producers aim to develop 'completely autonomous driving'. ADAS (Advanced Driver Assistance Systems) which has been applied in automobile recently, supports the driver in controlling lane maintenance, speed and direction in a single lane based on limited road environment. Although technologies of obstacles avoidance on the obstacle environment have been developed, they concentrates on simple obstacle avoidances, not considering the control of the actual vehicle in the real situation which makes drivers feel unsafe from the sudden change of the wheel and the speed of the vehicle. In order to develop the 'completely autonomous driving' automobile which perceives the surrounding environment by itself and operates, ability of the vehicle should be enhanced in a way human driver does. In this sense, this paper intends to establish a strategy with which autonomous vehicles behave human-friendly based on vehicle dynamics through the reinforcement learning that is based on Q-learning, a type of machine learning. The obstacle avoidance reinforcement learning proceeded in 5 simulations. The reward rule has been set in the experiment so that the car can learn by itself with recurring events, allowing the experiment to have the similar environment to the one when humans drive. Driving Simulator has been used to verify results of the reinforcement learning. The ultimate goal of this study is to enable autonomous vehicles avoid obstacles in a human-friendly way when obstacles appear in their sight, using controlling methods that have previously been learned in various conditions through the reinforcement learning.

멀티 에이전트 강화학습 기술 동향 (A Survey on Recent Advances in Multi-Agent Reinforcement Learning)

  • 유병현;데브라니 데비;김현우;송화전;박경문;이성원
    • 전자통신동향분석
    • /
    • 제35권6호
    • /
    • pp.137-149
    • /
    • 2020
  • Several multi-agent reinforcement learning (MARL) algorithms have achieved overwhelming results in recent years. They have demonstrated their potential in solving complex problems in the field of real-time strategy online games, robotics, and autonomous vehicles. However these algorithms face many challenges when dealing with massive problem spaces in sparse reward environments. Based on the centralized training and decentralized execution (CTDE) architecture, the MARL algorithms discussed in the literature aim to solve the current challenges by formulating novel concepts of inter-agent modeling, credit assignment, multiagent communication, and the exploration-exploitation dilemma. The fundamental objective of this paper is to deliver a comprehensive survey of existing MARL algorithms based on the problem statements rather than on the technologies. We also discuss several experimental frameworks to provide insight into the use of these algorithms and to motivate some promising directions for future research.

An Acquisition of Strategy in Two Player Game by Coevolutionary Agents

  • Kushida, Jun-ichi;Noriyuki Taniguchi;Yukinobu Hoshino;Katsuari Kamei
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.690-693
    • /
    • 2003
  • The purpose of two player game is that a player beats an enemy. In order to win to various enemies, a learning of various strategies is indispensable. However, the optimal action to overcome the enemies will change when the game done over and again because the enemy's actions also change dynamically. Sol it is din-cult that the player aquires the optimal action and that the specific player keeps winning to various enemies. Species who have a competition relation and affect other's existence is called a coevolution. Coevolution has recently attracred considerable interest in the community of Artificial Life and Evolutionary Computation(1). In this paper, we apply Classifier System for agent team to two player game. A reward and a penalty are given to the used rules when the agent achieve specific action in the game and each team's rulebase are evaluated based on the ranking in the league. We show that all teams can acquire the optimal actions by coevolution.

  • PDF

지식경영의 조직요인, CRM의 시스템요인, 신뢰가 CRM의 성과에 미치는 영향에 관한 연구 (A Study of the Organizational Factors of Knowledge Management, CRM System Factors, and Trust for CRM Performances)

  • 이현수;서영호
    • 경영정보학연구
    • /
    • 제5권1호
    • /
    • pp.113-127
    • /
    • 2003
  • 본 연구는 지식경영의 조직요인, CRM의 시스템요인, 신뢰요인이 CRM의 성과에 어떠한 영향을 미치는지를 확인하는데 연구의 목적이 있다. 분석결과를 보면 국내기업은 고객과의 관계에서 신뢰를 가장 중요하게 여기고 있음을 알 수 있다. 그 다음으로는 지식지향적 조직문화/특성이 중요도가 높은 것으로 나타나 국내 기업은 고객과의 관계에서 조직의 변화가 중요하며 조직의 문화를 대변하는 구성원이나 조직 의 특성에 따라 고객관리에서의 성과의 차이를 보일 수 있다는 것으로 해석할 수 있다. 마지막으로 고객과의 연결의 역할을 하는 정보기술을 중요시 여기고 있어 고객관계관리를 성공적으로 이끌기 위해 국내기업은 신뢰와 기업의 변화, 고객 연결기술에 중점을 두고 있음을 미루어 짐작할 수 있다.