• 제목/요약/키워드: Reward System

검색결과 381건 처리시간 0.029초

태스크 선택정책에 기반을 둔 IRIS 태스크 스케줄링 알고리즘 (IRIS Task Scheduling Algorithm Based on Task Selection Policies)

  • 심재홍;최경희;정기현
    • 정보처리학회논문지A
    • /
    • 제10A권3호
    • /
    • pp.181-188
    • /
    • 2003
  • 본 논문에서는 IRIS(Increasing Reward with Increasing Service) 태스크들을 위한 기존 온-라인 최적 알고리즘에 근접한 총가치(total reward)를 생성하면서 보다 낮은 스케줄링 복잡도를 가진 휴리스틱(heuristic) 온-라인 스케줄링 알고리즘을 제안한다. 기존 알고리즘들은 총가치를 최대화하기 위해 시스템 내의 모든 태스크들을 스케줄링 대상으로 고려한다. 따라서 이들 알고리즘들은 많은 태스크들을 가진 실제 시스템에 적용하기에는 매우 놀은 시간 복잡도를 가진다. 제안 알고리즘은 시스템 내의 모든 태스크들을 대상으로 스케줄링하는 것이 아니라, 상수 W개의 태스크들을 선택하여 이들을 대상으로 스케줄링 한다. 제안 알고리즘은 W개의 태스크를 어떤 기준에 의해 선택할 것인가를 규정하는 테스크 선택정책에 기반을 두고 있으며, 간단하면서도 직관적인 두 가지 선택정책과 이 둘을 통합한 보다 일반화된 선택정책을 제안한다. 스케줄링 대상을 축소함으로써 제안 알고리즘의 복잡도를 O(Wn)로 줄일 수 있었다. 다양한 성능실험 결과 알고리즘 평균 계산 빈도는 O(W)에 더 가깝다는 것을 확인할 수 있었다.

스마트 제어알고리즘 개발을 위한 강화학습 리워드 설계 (Reward Design of Reinforcement Learning for Development of Smart Control Algorithm)

  • 김현수;윤기용
    • 한국공간구조학회논문집
    • /
    • 제22권2호
    • /
    • pp.39-46
    • /
    • 2022
  • Recently, machine learning is widely used to solve optimization problems in various engineering fields. In this study, machine learning is applied to development of a control algorithm for a smart control device for reduction of seismic responses. For this purpose, Deep Q-network (DQN) out of reinforcement learning algorithms was employed to develop control algorithm. A single degree of freedom (SDOF) structure with a smart tuned mass damper (TMD) was used as an example structure. A smart TMD system was composed of MR (magnetorheological) damper instead of passive damper. Reward design of reinforcement learning mainly affects the control performance of the smart TMD. Various hyper-parameters were investigated to optimize the control performance of DQN-based control algorithm. Usually, decrease of the time step for numerical simulation is desirable to increase the accuracy of simulation results. However, the numerical simulation results presented that decrease of the time step for reward calculation might decrease the control performance of DQN-based control algorithm. Therefore, a proper time step for reward calculation should be selected in a DQN training process.

경영자 능력이 보상수준 및 성과-보상 민감도에 미치는 영향 (Effect of Managerial Ability on Reward Level and Performance-Reward Sensitivity)

  • 변설원
    • 산업융합연구
    • /
    • 제21권2호
    • /
    • pp.9-16
    • /
    • 2023
  • 연구는 경영자 능력이 보상정책(보상수준 및 성과-보상 민감도)에 미치는 영향에 대해 분석하였다. 이를 위해 2012년부터 2019년까지 금융업을 제외한 코스피 및 코스닥 상장기업을 대상으로 최종 14,150 기업-연도 자료를 활용하였다. 실증분석 결과, 경영자 능력이 높을수록 차기 보상수준은 증가하지만(경영자 능력가설), 성과-보상 민감도는 감소하는 것으로 나타났다. 이는 경영자 능력과 보상 사이 양(+)의 관계를 통해 경영자 능력가설을 재확인하면서, 경영자 능력에 대한 높은 보상이 성과에 기인하기 보다는 성과 이외 경영자 능력에 대한 추가적인 보상일 수 있다는 점을 의미한다. 본 연구는 경영자 능력과 보상체계의 보다 복합적인 효과를 살펴보았다는 점에서 기존 연구와의 차별성 및 기여점을 가진다.

지식공유에 미치는 개인적·조직적 영향요인에 관한 연구 -대덕연구단지 연구개발 조직을 중심으로- (A Study on Individual and Organizational Factors Affecting Knowledge Sharing -Focused on The Research & Development Organization in Daedeok Science Town-)

  • 김동영;한인수
    • 지식경영연구
    • /
    • 제5권1호
    • /
    • pp.83-99
    • /
    • 2004
  • This research aims to verify individual and organizational factors that will affect knowledge sharing, especially in research & development organizations with a premise that knowledge sharing is one of the most important factors of successful knowledge management. Many factors which are supposed to affect knowledge sharing arc empirically investigated in this research : individual factors ((1)self esteem (2)expected contribution), organizational factors ((3)top management's will, (4)accessibility of knowledge management system (5)validity of evaluation & reward knowledge sharing, (6)trust, (7)open communication). As a result, it is found that 'expected contribution' among individual factors and 'open communication' and 'validity of evaluation & reward' among organizational factors are highly correlated with knowledge sharing. These findings suggest that enhancement of perceived expected contribution among employees and building cultures of open communication and effective evaluation & reward system for knowledge sharing will contribute to activation of knowledge sharing in the research and development organizations.

  • PDF

경영성과의 배분기준량 설정 (Selecting Reward Measure for Improved Business Results)

  • 이재권
    • 산업경영시스템학회지
    • /
    • 제19권37호
    • /
    • pp.117-125
    • /
    • 1996
  • The objective of this study is to select reward measure of improved business results. Ga-in sharing is defined as a compensation system that is designed In provide for variable compensation and to support an employee involvement process by rewarding the members of a group or organization for improvements in organizational performance. Gains, as measured by a predetermined formula, are shared with all eligible employees, typically through the payment of cash bonuses. Generally sales, profit value-added, cost reduction portion and otherthings have been used as gains, otherwise improved business results, without any proof which is correlated to productivity improvement. This paper suggests which business result is fit reward measure for each business types and sizes.

  • PDF

전문 연구기관에서의 지식경영 도입을 위한 지식 평가 및 보상 반응도 연구 (A Study on Response to Evaluation and Reward on Knowledge Sharing for Introducing Knowledge Management in the R&D Institute)

  • 유재복
    • 정보관리학회지
    • /
    • 제20권4호통권50호
    • /
    • pp.67-90
    • /
    • 2003
  • 지식경영을 도입함에 있어서 조직 구성원들의 자발적인 지식 공유활동을 활성화시키기 위해서는 무엇보다도 구성원들의 동기유발 방식을 변화시킬 필요가 있다. 이를 위해 지식 기여에 대한 공정한 평가와 적절한 보상체계의 수립은 매우 중요하다. 이 연구에서는 지식경영을 도입한 국내 기업체 및 전문 연구기관에서의 지식 기여에 따른 평가와 보상과 관련한 문헌분석 및 실제 사례분석을 토대로 지식 기여에 대한 바람직한 평가 및 보상 모형, 즉 가설을 설정하였다. 아울러 설정된 가설을 토대로 한국원자력연구소를 대상으로 설문조사를 실시함으로써 전문 연구기관에서의 지식 기여에 대한 평가 및 보상에 대한 구성원들의 반응도를 조사 분석하였다. 본 연구의 분석결과는 지식경영을 도입하고자 하는 전문 연구기관에서 매우 유용하게 활용될 수 있을 것으로 기대된다.

적응적 타임아웃 기반 전력관리 SRN 모델링 (Power Management SRN Modeling based on Adaptive Timeout)

  • 노철우;김경민
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.300-307
    • /
    • 2008
  • 전력관리는 전력상태 전환과 시스템 부하 (workload)에 의존성이 있다. 시스템 모델은 전력상태 전환과 시스템 큐에 대한 추계적 모델들로 구성된다. 본 논문에서는 다양한 전력관리 기법을 위한 추계적 모델들을 개발한다. 추계적 프로세스에 기반한 전력관리 모델은 시스템 큐와 다양한 모델링 기능을 표현할 수 있는 페트리 네트의 확장형인 SRN (Stochastic Reward Nets)을 이용하여 개발된다. 적응적 타임아웃기반 전력관리 SRN 모델을 개발하고 기존 전력관리 기법인 greedy, N-Policy 기법과 전력소모 및 성능비교를 수행한다.

데이터베이스 시스템 신뢰도를 위한 페트리 네트 모델링 (Petri Net Modeling of Database System Reliability)

  • 노철우;김경민;김티나
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.315-319
    • /
    • 2005
  • 컴퓨터 시스템의 성능분석을 위하여 페트리 네트 기반 모델이 널리 사용되어 왔으나, 신뢰도와 가용도 분석을 위한 페트리 네트 모델링은 폭넓은 관심을 갖지 못했다. 본 논문에서는 페트리 네트를 이용한 데이터베이스 시스템의 신뢰도 분석과 모델링 기법에 대하여 논의한다. 공유 메모리(Shared Memory), 프로세서, 버스, 데이터베이스(디스크)의 구성요소를 갖는 고장감내형(fault-tolerant) 데이터 베이스 시스템의 신뢰도 분석을 위한 페트리 네트 모델을 개발한다. 각 구성요소에 대한 고장을 고려하며, 데이터베이스 시스템이 동작중일 조건은 데이터베이스가 동작하고 컴퓨터 구성요소인 프로세서, 메모리, 버스가 동작중인 경우로 한다. 각 구성요소는 개별적으로 고장이 날 수 있으며, 시스템이 동작하는 한 복구할 수 있다. 이러한 고장 및 복구 조건을 고려한 시스템의 신뢰도 분석을 페트리 네트의 확장 모델이며 모델링 기능이 풍부한 마르코프 reward 모델을 이용하여 수행한다. Stochastic Reward Net(SRN)이 갖고 있는 variable cardinality, enabling 함수, 시간천이 우선순위 등의 기능을 이용하여 신뢰도 모델을 개발하는 기법을 제시한다.

  • PDF

User Commitment to Blockchain-Based Social Media Platforms from the Perspective of Perceived Justice Regarding the Token Reward System: the Mediating Role of Psychological Ownership

  • Xue, FAN;Seongtaek, RIM;Mengmeng, WANG
    • 동아시아경상학회지
    • /
    • 제11권1호
    • /
    • pp.1-19
    • /
    • 2023
  • Purpose - In this study, we aimed to theorize blockchain-based social media platform users' commitment by examining the impact of their perceived justice of the token reward system. In addition, this study applied psychological ownership theory to verify the underlying mechanism between users' perceptions of justice and their commitment to the platforms. Research design, data, and methodology - To empirically test our conceptual framework in the study, we collected data through a web-based survey approach from the responses of 385 users who had experience with blockchain-based social media platforms. We employed a structural equation modeling approach to empirically test our proposed hypotheses. Result - The results indicated that distributive justice and informational justice have positive effects on user commitment. The results also showed that psychological ownership plays an important role in mediating the relationship between users' sense of distributive justice and commitment, and between procedural justice and commitment. The findings provided a better understanding of the sense of justice and user commitment in a blockchain-based social media environment. Conclusion - This study represents a preliminary attempt to theorize and empirically examine blockchain-based social media platform users' commitment. This study provided important contributions to the literature on how the effect of users' sense of justice in a reward system affects their commitment to blockchain-based social media platforms.

Autonomous and Asynchronous Triggered Agent Exploratory Path-planning Via a Terrain Clutter-index using Reinforcement Learning

  • Kim, Min-Suk;Kim, Hwankuk
    • Journal of information and communication convergence engineering
    • /
    • 제20권3호
    • /
    • pp.181-188
    • /
    • 2022
  • An intelligent distributed multi-agent system (IDMS) using reinforcement learning (RL) is a challenging and intricate problem in which single or multiple agent(s) aim to achieve their specific goals (sub-goal and final goal), where they move their states in a complex and cluttered environment. The environment provided by the IDMS provides a cumulative optimal reward for each action based on the policy of the learning process. Most actions involve interacting with a given IDMS environment; therefore, it can provide the following elements: a starting agent state, multiple obstacles, agent goals, and a cluttered index. The reward in the environment is also reflected by RL-based agents, in which agents can move randomly or intelligently to reach their respective goals, to improve the agent learning performance. We extend different cases of intelligent multi-agent systems from our previous works: (a) a proposed environment-clutter-based-index for agent sub-goal selection and analysis of its effect, and (b) a newly proposed RL reward scheme based on the environmental clutter-index to identify and analyze the prerequisites and conditions for improving the overall system.