• 제목/요약/키워드: delayed reward

검색결과 22건 처리시간 0.025초

학습 스트레스의 수준 및 제공되는 보상 조건의 차이가 단기 및 장기 기억의 수행에 미치는 영향 (The effect of learning stress and reward style on short- and long-term memory performance)

  • 정주연;한상훈
    • 감성과학
    • /
    • 제15권4호
    • /
    • pp.527-540
    • /
    • 2012
  • 학습자의 학습 스트레스 수준(stress level)과 금전적 보상(monetary rewards)의 제시 시점 차이가 장, 단기 기억수행에 미치는 영향을 알아보았다. 지연-파지 효과(delay-retention effect)에서는 지연 보상 (delayed reward)이 기억의 공고화(consolidation) 과정을 촉진시켜 결과적으로 장기 기억 수행을 향상시키게 된다고 주장한다. 본 연구에서는 지연 보상과 즉시 보상(immediate reward)이 학습 스트레스가 높고, 낮은 맥락의 차이에 따라 기억 수행에 미치는 영향력이 다를 것이라 예상하였다. 따라서 학습 맥락을 학습 스트레스가 높고, 낮은 두 조건으로 나누고, 보상 조건과 기억의 인출 시점을 구분하여 실험하였다. 보상 조건은 보상 제시 시점(5초 후 제시, 바로 제시)과 보상의 유무(500원, 0원)를 구분하였고, 기억 검사는 바로 인출하는 경우와 기억 공고화 과정을 거치고 일주일 후 인출하는 경우로 나누었다. 실험 결과 지연 보상은 장기 기억에 이점 효과가 있었고, 즉시 보상은 단기 기억에만 이점 효과가 나타났다. 이러한 보상의 기억 이점 효과는 스트레스가 높은 학습 맥락에서만 관찰되었다. 본 결과는 학습자가 지각하는 학습 스트레스 수준이 높을수록 보상에 대한 민감도가 높으며, 학습 후 즉시 보상 보다 지연 보상이 기억 공고화 과정에서 기억을 촉진시키는 역할을 수행하여 결과적으로 장기 기억력을 향상시킴을 시사한다.

  • PDF

이동 로봇을 위한 행위 기반 제어 및 학습 구조의 설계와 구현 (Design and Implementation of a Behavior-Based Control and Learning Architecture for Mobile Robots)

  • 서일홍;이상훈;김봉오
    • 제어로봇시스템학회논문지
    • /
    • 제9권7호
    • /
    • pp.527-535
    • /
    • 2003
  • A behavior-based control and learning architecture is proposed, where reinforcement learning is applied to learn proper associations between stimulus and response by using two types of memory called as short Term Memory and Long Term Memory. In particular, to solve delayed-reward problem, a knowledge-propagation (KP) method is proposed, where well-designed or well-trained S-R(stimulus-response) associations for low-level sensors are utilized to learn new S-R associations for high-level sensors, in case that those S-R associations require the same objective such as obstacle avoidance. To show the validity of our proposed KP method, comparative experiments are performed for the cases that (ⅰ) only a delayed reward is used, (ⅱ) some of S-R pairs are preprogrammed, (ⅲ) immediate reward is possible, and (ⅳ) the proposed KP method is applied.

온-오프라인 채널에서 운영하는 고객보상프로그램의 보상채널과 보상시점에 따른 효과 분석 -백화점과 온라인 종합몰을 중심으로- (The Effect of Reward Channel and Reward Time of Customer Loyalty Programs for On-offline Channels -Focusing on Department Stores and Online Shopping Stores-)

  • 박민정
    • 한국의류학회지
    • /
    • 제37권4호
    • /
    • pp.467-481
    • /
    • 2013
  • The study examined the main effect of the reward channel and reward time of customer loyalty programs for on-offline shopping channels; in addition, it investigated the interaction effect of the reward channels and merchandise as well as the interaction effect of the reward time and merchandise. An online apparel shopping web experiment was conducted with a 2 (reward channel: online channel reward vs. offline channel reward) ${\times}2$ (reward time: immediate vs. delayed) ${\times}2$ (merchandise: online channel product vs. offline channel products) between-subject factorial design. An online shopping channel was considered the core-shopping channel and a department store was considered the cross-shopping channel. Loyalty program value, core-channel loyalty and cross-channel loyalty were measured as dependent variables. A total of 845 shoppers (who had experiences in shopping in both channels) participated in the experiment. The results of the study revealed (1) the main effect of the reward channel on loyalty program value, core-channel loyalty and cross-channel loyalty [online>offline channel rewards], (2) the main effect of reward time on loyalty program value, core-channel loyalty and cross-channel loyalty [immediate>delayed reward], and (3) the interaction effect of the reward channel and merchandise on loyalty program value, core-channel loyalty, and cross-channel loyalty. (4) Finally the study found that loyalty program value affected cross-channel loyalty indirectly through core-channel loyalty. This study suggested diverse theoretical and managerial implications for multi-channel retailers.

Affective Decision-Making among Preschool Children in Diverse Cultural Contexts

  • Qu, Li;Shan, Gao;Yip, Cindy;Li, Hong;Zelazo, Philip David
    • Child Studies in Asia-Pacific Contexts
    • /
    • 제2권2호
    • /
    • pp.123-132
    • /
    • 2012
  • The current study examined 3- and 4-year-olds' affective decision-making in a variety of cultural contexts by comparing European Canadian children to Chinese Canadian, Hong Kong Chinese, and mainland Chinese children (N = 245). All children were tested with a delay of gratification task in which children chose between an immediate reward of lower value and a delayed reward of higher value. Results showed that Chinese Canadian and Hong Kong Chinese children chose more delayed rewards than European Canadian children, with mainland Chinese children showing a trend toward more delayed rewards. Across cultures, 4-year-olds chose more delayed rewards than 3-year-olds; and among 4-year-olds, girls made more such choices than boys. The findings are consistent with previous findings that exposure to Chinese culture is associated with better cool executive function, but they also highlight the importance of examining development across diverse cultural contexts.

인지양식 유형과 보상의 제시형태에 따른 아동의 만족지연능력 발달 (The Development of Delay of Gratification by Cognitive Style and Reward Presentation)

  • 허수경;이경님
    • 아동학회지
    • /
    • 제17권2호
    • /
    • pp.221-233
    • /
    • 1996
  • The purpose of the present study was to investigate the effects of age, sex, cognitive style and reward presentation on delay of gratification. The subjects of this study were 120 children 4, 6 and 8 years of age attending preschool and an elementary school in Pusan. They were identified as impulsive or reflective according to their performance on Kagan's Matching Familiar Figures Test. The levels of reward presentation consisted of the reward which was presented physically and the reward which wasn't presented physically. Length of waiting time was recorded as the measure of maintenance of delay of gratification. The data of this study were analyzed with Two-way ANOVA, Duncan's Multiple Range Test. The major finding were as follows: (1) Delay time increased with age. (2) No sex difference is found in delay time. (3) Reflective children delayed longer than impulsive children in all age groups. (4) The reward which wasn't physically presented produced loner delay time than the reward which was physically presented in all age groups.

  • PDF

강화학습과 분산유전알고리즘을 이용한 자율이동로봇군의 행동학습 및 진화 (Behavior leaning and evolution of collective autonomous mobile robots using reinforcement learning and distributed genetic algorithms)

  • 이동욱;심귀보
    • 전자공학회논문지S
    • /
    • 제34S권8호
    • /
    • pp.56-64
    • /
    • 1997
  • In distributed autonomous robotic systems, each robot must behaves by itself according to the its states and environements, and if necessary, must cooperates with other orbots in order to carray out a given task. Therefore it is essential that each robot has both learning and evolution ability to adapt the dynamic environments. In this paper, the new learning and evolution method based on reinforement learning having delayed reward ability and distributed genectic algorithms is proposed for behavior learning and evolution of collective autonomous mobile robots. Reinforement learning having delayed reward is still useful even though when there is no immediate reward. And by distributed genetic algorithm exchanging the chromosome acquired under different environments by communication each robot can improve its behavior ability. Specially, in order to improve the perfodrmance of evolution, selective crossover using the characteristic of reinforcement learning is adopted in this paper, we verify the effectiveness of the proposed method by applying it to cooperative search problem.

  • PDF

유통 업태별 고객보상프로그램 실태 조사 (The Study on Customer Loyalty Programs of Retailers)

  • 박민정;정소진
    • 한국의류산업학회지
    • /
    • 제13권2호
    • /
    • pp.242-252
    • /
    • 2011
  • The purpose of the study was to investigate customer loyalty programs of diverse types of retailers. As offline retailers, department store and discount store retailers were examined, and as nonstore retailers, online store and TV home shopping retailers were investigated. Types of customer loyalty programs were analyzed based on Dowling and Uncles'(1997) loyalty program framework which included two schemes, types of reward(direct versus indirect rewards) and timing of reward(immediate versus delayed rewards). The study found that different types of retailers utilized different types of loyalty programs: Department store used all the type of rewards, discount store focused on direct/immediate rewards, online store retailers used direct/delayed rewards and/or direct/immediate rewards, and TV home shopping retailers focused on direct/delayed rewards. The study provided diverse managerial and academic implications.

Adapative Modular Q-Learning for Agents´ Dynamic Positioning in Robot Soccer Simulation

  • Kwon, Ki-Duk;Kim, In-Cheol
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.149.5-149
    • /
    • 2001
  • The robot soccer simulation game is a dynamic multi-agent environment. In this paper we suggest a new reinforcement learning approach to each agent´s dynamic positioning in such dynamic environment. Reinforcement learning is the machine learning in which an agent learns from indirect, delayed reward an optimal policy to choose sequences of actions that produce the greatest cumulative reward. Therefore the reinforcement learning is different from supervised learning in the sense that there is no presentation of input-output pairs as training examples. Furthermore, model-free reinforcement learning algorithms like Q-learning do not require defining or learning any models of the surrounding environment. Nevertheless ...

  • PDF

군집 로봇의 협조 행동을 위한 로봇 개체의 행동학습과 진화 (Behavior Learning and Evolution of Individual Robot for Cooperative Behavior of Swarm Robot System)

  • 심귀보;이동욱
    • 한국지능시스템학회논문지
    • /
    • 제16권2호
    • /
    • pp.131-137
    • /
    • 2006
  • 군집 로봇시스템에서 개개의 로봇은 스스로 주위의 환경과 자신의 상태를 스스로 판단하여 행동하고, 필요에 따라서는 다른 로봇과 협조를 통하여 어떤 주어진 일을 수행할 수 있어야 한다. 따라서 개개의 로봇은 동적으로 변화하는 환경에 잘 적응할 수 있는 학습과 진화능력을 갖는 것이 필수적이다. 이를 위하여 본 논문에서는 지연된 보상능력이 있는 강화학습과 분산유전알고리즘을 이용한 새로운 자율이동로봇의 행동학습 및 진화방법을 제안한다. 지연 보상능력이 있는 강화학습은 로봇이 취한 행동에 대하여 즉각적인 보상을 가할 수 없는 경우에도 학습이 가능한 방법이다. 또한 개개의 로봇이 통신을 통하여 염색체를 교환하는 분산유전알고리즘은 각기 다른 환경에서 학습한 우수한 염색체로부터 자신의 능력을 향상시킨다. 특히 본 논문에서는 진화의 성능을 향상시키기 위하여 강화학습의 특성을 이용한 선택 교배방법을 채택하였다. 제안된 방법은 협조탐색 문제에 적용하여 컴퓨터 시뮬레이션을 통하여 그 유효성을 검증한다.

인터넷쇼핑 상황에서 보상프로그램이 브랜드충성도에 미치는 영향에 관한 연구 (Effects of Reward Programs on Brand Loyalty in Online Shopping Contexts)

  • 김지헌;강현모
    • Asia Marketing Journal
    • /
    • 제14권2호
    • /
    • pp.39-63
    • /
    • 2012
  • 보상프로그램에 관한 기존 연구들은 프로그램에 대한 소비자의 지각된 가치가 높을수록 브랜드충성도가 증가할 것이라는 가정 하에, 소비자가 가장 선호하는 보상프로그램을 설계하는 데 초점을 맞추어왔다. 또한 이들은 연구대상으로 인터넷쇼핑몰보다는 주로 오프라인 매장을 사용하였다. 이는 인터넷쇼핑 상황에서 보상프로그램에 대한 소비자의 가치인식이 브랜드충성도에 미치는 효과가 실제로 유의한지 그렇다면 어떠한 경로를 통해 영향을 미치는 지에 대한 연구가 미흡함을 의미한다. 한편, 소비자는 인터넷쇼핑몰을 이용할 때 필요한 물건을 구매하고자 하는 실용적 동기와 쇼핑 그 자체를 즐기고자 하는 쾌락적 동기를 가지게 되며, 인터넷쇼핑몰은 소비자들의 이러한 양면적 동기를 충족시킬 수 있는 가치(실용적 또는 쾌락적 가치)있는 경험들을 제공함으로써 브랜드충성도를 증가시킬 수 있다. 이는 인터넷쇼핑몰이 제공하는 보상의 유형이 실용적인지, 쾌락적 인지에 따라 다른 유형의 쇼핑 가치를 강화함으로써 브랜드충성도에 영향을 미치는 경로가 달라질 수 있음을 의미한다. 따라서 본 연구는 다음과 같은 세 가지 목적을 가지고 수행되었다. 첫째, 인터넷쇼핑 상황에서의 보상프로그램이 오프라인 쇼핑상황에서와 동일하게 브랜드충성도를 제고하는데 효과적인지 알아보고자 하였다. 둘째, 기존 연구에서 고려하지 않은 "보상프로그램 가치인식 → 브랜드신뢰, 브랜드감정 → 브랜드충성도" 경로를 추가한 연구모형을 제안하고 분석함으로써, 보상프로그램 가치인식이 브랜드충성도에 미치는 또 다른 경로가 있음을 보이고자 하였다. 마지막으로, 보상의 유형(실용적 vs. 쾌락적)에 따라 "보상프로그램 가치인식 → 브랜드신뢰, 브랜드감정 → 브랜드충성도" 관계가 조절될 수 있는지 확인하고자 하였다. 이를 위해 문헌연구를 통해 10개의 가설 및 연구모형을 도출하였으며, 20대 남녀220명을 대상으로 설문조사를 실시하여 데이터를 수집한 후, 구조방정식모델을 이용해 가설들을 검정함으로써 다음과 같은 시사점들을 제공하였다. 먼저, 본 연구는 오프라인 매장을 중심으로 연구되어온 브랜드충성도에 대한 보상프로그램의 효과가 인터넷쇼핑 상황에서도 유의함을 보여줌으로써 인터넷쇼핑몰이 보상프로그램을 운영해야 할 논리적 근거를 마련해주고 있다. 하지만 기존 연구를 통해 확인된 "보상프로그램 가치인식 → 프로그램 충성도 → 브랜드충성도"의 경로가 인터넷쇼핑 상황에서는 유의하지 않은 것으로 나타났다. 반면 "보상프로그램 가치인식 → 브랜드신뢰, 브랜드감정 → 브랜드충성도"의 경로가 유의하게 나타나 인터넷쇼핑몰이 제공하는 보상프로그램에 대한 가치인식은 오프라인 매장과는 다른 경로를 통해 브랜드충성도에 영향을 미치고 있음을 알 수 있다. 한편, 인터넷쇼핑몰이 제공하는 보상프로그램에 대한 가치인식이 브랜드 신뢰에 미치는 영향은 쾌락적 보상보다는 실용적 보상이 더 크게 나타난 반면, (통계적으로 유의하지는 않았지만) 보상프로그램에 대한 가치인식이 브랜드감정에 미치는 영향은 실용적 보상 보다는 쾌락적 보상이 더 큰 것으로 나타났다. 이는 해당 인터넷쇼핑몰을 이용할 때 소비자가 상대적으로 더 추구하는 가치의 유형(실용적 vs. 쾌락적)을 파악하여 이를 강화할 수 있는 유형의 보상을 제공하거나 소비자가 스스로 보상의 유형을 선택할 수 있는 권한을 부여할 경우, 브랜드신뢰와 브랜드감정을 효과적으로 증가시켜 브랜드충성도를 제고할 수 있음을 말해준다.

  • PDF