• 제목/요약/키워드: balance of exploration and exploitation

검색결과 24건 처리시간 0.019초

Learning Less Random to Learn Better in Deep Reinforcement Learning with Noisy Parameters

  • Kim, Chayoung
    • 한국정보기술학회 영문논문지
    • /
    • 제9권1호
    • /
    • pp.127-134
    • /
    • 2019
  • In terms of deep Reinforcement Learning (RL), exploration can be worked stochastically in the action of a state space. On the other hands, exploitation can be done the proportion of well generalization behaviors. The balance of exploration and exploitation is extremely important for better results. The randomly selected action with ε-greedy for exploration has been regarded as a de facto method. There is an alternative method to add noise parameters into a neural network for richer exploration. However, it is not easy to predict or detect over-fitting with the stochastically exploration in the perturbed neural network. Moreover, the well-trained agents in RL do not necessarily prevent or detect over-fitting in the neural network. Therefore, we suggest a novel design of a deep RL by the balance of the exploration with drop-out to reduce over-fitting in the perturbed neural networks.

온라인 게임회사의 전략적 양면성: 엔씨소프트의 활용과 탐험 (The Strategic Ambidexterity of Online Game Companies: The Exploitation and Exploration of NCsoft)

  • 배준희;구동모
    • 한국게임학회 논문지
    • /
    • 제15권1호
    • /
    • pp.115-124
    • /
    • 2015
  • 본 연구는 초경쟁적인 환경에서 온라인개발회사가 동태적 역량을 만들어 낼 수 있는 조직학습인 활용과 탐험에 대하여 엔씨소프트 사례를 중심으로 분석하였다. 학습, 루틴, 기존환경과의 적합성을 특징으로 하는 활용은 점진적 혁신을 이끌어 내는 반면, 비학습, 변화하는 환경에의 유연성과 관련된 탐험은 급진적인 혁신을 이끌어 낸다. 문헌연구를 바탕으로 우선 엔씨소프트의 활용과 탐험 활동을 온라인 게임산업의 사이클에 따라 검증하였다. 다음으로 엔씨소프트의 다양한 게임서비스의 사이클을 중심으로 활용과 탐험에 대해 살펴보았다. 온라인게임시장에서 비교적 빠르게 선도적 입지를 구축한 엔씨소프트는 온라인 게임산업 태동기와 성장기에는 활용 활동을 주로 하였으나, 산업의 성숙기에는 탐험활동을 늘여 왔다. 또한 각 게임서비스 라인의 신작 출시 및 기술개발에는 탐험활동을, 지속적인 패치 서비스 업데이트와 마케팅 및 시스템구축에는 활용활동을 수행하였다. 이것은 온라인 게임회사가 활용과 탐험의 균형을 통해 지속적인 경쟁우위를 창출할 수 있음을 시사한다.

양손잡이 제휴(Ambidextrous Alliance)가 기업 성과에 미치는 영향 (The Effects of Ambidextrous Alliance on Firm Performance)

  • 정도범;곽주영
    • 기술혁신연구
    • /
    • 제20권1호
    • /
    • pp.17-43
    • /
    • 2012
  • 전략적 제휴는 기업의 생존 및 지속적인 경쟁우위를 획득하기 위해서 매우 중요한 수단으로 인식되고 있다. 특히, 기술의 변화 속도가 매우 빠른 첨단 기술 산업에서는 다양한 파트너들과 전략적 제휴를 통해 외부 지식을 공유하고 이를 습득함으로써 기업 성과를 향상시킬 수 있을 것이다. 또한 March(1991)가 주장한 2개 유형의 활동, 즉 탐색(exploration)과 활용(exploitation) 간의 딜레마를 해결하기 위해 둘 중 하나의 활동을 외부화하는 방법으로 전략적 제휴가 수행되기도 한다. 하지만 최근 기술경영 분야에서는 탐색과 활용을 동시에 수행할 수 있는 양손잡이 조직(ambidextrous organization)이 커다란 이슈가 되고 있으며, 기업 성과에도 긍정적인 영향을 미치는 것으로 나타났다. 이는 기업의 내부뿐만 아니라 외부 활동 중의 하나인 전략적 제휴에서도 탐색과 활용 간의 균형이 중요하게 다루어질 것이다. 그러므로 본 연구에서는 탐색과 활용을 동시에 수행하는 양손잡이 제휴(ambidextrous alliance)와 기업 성과의 관계에 대해 살펴보고자 한다. 기존의 많은 연구들이 양손잡이 제휴에 대해 건수 중심으로 분석하였으나, 본 연구는 전체적인 제휴 구성(alliance portfolio)과 개별적인 제휴 파트너(alliance partner) 측면으로 접근하여 탐색과 활용 간의 균형 관계를 분석했다는 점에서 그 의의를 가질 것이다. 본 연구는 높은 불확실성과 치열한 경쟁으로 인해 외부 지식의 획득이 매우 중요한 미국의 바이오/제약 산업을 연구 대상으로 선택하였고, 1990년부터 2005년까지 자료를 수집하여 패널 데이터 분석을 수행하였다. 본 연구의 결과는 실증적으로 양손잡이 제휴의 중요성을 제시하며, 실무적으로도 기업의 전략적인 의사결정에서 탐색과 활용 간의 균형을 강조한다.

  • PDF

유전자 알고리즘에서 선택 기법을 이용한 해의 수렴 과정에 관한 연구 (A Study on the Convergence of Optimal Value using Selection Method in Genetic Algorithms)

  • 김용범;김병재;박명규
    • 산업경영시스템학회지
    • /
    • 제20권42호
    • /
    • pp.171-179
    • /
    • 1997
  • Genetic Algorithms face an inherent conflict between exploitation and exploration. Exploitation refers to taking advantage of information already obtained in the search. Exploration show that a pattern in bits coupled with another pattern elsewhere in the string is more effective. In this paper shows that the selection method has a major impact on the balance between exploitation and exploration. A more heavy-handed approach seeks to exploit the available information. If decisions must be made quickly, especially those in real-time trading environments, then quicker convergence through exploitation may be more desirable. Also this paper we present some theoretical and empirical the selection method in genetic algorithms for a GA-hard problem.

  • PDF

조직의 탐색과 활용에 대한 양손잡이 전략의 균형이 스타트업 성과에 미치는 영향 (The Study on the Balance of Ambidextrous Strategy of Exploration and Exploitation for Startup Performance)

  • 최성철;이우진
    • 벤처창업연구
    • /
    • 제16권6호
    • /
    • pp.131-144
    • /
    • 2021
  • 조직의 양손잡이(organizational ambidexterity) 구조는 기업이 새로운 기회를 포착하는 탐색(exploration) 활동과 자원을 효율적으로 이용하는 활용(exploitation) 활동을 동시에 추구할 수 있도록 설계한 조직 전략이다. 이러한 양손잡이 구조는 현재 대부분 여유 자원이 풍부한 대기업을 대상으로 연구가 이루어지고 있으며, 상대적으로 여유 자원 보유 수준이 낮은 스타트업의 양손잡이 조직구조 필요성에 대한 연구는 아직 많지 않다. 하지만, 최근 전 세계적으로 창업생태계가 고도화되면서 벤처에 투자하는 모험자본이 급속하게 증가하고 있으며, 이러한 현상은 스타트업에 많은 투자가 이루어지고 급성장할 수 있는 환경이 조성되면서 스타트업의 양손잡이 조직구조의 필요성과 적용 가능성에 대한 논의가 필요한 시점이다. 이에 본 연구는 새로운 아이디어로 시장의 문제를 해결하며 꾸준히 시장에서 탐색 활동을 하고 있는 스타트업(start-up)이 이러한 탐색 활동과 동시에 누적되어 가는 기업의 자원을 활용할 수 있는 역량을 갖추는 것이 기업성과에 영향을 미칠 것이라는 가설을 검증하였다. 본 연구의 가설검증을 위해 국내 140개 스타트업의 설문데이터를 분석하였으며, 지금의 시장 상황처럼 불확실하고 변동성이 높은 환경에서의 양손잡이 조직에 대한 필요성을 검증하기 위하여 환경적 동태성(environmental dynamics)의 조절효과가 있는지도 분석하였다. 연구결과 스타트업의 탐색과 활용의 균형(balance)은 기업성과에 유의미한 영향이 있음이 검증되었고, 환경적 동태성의 조절효과는 비재무성과와의 관계에 유의미한 영향을 미치는 것으로 나타났다. 따라서 자원이 부족한 스타트업의 경우 기업이 성장해 가는 과정에서 발생하는 잉여자원들을 효과적으로 활용하고 새로운 사업을 탐색하는 초기 단계부터 탐색과 활용의 균형을 맞추어야 한다는 결론을 도출하였다. 즉, 장기적으로 스타트업도 효과성과 효율성을 동시에 추구할 수 있는 메커니즘을 내재화하기 위해서 양손잡이 조직의 구조화를 추구하는 것이 지속적인 성장과 생존을 위해 중요함을 확인할 수 있었다. 본 연구는 조직의 구조 관점에서 스타트업의 성장을 위한 전략적 방향을 제시하고, 급격하게 성장하는 창업벤처 분야에서 스타트업의 양손잡이 역량과 기업성과와의 영향 관계에 대한 유의미한 결과가 스타트업의 성장에 기여할 것으로 기대한다.

탐색 (Exploration)과 이용(Exploitation)의 상반관계의 균형에 관한 연구 (Balancing the Tradeoffs Between Exploration and Exploitation)

  • 박선주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1099-1110
    • /
    • 2005
  • 전자상거래상에서 경매가 활발해짐에 따라 경매용 에이전트와 경매 에이전트의 비딩 스트레티지 개발에 관한 연구가 중요한 관심의 초점이 되고 있다. 특히, 우세한 스트레티지가 알려져 있지 않는 복잡한 경매 환경에서의 에이전트 스트레티지 개발은 실용적인 의미를 가지고 있다 이 논문은 최적의 스트레티지가 존재하지 않는 연속이중경매(Continuous Double Auction, CDA) 환경에서 사용할 수 있는 "적응성 스트레티지"를 소개한다. 적응성 스트레티지는 현재 알려져 있는 P-스트레티지에 실시간 적응력을 부가하는 것을 주 아이디어로 한다. 적응성 스트레티지는 여러 종류의 알려진 스트레티지들 중 이제까지 좋은 성능을 보여준 스트레티지를 계속 사용하려는 탐색(exploitation)과 바뀌어졌을지도 모르는 새로운 환경에 적합한 스트레티지를 찾아내려는 이용(exploration)간의 균형을 꾀하며, 이를 각 스트레티지의 기대이득과 실행횟수사이의 상반관계를 고려하는 휴리스틱 탐색 함수를 이용하여 결정한다. 실험분석의 결과, 적응성 스트레티지는 (1) P-스트레티지가 잘 작동하지 않는 환경에선 P-스트레티지보다 높은 이득을, (2) P-스트레티지가 다른 종류의 단순한 스트레티지를 앞서는 환경에서는 P-스트레티지와 비슷한 이득을 보인다.

창의적 성과를 제고하는 조직 양면성 구현양식에 대한 연구 (Working Mechanisms of Organizational Ambidexterity for Creative Performance)

  • 권정언;우형록
    • 지식경영연구
    • /
    • 제17권2호
    • /
    • pp.51-73
    • /
    • 2016
  • The organizational ambidexterity has been emerging as the way to gain competitive advantage in turbulent environment. The concept of ambidexterity is simultaneously accomplishing the balance between the activities of exploration and exploitation, and overcoming their conflicting tension. The beneficial merits of ambidexterity has been investigated in innovation, financial performance, strategic management, and etc. Our study focused on the impact of ambidextrous activities on creative performance. Although three ambidextrous modes-structural ambidexterity, contextual ambidexterity, and sequential ambidexterity-have been already acknowledged, scant studies suggested the specific mechanisms to achieve ambidexterity in practice at the operating level. To address the issue we performed the semantic network analysis on the basis of the previous literatures prescribing ambidexterity theory. We took interview with 21 teams to explore behaviors of teams from the ambidextrous perspective, and then interpreted the relationship among words which appeared in the interview. This study found the appropriate mechanism which alleviate tension revealed by exploitation and exploration exist as practical reality. We demonstrated how these ambidextrous mechanisms can be used to generate the creative performance as well as examined various antecedents. These findings would contribute to the more fine-grained understanding of organizational ambidexterity, especially in conjunction with organizational creativity.

탐험과 활용관점 플랫폼 기술 포트폴리오 전략이 성과에 미치는 영향: 나노기술을 중심으로 (Effects of Platform-based Exploratory and Exploitative Technology Strategy on Firm's Performance: Nanotechnology case)

  • 문희성;신준석
    • 기술혁신연구
    • /
    • 제27권1호
    • /
    • pp.45-77
    • /
    • 2019
  • 새로운 가능성의 탐험(Exploration)과 기존 확실성의 활용(Exploitation)간 균형은 조직 학습뿐 아니라 전략, 혁신, 연구개발의 중요한 문제다. 기술의 융복합화 트렌드 속에 기업들은 지속적 경쟁 우위를 위해 기술 지식 자산을 가급적 다양하게 보유하려는 동시에 특정 분야에 깊은 기술 역량을 가지려 한다. 기업들은 기술 포트폴리오 전략 고민하지만, 기술 속성에 대한 고려는 제한적이다. 첨단 기술의 대표인 나노기술은 기존의 제품 및 사업 중심 기술과 달리 다양한 분야에 활용되는 일반목적기술 또는 플랫폼 기술 속성을 가지고 있다. 본 연구는 다국적 기업들이 플랫폼 기술로서 나노기술에 대해 탐험과 활용, 즉 다각화와 특정 기술 우위 관점의 포트폴리오 전략이 혁신 및 재무 성과에 어떤 영향을 미치는지를 패널 데이터 기반으로 다중 회귀 분석을 하였다. 본 연구의 실증 분석결과는 기존의 제품 기술들과 달리, 플랫폼 기술로서의 나노기술은 다각화와 특정 기술 우위가 증가할수록 혁신 성과와 재무 성과에 모두 긍정적인 영향을 주는 것으로 나타났다. 또한 나노기술의 포트폴리오 형태, 즉 다각화와 전문성 기반의 특정 기술 우위 중에, 다각화된 나노기술 포트폴리오가 특정 기술에 우위를 갖는 경우보다 혁신 성과와 재무 성과를 향상시키는 데 더 많은 기여를 하고 있다는 결과를 얻었다. 이는 기업들이 자원의 제약하에서 일반목적기술의 경우 포트폴리오 전략에 어떻게 추구하는 것이 효율적인지를 시사한다.

Hybrid artificial bee colony-grey wolf algorithm for multi-objective engine optimization of converted plug-in hybrid electric vehicle

  • Gujarathi, Pritam K.;Shah, Varsha A.;Lokhande, Makarand M.
    • Advances in Energy Research
    • /
    • 제7권1호
    • /
    • pp.35-52
    • /
    • 2020
  • The paper proposes a hybrid approach of artificial bee colony (ABC) and grey wolf optimizer (GWO) algorithm for multi-objective and multidimensional engine optimization of a converted plug-in hybrid electric vehicle. The proposed strategy is used to optimize all emissions along with brake specific fuel consumption (FC) for converted parallel operated diesel plug-in hybrid electric vehicle (PHEV). All emissions particulate matter (PM), nitrogen oxide (NOx), carbon monoxide (CO) and hydrocarbon (HC) are considered as optimization parameters with weighted factors. 70 hp engine data of NOx, PM, HC, CO and FC obtained from Oak Ridge National Laboratory is used for the study. The algorithm is initialized with feasible solutions followed by the employee bee phase of artificial bee colony algorithm to provide exploitation. Onlooker and scout bee phase is replaced by GWO algorithm to provide exploration. MATLAB program is used for simulation. Hybrid ABC-GWO algorithm developed is tested extensively for various values of speeds and torque. The optimization performance and its environmental impact are discussed in detail. The optimization results obtained are verified by real data engine maps. It is also compared with modified ABC and GWO algorithm for checking the effectiveness of proposed algorithm. Hybrid ABC-GWO offers combine benefits of ABC and GWO by reducing computational load and complexity with less computation time providing a balance of exploitation and exploration and passes repeatability towards use for real-time optimization.

중소 IT기업의 혁신유형별 네트워크 형태에 대한 실증 연구 (The Empirical Study on the Relationship between Innovation Type and Network Configuration of IT SMEs)

  • 김선우;이장재;이철우
    • 한국지역지리학회지
    • /
    • 제12권6호
    • /
    • pp.693-703
    • /
    • 2006
  • 본 연구는 혁신유형과 네트워크 형태간의 관계를 탐색적으로 고찰하였다. 즉, 기업의 혁신유형에 따라 사회적 자본의 특성이 어떻게 다르게 나타나는지를 실증 분석하고 있다. 이 관계를 검증하기 위해 2005년 6월에서 7월 사이에 실시된 "경북 IT기업 기술혁신활동 조사"에서 나타난 168개 기업 자료를 실증적으로 분석하였다. 분석은 IT기업의 기술혁신 유형변수로 '탐색형 기업', '활용형 기업'으로 구분하였고, 사회적 자본은 네트워크의 형태를 나타내는 '구조적 변수'와 강도를 나타내는 '관계적 변수'로 구분하여 구성형태를 분석하였다. 분석 결과, 탐색형 기업에서는 네트워크의 범위가 넓고(sparse network) 약한 연계(weak tie) 관계를 가지는 반면, 활용형 기업에서는 네트워크가 범위를 좁고(dense network) 강한 연계(strong tie) 관계를 가지는 것으로 나타났다.

  • PDF