Q-Learning을 이용한 릴레이 선택 기법

A Relay Selection Scheme with Q-Learning

  • 정홍규 (숭실대학교 정보통신전자공학부) ;
  • 김광열 (숭실대학교 정보통신전자공학부) ;
  • 신요안 (숭실대학교 정보통신전자공학부)
  • Jung, Hong-Kyu (School of Electronic Engineering, Soongsil University) ;
  • Kim, Kwang-Yul (School of Electronic Engineering, Soongsil University) ;
  • Shin, Yo-An (School of Electronic Engineering, Soongsil University)
  • 투고 : 2012.04.28
  • 심사 : 2012.06.14
  • 발행 : 2012.06.25

초록

차세대 무선통신 시스템에서 다중 경로 페이딩의 영향을 효율적으로 감소시키기 위한 방법으로 최근 협력통신 시스템이 각광을 받고 있다. 협력통신 시스템은 정보를 전송하기 위해서 다양한 페이딩 계수를 가지고 있는 협력 릴레이를 사용하기 때문에, 모든 릴레이를 협력통신에 참여 시키는 것은 자원의 낭비를 초래한다. 그러므로 무선자원을 효율적으로 사용하기 위해서는 최적의 릴레이를 선택적으로 사용할 필요가 있다. 본 논문에서는 무선 협력통신 네트워크에서 발생하는 이러한 문제를 해결하기 위하여 Q-Learning 알고리즘을 이용한 협력 릴레이 선택 기법을 제안한다. Q-Learning에서는 자가 학습을 위해서 상태, 행동, 그리고 보상에 대한 파라미터를 정의한다. 이러한 파라미터가 잘 정의 될 때 Q-Learning을 이용하여 우수한 통신 성능을 얻을 수 있다. Q-Learning 알고리즘의 우수성을 보이기 위해서, 수학적인 분석을 통해서 최적의 협력 릴레이를 얻는 기법과 통신 성능을 비교하였다. 모의실험 결과, 제안된 기법에서 Q-Learning 알고리즘 내의 보상을 주는 방식에 따라, 비교 기법과 유사한 심벌오율 성능을 얻으면서 보다 더 적은 협력 릴레이를 선택하는 것을 보였다. 따라서 본 논문에서 제안된 기법은 다수의 릴레이를 사용하는 차세대 무선통신 시스템의 성능 향상을 위한 좋은 접근 방식의 하나로 판단된다.

As a scheme to efficiently reduce the effects of multipath fading in next generation wireless communication systems, cooperative communication systems have recently come into the spotlight. Since these cooperative communication systems use cooperative relays with diverse fading coefficients to transmit information, having all relays participate in cooperative communication may result in unnecessary waste of resources, and thus relay selection schemes are required to efficiently use wireless resources. In this paper, we propose an efficient relay selection scheme through self-learning in cooperative wireless networks using Q-learning algorithm. In this scheme, we define states, actions and two rewards to achieve good SER (Symbol Error Rate) performance, while selecting a small number of cooperative relays. When these parameters are well-defined, we can obtain good performance. For demonstrating the superiority of the proposed Q-learning, We compared the proposed scheme with Q-learning and a relay selection scheme with a mathematical analysis. The simulation results show that, compared to a scheme that obtains optimum relays through a mathematical analysis, the proposed scheme uses resources efficiently by using smaller numbers of relays with comparable SER performance. According to these simulation results, the proposed scheme can be considered as a good attempt for future wireless communication.

키워드

참고문헌

  1. A. Nosratinia, T. E. Hunter, and A. Hedayat, "Cooperative communication in wireless networks," IEEE Commun. Mag., vol. 42, pp. 74-80, October 2004. https://doi.org/10.1109/MCOM.2004.1341264
  2. Y. Zhao, R. S. Adve, and T. J. Lim, "Improving amplify-and-forward relay networks: Optimal power allocation versus selection," IEEE Trans. Wireless Commun., vol. 6, no. 8, pp. 3114-3123, August 2007.
  3. Z. Kenan and T. M. Lok, "A relay selection scheme under optimal power allocation," Proc. ICCS 2008, pp. 1609-1613, Guangzhou, China, November 2008.
  4. H. Wu, Y. Wang, C. Xiong, and D. Yang, "A novel relay selection scheme with simplified power allocation for wireless relay networks," Proc. IEEE GLOBECOM 2009, pp. 1-5, Honolulu, USA, December 2009.
  5. F. Ke, S. Feng, and H. Zhuang, "Relay selection and power allocation for cooperative network based on energy pricing," IEEE Commun. Lett., vol. 14, no. 5, pp. 396-398, May 2010. https://doi.org/10.1109/LCOMM.2010.05.100168
  6. L. Song, "Relay selection for two-way relaying with amplify-and-forward protocols," IEEE Trans. Veh. Technol., vol. 60, no. 4, pp. 1954- 1959, April 2011. https://doi.org/10.1109/TVT.2011.2123120
  7. R. S. Sutton and A. G. Barto, Reinforcement Learning, MIT Press, 1998.
  8. 김재명, "Cognitive Radio 기술개요 및 발전방향," 대한전자공학회지, 제36권, 제6호, 20-27쪽, 2009년 6월.
  9. 조정일, 서종필, 유재호, 정재학, "Cognitive Radio 의 네트워크 및 물리계층 연구동향," 대한전자공학회지, 제36권, 제6호, 39-51쪽, 2009년 6월.
  10. A. Galindo-Serrano and L. Giupponi, "Distributed Q-learning for aggregated interference control in cognitive radio networks," IEEE Trans. Veh. Technol., vol. 59, no. 4, pp. 1823-1834, April 2010. https://doi.org/10.1109/TVT.2010.2043124
  11. O. V. Den Biggelaar, "Sensing time and power allocation for cognitive radios using distributed Q-learning," EURASIP Jour. Wireless Commun. & Networking, vol. 2012, no. 138, April 2012.
  12. J. Peng, J. Li, S. Li, and Jing Li, "Multi-relay cooperative mechanism with Q-learning in cognitive radio multimedia sensor networks," Proc. IEEE TrustCom-11/IEEE ICESS-11/ FCST-11, pp. 1624-1629, Changsha, China, November 2011.
  13. K. J. R. Liu, A. K. Sadek, W. Su, and A. Kwasinski, Cooperative Communication and Networking, Cambridge University Press, 2009.