一种基于Q-Learning的蜂窝网络中D2D通信资源分配策略 |
| |
作者单位: | 南京林业大学信息科学技术学院,南京210037 |
| |
基金项目: | 国家自然科学基金;南京林业大学引进高层次人才;教育部留学回国人员科研启动基金 |
| |
摘 要: | 为了缓解频谱资源压力,提高频谱利用率,将D2D通信技术引入现有的通信系统,从而提高通信系统的吞吐量,降低时延以及提高频谱资源的利用率.从资源分配的角度研究了D2D接入传统蜂窝网络方案,提出多Agent共同决策算法,该算法将每对D2D用户看作一个Agent,参与到马尔科夫决策中,并通过Q学习算法进行求解.通过仿真验证,在学习率为0.7时,D2D对的接入可以在有限的频谱资源上有效地提高系统的吞吐量,缩短达到最大吞吐量的时间.
|
关 键 词: | D2D通信 强化学习 马尔可夫决策 Q学习 资源分配 |
本文献已被 CNKI 万方数据 等数据库收录! |
|