摘要:高效的移动充电调度是构建长生命期、可持续运行的无线可充电传感器网络(WRSN)的关键之一. 现有基于强化学习的充电策略只考虑了移动充电调度问题的一个维度, 即移动充电器(MC)的路径规划, 而忽略了充电调度问题中的另一维度, 即充电时长调整, 因而仍然存在性能限制. 提出一种基于深度强化学习的WRSN动态时空充电调度方法(SCSD), 建立充电序列调度和充电时长动态调整的深度强化学习模型. 针对移动充电调度中离散的充电序列规划和连续的充电时长调整问题, 使用DQN为待充电节点优化充电序列, 并基于DDPG计算并动态调整序列中待充电节点的充电时长. 通过分别从空间和时间两个维度的优化, 在避免节点缺电失效的同时, 所提出的SCSD可实现充电性能的有效提高. 大量仿真实验结果表明, SCSD与现有的几种有代表性的充电方案相比其充电性能具有明显优势.