联合子载波分配与功率分配的V2X通信频谱效率增强：一种多智能体深度Q网络（Multi-DQN）方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Telecom》：Spectral Efficiency Enhancement in V2X Communications via Joint Subcarrier Assignment and Power Allocation: A Multi-DQN Agent Approach

【字体：大中小】 时间：2026年06月10日 来源：Telecom 2.4

编辑推荐：

　　针对车联网（V2X）网络的兴趣急剧增长，给高效的无线资源管理带来了重大挑战。本论文旨在解决联合子载波分配与功率分配问题，以最大化系统频谱效率。首先，研究人员将资源分配与功率分配数学表述为一个优化问题，并采用传统优化方法求解，以建立性能基准。为了克服传统优化带来

针对车联网（V2X）网络的兴趣急剧增长，给高效的无线资源管理带来了重大挑战。本论文旨在解决联合子载波分配与功率分配问题，以最大化系统频谱效率。首先，研究人员将资源分配与功率分配数学表述为一个优化问题，并采用传统优化方法求解，以建立性能基准。为了克服传统优化带来的高计算复杂度，研究人员随后提出了一种基于深度强化学习（DRL）的多智能体深度Q网络（Multi-DQN）框架。所提出的智能体通过与环境的交互学习最优分配策略，从而实现自适应和实时决策。系统性能在视距（LOS）和非视距（NLOS）两种不同场景下进行了研究，弥补了先前方法的不足。仿真结果表明，所提出的Multi-DQN智能体方法显著优于增强的传统基准方法，在实现更高频谱效率（SE）的同时大幅降低了计算复杂度。

以下是对论文《Spectral Efficiency Enhancement in V2X Communications via Joint Subcarrier Assignment and Power Allocation: A Multi-DQN Agent Approach》（发表在《Telecom》）的解读文章，基于原文内容进行专业浓缩与总结。

**研究背景、现存问题与研究动机**

随着第五代（5G）及未来第六代（6G）移动通信的发展，车联网（V2X）通信正在推动交通系统向智能、互联和自主的方向变革。V2X通信涵盖车辆与基础设施（V2I）、车辆与车辆（V2V）、车辆与行人（V2P）以及车辆与网络（V2N）等多种实体间的信息交互。为满足低延迟、高可靠性和高数据速率的需求，第三代合作伙伴计划（3GPP）在Release 14中引入了蜂窝车联网（C-V2X），并在后续版本中通过5G新空口（5G NR）进行增强。然而，V2X网络面临动态拓扑、高移动性、多样化服务质量（QoS）需求等挑战，导致传统的基于静态模型和规则启发式的方法在资源分配（如子载波分配和功率控制）中日益不足。特别是非正交多址（NOMA）技术虽能提升频谱效率，但联合优化子载波分配与功率分配问题属于混合整数非线性规划（MINLP），具有非凸性，在大规模网络中计算复杂度极高，难以实时应用。现有研究多采用匹配理论、博弈论等局部优化方法，或基于深度强化学习（DRL）的集中式/分散式方案，但较少系统性地评估不同传播环境（如LOS与NLOS）下的性能。因此，研究人员提出一种基于多智能体深度Q网络（Multi-DQN）的分散式框架，旨在降低计算复杂度的同时提升频谱效率（SE）。

**研究内容、主要结论与意义**

研究人员针对NOMA下行V2X通信系统，首先将联合子载波分配与功率分配问题形式化为优化问题，并采用增强型传统优化算法（基于穷举搜索）作为性能基准。随后，提出一种分散式的Multi-DQN智能体框架，其中每个车辆用户设备（VUE）对作为一个独立的深度Q网络（DQN）智能体，通过与环境交互学习最优子载波选择与功率分配策略。仿真在LOS与NLOS两种场景下进行，结果表明：所提出的Multi-DQN框架相比增强型传统基准方法，在LOS和NLOS场景下分别实现了90%和225%的频谱效率提升，同时大幅降低了计算复杂度。该框架将决策边缘化（即由VUE智能体本地决策），有效解耦了VUE与蜂窝用户设备（CUE）的操作，提升了系统可扩展性。论文发表在《Telecom》，揭示了DRL在复杂动态V2X环境中资源管理的巨大潜力。

**关键方法概述（不超过250字）**

研究人员采用的关键技术方法包括：第一，增强型传统优化算法（Algorithm 1），通过穷举搜索所有可行子载波分配组合，并迭代优化功率分配（Algorithm 2用于CUE功率分配，Algorithm 3基于二分图最大权重匹配（Kuhn–Munkres算法）完成VUE对子载波分配与功率优化），以建立性能基准；第二，基于多智能体深度强化学习的Multi-DQN框架，将每个VUE对建模为独立DQN智能体，定义连续状态空间（含信道增益、功率、干扰等）、离散动作空间（子载波选择与11级功率水平）和奖励函数（最大化CUE频谱效率、保障VUE数据速率与信干噪比（SINR）约束），采用经验回放、固定目标网络和epsilon-greedy策略进行训练；第三，仿真基于3GPP R-18标准参数（4个子载波、12个CUE、4个VUE对），在LOS和NLOS路径损耗模型下评估性能。

**研究结果**

**5.1 DRL框架与增强型传统模型基准测试**
通过对比三种方案（文献[16]的NVRA算法、增强型传统算法、所提Multi-DQN智能体）发现：随着VUE最小SINR要求增加，增强型传统算法为保障VUE约束而降低RSU发射功率，导致CUE频谱效率下降；而Multi-DQN智能体框架中RSU功率独立，因此CUE频谱效率显著高于其他两种方案。同时，Multi-DQN框架的VUE频谱效率也优于增强型传统模型，且与异构V2X（MADQN）[22]相比，在所有SINR要求下均保持更稳定的频谱效率。

**5.2 LOS场景下的DRL框架与增强型传统模型**
在LOS路径损耗模型下，以CUE平均频谱效率与VUE平均频谱效率为指标，比较不同RSU发射功率及VUE SINR要求（0、5、10、15 dB）。结果表明：在低VUE SINR要求时，Multi-DQN框架在RSU功率超过一定阈值后（0 dB时17 dBm）开始优于增强型传统模型，且随着SINR要求提高，交叉点提前。Multi-DQN框架能充分利用RSU额外功率提升CUE频谱效率（可达3.5 bps/Hz），而增强型传统模型因保守干扰管理而趋于饱和（约2.8 bps/Hz）。对于VUE，Multi-DQN框架在低RSU功率时获得极高频谱效率（如0 dB要求时达8.4 bps/Hz），但随RSU功率增加因干扰增强而下降；增强型传统模型则严格满足SINR目标，未利用低干扰优势。

**5.3 NLOS场景下的DRL框架与增强型传统模型**
在NLOS场景中，物理障碍自然衰减了RSU对VUE的干扰。Multi-DQN框架的CUE频谱效率始终优于增强型传统模型约1 bps/Hz（如0 dB要求时从1.4至4.2 bps/Hz对比0.2至3.2 bps/Hz）。VUE频谱效率方面，Multi-DQN框架峰值达到约12.0 bps/Hz（0 dB要求），而增强型传统模型仅约3.98 bps/Hz；即使在15 dB严格约束下，Multi-DQN框架仍保持约13.8 bps/Hz的总体系统频谱效率，而增强型传统模型仅约8.8至9.2 bps/Hz。这表明NLOS环境下Multi-DQN智能体通过学习信道特性有效抑制干扰，实现系统容量翻倍。

**5.4 整体系统性能**
在LOS场景中，Multi-DQN框架的整体系统频谱效率在0 dB SINR要求时约9.3 bps/Hz，比增强型传统模型（约5.5 bps/Hz）提升约35%；随SINR要求提高，增益缩小。在NLOS场景中，Multi-DQN框架的整体频谱效率在0 dB时达13.5 bps/Hz，增强型传统模型仅约4.0至7.0 bps/Hz，且改善幅度超过200%。进一步分析百分比改善率：LOS场景中，低SINR要求时改善最高达90%；NLOS场景中改善超过200%。表明Multi-DQN在恶劣传播条件下适应性更强。

**5.5 附加性能指标评估**
能量效率（EE）评估显示：Multi-DQN框架的EE随RSU功率增加缓慢下降，且严格SINR要求导致EE降低；NLOS环境EE优于LOS。公平性采用Jain指数衡量：Multi-DQN框架的VUE公平指数在所有条件下接近1，随RSU功率增加略有下降，但整体保持高公平性。收敛性分析表明：Multi-DQN智能体在少量训练回合后即稳定收敛，所获平均累积奖励在NLOS场景下更高且收敛更快。

**总结与讨论**
讨论部分指出：所提出的分散式Multi-DQN框架通过将决策迁移到边缘，有效解耦了VUE与CUE操作，在LOS和NLOS场景下均显著提升了频谱效率（SE）并降低了计算复杂度。增强型传统算法因依赖穷举搜索，计算复杂度随网络规模指数增长，难以用于实时决策；而Multi-DQN框架仅需前向传播，复杂度多项式增长，适用于高密度车辆网络。未来方向包括：利用联邦深度强化学习（FDRL）实现全局协调，以及集成动态模式选择算法。

研究结论原文翻译如下：本文提出了一种定制化的分散式多智能体深度Q网络（Multi-DQN）框架，用于V2X通信环境中子载波（SC）与功率分配的联合优化。通过从集中式模型转向边缘架构，该方法有效解耦了VUE与CUE的操作。在视距（LOS）和非视距（NLOS）场景下的实验评估证实，VUE Multi-DQN框架始终优于采用传统方法的已有基准。具体而言，所提模型在LOS和NLOS场景下分别实现了90%和225%的频谱效率（SE）提升，同时降低了计算复杂度。这些结果表明，将决策转移至边缘不仅能增强系统可靠性与性能，还为高密度车辆网络提供了可扩展的解决方案——在传统优化方法因大量CUE和VUE导致高复杂度而难以应对的场合尤为适用。基于这些成果，未来研究将致力于实现VUE与CUE对之间的全局协调，以保证系统最优性。通过实施联邦深度强化学习（FDRL）框架，研究人员将使得分散式智能体能够协同优化策略，在保持边缘处理低延迟优势的同时促进全网络同步协调。此外，将动态“模式选择”算法与所提Multi-DQN框架相结合是未来研究的另一方向。

联系信箱：

粤ICP备09063491号

热点排行