
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多目标强化学习中基于偏好驱动的进化策略优化
《IEEE Access》:Preference-Driven Evolutionary Policy Optimization in Multi-Objective Reinforcement Learning
【字体: 大 中 小 】 时间:2026年06月12日 来源:IEEE Access 3.6
编辑推荐:
摘要:在现实世界的多目标强化学习场景中,决策者通常会关注那些能够反映复杂动态环境中不断变化的偏好的策略子集。然而,现有方法难以在高效的偏好调整与充分的全球探索之间取得平衡,且往往缺乏处理非静态环境下偏好变化的有效机制。我们提出了基于偏好驱动的进化策略优化方法(PD-Evo),该框