专栏算法工具链2025年多目标优化最新创新点有哪些?

2025年多目标优化最新创新点有哪些?

巴山夜雨2025-09-21
27
0

强化学习+多目标优化

传统多目标优化里,怎么平衡目标权重一直是个老大难的问题。现在的前沿玩法是用深度强化学习框架,让智能体动态学习目标间的权衡策略,自适应调整各目标的优化权重。

这种方法的核心创新点是把多目标权衡变成序贯决策过程,靠策略网络实现权重的动态分配。

参考论文:

Constrained Multi-objective Optimization with Deep Reinforcement Learning Assisted Operator Selection(一区TOP)

方法:论文提出用深度强化学习指导约束多目标优化:把种群的收敛性、多样性和可行性当状态,进化算子当动作,种群改进当奖励,通过深度Q网络学习选算子策略,自适应提升性能且兼容多种算法。
图片

创新点:

  • 以种群收敛性/多样性/可行性为状态,进化算子作为动作,改进效果定奖励,训练深度Q网络智能选算子。

  • 框架兼容各类约束多目标进化算法,支持多候选算子自适应切换。

  • 相比现有方法,能综合考虑约束满足和未来优化潜力,显著提升算法性能和跨问题通用性。

图片

元学习+多目标优化

人工设定目标权重的局限性太明显了,所以自适应权重分配成了刚需。最新的梯度基多目标双层优化算法,靠元学习机制让模型从历史优化过程里学经验,掌握不同任务的目标重要性模式。

具体点讲就是搭个元学习器来预测任务特定的权重分布,根据任务特征自动调整目标优先级。

参考论文:

Predictive model-based multi-objective optimization with life-long meta-learning for designing unreliable production systems

方法:论文针对混合流水车间的缓冲区与资源分配问题,用随机森林替代仿真预测性能,结合终身元学习优化的遗传算法,动态调整参数解决混合流水车间的多目标优化问题(提升吞吐量、降低资源消耗)。
图片

创新点:

  • 将终身元学习融入增强型非支配排序遗传算法,动态调整参数以提升解空间探索能力。

  • 用随机森林回归器替代离散事件仿真作为预测模型,构建多目标优化框架降低计算成本。

  • 通过模式挖掘从优化结果中提取缓冲区和资源分配的实用规则,提供管理指导。

图片

GNN+多目标优化

如何处理目标间的复杂关系?图神经网络yyds!把每个目标当成图节点,目标间的相关性和约束关系做成边,用 GNN 学目标间的深层次依赖关系。这种方法尤其适合有层次结构或网络拓扑的多目标问题。

参考论文:

Graph-Supported Dynamic Algorithm Configuration for Multi-Objective Combinatorial Optimization

方法:论文提出 GS-MODAC 方法,用图神经网络(GNN)分析优化问题的解结构,结合深度强化学习自动调整算法参数,以提升多目标优化的效率和效果,适用于调度、路径规划等场景。
图片

创新点:

  • 用图神经网络将多目标优化的解转化为图结构,自动学习解的状态特征。

  • 基于超体积改进设计奖励函数,通过强化学习动态调整多目标算法参数。

  • 在调度和路径问题中对复杂、大规模问题表现出更好的适应性和泛化能力。

图片
扫码添加小享,回复“多目标创新
免费获取全部论文+开源代码
图片

GAN+多目标优化

有没有遇到过优化问题里多个目标打架的情况?多目标组合生成对抗优化算是种新的解题思路。简单说就是生成器负责产生候选解,判别器评估解在不同目标下的质量,通过对抗训练实现目标间的动态平衡。

创新点在于把目标冲突变成生成对抗博弈,靠博弈均衡找最优权衡点。

参考论文:

Accelerating multi-objective optimization of concrete thin shell structures using graph-constrained GANs and NSGA-II

方法:论文用图约束GAN生成符合拓扑约束的初始设计,结合NSGA-II进行多目标优化,以最小化重量、挠度和应变能,在实际案例中实现显著性能提升,收敛速度快50%。
图片

创新点:

  • 结合图约束GAN与NSGA-II,用GAN生成符合拓扑约束的初始设计,提升优化起点质量。

  • 以重量、挠度和应变能为优化目标,通过NSGA-II维护帕累托最优解的多样性与收敛性。

  • 实际案例中性能显著提升,收敛速度比传统方法快50%,结构完整性经验证可靠。

图片

自监督学习+多目标优化

现在好多场景都缺标注数据,人工标数据又贵又慢,如何做多目标优化?自监督学习来救场!具体说就是用自编码器这类无监督学习技术,从数据内在结构里发现潜在的优化目标,再进行联合优化。

关键在于设计出能抓住数据多样性和质量的无监督目标函数,这对于数据稀缺的场景来说,就是救星。

参考论文:

BarlowWalk: Self-supervised Representation Learning for Legged Robot Terrain-adaptive Locomotion

方法:论文提出 BarlowWalk,用 Barlow Twins 自监督学提取运动特征,结合 PPO 与多目标奖励,靠不对称架构让机器人自主稳走复杂地形,无需知识蒸馏,实验显示跟踪误差更低、收敛更稳定。
图片

创新点:

  • 用Barlow Twins自监督学习从历史本体感知数据中提取运动特征,减少对外部地形感知的依赖。

  • 设计多目标奖励函数,结合不对称架构实现策略与评论网络的差异化训练。

  • 无需知识蒸馏,仅靠本体感知就让机器人在复杂地形稳定行走,跟踪误差低且收敛稳定。

图片

总的来说,这几个创新方向各有亮点,都是比较推荐多目标优化领域的论文er做的,如果想快点出成果,那就可以重点关注起来啦!

 

 

文章转载自公众号:AI算法Paper

原文链接:https://mp.weixin.qq.com/s/h_OFf_I0HyJQr_EYlXUi0w

算法工具链
技术深度解析前沿技术
评论0
0/1000