报告人:王晶,美国伊利诺伊州立大学 教授
报告地点:中南大学天心校区电子楼207会议室
报告时间:2026年6月1日(周一)下午3:00
报告题目:基于不确定成本函数的多智能体系统分布式场景 Q 学习控制
报告人简介:
王晶,伊利诺伊州立大学电气工程系教授,IEEE高级会员。1997年在中南大学获控制理论与应用博士学位,后于中国科学院计算技术研究所、新加坡国立大学从事博士后研究。2002年起先后任职于中佛罗里达大学、贝休恩-库克曼大学、布拉德利大学,2024年加入伊利诺伊州立大学任教授。出版Springer学术专著1部、专著章节4篇,发表论文150余篇。研究方向包括非线性控制、协同控制与机器人学、分布式优化与学习、自适应神经控制等。
报告内容简介:
本次报告将介绍一种用于多智能体系统协同跟踪控制的分布式场景 Q 学习算法,该算法针对成本函数不确定的情况。首先,引入基于场景的 Q 函数,将标称的阶段成本替换为一种对数-和-指数形式的最坏情况成本,该成本由独立采样的不确定性场景求得,从而在无需已知不确定性分布的情况下提供概率鲁棒性保证。其次,设计了三个动态平均一致性估计器,使得每个智能体仅通过单跳邻居通信,便能分别跟踪全局场景成本总和、全局最小 Q 值以及全局当前 Q 值。第三,建立了严格的收敛性保证:估计器以网络权重矩阵的谱隙所决定的速率几何收敛于真实全局和值,而时序差分权重更新在标准 Robbins–Monro 条件与特征独立条件下,几乎必然收敛到唯一的 TD 不动点。数值仿真验证了所提出设计的有效性。