• 论文 • 上一篇    下一篇

多智能体协调控制的演化博弈方法

王龙,杜金铭   

  1. 北京大学系统与控制研究中心, 北京 100871
  • 出版日期:2016-03-25 发布日期:2016-03-24

王龙,杜金铭. 多智能体协调控制的演化博弈方法[J]. 系统科学与数学, 2016, 36(3): 302-318.

WANG Long,DU Jinming. EVOLUTIONARY GAME THEORETIC APPROACH TO COORDINATED CONTROL OF MULTI-AGENT SYSTEMS[J]. Journal of Systems Science and Mathematical Sciences, 2016, 36(3): 302-318.

EVOLUTIONARY GAME THEORETIC APPROACH TO COORDINATED CONTROL OF MULTI-AGENT SYSTEMS

WANG Long ,DU Jinming   

  1. Center for Systems and Control, Peking University, Beijing 100871
  • Online:2016-03-25 Published:2016-03-24

提出一种基于演化博弈理论的多智能体系统协调控制方法. 在所建立的数学模型框架中智能体根据其自身的利益, 通过局部交互, 在博弈竞争中学习, 自主调整其行为. 根据系统整体性能的要求, 通过选择合适的博弈类型、设计适宜的收益计算方法、更新进化规则等, 实现对多智能体系统的控制. 在演化过程中, 无需指定某些特定个体的具体动力学行为, 只需通过种群的自适应进化即可实现整体目标. 以分工合作问题为例, 详细解析所提出的控制方法, 通过理论分析和仿真验证该方法可以实现多智能体系统的自适应协调控制.

In this paper, we propose an evolutionary game theoretic approach to coordinated control of multi-agent systems. In such fundamental mathematical framework, agents play games with their neighbors, and update strategies through local interaction. The agents autonomously regulate their behavior, according to their own benefit. % which is most like unsupervised study for individuals. Based on certain performance of the whole system, the control target is realized through selecting proper game type, designing fitness calculation and evaluation method, interactive restriction, update rule, and so on. In the evolutionary process, we do not need to design certain agents' dynamics and assign them what to do, but realize the final target through the self-adaptive evolution of the system. Taking division and cooperation problem as an example, we explain the proposed control approach in detail. The adaptive coordinated control process, which is a controllable, intelligent, and autonomous decision process, is analyzed and verified through simulation.

MR(2010)主题分类: 

()
[1] 赵兰浩, 纪志坚. 符号网络条件下扩散耦合多智能体系统的可控性分析[J]. 系统科学与数学, 2021, 41(6): 1455-1466.
[2] 李珂, 慕小武. 半马氏切换拓扑下随机非线性多智能体系统的$H_{\infty}$包含控制问题研究[J]. 系统科学与数学, 2021, 41(6): 1467-1480.
[3] 陈振杰, 傅勤, 郁鹏飞, 张丹. 一类四阶抛物型偏微分多智能体系统的协调控制[J]. 系统科学与数学, 2021, 41(4): 898-912.
[4] 晋守博,李耀红,魏章志.  基于大通讯时滞的多智能体系统的控制协议研究[J]. 系统科学与数学, 2020, 40(9): 1531-1538.
[5] 张金凤,纪志坚,渠继军. 基于自同构和领导者对称的多智能体系统能控性[J]. 系统科学与数学, 2020, 40(4): 565-577.
[6] 唐益萍,傅勤,王雪松. 基于迭代学习的正则非线性多智能体系统的跟踪控制[J]. 系统科学与数学, 2019, 39(8): 1171-1183.
[7] 张晓丹,刘开恩,纪志坚. 具有时变时滞多智能体系统二分一致性[J]. 系统科学与数学, 2018, 38(8): 841-851.
[8] 郭少岩,莫立坡,尹升鹏. 持续干扰下马尔科夫切换多智能体系统的均方一致性[J]. 系统科学与数学, 2017, 37(6): 1427-1438.
[9] 何英高,王翔宇. 基于二部图的多智能体系统加权分组一致性[J]. 系统科学与数学, 2017, 37(4): 1010-1020.
[10] 王平,贾英民. 具有有界输入领航者的二阶非线性多智能体系统的协调跟踪[J]. 系统科学与数学, 2016, 36(9): 1376-1387.
[11] 李健,沈艳军,刘允刚. 线性多智能体系统一致性的自适应动态规划求解方法[J]. 系统科学与数学, 2016, 36(7): 1016-1030.
[12] 张婷,李俊民. 基于${\it\Sigma}\Delta$量化的多智能体系统的量化一致性[J]. 系统科学与数学, 2016, 36(5): 617-632.
[13] 崔玉龙,高利新,陈文海,郑海鹰. 离散时间下广义多智能体系统基于观测器的分布式一致协议[J]. 系统科学与数学, 2016, 36(3): 437-452.
[14] 郑月龙,张卫国. 时间成本、多人雪堆博弈与合作演化研究[J]. 系统科学与数学, 2016, 36(11): 1933-1944.
[15] 李宗刚,张通州,谢广明. 一类异构线性多智能体系统最优输出跟踪的分析与控制[J]. 系统科学与数学, 2015, 35(7): 766-778.
阅读次数
全文


摘要