多智能体系统(Multi-AgentSystem,MAS)是由一系列相互作用的智能体构成,内部各个智能体之间通过相互通信、合作、竞争等方式,完成单个智能体不能完成的大量而又复杂的工作。多智能体系统已在飞行器编队、传感器网络、多机器人合作控制、交通车辆调度、军事对抗等领域广泛应用。
多智能体系统在实际应用中受环境的不确定、计算容量小、智能体规模可扩展性弱、智能体之间信息的不对称、交互的不及时、不准确等因素影响,往往难以达到预期的任务效果。拟开发的仿真实验平台通过对多智能体协同算法设计、模型训练及决策有效性的评估等环节的关联选代及综合分析,从而对任务过程提供全面及体系化的能力支撑。通过本实验教学, 能够让学生体会到对于复杂问题,解决问题的源头在何处,所能采用的技术手段有哪些,不同方案的优劣体现在何处。希望通过多智能体协同任务处理过程的教学,完成对本科阶段所学理论知识和实验技能的衔接和整合。同时,将业界技术的前沿思想通过算法的形式嵌入在实验方案中,以此来缩小课堂知识和业界技术前沿的鸿沟。
本实验涉及的数理基础包括:微积分、线性代数、概率统计和大学物理。涉及的核心专业知识包括:程序设计、信号与系统、数字信号处理、信息论、深度学习、估计与决策、电子系统综合实验等。以目前实验室中Robomaster系统中的多车协同对抗为主要研究对象,重点围绕交互信息包在丢失、时滞、失效情况下小车行为刻画、决策算法及系统性能评估问题开展教学,并适当在虚拟仿真平台上追加异种智能体,从而形成异种多智能体间的协同对抗体系。
目前业界围绕多智能体协同开发的典型虚拟仿真系统包括百度的Apollo仿真平台、英伟达的基于神经重建引擎的。mniverse平台、微软的Airsim平台等,上述平台的优点是仿真功能完整,算法先进,能够对真实物理场景存在的问题进行一定程度的提炼和刻画,同时具有很好的展示效果。但对本科阶段学生而言,上述平台所涉及因素过多,不利于学生抓住主线,短期内无法提炼算法模型的思想内涵。本实验教学基于上述虚拟系统,利用其提供的传感接口,结合目前前沿的多智能体协作的算法方案和实验室已有的多车对抗系统平台产生的数据完成对算法的提炼和完善,使学生能够在一个学期内完成对系统功能的认知、熟悉待开发模块的算法流程,能够基本完成仿真系统的调试。
实验教学目标(实验后应该达到的知识、能力水平)
围绕新工科面向新经济、新业态的产业发展,课程以Robomaster机甲大师对抗赛为背景,搭建虚拟多智能体自主协同对抗实验教学为主要内容,发挥复旦综合性研究型大学优势并结合恩艾(中国)仪器有限公司在信号处理和大数据处理领域中的深厚行业积累,以培育引领未来新技术、新产业的卓越人才为目标,着力培养学生对多智能体协同对抗技术的学习和认知能力。
课程通过虚拟现实的远程仿真实验及任务挑战实践等多种方式,进一步提升自身的学习兴趣,加深对多智能体相关知识的理解和运用,达到理论与实践相辅相长的教学效果。
(1)实验原理(限 1000字以内)
为机器增能提智,让其具有自主的感知、规划、动作和协同能力,可以减轻人类的工作负荷,提升人们生活的幸福感和体验感,而由多机器人形成的多智能体,可以解决不用行业不同场景下的复杂问题,异种多智能体合作及对抗集中体现了上述问题的诉求。目前,国内外众多知名的互联网企业纷纷布局该领域的研发,而面对行业发展对相关技术人才的需求,全球著名高校不约而同加快了相关专业建设的步伐。
本课程凝练业界对异种多智能体技术多年探索的已有成果,选择适合高等院校学生培养阶段的人工智能理论知识点,通过对复杂环境下对抗系统的合理简化,经过较长时间的实践探索,逐步完善了相关实验原理,简介如下:
1、数据采集:通过车载/机载摄像头动态收集对抗方车辆在两维空间的拓扑结构图像(作为训练数据), 以此获取各小车的路线轨迹及位置坐标,同时通过传感器收集对抗方动作(作为训练标签)形成机器学习的数据集;
2、模型训练:建立CNN等计算机视觉为主导的神经网络模型,通过收集的数据集进行深度学习的训练,通过不断调整和优化网络参数和超参数以达到预期效果,实现依据对抗方的(拓扑-位置-动作)图像输入->己方实时出击为输出的对抗目的。
3、实践验证:将模型部署在Robomaster对抗系统上实时运行,通过半人工监督的方式评估对抗模型的效果。
知识点:共18个
1、对抗前端的数据收集(包括数据获取、数据清洗、数据分类、标签整定、数据压缩、数据汇集等6个知识点)
2、机器学习模型设计(包括神经网络基础、复杂网络结构、机器学习原理、深度学习理论等4个知识点)
3、神经网络模型训练(包括数据训练算力基础、网络参数调整、网络超参数设计、网络结构优化等4个知识点)
4、对抗模型部署(包括智能终端算力分析、神经网络模型压缩、智能终端系统调试、智能终端优化等4个知识点)
(2)核心要素仿真设计(对系统或对象的仿真模型体现的客观结构、功能及其运动规律的实验场景进行如实描述,限500字以内)
为扩大实验教学的受众面,基于实验原理,课程对实验核心要素进行了虚拟化仿真的改造,同时为提升实验的教学效果,课程开发了远程操控验证等关键性环节。简介如下:
1、真实对抗方数据采集过程的虚拟化:①设计制作了可无线遥控的小车系统以替代真实对抗双方的小车;②以目前实际运行的Robomaster系统的实物环境为基准,搭建对应的虚拟对抗平台,对抗方在对抗过程中策略的复杂度逐次递增;③在仿真环境中加入“上帝视角”广角摄像头,令不同实验者在远程端可以通过屏幕实时观察对抗胜负情况,可以指定实验者远程对某个小车接管对抗,形成半自主的人机协同对抗;④小车上安装的摄像头实时记录对抗方发射炮弹次数及击中的次数,对抗双方的操控及得分信息保存在服务器上形成数据集,供后续实验者远程访问服务器获取该训练数据集。
2、实际对抗系统模型的仿真:采用较为简单CNN基础神经网络结构替代业界中复杂的深度网络训练模型,将业界中采用的多目景深摄像头简化为普通USB摄像头,将激光雷达传感器简化为激光避障传感器,大幅减少数据的种类和数据量,为实验课程实现对对抗行为刻画的正常教学提供可行性保障。建设算力强大的GPU服务器和虚拟桌面工作站,提供给实验者远程访问,不同实验者按排队序列提交数据进行模型的训练和修改完善,全程模拟和仿真实际对抗场景中基于模型训练的真实过程,以此提升实验教学的仿真程度。
3、验证对抗功能的远程实验仿真:采用远程部署的方式,实验者可将训练完成的模型通过网络写入Robomaster智能小车对抗系统,在“上帝视角”摄像头的监测下,以自主或半人工的方式监督验证对抗过程。由于采用远程提交方式,实验者可在自己提前预约的时间段内完成相关远程仿真实验,整体实验装置有能力全天候连续运行。
本课程是复旦大学在新工科建设背景下拟推出的一门新型实验实践课程,借鉴并采用新工科所提倡的教育教学理念:以学生为中心开展教学实践活动,以学生能力提升为成果导向,以持续改进为课程完善路径。
(1)以学生为中心:每期开课前进行课程预调查以了解学生不同的学习基础,进而结合学生自主意愿推荐成立3人的线上远程学习小组,搭配不同年级、不同专业的学生形成优势互补、水平较为均衡的合作团队;为小组(3-4组)配备课程线上助教或指导教师,帮助学生及时吸收理论知识和指导学生完成实践环节;配备高水平专业教师和行业资深专家组成结构完整、能力互补的高质量教学团队,不但能有效解答学生课程学习中所遇到的专业问题,而且能及时回应学生对技术前沿和应用的关注;
(2)以学生能力提升为成果导向:结合课程教学在新工科专业人才培养目标中的定位,根据学生基础确定能力提升的目标并形成相应的计划和指标;课程以培养学生解决复杂性工程问题能力为着力点,特别是面对对抗环境中涉及控制、通信、信号处理等多领域的相关问题,安排理论教学和动手实践内容分阶段穿插在教学过程中,将各知识点有机衔接;通过小车对抗的实验教学,鼓励学生参加RoboMaster机甲大师赛等实践活动,以此来检验学生通过该课程对其综合能力提升的程度。
(3)以持续改进为课程完善路径:在课程实施过程中穿插4次线上综合调研反绩,及时掌握课程进度与学生掌握程度,对课程实施环节进行调整;及时对接业界最新的技术研究成果和理论前沿发展的动向,调整并补充课程教学内容;充分引入企业行业资源,更新教学仪器设备和教学环境。
(1)学生交互性操作步骤,共10 步 |
|||||||
步骤 序号 |
步骤目标要求 |
步骤合理用时 |
目标达成度赋分模型 |
步骤 满分 |
成绩类型 |
||
1 |
小车组装远程设计 |
1.5学时 |
视组装小车功能的完整性,由教学团队评估进行赋分 |
10 |
u操作成绩 u实验报告 口预习成绩 口教师评价报告 |
||
2 |
小车系统集成设计 |
1.5学时 |
根据各接口参数配置的合理性和完整性,由教学团队评估进行赋分 |
10 |
|||
3 |
数据远程采集 |
3学时 |
视采样数据的质量和规模,由教学团队评估进行赋分 |
10 |
|||
4 |
数据远程获取及清洗 |
1.5学时 |
依据清洗方案的合理性,由教学团队评估进行赋分 |
5 |
|||
5 |
建立神经网络模型 |
2学时 |
依据对网络各模块功能理解的准确性及搭建的熟练度,由教学团队评估进行赋分 |
10 |
|||
6 |
训练神经网络模型 |
3学时 |
视训练的效果,由教学团队评估进行赋分 |
15 |
|||
7 |
优化神经网络模型 |
2学时 |
依据优化函数设计的合理性由教学团队评估进行赋分 |
10 |
|||
8 |
部署神经网络模型 |
1.5学时 |
依据部署的合理性和熟练 |
10 |
(2)交互性步骤详细说明 1、小车组装远程设计说明:个别学生由于知识技能基础不足,在勾选组件形成设计方案后,无法达到后期的实验要求,教师借此为学生讲解硬件系统的相关知识以及人工智能对算力的要求等内容。 2、小车系统集成设计说明:学生通过网络自行学习和了解小车组件之间的连接方法和协议,并构建系统结构图以及标注接口参数(电压、电流、信号参数等),对相关协议进行说明(速率、码流等)。 3、数据远程采集:学生在远程操作过程中应注意:因网络延迟导致的操作停顿或异常,应耐心并缓慢地完成操作过程(操作停顿时小车不记录数据,以保持数据连续性和流畅性)。 4、数据远程获取及清洗说明:学生在获取对抗方位置拓扑信息图像时,应对冗余的图像数据和不清晰的数据及时进行删除和清洗,以免影响后续的训练过程。 5、建立神经网络模型说明:神经网络的具体设计应考虑数据类型、数据量多少和以及部署环境等因素,通过分析之前收集的数据参考课程给出的基础模型进行合理调整或优化。 6、训练神经网络模型说明:GPU服务器算力强大,24小时开放,可同时支持8个并行训练任务(其余提交的任务应进入排队队列),安装实验课程的数据集规模,每次训练任务耗时约1-2小时。学生应自觉按顺序远程提交任务排队训练,也可以用自己的电脑进行训练。 7、优化神经网络模型说明:小车车载计算力较弱,所采用平台为Jasonnano系统板,为达到实时操控自动运行对抗的目的,需要对训练完成的模型进行优化和裁剪。 8、部署神经网络模型说明:考虑到小车搭载的内存及外部存储卡容量有限,需检查模型部署情况,若遇到运行问题则需重新修改或压缩模型,并在实验室助教的帮助下进行启动监测。 9、对抗实践检测说明:学生应按照提前预约的时间启动小车对抗功能,在启 |
动前应向助教确认自己的小车已经准备就绪。 10、课程总结与提升说明:学生应按照复杂性工程问题归纳的方式,总结梳理在实验过程中所遇到的问题、相应的解决方案以及解决效果;如需继续参加课程高阶挑战任务可以提出申请,获得批准后可继续实验虚拟仿真设备。 |
1、实验涉及对抗双方的博奕,对抗方的策略可分为简单、中等复杂、随机及均衡对奕三种逐次递进的策略,由对应的实验结果即胜负比值,观察和分析对抗策略设计的合理性和鲁棒性。
2、针对实际对抗和具备虚拟仿真辅助的实际对抗两种情形, 分析虚拟仿真所形成的策略对实际系统对抗性能的改善。
Tel:021-31242506
Email:taoyang@fudan.edu.cn
研究方向:物联网系统中低时延高可靠的无线信号处理及传输;复杂信号处理中的机器学习;通信感知一体化;多智能体系统中协同信息感知、计算与通信的任务策略设计