腾讯游戏携手中科院高能所粒子天体物理重点实验室,公布“ai技术实现天文卫星星座的协同观测”合作项目

2022年6月27日,腾讯游戏宣布将以人工智能(ai)技术助力中科院高能所粒子天体物理重点实验室“全变源追踪猎人星座”(catch:chasing all transients constellation hunters)计划,该合作有望将我国空间天文观测技术推向新的高度,并且在时域天文学的后随观测上做出重要贡献 。
catch计划是粒子天体物理重点实验室提出的、由上百颗微卫星组成的智能化x射线天文星座,计划于2030年前后全面部署,其核心科学目标是“刻画极端宇宙的多维度动态全景” 。腾讯游戏和粒子天体物理重点实验室的合作致力于推动多智能体强化学习算法在catch星座的协同观测方面的应用 。届时,catch计划将利用腾讯游戏在业界领先的ai技术,实现星座的在轨自主协同观测等功能 。
腾讯游戏cros ai研发团队在游戏中训练的ai智能体已达到顶尖玩家的水准;该团队还创新地推出了人机协作、人机对抗等应用,在丰富了玩家体验的同时,提升了协作效率 。随着ai技术的不断发展,人机协作在过去的探索中取得了较好的应用效果,“理解-沟通-协作”的方式也帮助系统更高效地实现了既定目标 。
catch星座在ai技术配合下协同观测目标天体的想象图
正如腾讯游戏cros ai研发团队所开发的ai智能体,其智能与敏捷源于学习沉淀自上亿局“人机模式”游戏对战的经验;catch计划所使用的多智能体协同算法也在“深度学习”过往的天文观测数据 。目前,腾讯游戏的算法工程师们结合我国天文卫星的爆发源数据,初步搭建了爆发源仿真模拟器,用以训练专属于太空观测环境的ai算法 。当catch星座在太空中运行时,将借助上述算法对深空中成千上万的爆发源数据进行实时分析,调度卫星执行目标选择、指向调整、编队组合等观测指令,对观测目标进行全天、全时监测,后期还将根据观测结果进行持续性的算法优化 。
如何操控上百颗卫星更高效地观测宇宙中的爆发源和变源天体?早在catch概念提出的时候,科学家们就意识到了这样的挑战 。以传统的经验来看,单颗卫星的天文观测往往就需要一支专门的团队来运行;而对于体量高达百颗卫星的catch星座来说,这似乎是一个不可能完成的任务 。为此,腾讯游戏cros ai研发团队与空间和天文方面的专家进行了充分的讨论,提出了更为理想的解决方案:利用游戏ai较新的训练技术——多智能体强化学习方法,来控制卫星协同合作,完成各类观测任务,实现观测计划的较优化 。
具体来说,该团队为模型训练配备了高并发的分布式环境,可以支持接入上万路模拟环境同时训练,还能利用训练样本,进行分布式训练;同时结合团队较新研发的模型压缩、部署优化方案,以便有效地平衡空间信号的感知、控制精度的要求和卫星算力的限制,高效地完成多颗卫星的协同观测任务 。这一方案既包含满足科研目的的精度要求,也符合太空环境实时调度的算力要求,还能够支持大规模算力的基础系统架构要求 。
腾讯游戏ai多智能体算法早前已经应用在英雄联盟手游、火影忍者手游等多人在线战术竞技游戏中 。具体来说,游戏ai可以通过多智能体深度学习与强化学习训练,使其自身对战水平得以匹配大多数玩家的水平 。在“去中心化”的多智能体算法调度下,游戏ai不仅可以和玩家进行能力配合,还能使玩家体验到不同风格的战术 。另外,在针对游戏ai的训练中,提升输出强度并非单一的训练目标,而是需要平衡一系列的量化指标:从战斗能力、防守能力,到与队友的配合程度等,多维度量化分析较优博弈策略,并通过不断优化训练参数,提升游戏ai的综合性能 。