等离子体|谷歌人工智能团队的最新成果: 控制聚变反应堆

等离子体|谷歌人工智能团队的最新成果: 控制聚变反应堆

文章图片



托卡马克装置内的等离子体
在世界等待建造迄今为止最大的核聚变反应堆(ITER)的同时 , 类似设计的小型反应堆仍在运行 。 这些被称为托卡马克装置的反应堆 , 可以帮助我们测试硬件和软件 。 硬件测试可以帮助我们改进一些东西 , 比如用于托卡马克装置内壁的材料 , 或者约束等离子体的磁铁的形状和位置 。
但一定程度上软件是更重要的 。 为了实现核聚变 , 托卡马克装置的控制软件必须监测它所包含等离子体的状态 , 并通过实时调整系统的磁铁来应对等离子体的任何变化 。 如果不这样做 , 可能会导致能量下降这将导致任何聚变的失败 , 或者看到等离子体溢出容器并损坏装置内壁 。 要想获得正确的控制软件 , 需要对等离子体和用于约束等离子体的磁铁有详细的了解 , 或者更准确地说正确的控制软件是必需的 。 因为今天 , 谷歌的DeepMind人工智能团队宣布 , 他们的软件已经成功训练如何控制托卡马克装置 。
失控
核聚变的托卡马克装置控制软件开发是一个复杂的过程 。 根据过去类似设计的经验 , 工程师可以提取软件运行所需的一些基本原则 , 比如要读取哪些传感器输入 , 以及如何应对它们的变化 。 但是基于硬件的设计和等离子体的能量 , 总是会有一些差异 。 因此 , 通常会有一个测量-建模-改进的迭代过程 , 然后对控制过程进行调整 , 同时保持足够的性能 。 最终的控制软件趋向于定制化 , 如果研究人员想要在托卡马克实验中使用非常不同的等离子体几何形状 , 可能需要对软件进行重大的版本调整 。 该领域的研究人员已经确定 , 人工智能是一种可能的解决方案 。 给人工智能足够多的例子 , 它就能找出在等离子体中产生理想性能的控制配置 。 这可以研究人员专注于他们想要的最终状态 , 然后让人工智能自己去思考如何达到这种结果 , 这样研究人员就可以专注于研究而不是频繁更新软件 。 为了实践这个想法 , 我们需要人工智能专家和托卡马克装置 。 在这篇新论文中 , 人工智能团队来自谷歌的DeepMind部门 , 该部门以开发能够处理从蛋白质折叠到《星际争霸》等的人工智能而闻名 , 而托卡马克装置由洛桑的瑞士等离子中心提供 。
核聚变训练
由于在训练过程中 , 将人工智能置于实际的硬件上可能会造成巨大灾难 , 因此团队首先根据瑞士等离子中心的硬件设计了一个托卡马克模拟器 。 这在很大程度上是准确的 , 他们在人工智能中设定了限制 , 如果不能为等离子体制造出准确的结果 , 那么训练出的控制参数将不会引导到真正的托卡马克装置中 。 DeepMind团队随后训练了一个深度强化学习程序 , 通过让它控制模拟器探索各种等离子体配置 。 在训练过程中一个中间的软件层提供了一个奖励功能 , 指示等离子体的特性与期望状态有多接近 。 另一种被称为“批评者”的算法 , 学习托卡马克装置控制磁铁的各种变化所带来的预期回报 。 这些都被一套神经网络控制用来学习它应该采取的行动 。 标准的控制软件将被用来激活托卡马克 , 并将等离子体提升到高能量 。 一旦等离子体稳定下来 , 它就把控制权交给人工智能 。 成功了当在实际的托卡马克装置上运行时 , 人工智能软件的表现与期望的差不多 , 随着时间的推移它可以控制不同条件的实验运行 。 在一个测试案例中 , 它增加了能量 , 保持等离子体稳定 , 然后改变等离子体的几何形状 , 然后在能量下降之前将等离子体重新成功定位;而在另一个实验中 , 它在同一个托卡马克上同时运行了两个不同的等离子体 。

相关经验推荐