将机器学习应用于宇宙的奥秘

计算机可以击败国际象棋冠军,模拟明星爆炸,并预测全球气候。我们甚至教他们成为无懈可击的问题解决者和快速学习者。

现在,能源部劳伦斯伯克利国家实验室(伯克利实验室)及其合作者的物理学家已经证明计算机已经准备好应对宇宙中最大的谜团。该团队从模拟的高能粒子碰撞中提供数千张图像,以训练计算机网络以识别重要特征。

研究人员将称为神经网络的强大阵列编程为一种类似蜂巢的数字大脑,用于分析和解释碰撞遗留下来的模拟粒子碎片的图像。在这次试运行期间,研究人员发现神经网络在大约18,000张图像的采样中识别重要特征的成功率高达95%。

该研究于1月15日在Nature Communications杂志上发表。

下一步是将相同的机器学习过程应用于实际的实验数据。

强大的机器学习算法允​​许这些网络在处理更多图像时改进分析。基础技术用于面部识别和其他类型的基于图像的对象识别应用。

本研究中使用的图像 - 与布鲁克海文国家实验室的相对论重离子对撞机和欧洲核子研究中心的大型强子对撞机中的粒子对撞机核物理实验相关 - 重现了亚原子粒子“汤”的条件,这是一种超级流体状态,称为夸克 - 胶子等离子体据信在宇宙诞生后仅存在百万分之一秒。伯克利实验室的物理学家参与了这两个站点的实验。

“我们正在努力了解夸克 - 胶子等离子体最重要的特性,”伯克利实验室核科学部核物理学家王新年说。其中一些属性是如此短暂,并且发生在如此微小的尺度上,它们仍然笼罩在神秘之中。

在实验中,核物理学家使用粒子碰撞器将重核粉碎在一起,就像剥去电子的金或铅原子一样。这些碰撞被认为可以释放原子核内的粒子,形成一个短暂的,亚原子尺度的火球,甚至可以将质子和中子分解成自由浮动形式的典型束缚构造块:夸克和胶子。

研究人员希望通过了解这种夸克 - 胶子等离子体形成的精确条件,例如填充多少能量,以及当它转变为流体状态时的温度和压力,他们将获得关于其成分颗粒物质的新见解和他们的属性,以及宇宙的形成阶段。

但是,这些特性的严格测量 - 所谓的“状态方程”涉及在这些碰撞中物质从一个阶段变为另一个阶段 - 已经证明具有挑战性。实验中的初始条件可以影响结果,因此提取独立于这些条件的状态方程测量是具有挑战性的。

“在核物理界,圣杯是看到这些高能相互作用中的相变,然后从实验数据中确定状态方程,”王说。“这是我们尚未从实验中学到的夸克 - 胶子等离子体最重要的特性。”

研究人员还探索了控制夸克和胶子之间相互作用的基本力量,物理学家称之为量子色动力学。

最新研究的主要作者,加州大学伯克利分校的伯克利实验室附属博士后研究员庞龙刚说,2016年,当他还是法兰克福高等研究院的博士后研究员时,他对这种研究的潜力感兴趣。人工智能(AI)帮助解决具有挑战性的科学问题。

他看到一种形式的人工智能,被称为深度卷积神经网络 - 其结构受到动物大脑中图像处理过程的启发 - 似乎非常适合分析与科学相关的图像。

“这些网络可以识别模式并评估棋盘位置和Go游戏中的选定动作,”Pang说。“我们认为,'如果我们有一些视觉科学数据,也许我们可以从中得到一个抽象概念或宝贵的物理信息。'”

Wang补充说:“通过这种类型的机器学习,我们试图找出某种模式或模式的相关性,这是模式的唯一标志。”因此,在训练之后,网络可以自己查明图像中的部分和相关性(如果存在的话),这些部分与科学家试图解决的问题最相关。

Pang表示,分析所需的数据积累可能是计算密集型的,并且在某些情况下,只需要一整天的计算时间来创建一个图像。当研究人员采用并行工作的GPU阵列时 - GPU是最初为增强视频游戏效果而创建的图形处理单元,并且已经发展成各种用途 - 它们将每个图像的时间减少到大约20分钟。

他们在伯克利实验室的国家能源研究科学计算中心(NERSC)的研究中使用了计算资源,其中大部分计算工作主要集中在德国GSI和中国华中师范大学的GPU集群。

研究人员指出,使用复杂的神经网络的一个好处是,他们可以识别在初始实验中甚至没有找到的特征,比如在你甚至没有找到它时在大海捞针中找到针。他们甚至可以从模糊图像中提取有用的细节。

“即使你的分辨率很低,你仍然可以得到一些重要的信息,”庞说。

正在进行讨论,将机器学习工具应用于实际重离子碰撞实验的数据,模拟结果应有助于训练神经网络解释实际数据。

“在高能粒子物理学中将会有很多应用,”王说,除了粒子对撞机实验。