在努力了解宇宙的过程中,我们越来越贪婪,进行的观察超出了我们所知。卫星每年发射的信息量达数百兆字节,而智利正在建造的一架望远镜每晚将产生15 TB的太空图片。对于人类来说,这是不可能的。正如天文学家Carlo Enrico Petrillo告诉The Verge:“看星系的图像是我们工作中最浪漫的部分。这就是问题的重点所在。”这就是Petrillo训练AI程序来寻找他的原因。

Petrillo和他的同事正在寻找一种基本上是太空望远镜的现象。当一个巨大的物体(一个星系或一个黑洞)进入遥远的光源和地球上的观察者之间时,它会弯曲空间和周围的光线,从而形成一个透镜,使天文学家能够更近距离地观察难以置信的古老的遥远部分应当被屏蔽的宇宙。这称为重力透镜,这些透镜对于理解宇宙的构成至关重要。但是,到目前为止,找到它们是一件缓慢而乏味的工作。

那就是人工智能的源头-寻找引力透镜只是个开始。就像斯坦福大学教授吴安德(Andrew Ng)所说的那样,人工智能的能力能够使任何事情“自动化,一个典型的人只需不到一秒钟的思想就可以完成。”不到一秒钟听起来并没有太大的空间进行思考,但是在筛选当代天文学所创建的大量数据时,这真是天赐之物。



这波AI天文学家不仅在考虑这项技术如何对数据进行分类。他们正在探索一种全新的科学发现模式,其中人工智能可以绘制出我们从未见过的宇宙部分。

但首先:重力透镜。爱因斯坦的广义相对论在1930年代就预言了这一现象,但是直到1979年才发现第一个例子。为什么?好吧,空间非常非常大,人类需要花费很长时间才能看到它,尤其是在没有今天的望远镜的情况下。到目前为止,搜寻重力透镜已成为零星事务。

明尼苏达大学天体物理学教授莉莉亚·威廉姆斯(Liliya Williams)告诉The Verge:“我们现在已经通过各种方式找到了这些透镜。”寻找某些完全不同的东西是偶然发现的。人们通过两三个调查发现了一些寻找它们的人。但是其余都是偶然发现的。”

看着图像正是AI擅长的事情。因此,波恩,那不勒斯和格罗宁根大学的Petrillo及其同事转向了硅谷钟爱的AI工具:一种由数字“神经元”组成的计算机程序,以大脑中的神经元为模型,响应输入而激发。向这些程序(称为神经网络)提供大量数据,它们将开始识别模式。它们特别擅长处理视觉信息,并被用于为各种机器视觉系统提供动力-从自动驾驶汽车的摄像头到Facebook的照片标签面部识别。

正如上个月发表的一篇论文所述,将这项技术应用于寻找重力透镜非常简单。首先,科学家们建立了一个数据集来训练神经网络,这意味着生成600万张虚假图像,显示出引力透镜的功能和外观。然后,他们使神经网络失去了对数据的支持,使其缓慢地识别出模式。稍后进行了一些微调,他们有了一个程序,可以在眨眼间识别引力透镜。
“人工智能在短短20分钟内检查了21,789张照片”

Petrillo说:“一个非常好的人类分类器可以以每小时约一千的速度对图像进行分类。”根据他的团队正在使用的数据,他估计每30,000个星系中都会发现一个透镜。因此,一个不经过睡眠或休息一周就能工作的分类器,预计只会发现五到六个镜片。相比之下,神经网络在短短20分钟内浏览了21789张图像的数据库。 Petrillo说,那是一个古老的计算机处理器。他说:“这段时间可以大大缩短。”

神经网络不如计算机精确。为了避免俯视任何镜头,其参数非常宽大。它产生了761种可能的候选物,人类对其进行了审查,并缩减为56种。需要进一步观察以确认这些是合法发现,但Petrillo猜测大约三分之一将成为真正的发现。与整个科学界在过去几十年中发现的数百个镜头相比,这大约每分钟可找到一个镜头。这是令人难以置信的加速,也是AI如何帮助天文学的完美范例。

找到这些透镜对于理解天文学的一个大奥秘至关重要:宇宙实际上是由什么组成的?我们所熟悉的物质(行星,恒星,小行星等)被认为仅占所有物理物质的5%,而其他怪异的物质占了另外95%。其中包括一种称为暗物质的假想物质,我们从未直接观察到。取而代之的是,我们研究重力对宇宙其余部分的引力影响,其中引力透镜是关键指标之一。

那么AI还能做什么呢?研究人员正在研究许多新工具。像Petrillo一样,有些正在从事鉴定工作:例如,对星系进行分类。其他公司则正在帮助梳理数据流中的有趣信号,例如一个神经网络,该网络消除了射电望远镜的人为干扰,以帮助科学家找到可能令人兴奋的信号。还有更多的方法被用于识别脉冲星,定位异常的系外行星或增强低分辨率望远镜的图像。简而言之,潜在的应用有很多。
““总的来说,与机器相比,人类更容易产生偏见,效率降低并且更容易犯错误。”

爆炸的部分原因是更大的硬件趋势推动了AI的广泛应用,例如大量廉价的计算能力。但这也是因为天文学的本质在变化。天文学家不再在万里无云的夜晚保持寂寞守夜,跟踪各个行星的运动。取而代之的是,他们使用复杂的机器,吞噬了早期科学家无法想象的大量数据,吞噬了天空的一部分。威廉姆斯说,更好的望远镜和更好的数据存储意味着比以往更多的分析。

分析大量数据正是人工智能的强项。我们可以教它识别模式,然后将其设置为像不倦的助手一样工作:从不眨眼,始终保持一致。

它是否使天文学家担心他们信任一台可能缺乏发现敏锐事物所需的人类洞察力的机器上的信任?佩特里罗说,他没有打扰。 “总的来说,与机器相比,人类更具偏见,效率低下并且更容易犯错误。”威廉姆斯表示同意:“计算机可能会错过某些事物,但他们会系统地怀念它们。”只要我们知道它是什么,是他们不知道,我们可以部署自动化系统而没有太大的风险。

对于某些天文学家来说,人工智能的潜力已不仅仅是单纯的数据分类。他们认为人工智能可以用来创造信息,填补我们对宇宙的观察中的盲点。

天文学家凯文·舍温斯基(Kevin Schawinski)和他的团队专门研究银河系和黑洞天体物理学,他们使用AI来增强模糊望远镜图像的分辨率。为此,他们部署了一种神经网络,这种神经网络擅长于生成所研究数据的变化形式,例如训练有素的伪造品,可以模仿著名画家的风格。这些被称为生成对抗网络(GAN)的网络已经被用来根据名人的照片制作假脸。模仿个人声音的虚假音频对话;以及其他一系列数据类型。它们是当代AI研究最丰富的接缝之一,对于Schawinski来说,它们意味着获得以前所没有的信息。

Schawinski和他的团队在今年早些时候发表的论文展示了如何使用GAN来改善空间图片的质量。他们降低了一堆星系图片的图像质量,增加了噪点和模糊,然后使用经过望远镜图像训练的GAN来提高其分辨率,并将其与原始图像进行比较。结果非常准确:足以说服沙温斯基,人工智能有潜力改善天文学中的各种数据集。他说,他和他的团队“正在取得很多不错的成果”,但是他们在发布之前无法透露任何内容。

沙温斯基对此项目持谨慎态度。毕竟,这听起来似乎违反了科学的核心原理:您只能通过直接观察宇宙来了解宇宙。他说:“正是出于这个原因,这是一种危险的工具。”只有在我们a)拥有充足且准确的训练数据,并且b)可以检查结果的情况下,才应使用该工具。因此,您可以训练GAN来生成有关黑洞的数据,然后将其放宽到以前从未详细观察到的天空部分。然后,如果它暗示那里存在黑洞,天文学家将第一手证实这一发现,就像引力透镜一样。 Schawinski说,与所有科学工具一样,需要进行严格的耐心测试,以确保获得的结果不会“误入歧途”。

如果这些方法卓有成效,那么它们将成为Schawinski的一个全新的探索方法,与经典计算机模拟和良好的老式观测并存。现在还处于初期,但回报可能是巨大的。 Schawinski说:“如果您拥有此工具,则可以访问存档中的所有现有数据,也许可以对其进行一些改进,并获得更多的科学价值。”以前没有的价值。人工智能将执行某种科学的炼金术,帮助我们将旧知识转化为新知识。而且我们甚至可以在不离开地球的情况下探索前所未有的太空。