你知道地球的大气是由什么组成的吗?你可能只记得它主要由氧气和氮气组成。借助百度的一点帮助,您可以轻松得出更精确的答案:氮(78.084%)、氧(20.946%)、 氩(0.934%)、水汽(0.25%)、二氧化碳(0.032%)、 氖(0.0018%)、 氦(0.00052%) 、甲烷(0.0002%)、 氪(0.0001%)、氢(0.00005%)、 氙(0.000008%)、臭氧(0.000001%)、 其他(0.001421%)。然而,当谈到外大气层太阳系外行星的大气层的组成时,答案是未知的。这太遗憾了,因为大气可以表明行星的性质,以及它们是否可以承载生命。
由于系外行星如此遥远,已证明探测它们的大气层极其困难。研究表明,人工智能 (AI) 可能是我们探索它们的最佳选择但前提是我们能够证明这些算法以可靠、科学的方式思考,而不是欺骗系统。现在,我们发表在《天体物理学杂志》上的新论文为了解它们的神秘逻辑提供了令人放心的见解。
天文学家通常利用凌日方法来研究系外行星,这涉及测量当行星从恒星前面经过时恒星发出的光的倾角。如果行星上存在大气,它也可以吸收极少量的光。通过在不同波长(光的颜色)下观察这一事件,可以在吸收的星光中看到分子的指纹,在我们所谓的光谱中形成可识别的图案。如果恒星与太阳相似,则木星大小行星的大气产生的典型信号只会使恒星光减少约 0.01%。地球大小的行星产生的信号要低 10-100 倍。这有点像从飞机上发现猫的眼睛颜色。
未来,詹姆斯韦伯太空望远镜 (JWST) 和阿里尔太空任务这两个探测器都将从太空轨道上调查系外行星,它们将为数千个系外大气层提供高质量的光谱,从而提供帮助。但是,尽管科学家对此感到兴奋,但最新研究表明这可能很棘手。由于大气层的复杂性,对单个凌日行星的分析可能需要数天甚至数周才能完成。
自然,研究人员已经开始寻找替代工具。人工智能以其吸收和学习大量数据的能力以及经过训练后在不同任务上的出色表现而闻名。因此,科学家们试图训练人工智能来预测大气中各种化学物质的丰度。
目前的研究已经确定人工智能非常适合这项任务。然而,科学家们一丝不苟且持怀疑态度,为了证明事实确实如此,他们想了解人工智能是如何思考的。
窥视黑匣子内部
在科学中,如果不理解,就不能采用理论或工具。毕竟,你不想经历在系外行星上发现生命的兴奋,只是意识到这只是人工智能中的一个“小故障”。坏消息是人工智能在解释他们自己的发现方面很糟糕。即使是人工智能专家也很难确定是什么原因导致网络提供给定的解释。这种劣势往往阻碍了人工智能技术在天文学和其他科学领域的应用。
我们开发了一种方法,可以让我们一瞥人工智能的决策过程。该方法非常直观,假设 人工智能必须确认图像是否包含猫。它大概会通过发现某些特征来做到这一点,例如皮毛或脸型。为了了解它所引用的特征和顺序,我们可以模糊猫的图像的一部分,看看它是否仍然可以识别出它是一只猫。
这正是我们通过“扰动”或改变光谱区域为系外行星探测人工智能所做的。通过观察当每个区域被篡改时人工智能对系外行星分子丰度(例如大气中的水)丰度的预测如何变化,我们开始构建人工智能如何思考的“图片”,例如它用于光谱的哪些区域决定大气中的水位。
令我们天文学家感到欣慰的是,我们发现训练有素的人工智能在很大程度上依赖于物理现象,例如独特的光谱指纹就像天文学家一样。这可能不足为奇,毕竟,人工智能还能从哪里学习呢?事实上,在学习方面,人工智能与厚脸皮的高中生并没有太大的不同它会尽量避开困难的道路(例如理解困难的数学概念),并找到任何捷径(例如背诵数学公式),以获得正确答案。如果人工智能基于记住它遇到的每一个频谱来做出预测,那将是非常不可取的。我们希望人工智能从数据中得出答案,并在未知数据上表现良好,而不仅仅是有正确答案的训练数据。
这一发现提供了第一种偷偷窥视所谓“人工智能黑匣子”的方法,让我们能够评估人工智能所学到的东西。 有了这些工具,研究人员现在不仅可以使用人工智能来加速对外部大气的分析,而且还可以验证他们的人工智能是否使用了众所周知的自然法则。
也就是说,现在说我们完全了解人工智能还为时过早。下一步是精确计算每个概念的重要性,以及如何将其处理为决策。
这个前景对人工智能专家来说是令人兴奋的,但对我们科学家来说更是如此。人工智能令人难以置信的学习能力源于它从数据中学习“表示”或模式的能力这种技术类似于物理学家如何发现自然定律以更好地了解我们的世界。 因此,接触人工智能的思想可能会让我们有机会学习新的、未被发现的物理定律。