从地球到系外行星:用机器学习寻找未知行星

  千百年来,人们仰望星空,记录观测结果,探索行星运行的规律。早年的天文学家最先发现的天体之一是行星,希腊人将它们命名为“planētai”,即“漫游者”,因为他们看似是毫无规律地在夜空中漫游。数个世纪的天文研究让人们认识了地球和其他围绕太阳公转的行星,而太阳则是银河系中的众多恒星之一。

  如今,在光学望远镜、太空飞行、数码影像技术和计算机等技术的帮助下,我们能够将我们的认知范围扩展到太阳系之外,探测到围绕着其他恒星公转的行星。通过对这些系外行星(太阳系外行星)的研究,我们对宇宙的探索和研究进一步加深。太阳系之外有什么?是否存在与太阳系行星相似的行星,以及与太阳系相似的星系呢?

  虽然新技术为寻找系外行星提供了帮助,但空间探索并非易事。其他星系的行星与其宿主恒星相比是那么的冰冷、渺小、黑暗,要在宇宙中找到他们,就像要在千里之外辨认探照灯旁的萤火虫一样。不过在机器学习的帮助下,我们取得了一些进展。

  天体物理学家寻找系外行星的主要方式,是通过自动化软件和手动分析对来自美国国家航空航天局(NASA)开普勒太空望远镜获得的大量数据进行分析。在四年的时间里,开普勒太空望远镜观测了大约20万颗恒星。它每30分钟对浩瀚宇宙拍摄一张照片,如今创造了大约140亿个数据点。这些140亿个数据点相当于2千万亿个可能的行星轨道。即便是对于最强大的计算机来说,这也是海量数据,分析起来既耗时又费力。为了让这个过程变得更加快速高效,我们采用了机器学习。

  当沿着轨道运行的行星遮挡一部分恒星的光线时,受测量的恒星亮度就会稍稍减弱。开普勒太空望远镜在四年的时间里对20万颗恒星的亮度进行了观测,从而寻找凌日行星引发的特征信号。

  机器学习是训练计算机识别事物规律的一种方式,针对大量数据进行分析时特别有用。其关键在于让计算机自行学习大量的样本,而不是根据具体的规则对其进行编程。

  Google AI团队的一名机器学习研究人员对太空探索充满了兴趣。他将20%的工作时间花在了这个项目上。在这一过程中,他与德克萨斯大学奥斯汀分校天体物理学家进行合作,将机器学习技术运用到了太空探索中,让机器学会了识别绕着遥远恒星公转的行星。

  研究人员用超过1.5万个经过标记的开普勒太空望远镜信号的数据集,训练基于TensorFlow建立的机器学习模型,来区分行星和其他天体。要做到这一点,机械学习就要辨别出行星的通性和规律,而不是恒星黑子、双星系统和其他天体的规律。当利用这个系统来测试未曾分析过的信号时,它识别行星信号和非行星信号的准确率高达96%。因此,研究人员知道这个模型能发挥作用。

  有了这个模型,他们将目光投向了更遥远的星空,开始用这个模型在开普勒太空望远镜收集的数据中寻找新行星。为了缩小搜索范围,他们锁定了拥有至少2颗行星的670颗已知恒星。这样一来,我们就发现了两颗新行星:开普勒80g和开普勒90i。值得注意的是开普勒90i是绕着开普勒90恒星公转的第 8 颗行星,是我们所在的太阳系之外首个已知的八行星星系。

  使用 1.5 万个标记的开普勒太空望远镜信号对机器学习模型进行训练,教它识别行星信号。研究人员使用这个模型在670颗恒星数据中寻找新行星,发现了2颗此前研究遗漏的行星。

  关于开普勒90i,研究人员还发现了一些有趣事实:它比地球大 30%,表面温度大约800华氏度,并不适合人类居住。此外,它每14天公转一周,要是有人住在上面的话,每两周就得过一次生日。

  开普勒90是我们所在的太阳系之外首个已知的八行星星系。在这个星系中,行星公转一周的时间更短,开普勒90i每14天公转一周。

  机器学习的可能性或许比天空还要广。目前,研究人员只是用此模型探索了20万颗恒星中的670颗。来自开普勒太空望远镜的数据中可能存在着更多尚未被发现的系外行星,而机器学习等新想法和新技术能够在未来推动天文探索。

  让我们继续探索无垠宇宙,超越深空!

第 1 /  10 页
点击查看余下全文