有物混成,先天地生。寂兮寥兮!独立而不改,周行而不殆。
——《道德经》
图1.宇宙的凝望(该图由Midjourney生成)
自古以来,人类对浩渺星空抱有无尽的遐想,不断地迈向探索的征程。近年来,随着科技的飞速发展,人类加快了对宇宙的探索步伐。通过运用先进的设备和技术,天文学家揭示了引力波、黑洞、暗物质与暗能量等令人惊奇的现象,这极大地加深了我们对宇宙的认知。
自2011年以来,人工智能(Artificial Intelligence,AI)技术经历了飞速发展,成功地跨越了科学与应用之间的技术鸿沟,在图像分类、语音识别、知识问答、无人驾驶等方面实现了重大的突破,进入了蓬勃发展的时期。而在天文学领域,AI的应用也在逐年加速增长。通过对arXiv上涉及AI在天文研究方面的论文进行统计,发现从2013年的46篇增长到2022年的2328篇,十年间增长了50倍之多。
图2.十年间发表在arxiv physics上的AI文章的数量(标题中检索machine learning,deep learning或neural network关键词的统计结果)
天文学已经进入了多波段、大样本和高信息量的时代,望远镜和其他观测仪器产生的数据量成为真正的“天文数字”。AI技术在天文学中的应用越来越广泛,其算法从传统机器学习发展到深度学习,分析任务从简单到复杂。随着神经网络结构的不断改进,AI模型在特征提取和表征方面的能力显著增强。现在,我们已经能够通过测光图像直接识别出非常暗的天体,例如低面亮度星系(如图3所示)和L矮星(如图4所示)。这些天体几乎是在可见光图像中能够被辨识出的最暗的星系和恒星。
图3.利用AI搜寻侧向低面亮度星系(图源:山东大学邢永广 衣振萍)
图4.利用AI搜寻L矮星(图源:山东大学曹智 衣振萍)
ChatGPT的横空出世标志着AI的重大突破,被视为引发新一轮AI革命的里程碑。ChatGPT是大模型和大数据相结合的成果。而在天文学领域,积累了海量的观测数据,在算法和算力的支持下,天文学也将迈入AI革命的时代,很可能带来颠覆性的变化。
建立的数据分析大模型可以从天文大数据中提取到更丰富、更准确的信息。例如,可以直接从图像中对各类天体进行自动检测和分类,自动融合多个波段的数据,提供可靠的天体属性参数,并自动生成统计图表。
图5展示了一个图像描述(image caption)任务的框架,由卷积神经网络(CNN)和循环神经网络(RNN)构成。该模型可以识别图像中的对象,并用文字描述图像内容,即通过AI模型使计算机拥有“看图说话”的能力。这种任务涉及图像和描述文本两种不同的信息模态,如何让AI模型充分利用多模态信息并进行交互,也是未来研究的一个趋势。
图5.一个图像描述任务框架
借助图像描述等技术,可以对天文图像进行自动分析,并通过文字、图像、语音等直接、友好的方式提供反馈结果。图6展示了对暗能量相机遗珍巡天的一幅图像自动分析并生成文字反馈的示意图。
图6.利用AI大模型自动识别天文图像中的天体,生成文字描述和星表。(图源:山东大学毕明轩)
AI还将助力加速发现新现象和新规律。利用AI算法,有望高效地识别隐含在天文大数据中的趋势和相关性。例如,利用AI算法可以快速识别与系外行星相关的微弱信号,从而找到与地球文明相似的智慧文明,这是根据德雷克方程推算出的银河系中的潜在存在。这样的发现将为我们揭示宇宙中的奥秘提供重要线索。
图7.用来估算银河系中类地外星文明的德雷克方程
除此之外,AI还将被广泛应用于望远镜的自动化观测,能够实时识别望远镜中感兴趣的天体,并帮助确定进一步观测的目标。这种自动化使天文学家能够高效地监测天空,并迅速响应瞬态事件。
我们期待在不久的将来能够创造出比ChatGPT更加智能的天文AI模型,从而将天文学家从繁杂的数据处理任务中解放出来,使他们能够更专注于科学研究。到那时,天文学家每天上班后的第一件事可能是边喝着咖啡,边听着AI助手汇报工作,通过声音、图像或视频,全方位获取AI助手的分析结果。
让我们共同期待这个美好时代的到来!
作者:衣振萍,山东大学副教授,硕士生导师,山东大学天文大数据团队负责人。
本文选自《中国国家天文》2023年5月刊
责任编辑:胡惠雯