人工智能在微生物组的应用具有巨大的潜力,从加速对这些丰富生态系统的基础科学理解的能力,到利用微生物群改善人类健康和减轻疾病。以下是在未来几年人工智能特别适合帮助解决的一些问题。
1.预测微生物组
微生物组构成一个复杂的动态系统。我们能否预测未来的微生物组会发生什么,就像预测天气一样?如果微生物组暴露在抗生素或其他药物中,我们能预测恢复与持续的微生物失衡吗?如果我们改变宿主的饮食,我们能预测微生物组随时间会发生什么吗?如果我们有意引入新的微生物,会发生什么?治疗目的,例如噬菌体或活细菌疗法?我们能否预测植入和对现有微生物群的影响?解决这些问题将涉及处理时间信息或输入序列的模型,这是人工智能研究的一个非常活跃的领域。
2.阐明宿主-微生物相互作用
尽管有证据表明微生物组与宿主广泛互动,但这些互动的细节,包括其背后的分子机制,仍然描述得不够清楚。哪些微生物单独或结合作用于宿主细胞以防止疾病,还是促进病理?宿主细胞如何响应?这种互动的机制是什么,例如分泌的代谢物、细胞表面蛋白质/多糖等?这些因素如何塑造宿主的免疫库,并影响对疫苗或感染的反应?能够解开这些复杂互动的AI模型需要整合多模态数据集测量宿主和微生物生理学的多个方面,并利用纵向和扰动实验来帮助确定潜在机制的因果关系。
3.揭示宏基因组学的“暗物质”
人类微生物组中的大量细菌基因尚未注释。这些基因的结构和功能是什么?它们是如何被调节以参与重要的细菌生理过程的?除了细菌之外,微生物组中的病毒和原生生物成分甚至更不为人所知。我们如何准确地识别并为之前未被研究的病毒或微生物组共生原生生物提供上下文?这些微生物与其他微生物组成分如何相互作用?历史上,对新生物序列的分析主要依赖于基于同源性的生物信息学方法;然而,对于来自未充分研究的生物体的基因组的序列,可能与任何已知序列的同源性有限。最近,AI在预测蛋白质结构方面的令人兴奋的进展提供了一种潜在的强大替代方法,利用结构和其他特征,这些特征可能为微生物组的“暗物质”功能提供更直接的洞察。这样的模型不仅可以用来理解新型微生物分子结构,还可以用于诊断和治疗目的。
4.微生物组生物地理学的绘制
在宏观生态系统的空间组织的重要性已经得到长期确立,定向研究也表明微生物群落的空间结构如何使局部互动和生态位利用变得重要。如何扩大微生物组空间结构的特征?这些结构相对稳定,还是随着宿主或环境变化而积极重新配置?空间结构如何影响微生物组的功能?新的高通量分子技术、基于光学的方法以及用于图像分析和解释的DL方法有可能揭开微生物组研究这一激动人心新领域的奥秘。
5.AI与实验形成闭环
理解生物系统最终需要进行实验以获取数据。设计有信息价值的微生物组实验并非易事,部分原因是微生物组的复杂性和需要评估和考虑的大量可能变量的组合。此外,这样的实验可能成本高昂,尤其是如果它们涉及人类或动物模型。人工智能能否用于设计能够提供最大信息的实验?一旦获得结果,人工智能模型是否可以自我更新并建议下一轮实验?我们能否使用人工智能来帮助我们理解这些实验的结果,例如,基于科学文献训练的AI模型可以总结结果并根据先验知识提出可能的解释?目前这样的AI系统听起来可能像是科幻小说,但使用深度学习进行最优实验设计的统计框架已经存在,快速的自然语言处理系统进展表明,我们可能很快就能使用人工智能来帮助我们解释发现并提出下一步行动。