
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能需要传感器:为基于人工智能的加速发现构建数据层
《ACS Sensors》:Artificial Intelligence Needs Sensors: Building the Data Layer for Artificial Intelligence-Accelerated Discovery
【字体: 大 中 小 】 时间:2026年03月19日 来源:ACS Sensors 9.1
编辑推荐:
1. 参观太平洋西北国家实验室的Environmental Molecular Sciences Laboratory(EMSL),发现其正在改造为机器人实验室,实现远程高效实验。讨论指出,多技术分析产生的数据未充分整合,AI驱动科研需构建高质量数据层。传感器需适应复杂环境,并发展分布式网络和高效采样技术,以支撑实时自动化与动态系统研究。
我最近参观了太平洋西北国家实验室(Pacific Northwest National Laboratory),这里是分子科学领域规模最大、功能最强大的多用户设施之一——环境分子科学实验室(Environmental Molecular Sciences Laboratory, EMSL)的所在地。在参观期间,我参观了该实验室的一个区域,那里正在将整个翼楼改造成能够远程进行高通量实验的机器人实验室。这一愿景令人印象深刻:自主实验平台能够生成海量数据,从而推动由人工智能和机器学习驱动的新发现模式。
当天晚些时候,在享用了一顿烹饪得恰到好处的三文鱼晚餐后,我的主人们谈到了这一技术变革带来的另一个挑战。许多在国家实验室分析的样本需要经过多种先进的表征技术处理,每种技术都会产生大量数据集。然而,这些数据集中包含的许多信息从未被完全整合。“这么多数据都被浪费了,”一位同事指出。未来的目标不仅仅是收集更多数据,而是将来自不同实验的数据流连接起来,从而更全面地理解复杂系统,并保留成功与失败实验的科学记录。
这样的经历引发了关于科学界如何向人工智能(AI)驱动的研究转型的根本性问题。我的同事Baskar Ganapathysubramanian是爱荷华州立大学转化AI中心的联合主任,他经常简洁地提出这些问题:“我们如何衡量真正重要的东西?”以及“我们的数据层是什么?”后者指的是任何AI驱动的研究工作所依赖的关键基础——用于训练模型和做出决策的结构化实验观测数据。
这些问题在国家科学政策中得到了越来越多的体现。2025年11月,美国宣布了“Genesis Mission”计划,该计划旨在通过人工智能、大规模科学数据集和自动化实验平台来加速科学发现。该计划设想整合高性能计算、机器人实验室以及丰富的联邦数据资源,以训练科学基础模型并加快假设的生成和验证过程。虽然围绕这些努力的讨论大多集中在计算能力和AI算法上,但它们的成功最终取决于支撑这些工作的实验数据的质量、结构和可访问性。
归根结底,这一数据层的设计是由知识缺口所驱动的,尤其是那些影响决策制定和实现实时自动化的知识缺口。在许多情况下,这意味着需要生成具有空间分辨率、时间分辨率以及足够高通量的数据,以便捕捉复杂和动态的过程。因此,阵列式传感平台、映射技术和高通量测量方法变得越来越重要。然而,仅仅收集数据是不够的;数据必须高效地收集,并且其质量必须得到保证。AI和机器学习模型的可靠性取决于支撑它们的测量数据的准确性。在低质量数据上训练算法会在计算资源、能源消耗和环境影响方面带来实际成本。
随着AI计算需求的增加,这一点变得越来越重要。大规模的机器学习模型需要大量的能源和计算资源。在这种情况下,“绿色科学”必须超越材料和制造方法,还包括我们生成和使用数据的效率。高质量的数据能够捕捉最相关的变量,从而减少对大规模数据集的需求,并实现更高效的计算发现。
传感器定义了支撑AI驱动发现的科学数据层。它们不仅决定了我们可以测量什么,还决定了测量可以在哪里进行以及测量的频率。当今许多紧迫的挑战都涉及需要持续或频繁观测的动态系统。真正的个性化医疗、关键矿物的回收、大规模清洁水的可靠供应以及环境污染物的治理,都涉及随时间演变且通常发生在复杂环境中的过程。
这些环境很少适合使用传统的传感技术。血浆、废水流、工业反应器或北极水域在污染、稳定性和选择性方面都存在巨大挑战。然而,要理解这些系统,就需要在这些复杂环境中进行精确的测量。因此,下一代传感技术不仅需要具备分析性能,还需要在恶劣环境中保持可靠性。
另一个根本性挑战是将传感器准确地放置在需要的位置。能够在广阔空间范围内或复杂系统内运行的分布式传感网络对于捕捉支持AI驱动发现和决策所需的数据至关重要。同样重要的是那些能够高效将分析物传递给传感器的系统,无论是通过微流控技术、预浓缩策略,还是能够弥合现实世界环境与分析测量之间差距的采样架构。
随着围绕AI加速发现的各项计划不断扩展,测量科学的重要性变得更加明显。传感器领域有机会塑造支撑这些新研究模式的科学数据层的基础。通过设计能够在复杂和动态环境中稳定运行的高保真、高价值数据集的传感技术,我们可以确保下一代数据驱动的科学建立在真正捕捉关键信息的基础上。
本文尚未被其他出版物引用。