构建用于环境和职业暴露中化学健康风险推理的大型语言模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Hazardous Materials》：Structuring large language models for chemical health risk reasoning in environmental and occupational exposure

【字体：大中小】 时间：2026年03月21日 来源：Journal of Hazardous Materials 11.3

编辑推荐：

　　环境健康风险分析中，大语言模型（LLM）通过整合深度学习预测化学性质、检索增强生成（RAG）和领域感知提示工程，构建了统一推理框架。该框架采用语义结构化重组异构知识并优化提示策略，有效提升对复杂暴露数据的推理准确性和减少幻觉问题，在涵盖职业暴露和日常接触的100题基准测试中，其正确性、可信度和领域相关度均优于基线模型，为化学风险与疾病关联分析提供了可扩展的AI解决方案。

卓晨|孟杜|陈倩|余汉清

中国科学技术大学环境科学与工程学院，先进环境技术国家重点实验室，合肥，230026，中国

摘要

大型语言模型（LLMs）已经彻底改变了众多科学领域。然而，它们在环境健康领域的应用仍然有限，因为这些模型容易产生幻觉，并且难以对复杂的现实世界暴露数据进行推理。化学风险，尤其是来自稀有或研究不足的化合物的风险，涉及多种职业和日常场景，在这些场景中，结构化知识往往不完整且整合度较低。为了解决这些问题，我们提出了一个健康风险辅助系统，该系统将基于深度学习的化合物属性预测、检索增强生成（RAG）和提示工程整合到一个统一的推理框架中。我们设计的两个核心策略是：语义结构化，它将异构知识重新组织成上下文一致且语义丰富的概况；以及领域感知提示，它引导大型语言模型进行与毒理学目标相一致的结构性和角色特定的推理。该框架使系统能够以更高的相关性和准确性将物理化学属性与暴露途径和疾病结果联系起来。在涵盖慢性毒性、职业危害和特定暴露风险的100个问题的基准测试中，我们的LLM-RAG系统在正确性、准确性和领域特定帮助性方面始终优于基线模型。

引言

化学工业的迅速发展将越来越多的化合物引入了职业和日常环境中。这显著增加了人类暴露的复杂性，并在健康风险评估方面带来了新的挑战。这些挑战主要源于两个因素：一是大量化学物质的毒性数据有限；二是环境过程（如传输、转化和积累）的复杂性。这些因素共同影响了污染物在现实世界条件下的行为。因此，健康风险评估变得尤为具有挑战性。传统的筛查方法可以帮助识别未知污染物，但它们通常不足以评估涉及多种化合物和不断变化的暴露场景的复合风险。

为了支持更深入的理解，人工智能（AI）通过“AI for Science”（AI4S）范式成为科学研究的中心[1]。特别是机器学习（ML）技术被用来预测化学暴露的环境行为和健康影响。研究人员使用实验或理论数据集开发基于ML的化合物属性预测模型。这些模型支持生态毒理学和环境终点预测。传统模型（如定量结构-活性关系（QSAR）[2]、[3]，以及现代深度学习（DL）模型[4]、[5]、[6]（如图神经网络（GNNs）[7]、[8]和变换器[9]）已在预测毒性终点[10]、物理化学性质和环境归趋参数[11]方面展现出有效性，适用于广泛的人类和生态毒理学应用[12]。除了单一任务预测之外，基于AI的分析开始提供综合见解，以支持早期疾病预防和暴露相关干预[13]。

最近，大型语言模型（LLMs）通过实现语言流畅性和多领域推理，彻底改变了自然语言处理。高度参数化的模型，如GPT-4（OpenAI）、LLaMA 3（Meta）和DeepSeek-R1，现在能够执行多种任务，包括生成、翻译和技术解释。在医疗保健[14]、[15]、[16]、[17]、[18]和化学自动化[19]、[20]、[21]、[22]领域，LLMs协助临床决策支持、分子设计和自动化合成规划。在环境科学领域，如TianGong GPT [23]和专门的环境问答系统[24]等与领域对齐的LLMs展示了针对环境应用的有希望的能力[25]。

尽管取得了最新进展，但将LLMs应用于环境健康仍然是一个重大挑战。现实世界的暴露场景既包括职业环境也包括日常环境，涉及多种化学类别、暴露途径和健康结果。这种复杂性使得建立化合物属性与疾病风险之间的可靠联系变得困难。LLMs在整合异构信息和建模复杂关联方面具有强大的能力，非常适合映射化学属性、暴露活动和健康效应之间的相互作用。然而，一个持续存在的问题是幻觉，即生成的输出可能偏离事实知识或呈现误导性的推理[26]、[27]、[28]。在处理罕见化合物或毒理学结果描述不足的情况时，这个问题尤为严重，这在职业健康和环境暴露背景下很常见。在安全相关背景下，模型可能会产生临床或环境相关的事实幻觉，误解定量信息，或提供过于自信但不正确的建议。在保持事实准确性的同时平衡生成灵活性仍然具有挑战性，尽管数据增强和提示工程等新兴方法提供了潜力。此外，解释环境健康数据需要领域特定的知识，而这通常是通用模型或非专家用户无法获得的。虽然将策划的知识注入模型输入可以提高相关性，但微调仍然需要大量资源且缺乏可扩展性。

为了克服这些限制，我们开发了一个领域适应性的检索增强生成（RAG）框架，用于健康风险推理，该框架结合了语义结构化、基于MolCLR的物理化学属性预测和领域感知提示。该系统将LLM与包含物理化学属性、环境行为和疾病关联的外部知识库集成在一起。这种结构使模型能够检索相关证据并生成特定于场景的评估，同时最小化幻觉。在此基础上，我们实现了一个本地部署的LLM-RAG辅助系统，包含四个核心模块：知识处理、检索、生成和评估（图1）。为了丰富知识库，深度学习模型预测了描述不足的化合物的关键物理化学参数。这些预测增强了系统分析职业和非职业场景中的慢性及急性暴露的能力。为了提高输出的质量和相关性，我们引入了两种协同策略：语义结构化将异构信息重新组织成连贯的、化合物级别的概况，以支持上下文一致的检索；领域感知提示使用专家角色指令和特定于暴露的模板引导模型进行结构化推理。对于评估，我们将LLM作为裁判的范式与RAGAS框架结合起来。这种双重方法使用基于模型和检索的指标来评估正确性、帮助性、信息量和相关性。该系统使得LLM在各种化学健康场景中的推理透明且可扩展，并为开发先进的职业疾病预防和环境健康保护工具提供了途径。

部分片段

本地知识库构建

为了支持使用LLMs进行可靠的健康风险推理，我们采用了一种基于语义结构化的策略构建了特定领域的知识库。该方法结合了数据增强、属性对齐和知识重组，以提高检索内容的一致性和信息量。

我们首先从环境和医疗保健相关的网络资源中提取了相关信息，重点关注人类活动、化合物、环境效应和疾病风险。这一过程产生了

健康风险推理框架设计

健康风险聊天机器人框架包括三个核心组成部分：知识库、检索机制和生成模块（图2）。知识库整合了两种类型的信息。第一种是包含由深度学习模型预测的分子属性的结构化数据库，该模型在预训练后进行了微调；第二种是半结构化文本存储库，其中包含了日常生活中遇到的有害化合物及其相关疾病的描述。

结论

我们的集成LLM-RAG框架结合了语义结构化和领域感知提示，以实现环境健康领域的准确和特定于上下文的推理。通过将化合物数据转化为连贯的概况，并用特定于任务的提示指导输出，该系统有效地建立了化学属性、暴露途径和疾病风险之间的联系。这种结构化的方法提高了答案的相关性、一致性、帮助性和毒理学洞察力，这一点通过基于检索的评估得到了证实。

环境影响

化学风险，尤其是来自稀有或研究不足的有害化学物质的风险，涉及多种职业和日常场景，在这些场景中，结构化知识往往不完整且整合度较低。在这项工作中，我们提出了一个健康风险辅助系统，该系统将基于深度学习的化合物属性预测、检索增强生成和提示工程整合到一个统一的推理框架中。这一框架为AI支持的健康风险评估提供了一种可扩展且值得信赖的方法。

CRediT作者贡献声明

陈倩：写作——审稿与编辑、撰写初稿、监督、软件开发、项目管理、方法论、调查、概念化。余汉清：写作——审稿与编辑、撰写初稿、验证、监督、项目管理、资金获取、概念化。卓晨：写作——审稿与编辑、撰写初稿、方法论、调查、形式分析、概念化。孟杜：调查、形式分析。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争财务利益或个人关系。

致谢

我们感谢中国国家自然科学基金（52170056、52192684、22422608和52293441）以及中国教育部的基础与跨学科学科突破计划（JYB2025XDXM909）对这项工作的支持。

联系信箱：

粤ICP备09063491号

摘要

引言