
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ProQSAR:一个模块化且可重复的小数据QSAR建模框架,提供现成的模型可供直接使用
《Journal of Cheminformatics》:ProQSAR : A modular and reproducible framework for small-data QSAR modeling with fit-and-use models
【字体: 大 中 小 】 时间:2026年04月23日 来源:Journal of Cheminformatics 5.7
编辑推荐:
摘要 背景 定量结构-活性关系(QSAR)模型是计算机辅助药物发现和预测毒理学的核心,但其实际应用往往受到临时性工具、不一致的验证协议以及较差的可重复性的阻碍。 目标 我们推出了ProQSAR,这是一个模块化、可重复的工作平台,它规范了端
定量结构-活性关系(QSAR)模型是计算机辅助药物发现和预测毒理学的核心,但其实际应用往往受到临时性工具、不一致的验证协议以及较差的可重复性的阻碍。
我们推出了ProQSAR,这是一个模块化、可重复的工作平台,它规范了端到端的QSAR开发过程,同时允许独立使用各个组件。
结果 在基于Bemis–Murcko骨架分割的代表性ProQSAR展示了基于描述符的最新性能:在整个回归套件(FreeSolv、0.658\pm 0.11),相较于领先的图谱方法0.494 vs 0.731)有了显著提升。在量子力学基准测试中,QM7上表现出色,并在多任务数据集ProQSAR在70.4\pm 11.6)。重要的是,所有预测结果都附有跨构象预测和明确的适用性领域标记,可以识别出分布外的数据,从而实现校准和决策支持。 PyPI、Docker Hub上发布;所有版本都包含了完整的来源信息(参数、包版本、校验和),以确保可重复性。 定量结构-活性关系(QSAR)模型是计算机辅助药物发现和预测毒理学的核心,但其实际应用往往受到临时性工具、不一致的验证协议以及较差的可重复性的阻碍。 我们推出了方法 结果 在基于Bemis–Murcko骨架分割的代表性ProQSAR展示了基于描述符的最新性能:在整个回归套件(FreeSolv、0.658\pm 0.11),相较于领先的图谱方法0.494 vs 0.731)有了显著提升。在量子力学基准测试中,QM7上表现出色,并在多任务数据集ProQSAR在70.4\pm 11.6)。重要的是,所有预测结果都附有跨构象预测和明确的适用性领域标记,可以识别出分布外的数据,从而实现校准和决策支持。 PyPI、Docker Hub上发布;所有版本都包含了完整的来源信息(参数、包版本、校验和),以确保可重复性。可用性
科学贡献
背景
目标
可用性
科学贡献