《PLOS Computational Biology》:Fung-AI: An AI/ML-driven pipeline for antifungal peptide discovery
编辑推荐:
摘要:新兴真菌病原体对全球健康与粮食安全构成日益严峻的威胁。本研究旨在通过对抗真菌药物发现方法的开发——Fung-AI流程(Pipeline):一种人工智能/机器学习(Artificial Intelligence/Machine Learning, AI/M
摘要:新兴真菌病原体对全球健康与粮食安全构成日益严峻的威胁。本研究旨在通过对抗真菌药物发现方法的开发——Fung-AI流程(Pipeline):一种人工智能/机器学习(Artificial Intelligence/Machine Learning, AI/ML)驱动的抗真菌药物发现方法,以应对人类对真菌病原体不断上升的易感性。研究人员训练了一个生成对抗网络(Generative Adversarial Network, GAN)以生成新型候选抗真菌肽序列;随后构建计算机模拟(in silico)抗真菌及溶血分类器,对AI生成的肽进行进一步优先排序以供实验验证。从约10,000个候选肽中分两阶段筛选出13个肽进行实验测试。结果显示五个肽对小麦病原菌禾谷镰刀菌(Fusarium graminearum)表现出轻度抗真菌活性,最小抑菌浓度(Minimal Inhibitory Concentration, MIC)范围为250–500 μg/mL;其中四个肽亦对人类病原菌白色念珠菌(Candida albicans)有活性(MIC:500 μg/mL)。两个AI生成的抗真菌肽在HepG2人肝癌细胞中显示出低细胞毒性(半数致死浓度 LC50> 704.2 μg/mL),表明其可作为未来治疗应用优化的 scaffold(骨架)。所测肽均未显著抑制新发病原体耳念珠菌(C. auris),提示需针对特定病原体进行候选肽的下选。总之,本研究提出了一种基于生成式AI、可快速设计全新(de novo)抗真菌肽的概念验证方法。
本文报道了发表于《PLOS Computational Biology》的研究论文"Fung-AI: An AI/ML-driven pipeline for antifungal peptide discovery"。该研究针对现有抗真菌药物种类匮乏及真菌与哺乳动物细胞生物学相似性高导致药物开发困难的问题,利用生成式人工智能构建了名为Fung-AI的计算流程用于全新抗真菌肽(Antifungal Peptide, AFP)的发现与筛选,并通过湿实验验证了AI生成肽的活性和毒性。
主要关键技术方法:
研究人员整合多个公开数据库(DRAMP 4.0、CAMPR4及Sharma等人数据集)构建含抗真菌与非负真菌肽的数据集(长度10–35个氨基酸),以及溶血/非负溶血肽数据集。采用时序卷积网络(Temporal Convolutional Network, TCN)及一维卷积双向长短时记忆网络结合BLOSUM嵌入(1DCNN-BiLSTM with BLOSUM embedding)构建三个抗真菌二元分类器和一溶血管分类器。生成对抗网络(GAN)设计为带编码器—解码器结构的自编码GAN(Autoencoder-GAN),同时以抗真菌与非负真菌肽训练以防模式崩溃。GAN生成约10,000条候选序列后,依次经三个抗真菌分类器过滤(概率阈值>0.5)、溶血管分类器排除潜在毒性肽、UMAP降维与HDBSCAN聚类取样、BLAST比对确证新颖性,并按净电荷(0<净电荷<+6)及疏水残基比例(30–60%)及pep-fold4预测二级结构最终选取代表性肽合成。实验验证采用微量稀释法测最小抑菌浓度(mic)针对禾谷镰刀菌(fusarium graminearum)、酿酒酵母(saccharomyces cerevisiae)、白色念珠菌(candida albicans)及耳念珠菌(candida auris),并以hepg2细胞cck-8 celltiter>净电荷<+6)及疏水残基比例(30–60%)及pep-fold4预测二级结构最终选取代表性肽合成。实验验证采用微量稀释法测最小抑菌浓度(mic)针对禾谷镰刀菌(fusarium>50。
研究结果
In silico generation and down-selection of candidate antifungal peptides(候选抗真菌肽的计算机模拟生成与下选)
GAN生成9,994条独特、无重复且不在训练/测试集中的肽序列(长10–35 aa)。经三个抗真菌分类器联用筛选,3,578条被三模型一致预测为抗真菌(概率>0.5);再经溶血管分类器去除溶血肽后保留2,433条。UMAP可视化显示预测为抗真菌且非溶血的生成肽多与训练集中已知抗真菌肽聚为一类。HDBSCAN对训练集抗真菌肽聚类得到21簇,选出≥70%成员为非溶血的9簇,生成肽映射到其中5簇共78条。BLAST比对NCBI nr数据库显示所有78条序列与已知蛋白全局相似度分数(Global Similarity Fraction = Query Cover × Percent Identity)均<0.75(无>90%覆盖且>80%同一性的显著相似),证实AI生成序列具新颖性。按集群归属概率>0.9、合理净电荷与疏水性及代表性二级结构(由PEP-FOLD4预测),从5个不同簇中各选1条肽(共5条)进入首轮实验。
Antifungal activity and cytotoxicity of AI-generated peptides(AI生成肽的抗真菌活性与细胞毒性)
初筛发现Cluster 17中Peptide 40对F. graminearum和S. cerevisiae均有抑制,遂追加合成同簇另8条符合条件肽。结果显示Cluster 17中9条合成肽有5条对F. graminearum有抑制活性(MIC 250–500 μg/mL);其中Peptide 12和40活性最强(F. graminearum MIC=250 μg/mL;S. cerevisiae与C. albicans MIC=500 μg/mL),Peptide 48对上述三株MIC=500 μg/mL但仅作用于F. graminearum和C. albicans,Peptide 17仅抑制F. graminearum(MIC=500 μg/mL),Peptide 65抑制F. graminearum和C. albicans(MIC=500 μg/mL)但不抑制S. cerevisiae。所有测试肽在≤500 μg/mL下均不抑制C. auris。细胞毒性方面:Peptide 12 LC50=66.06 μg/mL(较高毒性),Peptide 40 LC50=315.5 μg/mL,Peptide 17 LC50=85.88 μg/mL,Peptide 65 LC50=704.2 μg/mL(低毒),Peptide 48在测试浓度下未观察到毒性(NT)。Peptide 48和65因低细胞毒性及预测形成阳离子α螺旋结构被认为具进一步优化潜力。
讨论(总结翻译)
研究人员开发并实验验证了Fung-AI流程——一个支持AI/ML的全新抗真菌肽设计方法。研究人员用自定义GAN在计算机中生成约10,000候选肽,经计算下选并跨农业与医学相关病原真菌面板评估抗真菌活性。在两阶段实验中测试少于20条肽即从Cluster 17发现5/9合成肽(55%)对至少一种真菌有活性,其中2条(Peptide 48、65)同时对F. graminearum和C. albicans有抗真菌活性且在人肝细胞系中细胞毒性低(LC50高于MIC),提示可进一步优化作为治疗先导物。尽管序列有别于已知蛋白,这些肽呈阳离子且预测形成α螺旋结构,可能通过与已知抗微生物肽类似的膜破坏机制发挥作用。研究证明Fung-AI流程可用少量实验筛选发现新型抗真菌肽。研究人员指出四点局限与改进方向:(1)公开抗真菌肽数据有限(DRAMP中仅~5%标注为抗真菌),GAN用异源训练集致生成肽MIC偏高,未来可用病原体特异性数据微调或采用扩散模型;(2)未实验验证作用机制(Mechanism of Action, MOA),未来可将MOA预测纳入下选,并尝试蛋白质或小分子扩散模型针对特定真菌靶点生成;(3)受试肽均不能显著抑制临床新发多重耐药C. auris,因其公开数据稀缺(DBAASP中仅78条相关肽),需积累该菌的高通量药敏与基因组等多模态数据;(4)本研究下选策略基于预测活性和溶血及理化性质,未来应评估无下选时GAN本身的命中率,并尝试基于宿主特异性或结构多样性的替代下选方案。综上,Fung-AI流程展示了生成式AI应用于抗真菌药物发现的价值,结果鼓励继续针对相关农业及人类病原真菌对AI生成肽进行探索、筛选与优化。