《Egyptian Rheumatology and Rehabilitation》:Machine learning in systemic lupus erythematosus research: a bibliometric and visual analysis (2015–2025)
编辑推荐:
背景:系统性红斑狼疮(SLE)是一种严重的自身免疫性疾病,给个人和医疗系统带来沉重负担。机器学习(ML)在推进SLE的诊断、预后和精准医学方面具有巨大潜力。然而,目前尚无文献计量评估专门关注这一交叉领域。本研究人员通过过去十年关于ML在SLE中应用出版物的综合
背景:系统性红斑狼疮(SLE)是一种严重的自身免疫性疾病,给个人和医疗系统带来沉重负担。机器学习(ML)在推进SLE的诊断、预后和精准医学方面具有巨大潜力。然而,目前尚无文献计量评估专门关注这一交叉领域。本研究人员通过过去十年关于ML在SLE中应用出版物的综合文献计量和可视化分析来填补这一空白。这些发现旨在为研究人员、临床医生和政策制定者提供宝贵见解,从而支持他们理解和推进这一有前景的跨学科领域。
方法:对关于ML在SLE中应用的英文出版物进行了科学计量分析。文献数据集包含2015年至2025年间发表的研究和综述文章,检索自Web of Science核心合集(Web of Science Core Collection)。使用CiteSpace软件(版本6.3.R2),本研究人员系统研究了随时间变化的发表趋势、机构间的合作网络以及该领域内主题研究焦点的演变。
结果:对所纳入出版物的分析显示,中华人民共和国贡献了最多的研究,而加州大学系统(University of California System)是领先机构。最多产的个人研究者是Lipsky, Peter E和Grammer, Amrie C。引用次数最多(30次)的参考文献是Aringer M(2019)。共被引分析确定了关键研究领域,包括疾病分类、预测模型、狼疮肾炎(lupus nephritis)和生物标志物发现。新兴关键词趋势突出显示了对疾病活动、I型干扰素(type I interferon)、预测工具和发病机制日益增长的兴趣。
结论:本研究描绘了ML在SLE研究中应用的知识图谱,概括了三个核心主题集群:疾病分类与诊断、疾病活动与结局预测、以及发病机制与生物标志物发现。这些发现有助于阐明该领域的演变,并为未来的跨学科研究提出优先方向,同时强调了文献计量学在指导科学探究中的作用。
**论文解读:机器学习在系统性红斑狼疮研究中的文献计量与可视化分析(2015–2025)**
**研究背景与问题**
系统性红斑狼疮(Systemic Lupus Erythematosus, SLE)是一种慢性、异质性的自身免疫性疾病,以致病性自身抗体产生、系统性炎症及潜在多器官损伤为特征。尽管治疗手段的进步改善了预后,但由于临床异质性高及死亡率持续偏高,疾病管理仍充满挑战。机器学习(Machine Learning, ML)作为数据驱动的方法,能够从复杂数据集中提取可解释模式,为改进SLE的诊断、预后、患者分型及精准医疗提供了变革性工具。近年来,ML在SLE研究中的应用迅速扩展,从医学影像等通用医疗场景转向疾病特异性挑战,包括提升诊断准确性、从多组学数据中揭示机制、预测疾病进展风险及治疗反应。然而,相关文献增长迅速、内容碎片化且存在冗余,缺乏对该领域知识结构、关键贡献者、热点演变的系统梳理。因此,亟需通过文献计量(Bibliometric)分析,以严谨的定量框架绘制学术图谱,识别核心研究主题与合作网络,为研究者、临床医生及政策制定者提供导航。
**研究与结论**
研究人员基于Web of Science核心合集(Web of Science Core Collection, WOSCC)检索2015年至2025年间的英文文献,最终纳入451篇论文。使用CiteSpace 6.3.R2软件,开展发表趋势、国家/机构/作者合作网络、共被引网络、关键词共现及突发性分析。主要发现:发表量呈指数增长(R2=0.8447,从2015年的4篇增至2025年的121篇);中国贡献最多研究,加州大学系统(University of California System)为领先机构;研究者Lipsky, Peter E和Grammer, Amrie C产文最多(各9篇);最被引参考文献为Aringer M(2019)关于SLE分类标准的研究(被引30次);共被引聚类揭示疾病分类、预测模型、狼疮肾炎、生物标志物发现为核心领域;关键词突发检测显示疾病活动、I型干扰素(Type I Interferon)、预测、发病机制等成为新兴热点。研究意义在于系统描绘了ML应用于SLE的知识景观,明确了三个核心主题集群:疾病分类与诊断、疾病活动与结局预测、发病机制与生物标志物发现,为未来跨学科研究提供了优先级建议,并凸显了文献计量在指导科学探究中的作用。该论文发表在《Egyptian Rheumatology and Rehabilitation》。
**关键技术与方法**(不超过250字)
研究人员采用科学计量(Scientometric)方法,数据来源为WOSCC,检索策略覆盖SLE和ML相关术语(如“systemic lupus erythematosus”、“machine learning”、“deep learning”等),限定英文文献及2015-2025年时间窗。使用CiteSpace 6.3.R2软件进行分析:以每年为时间切片,采用g-index(k=25)筛选节点;应用Pathfinder和Pruning sliced networks算法简化网络并突出关键连接;采用对数似然比(Log-Likelihood Ratio, LLR)算法进行聚类;利用Kleinberg算法检测关键词突发(默认γ=1.0)。网络归一化使用关联强度(Cosine)和Jaccard指数。无具体样本队列来源,因该研究为文献计量分析。
**研究结果**(保留每个小标题并说明通过什么研究得出什么结论)
**出版物分析**(Analysis of the publications):通过拟合年度发表量数据,研究人员发现2015至2025年间发表量呈指数增长(y = 5.7107e
0.3447x,R2=0.8447),表明ML在SLE研究中的应用兴趣迅速扩大。
**国家和机构分析**(Analysis of countries and institutions):通过国家合作网络(50节点,243连线)分析,中国和美国为最活跃的核心节点,中国居发表量首位;机构合作网络(249节点,578连线)显示加州大学系统和哈佛大学(各13篇)领先,南京大学(12篇)紧随其后,中美机构间合作密切。
**作者分析**(Analysis of author):通过作者共现网络分析,Lipsky, Peter E和Grammer, Amrie C发表量最多(各9篇),且多共同发表高影响力文章,但整体作者间合作有限,低中心性提示未来需高质量大规模协作。
**共被引参考文献分析**(Analysis of co-cited references):共被引网络含553条参考文献及1606条链接,密度0.0105。最被引前5篇文献中,3篇聚焦SLE分类标准、狼疮肾炎及ML诊断算法。例如,Aringer 2019年的分类标准具有高敏感性和特异性;一项研究开发了基于LASSO-逻辑回归的ML诊断算法,准确率达94.8%;另一研究利用多队列基因表达数据构建ML分类器预测疾病活动,随机森林模型在交叉验证中达83%准确率,但受技术异质性影响。
**共被引期刊分析**(Analysis of co-cited Journal):期刊共被引网络(503节点,2768链接)显示核心风湿病学期刊(如Arthritis Research & Therapy, Journal of Rheumatology, Annals of the Rheumatic Diseases, Lupus)构成中心枢纽,Nature Reviews Rheumatology、Nature Communications等高影响力跨学科期刊也占据重要位置。近期(2022-2025年)活跃度显著增加(暖色调节点),反映ML在SLE研究中快速演进。
**关键词共现与突发分析**(Analysis of keyword co-occurrence and burst keywords):关键词共现网络含371节点、1577链接。最高频关键词为“systemic lupus erythematosus”、“machine learning”、“classification”、“disease”、“artificial intelligence”。突发检测(前25名)显示,“disease activity”、“type I interferon”、“prediction”、“women”、“mri”、“pathogenesis”等术语引用强度显著上升,指示当前研究热点,如整合多模态数据预测疾病活动、ML驱动发病机制研究(I型干扰素失调、性别特异因素)等。
**讨论与结论**
讨论部分指出,三个核心研究领域(疾病分类诊断、疾病活动预测、发病机制与生物标志物发现)存在共同的挑战:数据碎片化(临床、组学、真实世界数据)、模型可解释性不足(“黑箱”算法)以及外部验证缺乏,这阻碍了临床工具的开发。未来研究应超越增量模型优化,聚焦于开发可解释的多模态框架以整合纵向临床数据与多组学层,建立动态疾病模型;推动假设驱动的ML以揭示新生物学关联(如非凋亡性细胞死亡);在大型独立多样化队列中实施严格验证;构建考虑SLE临床异质性的亚型特异性模型。研究结论翻译如下:本文献计量分析描述了ML-SLE研究过去十年的关键模式。数据表明,中华人民共和国、加州大学系统以及研究者Peter E. Lipsky和Amrie Grammer是出版量最多的贡献者,并在广泛合作网络中作为中心节点。国际和机构间合作(尤其发达国家的机构)是高效产出相关研究的一个突出结构特征。基于关键词和引文分析的知识结构围绕三个核心主题集群凝聚:疾病分类/诊断、疾病活动/预后预测以及发病机制探索/生物标志物发现。发表趋势显示,从初始概念验证研究向ML模型开发和验证的转向,表明研究优先级正向着潜在临床转化的成熟方向发展。这些发现受综述范围限制,凸显了该领域的主要贡献者、合作模式及主导研究前沿。