口腔癌数值指数(OCNI):一种基于细胞学的口腔病变风险评估工具的开发与验证

《Journal of Clinical Medicine》:Oral Cancer Numerical Index (OCNI): Development and Validation of a Cytology-Based Risk Assessment for Oral Lesions

【字体: 时间:2026年06月18日 来源:Journal of Clinical Medicine 2.9

编辑推荐:

  背景/目的:口腔潜在恶性疾病(OPMDs)需要准确的风险分层,以识别最有可能患有严重口腔上皮异型增生(OED)或口腔鳞状细胞癌(OSCC)的患者。研究人员开发并内部验证了口腔癌数值指数(OCNI),这是一种基于临床特征和深度学习刷状细胞学测量的定量风险评分。方

  
背景/目的:口腔潜在恶性疾病(OPMDs)需要准确的风险分层,以识别最有可能患有严重口腔上皮异型增生(OED)或口腔鳞状细胞癌(OSCC)的患者。研究人员开发并内部验证了口腔癌数值指数(OCNI),这是一种基于临床特征和深度学习刷状细胞学测量的定量风险评分。方法:这项回顾性模型开发和内部验证研究使用了来自多中心Grand Opportunity研究的数据。前瞻性纳入的具有完整数据的OPMD受试者按个体层面以70:30的诊断分层比例分为训练集(n=384)和保留测试集(n=164)。主要终点是严重OED或OSCC与良性诊断、轻度和中度OED的比较。预测因子包括年龄、性别、吸烟史、病变颜色、病变大小、多发性病变、溃疡形态以及基于深度学习的细胞学得出的分化鳞状上皮细胞(DSE)和小圆形细胞(SR)的百分比。在训练集中预先指定了排除和纳入阈值,分别以90%敏感性和90%特异性为目标,然后应用于保留测试集。结果:在预先指定的排除阈值(OCNI ≤ 37.6)下,敏感性为92%,阴性预测值为97%。在纳入阈值(OCNI > 60.0)下,特异性为89%,阳性预测值为67%。校准在保留集中良好(截距,-0.07;斜率,1.13;Hosmer-Lemeshow p = 0.36),且OCNI随着组织病理学严重程度的增加而显著增加。结论:OCNI提供了对严重OED或OSCC的客观、临床可解释的风险估计,具有强大的排除和纳入性能以及良好的校准。这些结果支持OCNI作为口腔病变风险分层辅助工具的进一步外部验证。
## 论文解读:口腔癌数值指数(OCNI)——基于细胞学的口腔病变风险评估工具的开发与内部验证

### 研究背景与现存问题

口腔潜在恶性疾病(oral potentially malignant disorders, OPMDs)在全球约影响4.7%的人群,其中可能隐匿口腔上皮异型增生(oral epithelial dysplasia, OED)或口腔鳞状细胞癌(oral squamous cell carcinoma, OSCC)。然而,传统的视觉与触诊检查(conventional visual and tactile examination, CVTE)无法可靠区分OPMD的风险等级,导致临床管理存在两大关键缺口:一是难以确定哪些病变需要立即活检(因良性病变与高风险病变的颜色、形态等临床特征重叠显著);二是缺乏广泛可用的客观严重程度评估指标,以支持一致的风险分层和纵向监测。这种局限性可能导致诊断延迟、不必要的活检以及临床决策的差异性。刷状细胞学(brush cytology)作为一种非侵入性辅助手段被提出,但传统细胞学工作流程受限于主观解读和不便的远程处理。近年来,定量细胞学取得进展,结合深度学习的细胞表型分析可客观量化细胞变化,并与异型增生及恶性肿瘤风险相关。多中心Grand Opportunity(GO)研究为此提供了大规模配对临床、细胞学和组织病理学数据。基于此,研究人员开发了口腔癌数值指数(oral cancer numerical index, OCNI),旨在将上述发现转化为临床可操作的风险评分。

### 研究内容与结论

本研究利用GO研究数据,进行回顾性预测模型开发和内部验证。共纳入692名受试者(144名健康对照、325名良性、65名轻度OED、27名中度OED、17名严重OED、114名OSCC),其中OPMD患者(良性、各等级OED及OSCC)用于模型开发。采用70:30的诊断分层随机分割,以训练集(n=384)和保留测试集(n=164)进行模型拟合与评估。主要结局为严重OED或OSCC(联合组)与良性、轻度、中度OED的区分。通过LASSO逻辑回归筛选预测因子并建立OCNI模型(0–100分),并预先在训练集确定排除阈值(≤37.6,目标90%敏感性)和纳入阈值(>60.0,目标90%特异性),随后在保留测试集评估表现。结果显示:保留测试集受试者工作特征曲线下面积(AUROC)为0.92(95% CI 0.83–0.96)。排除阈值下敏感性为92%,阴性预测值(NPV)为97%,仅有3例严重OED/OSCC被漏诊;纳入阈值下特异性为89%,阳性预测值(PPV)为67%。校准良好(截距-0.07,斜率1.13,Hosmer-Lemeshow p=0.36)。OCNI随组织病理学严重程度增加而显著递增(Kruskal-Wallis p<0.0001;Jonckheere-Terpstra趋势检验p<0.0001)。结论表明,OCNI能客观、临床可解释地估计严重OED或OSCC风险,并具备良好的排除和纳入性能,支持其作为口腔病变风险分层的辅助工具。该论文发表在《Journal of Clinical Medicine》。

### 主要关键技术方法

研究人员采用了以下核心技术方法:
- **样本队列来源**:利用多中心国际前瞻性GO研究的数据,该研究于2010年7月至2012年12月间从四个研究中心(德克萨斯大学圣安东尼奥健康科学中心、德克萨斯大学休斯顿健康科学中心、谢菲尔德大学、莱斯大学、纽约大学)收集受试者。受试者包括:组1(经临床诊断的OPMD,需常规刀片活检的成人)、组2(新确诊OSCC,等待治疗的成人)、组3(健康对照)。本研究模型开发仅纳入组1(OPMD)受试者,健康对照仅用于参考分析。
- **深度学习细胞表型检测**:基于YOLOv8(Ultralytics, Los Angeles, CA, USA)预训练模型,通过迁移学习训练细胞目标检测模型,识别四种口腔细胞表型:分化鳞状上皮细胞(differentiated squamous epithelial, DSE)、小圆形细胞(small round, SR)、白细胞和裸核(lone nuclei, LN)。锁定模型输出的DSE和SR细胞百分比作为细胞学预测因子,不重新训练目标检测器。
- **模型开发与验证**:使用LASSO(最小绝对收缩和选择算子)逻辑回归进行预测因子选择和系数收缩,10折交叉验证确定惩罚参数。模型输出转换为0–100分即为OCNI。预先在训练集设定90%敏感性和90%特异性对应的阈值,并在保留测试集进行独立评估。校准通过Hosmer-Lemeshow检验、Brier评分及校准图评估。

### 研究结果

**3.1 受试者特征(Subject Characteristics)**
通过比较良性/轻中度OED组与严重OED/OSCC组,发现后者年龄更大(60±12岁 vs. 56±14岁, p=0.0152),男性占比更高(66% vs. 46%, p=0.0001),吸烟史更普遍(任何吸烟史73% vs. 59%, p=0.0033)。病变特征方面,严重OED/OSCC病变更大(26±16 mm vs. 16±12 mm, p<0.0001),白色病变较少(12% vs. 45%),红色(25% vs. 15%)和红白混合病变(63% vs. 40%)更常见,且更常表现为结节/肿块(51% vs. 18%)和溃疡(47% vs. 10%),而斑块/斑片形态较少(32% vs. 74%)。

**3.2 细胞学检测参数(Cytology Test Parameters)**
随着疾病严重程度增加,细胞学参数显著偏离健康对照水平:DSE细胞百分比从对照组的96±3%下降至良性/轻中度OED组的83±17%和严重OED/OSCC组的46±31%(p<0.0001);SR细胞百分比从3±2%分别增至11±10%和22±14%(p<0.0001);白细胞百分比从0.9±0.7%增至7±13%和32±28%(p<0.0001);中位细胞直径从72±4 μm分别降至68±8 μm和55±13 μm(p<0.0001)。单变量和多变量分析均显示临床变量和细胞学变量与严重OED/OSCC独立相关。

**3.3 诊断性能(Diagnostic Performance)**
最终LASSO模型保留的预测因子包括年龄、性别、吸烟史、病变颜色、病变大小、多发性病变、溃疡形态、DSE细胞百分比和SR细胞百分比。在保留测试集(n=164)中,OCNI的AUROC为0.92(95% CI 0.83–0.96)。排除阈值(OCNI ≤ 37.6)下:敏感性92%(95% CI 79–98%),NPV 97%(91–99%),仅漏诊3例;若所有OPMD患者本应推荐刀片活检,使用此阈值可使93例(57%)活检变得不必要。纳入阈值(OCNI > 60.0)下:特异性89%(82–94%),PPV 67%(51–80%)。校准分析显示截距接近0(-0.07),斜率接近1(1.13),Hosmer-Lemeshow检验p=0.3643,表明预测风险与观察结果一致性良好。

**3.4 OCNI分布(Distribution of OCNI)**
保留测试集中OCNI中位数(四分位距)随组织病理学严重程度递增:良性26.4(19.7–36.6),轻度OED 28.5(22.3–44.6),中度OED 42.6(31.9–54.9),重度OED 43.2(28.5–56.2),恶性77.8(63.8–84.4)。组间差异显著(Kruskal-Wallis p<0.0001),且存在强烈单调递增趋势(Jonckheere-Terpstra p<0.0001),支持OCNI与疾病严重程度的梯度关系。

**3.5 健康对照参考限(Reference Limits in Healthy Controls)**
在144名健康对照中,各项细胞学参数分布较窄:DSE细胞百分比中位数96.5%,参考下限>90.7%;SR细胞中位数2.7%,参考上限<7.5%;白细胞中位数0.7%,参考上限<2.0%;OCNI中位数14.5,参考上限<30.2;中位细胞直径中位数72.4 μm,参考下限>66.1 μm。这些参考限为异常结果的判读提供了基准。

### 讨论与结论

讨论部分强调,OCNI的主要优势在于其多模态整合了临床特征和深度学习衍生的细胞学测量,在预测严重OED或OSCC时表现出良好的区分度、校准度以及临床相关的排除和纳入性能。与现有辅助手段(如自体荧光、活体染色、唾液生物标志物)相比,细胞学检测具有最高准确性,而OCNI通过结合深度学习进一步提升了性能。研究的方法学优势包括:基于前瞻性多中心研究、针对目标人群(OPMD)建模、采用两至三级组织病理学裁定、诊断分层随机分割、预先设定阈值并独立验证。局限性包括:仅限于内部验证、来源于二级/专科医疗环境(外推至初级保健时预测值可能变化)、严重OED亚组样本量较小、可能存在选择偏倚,以及需进一步评估成本、可及性和工作流程整合。结论部分翻译如下:总之,OCNI提供了对严重OED或OSCC风险的客观、多模态估计,结合了临床检查结果与深度学习衍生的细胞学特征。OCNI表现出强大的区分度、校准度以及临床相关的排除和纳入性能,同时能够追踪疾病谱中不断增加的严重程度。这些结果支持Cyt-MF系统作为口腔病变风险分层辅助工具的进一步外部验证。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号