《Frontiers in Plant Science》:An in situ image-based phenotyping system for hydroponic maize seedling roots based on DB-UNet and customized skeleton-based analysis
编辑推荐:
根系表型(Root phenotype)是影响玉米生长和发育的关键农艺性状。原位观察和高精度根系表型分析为监测玉米生长提供重要支持。传统根系表型方法缺乏原位监测能力,且现有模型在根系分割中的精度有限。为解决这些问题,研究人员开发了一个整合作物栽培与数据采集的作
根系表型(Root phenotype)是影响玉米生长和发育的关键农艺性状。原位观察和高精度根系表型分析为监测玉米生长提供重要支持。传统根系表型方法缺乏原位监测能力,且现有模型在根系分割中的精度有限。为解决这些问题,研究人员开发了一个整合作物栽培与数据采集的作物根系表型系统(crop root phenotyping system)。研究人员还提出了一种用于水培玉米根系分割的DB-UNet模型(DB-UNet model)。DB-UNet在编码器下采样层级构建了一个CNN-ViT双分支并行结构(CNN-ViT dual-branch parallel structure)。轻量级ViT分支(ViT branch)使用序列下采样(sequential downsampling)实现全局拓扑依赖性建模(global topological dependency modeling),同时降低计算成本。一个注意力融合模块(Attention Fusion Module)动态校准双分支特征权重,实现局部根系边缘细节与全局上下文信息的互补融合。研究人员构建了一个混合损失函数(mixed loss function),结合Dice损失(Dice loss)、Focal损失(Focal loss)和结构一致性KL损失(structural consistency KL loss),以解决类别不平衡、困难样本分割和双分支特征语义分歧问题。在定制的水培玉米根系数据集上,DB-UNet达到了91.02%的mIoU(mean Intersection over Union)、82.78%的FG IoU(Foreground Intersection over Union)以及97.72%的Centerline-Dice(Centerline-Dice)。与经典U-Net相比,mIoU、FG IoU和Centerline-Dice分别提高了0.92%、1.84%和1.99%。植株级别五折交叉验证进一步表明,DB-UNet在不同植株级别分区中保持了稳定的分割性能。基于DB-UNet分割结果,研究人员提出一种定制化骨架算法(customized skeleton-based algorithm)用于多性状根系表型提取,实现了总根长(total root length)和根系分支点(root branch points)的提取。根系面积(root area)通过二值掩膜像素统计计算。与传统Zhang-Suen算法相比,根长测量的平均相对误差降低至3.14%,比传统方法低8.42个百分点。此外,研究人员分析了分割精度指标与表型相对误差之间的关系。较高的分割质量通常导致较低的表型相对误差和更可靠的性状测量。特别地,Centerline-Dice与根长估计密切相关,而像素级分割一致性与根系面积测量更为相关。皮尔逊相关系数(Pearson correlation coefficient)和斯皮尔曼秩相关系数(Spearman rank correlation coefficient)分析显示,玉米株高(plant height)与总根长之间存在强正相关,系数分别为0.8466和0.8634。
**论文解读文章**
**研究背景与问题**
根系是作物吸收水分和矿质养分的关键地下器官,其表型性状(如根长、分枝结构)直接反映作物对环境条件的适应性和生长状态。准确、定量地监测根系动态变化对优良性状鉴定、品种筛选和遗传育种至关重要。玉米作为全球主要粮食作物,其根系构型(Root System Architecture, RSA)对产量潜力和抗逆性起决定性作用。然而,传统根系观测方法(如挖掘法、土壤钻芯法、微根管技术)存在破坏性强、无法原位连续监测、视野受限等缺陷。尽管透明根盒系统结合水培条件可实现非破坏性成像,但现有深度学习语义分割模型在细根分割、拓扑结构保持方面仍面临挑战——水培玉米根系具有纤细、前景像素稀疏、边缘弱对比度、强拓扑连续性等特点,导致分割结果易出现断裂和遗漏。此外,下游表型提取(如根长、根面积)的精度高度依赖分割质量。因此,开发一套集原位成像、高精度分割和稳定表型提取于一体的系统具有重要研究意义。
**研究内容与结论**
本研究构建了一个包含作物栽培模块和数据采集模块的原位根表型系统,并提出了针对水培玉米根系的DB-UNet分割模型及定制化骨架分析框架。DB-UNet通过CNN-ViT双分支并行结构、注意力融合模块(Attention Fusion Module, AFM)和混合损失函数(SL Loss),在局部细节与全局结构之间实现协同建模,显著提升了细根分割和拓扑保持能力。基于分割结果,研究人员开发了改进的骨架提取算法(结合广度优先搜索的毛刺修剪和深度优先搜索的链码统计),实现了总根长、投影根面积和分支点数的多性状提取。在21个测试样本上,根长测量的平均相对误差仅为3.14%,较传统Zhang-Suen算法降低8.42个百分点。进一步分析表明,分割质量(特别是拓扑感知指标Centerline-Dice)直接影响表型提取准确性。基于提取的根长,研究人员对15株玉米幼苗的株高与总根长进行相关性分析,发现两者呈现强正相关(Pearson系数0.8466,Spearman系数0.8634),证实了地上地下生长的协同性。该研究为高通量、高精度玉米根系表型分析和地上-地下同步研究提供了技术支撑,论文发表在《Frontiers in Plant Science》。
**主要关键技术方法**
本研究采用的技术方法包括:(1)基于透明根盒的水培作物栽培系统与工业RGB相机(Hikvision CS20010GC,分辨率5472×3648像素)组成的数据采集系统,用于获取22株玉米幼苗10天连续生长图像(共154张,经裁剪后构成1547张512×512图像块),并按植株级别以7:2:1比例划分训练、验证和测试集;(2)DB-UNet模型,其核心模块为CNN-ViT双分支并行编码器、注意力融合模块(AFM)以及由Dice损失、Focal损失和KL散度组成的混合损失函数;(3)定制化骨架提取算法,包括基于连通分量分析的预处理、Zhang-Suen细化、广度优先搜索(BFS)毛刺修剪和深度优先搜索(DFS)改进链码统计用于根长计算;(4)以WinRHIZO系统(扫描分辨率164 DPI,0.142 mm·pixel
-1)测量值为参考基准,进行回归分析和残差分析。
**研究结果**
**Dataset construction(数据集构建)**:研究人员建立了基于透明根盒的水培玉米根系成像数据集,通过原位成像和人工标注,按植株级别划分训练、验证和测试集,为模型训练提供可靠数据基础。此部分通过采集22株幼苗10天连续生长图像并裁剪成512×512图像块,最终得到1547张图像。
**DB-UNet model based on U-Net improvement(基于U-Net改进的DB-UNet模型)**:DB-UNet在U-Net编码器每一下采样层级引入CNN-ViT双分支并行结构:CNN分支提取局部边缘细节,轻量级ViT分支通过序列下采样(4×4步长卷积压缩token序列至H/4×W/4)实现全局拓扑依赖建模,显著降低计算成本。AFM使用空间和通道注意力动态分配权重,在边缘区域侧重CNN特征,在主根连续性上侧重ViT特征,实现局部与全局互补融合。混合损失函数(SL Loss)平衡区域重叠(Dice Loss)、困难样本(Focal Loss)和双分支特征一致性(对称KL散度)。在测试集上,DB-UNet的mIoU达91.02%,FG IoU达82.78%,Centerline-Dice达97.72%,相比U-Net分别提升0.92%、1.84%和1.99%。植物级别五折交叉验证(22株分为5份)进一步证实DB-UNet在不同植株分区下保持稳定性能(平均mIoU 90.36%)。
**Multi-trait root phenotyping method and validation based on segmentation results(基于分割结果的多性状根系表型方法及验证)**:提出定制化骨架分析算法,包括预处理(连通分量分析、面积阈值τ
area=50移除孤立噪声,区分主根与侧根)、Zhang-Suen骨架提取、BFS毛刺修剪(路径长度短于预定义阈值的分支被移除)以及DFS改进链码统计(对角连接长度√2,水平/垂直连接长度1,避免分支点重复计数)。在21个测试样本上,与传统Zhang-Suen算法对比:改进算法相对误差范围1.03%~5.60%,平均3.14%;传统算法范围8.45%~14.26%,平均11.56%。线性回归显示改进算法与WinRHIZO参考值高度一致(R2=0.9869)。此外,基于DB-UNet分割结果提取的投影根面积(前景像素统计)和分支点数(修剪骨架图)与WinRHIZO参考值的线性回归R2分别达0.9784和0.9920,残差分析表明误差近似正态分布,无明显系统性偏差。
**Correlation analysis between aboveground and belowground traits(地上与地下性状相关性分析)**:基于DB-UNet分割结果和定制化根长提取算法,对15株玉米幼苗最后10天连续生长数据进行株高(由RGB图像顶部和底部座标确定)与总根长的相关性分析。Pearson相关系数范围0.882~0.985,Spearman相关系数除两株外均达完美正相关;总体Pearson系数0.8466,Spearman系数0.8634,均表示强正相关。Spearman系数略高提示秩变化一致性更为显著,反映地上地下生长节奏的高度协同。
**讨论与结论**
**讨论部分总结**:本研究的DB-UNet模型及表型框架在玉米根系数据集上表现较好,但仍存在局限。首先,生物个体数量有限(22株幼苗),尽管进行了五折交叉验证,但样本量可能不足以涵盖不同基因型、发育阶段或环境处理下的根系形态变异,未来将扩大数据集,纳入多种玉米品种和更长生长周期。其次,当前图像采集于高度受控的水培条件(透明根盒、稳定成像环境),与土壤或田间环境差异大,未来将扩展到不同栽培方式、成像背景、品种和发育阶段的数据场景。最后,当前框架未包含显式RSA重建或图结构建模(如根序识别、父子关系重建、RSML输出),仅适用于分割驱动的形态性状提取,未来将整合关键点检测、根系图构建和根序分类,向完整RSA重建延伸。
**研究结论部分翻译**:本研究聚焦玉米幼苗期根系。传统根系表型方法具有破坏性且缺乏原位监测能力,现有图像分割模型对细根和小目标的分割精度有限。为解决这些问题,研究人员使用扁平根盒建立了水培玉米根系原位成像数据集,设计出适用于水培玉米根系分割的DB-UNet模型,开发了定制化骨架表型分析框架,并系统研究了玉米株高与根长的相关性。这为高通量玉米根系表型及地上-地下协同生长机制研究提供了技术支持和数据参考。主要结论如下:(1)构建了由基于透明扁平根盒的作物栽培模块和基于工业RGB相机的数据采集模块组成的作物根系表型系统,可实现玉米幼苗根系非破坏性原位成像,为根分割模型提供高质量基础数据。(2)DB-UNet是针对水培玉米根系表型的任务特定优化,通过基于CNN的局部特征提取、基于轻量级ViT的全局依赖建模、基于注意力的异质特征融合以及结构一致性正则化,更有效地应对细根分割的挑战(前景稀疏、边界弱等),并在分割精度和下游表型输入稳定性上取得一致提升。(3)基于DB-UNet分割结果,提出整合像素统计和定制化骨架分析的表型框架,提取总根长、投影根面积和分支点三个代表性性状。与WinRHIZO参考值相比,根长估计的平均相对误差为3.14%,比传统Zhang-Suen方法低8.42个百分点;根面积和分支点数的线性拟合R2分别达0.9784和0.9920。(4)引入了拓扑感知指标Centerline-Dice评价骨架连续性,通过多种表型性状验证下游适用性,表明更好的分割质量(尤其是拓扑保持)导致更准确稳定的根性状提取。(5)玉米株高与总根长的相关性分析显示,Pearson和Spearman相关系数均指示强正相关,且Spearman系数略高,表明两者在秩变化上的一致性更为显著,反映幼苗期玉米地上与地下生长的高度协同节奏。尽管存在局限,该研究为作物根系遗传育种和抗逆性改良提供了重要应用价值。未来将扩大数据集、在更复杂生长条件下验证模型,并整合基于图结构的根系建模方法以实现完整RSA重建。