
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种新颖的数据增强方法以及一种基于数据的预测模型,用于研究在纳秒脉冲作用下气体-固体界面处的表面闪络现象
《Scientific Reports》:A novel data augmentation method and a data-driven prediction model for surface flashover at gas–solid interfaces under nanosecond pulses
【字体: 大 中 小 】 时间:2026年05月29日 来源:Scientific Reports 3.9
编辑推荐:
摘要气体-固体界面处的表面闪络是电磁脉冲模拟器可靠性的关键因素。为了准确预测不同表面距离(15–500毫米)范围内的闪络现象,本文开发了一种基于机器学习的分类模型。构建了三个实验平台,其输出电压范围从±80千伏到±2000千伏,共收集了1245个有效数据样本,涵盖了各种表面距离、
气体-固体界面处的表面闪络是电磁脉冲模拟器可靠性的关键因素。为了准确预测不同表面距离(15–500毫米)范围内的闪络现象,本文开发了一种基于机器学习的分类模型。构建了三个实验平台,其输出电压范围从±80千伏到±2000千伏,共收集了1245个有效数据样本,涵盖了各种表面距离、电压极性、气体压力、电极配置和电压波形。为了解决某些实验条件下严重的类别不平衡问题(闪络比例超过85%),提出了一种基于三参数韦伯分布的数据增强方法:在估计出闪络电压的韦伯参数后,通过采样低于推荐的低累积概率阈值(U10%)来生成非闪络样本,从而有效缓解了不平衡和过拟合现象。训练了六种算法,包括支持向量机(SVM)、多层感知器(MLP)、随机森林(RF)、梯度提升(GB)、极端梯度提升(XGBoost)和轻量级梯度提升机(LightGBM),并采用了贝叶斯超参数优化方法。其中,SVM模型在测试集上取得了最佳性能,F1分数为0.9111,AUC为0.9590;MLP模型的性能排名第二。基于树的集成方法虽然F1分数略低,但存在过拟合的倾向。通过特征重要性和SHAP分析验证了该模型是否捕捉到了物理上一致的机制,而非虚假的统计相关性。