页岩矿物组成与脆性指数测井预测的集成学习方法——以松辽盆地青山口组为例

《Frontiers in Earth Science》:Ensemble learning for well-logging prediction of shale mineral composition and brittleness index: a case from the Qingshankou Formation, Songliao Basin

【字体: 时间:2026年06月05日 来源:Frontiers in Earth Science

编辑推荐:

  准确评价页岩储层岩石力学性质对于优化水力压裂设计并实现高效开发至关重要。为应对松辽盆地青山口组页岩矿物组成复杂、非均质性强所导致的常规岩石物理评价困难,研究人员提出了一种基于集成学习算法的创新测井评价框架。该框架利用常规测井数据对矿物组成进行定量预测,并引入考

  
准确评价页岩储层岩石力学性质对于优化水力压裂设计并实现高效开发至关重要。为应对松辽盆地青山口组页岩矿物组成复杂、非均质性强所导致的常规岩石物理评价困难,研究人员提出了一种基于集成学习算法的创新测井评价框架。该框架利用常规测井数据对矿物组成进行定量预测,并引入考虑有机质校正的改进脆性指数模型。基于三肇凹陷7口取心井174块岩心样品的X射线衍射(XRD)与总有机碳(TOC)分析数据,构建了包含7条敏感测井曲线的数据集,其中包括自然伽马(GR)、声波时差(AC)、密度(DEN)、补偿中子(CNL)和微球聚焦电阻率(MSFL)。通过对XGBoost、随机森林(RF)和AdaBoost算法的比较,最终选取XGBoost作为核心预测工具。结果表明,XGBoost模型在处理强非线性地质回归问题时表现出稳健的泛化性能。具体而言,在测试集中,黏土矿物、长英质矿物和碳酸盐矿物预测的决定系数(R2)均超过0.6,而均方根误差(RMSE)控制在3.8%以内,显示出相较于其他评估模型更高的预测精度。特征重要性分析表明,反映层间水中子慢化效应的CNL是预测黏土和长英质含量的关键特征;而AC和MSFL对于识别碳酸盐胶结具有指示意义。基于预测结果,揭示了青山口组页岩物质组成显著的纵向非均质性,并识别出Q7-Q9油层组为I类高脆性甜点段(BI > 0.65,长英质矿物含量 >60%)。依据评价结果,研究人员优化了青山口组页岩压裂目标层,并制定了差异化工程参数方案。该方法为陆相页岩油甜点优选与工程决策提供了科学依据和有效技术途径。
该论文发表于《Frontiers in Earth Science》,研究聚焦松辽盆地三肇凹陷青山口组页岩储层的矿物组成预测与脆性评价问题。随着非常规油气开发不断深化,页岩油储层压裂改造效果越来越依赖对岩石脆性和可压裂性的精细刻画。然而,与常规储层相比,页岩储层具有低孔隙度、低渗透率和强非均质性特征,其矿物组成复杂,陆源碎屑与湖相自生矿物混积明显,导致测井响应与矿物组成之间呈现显著非线性耦合关系。传统基于线性体积模型或简单多元回归的测井解释方法,难以准确表征有机质富集页岩中复杂的岩石物理响应,进而限制了矿物含量预测精度,也削弱了脆性指数评价的可靠性。此外,传统矿物组分法在脆性评价中往往忽略总有机碳(TOC)对岩石强度的削弱作用,或对碳酸盐矿物脆塑属性处理过于简化,难以真实反映有机质富集页岩的力学行为。因此,建立一种低成本、连续性强且兼顾有机质影响的页岩矿物与脆性测井评价方法,具有重要的地质与工程意义。

研究区位于松辽盆地中央坳陷区三肇凹陷,青山口组为该区页岩油勘探开发的关键层系。该组形成于湖盆强烈坳陷期,沉积环境总体为深湖—半深湖相,具有半封闭咸化湖盆特征,长期缺氧和强还原环境有利于有机质保存。与此同时,陆源碎屑输入与湖内化学沉淀并存,使页岩中长英质矿物、黏土矿物和碳酸盐矿物共同发育,形成矿物组成复杂且纵向差异显著的细粒沉积序列。前人微观孔隙结构研究表明,该套页岩同时发育有机质孔、粒间孔、黏土矿物粒内孔及碳酸盐溶蚀孔,不同矿物空间组合进一步加剧了储层的多尺度非均质性,也增加了基于测井数据反演矿物分布的难度。在此背景下,研究人员尝试引入集成学习(ensemble learning)方法,以提升非线性矿物预测和脆性评价能力。

研究人员基于7口井岩心—测井配套资料构建监督学习数据集,以174个X射线衍射(XRD)矿物分析样品作为矿物含量标定数据,并结合TOC测试数据建立页岩脆性评价流程。研究对象的矿物组成以长英质矿物和黏土矿物为主,伴少量碳酸盐矿物。统计结果显示,研究区页岩主要为长英质页岩和混合页岩,钙质页岩占比较低;Qn1段黏土和碳酸盐矿物相对较高,而Qn2-3段长英质组分明显升高。TOC总体呈高值单峰分布,多集中于2.0%—4.0%,部分样品超过5.0%,反映深湖还原环境下有机质保存条件较好。矿物和有机质的纵向变化共同控制了页岩岩石力学性质及可压裂性。

方法上,研究人员首先从常规测井资料中筛选出对岩性、物性和含烃性敏感的7条曲线,包括GR、AC、DEN、CNL、RLLD、RLLS和MSFL,并进行深度校正、标准化和重采样处理。随后开展数据质量控制,检查曲线完整性,利用中位数绝对偏差(MAD)识别并剔除异常值,再通过Pearson相关系数矩阵识别多重共线性。由于MSFL与RLLD、RLLS高度相关,且其纵向分辨率更高,最终保留MSFL并剔除后两者,以降低特征冗余。针对XRD矿物含量总和偏离100%的问题,研究将长英质、碳酸盐和黏土三类矿物重新归一化;同时对跨数量级的电阻率数据进行对数变换,以压缩动态范围并提升模型稳定性。数据按80%:20%划分训练集和测试集,并固定随机种子以保证结果可重复。

本研究采用随机森林(RF)、XGBoost和AdaBoost三种集成学习算法分别建立黏土矿物、长英质矿物和碳酸盐矿物的独立回归模型。其核心目标是在偏差—方差折中框架下实现对复杂非线性测井—矿物映射关系的高精度刻画。模型完成后,对输出结果实施物理约束后处理,即将负值设为0,并对三类矿物预测结果归一化,确保总和为100%。在脆性评价方面,研究人员在传统矿物脆性指数基础上引入TOC校正,将石英、长石和碳酸盐矿物统一视为脆性支撑组分,将黏土矿物和有机质视为塑性组分,建立适用于该区页岩的改进脆性指数(BI)模型。该处理突出了有机质低杨氏模量和塑性软化效应对压裂行为的影响。

主要技术方法可概括如下:其一,样本来源于松辽盆地三肇凹陷7口取心井,其中174个岩心样品用于XRD矿物定量标定,97个样品用于TOC分析;其二,利用GR、AC、DEN、CNL、MSFL等常规测井曲线构建监督学习特征集,并通过MAD异常值剔除、相关性筛选、归一化和对数变换完成预处理;其三,对RF、XGBoost和AdaBoost三类集成学习算法进行对比建模,采用R2、RMSE、MAE和MSE综合评估模型性能;其四,在矿物连续预测基础上,结合ΔlogR法获得的连续TOC资料,建立考虑TOC塑性校正的BI模型,实现全井段脆性连续评价。

以下结合论文结果部分各小标题进行归纳解读。

4.1 Model prediction results
该部分比较了三种集成学习模型在矿物组成预测上的效果。交会图显示,XGBoost模型预测值与实测值最接近1:1关系线,在0%—60%的主要矿物含量范围内点群集中、离散度小,说明其能够较好捕捉测井响应与矿物含量之间的内在非线性关系。相比之下,RF模型预测点更为分散,在高黏土含量区存在系统性低估;AdaBoost模型则线性趋势较差,尤其在低碳酸盐和高黏土区偏差较大。定量评价进一步证实XGBoost表现最佳:测试集中,黏土、长英质和碳酸盐矿物的R2均超过0.6,RMSE控制在3.2%—3.8%,MAE均低于3%。而RF和AdaBoost的R2普遍偏低,误差明显偏大。研究据此认定,XGBoost在该区强非线性地质回归问题中具有更优的拟合能力和泛化能力,是后续连续矿物预测的最优算法。文中同时指出,由于钙质页岩样本占比仅4.31%,样本分布不均衡在一定程度上限制了高碳酸盐样本预测精度,但XGBoost对少数类样本仍保持了较好学习能力。

4.2 Feature importance analysis
该部分通过RMSE增量法分析XGBoost模型中各测井特征对矿物预测的贡献,并据此解释岩石物理机制。结果表明,CNL在黏土和长英质矿物预测中最为关键。对于黏土矿物,CNL重要性最高,原因在于黏土层间水和吸附水富含氢元素,能够显著增强中子慢化效应;AC和DEN的重要性则分别对应黏土矿物较低弹性模量和体积密度差异。对于长英质矿物,CNL仍居首位,本质上反映了长英质与黏土组分之间此消彼长的地质约束;MSFL的重要性较高,则体现了石英和长石作为高电阻率绝缘矿物对地层电性响应的控制。对于碳酸盐矿物,AC和CNL贡献最大,MSFL次之。其地质含义在于,碳酸盐矿物具有低声波时差、低中子响应和胶结致密化导致的高微电阻率特征。综合来看,孔隙度测井系列,尤其是CNL与AC,是该区页岩矿物预测最核心的物理信息来源,而MSFL对脆性矿物识别具有重要补充价值。这一结果说明所建模型不仅预测精度较高,也具有清晰的地质可解释性。

4.3 Mineral distribution prediction and brittleness index evaluation
该部分在优选XGBoost模型基础上,对ZY1H井青山口组页岩开展全井段连续矿物组成预测,并结合ΔlogR法获得的连续TOC资料计算BI剖面。结果显示,矿物预测曲线与实测XRD数据匹配良好,且与ECS测井结果相互验证,表明该方法具备较高可信度。纵向上,1935—2000 m井段石英含量维持在60%—80%,碳酸盐含量约5%—15%,黏土含量普遍低于30%,对应BI多大于0.6,显示较强脆性;而2020—2050 m井段黏土含量升高至40%以上,碳酸盐降低,BI下降至0.5—0.55,反映塑性增强,不利于裂缝持续扩展。根据矿物组成和BI分布,研究人员将该区页岩划分为三类岩性组合:第一类为高脆性长英质页岩,以Q7-Q9油层组为代表,表现为低GR、石英含量>60%、黏土<30%、BI > 0.65;第二类为中等脆性、长英质—钙质纹层发育页岩,主要分布于Q3-Q6油层组,BI为0.55—0.65;第三类为低脆性混合页岩,主要位于Q1-Q2油层组,石英<50%、黏土>40%、BI < 0.55。由此可见,改进BI模型有效表征了青山口组页岩显著的纵向非均质性。

4.4 Significance for fracturing engineering
该部分讨论了矿物连续预测与脆性评价在压裂工程中的应用价值。研究指出,准确识别高脆性、低塑性层段是压裂选层的首要任务。ZY1H井中Q7-Q9油层组因BI普遍大于0.6、长英质脆性矿物含量高、GR较低且声波时差适中,被确定为优选压裂目标层。研究进一步将工程甜点分为两类:I类甜点为工程—地质双优层,典型代表即Q7-Q9油层组,其高脆性与浅水条件下增强的陆源碎屑供给、长英质矿物富集以及塑性组分减少密切相关;II类甜点为次级压裂层,以Q4-Q6油层组为代表,虽具有较高脆性,但碳酸盐胶结较强、储层致密性更高。针对纵向脆性差异,论文提出差异化分段压裂策略:高脆性集中段适宜高排量、高液量施工;高低脆性交互段宜采用小段多簇射孔;低脆性泥页岩段则应提高前置液比例、采取更保守的分段压裂方式。论文还指出,该评价结果与区域开发实践具有一致性,即高脆性顶部层段和低部泥页岩段压裂后均获得工业油流,说明所建方法对工程决策具有现实指导意义。

在讨论层面,论文强调,本研究建立的集成学习测井评价框架较传统XRD实验具有低成本、高效率和高纵向分辨率优势,能够突破岩心取样离散性的限制,实现全井段米级甚至厘米级连续矿物与脆性评价。同时,模型通过特征重要性分析建立了较明确的测井—矿物岩石物理解释链条,使预测结果兼具精度与可解释性。需要注意的是,该模型主要基于三肇凹陷青山口组页岩训练和验证,受沉积环境差异、矿物组合变化及测井仪器标定差异影响,其跨区块、跨层位直接迁移能力仍有限。论文提出未来可引入迁移学习(transfer learning)思路,利用少量目标区校正样本对预训练模型进行微调,从而扩展该方法在不同盆地和层系页岩储层评价中的适用性。

研究结论部分可译述如下:本研究以松辽盆地三肇凹陷青山口组页岩为对象,建立了基于集成学习算法的矿物组成预测与脆性指数评价框架。数据分析表明,在所比较的三种集成学习算法中,XGBoost依托梯度提升框架与正则化机制,在黏土、长英质和碳酸盐三类矿物测试集预测中表现出显著优势,R2 > 0.6,RMSE < 3.8%,为全井段矿物连续预测提供了方法基础。基于RMSE增量法的特征重要性分析有效阐明了矿物预测的测井响应机制:CNL由于响应黏土矿物层间水的中子慢化效应,成为预测黏土和长英质含量的关键特征;AC和MSFL则分别反映碳酸盐胶结体的致密声学特征与脆性矿物骨架的高电阻率特征,从而赋予模型明确的地质解释能力。结合TOC校正的改进BI模型客观刻画了青山口组页岩显著的纵向非均质性,并识别出Q7-Q9油层组为I类高脆性甜点段,其特征为BI > 0.65、长英质含量 >60%,为压裂目标层优选及差异化工程参数优化提供了坚实理论依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号