用于虚假新闻与错误信息检测的深层神经网络(Deep Neural Network, DNN)架构

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Cybersecurity and Privacy》：Deep Neural Network Architectures for Fake News and Misinformation Detection

【字体：大中小】 时间：2026年06月10日 来源：Journal of Cybersecurity and Privacy CS9.1

编辑推荐：

　　随着近期信息通信技术（Information and Communication Technology, ICT）的发展，误导性信息的快速传播对社会规范与公众信任造成损害，开发能够自动识别虚假内容的可信算法愈发困难。研究人员研究了一种融合机器学习（Machin

随着近期信息通信技术（Information and Communication Technology, ICT）的发展，误导性信息的快速传播对社会规范与公众信任造成损害，开发能够自动识别虚假内容的可信算法愈发困难。研究人员研究了一种融合机器学习（Machine Learning, ML）与深度学习（Deep Learning, DL）的混合人工智能（Artificial Intelligence, AI）策略以提升虚假新闻检测效果。该模型的深度学习部分利用卷积神经网络（Convolutional Neural Network, CNN）与带注意力层（Attention Layer）的双向长短期记忆网络（Bidirectional Long Short-Term Memory, BiLSTM）评估局部文本排列与全局文本语义；传统机器学习分类器——主要是支持向量机（Support Vector Machine, SVM）、随机森林（Random Forest, RF）和逻辑回归（Logistic Regression, LR）——同步使用词频–逆文档频率（Term Frequency–Inverse Document Frequency, TF–IDF）进行训练；对机器学习与深度学习的预测概率采用简单的集成平均（Ensemble Averaging）策略进行融合。该模型在LIAR数据集与Kaggle风格虚假新闻数据集上评估，展现出对不同文本类型的强泛化能力；相比任一单一模型，联合系统在准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1值（F1-score）及曲线下面积（Area Under the Curve, AUC）上均有显著提升。

用于虚假新闻与错误信息检测的深层神经网络架构——一篇研究论文的解读

本项研究由研究人员发表于Journal of Cybersecurity and Privacy。随着信息与通信服务数字化程度加深，虚假新闻（Fake News）现象日益严重。欧盟委员会（2018）将虚假新闻定义为"所有旨在故意造成公共危害或为牟利而设计、呈现与推广的虚假、不准确或误导性信息"。互联网上虚假信息的传播已成为重大社会问题，科学界对自动化虚假新闻识别的兴趣持续增长。现有多数方法将虚假信息自动识别建模为监督式二分类问题（分为虚假与真实新闻两类），并利用标注数据集训练与验证分类器。然而随数据集规模增大且复杂度提升，深度学习（Deep Learning, DL）能够从原始数据自动构建层次化表征的能力，在虚假新闻检测领域受到广泛关注。循环神经网络（Recurrent Neural Network, RNN）、卷积神经网络（Convolutional Neural Network, CNN）及注意力机制（Attention Mechanism）已被用于捕获文本数据的语义关联、时序依赖与上下文信息。在此基础上，研究人员提出一种将传统机器学习（Machine Learning, ML）与深度学习以集成（Ensemble）形式融合的混合算法用于虚假新闻检测，并在LIAR数据集与Kaggle风格虚假新闻语料库上进行多数据集评估，结果表明混合系统性能优于各独立模型，为实用虚假新闻检测系统提供了具可扩展性的完整流程。

研究人员所用主要关键技术方法如下：采用两个文本数据集——LIAR数据集（含12 836条标注真实度等的简短陈述，来源于政治讨论、电视广告、Facebook帖子、推文、访谈及新闻稿等自然场景）与Kaggle虚假新闻数据集（虚假部分取自2016年美国大选期间材料，真实部分取自《纽约时报》《华尔街日报》等2015—2016年报道，约6 300条，真假均衡分布）。文本预处理含去空、分词、定长截断（最大序列长度L＝200 token）；深度学习分支使用词嵌入（维度128），经一维卷积层（Conv1D，最多128个滤波器）提取n?gram特征并最大池化（Max?Pooling）与Dropout，再输入双向长短期记忆网络（Bidirectional Long Short?Term Memory, BiLSTM；每向64单元，返回序列），叠加注意力层（Attention Layer）计算上下文向量后经全连接层输出Sigmoid概率；使用分类交叉熵损失与随机梯度下降（Stochastic Gradient Descent, SGD）反向传播优化。传统机器学习分支以词频–逆文档频率（Term Frequency–Inverse Document Frequency, TF–IDF；特征规模10 000～15 000词项）向量化文本，分别训练线性核支持向量机（Support Vector Machine, SVM）、随机森林（Random Forest, RF）与逻辑回归（Logistic Regression, LR）。集成阶段先以Platt缩放对所有分类器输出做概率校准，再对校准后概率取等权平均得到最终预测。按8∶2分层抽样划分训练集与测试集，用准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F₁值（F₁?score）及ROC曲线下面积（Area Under the Curve, AUC）进行评估。

5. Results and Discussion（结果与讨论——研究人员原文第5节内容）

实验结果显示，BiLSTM＋注意力模型准确率约0.94，优于所考察的传统TF–IDF基模型；集成模型取得最高准确率0.96，证实异质分类器融合的收益。F₁值比较中，BiLSTM＋注意力模型F₁≈0.94，体现精确率与召回率的良好平衡；集成模型F₁≈0.945，表明对真假新闻实例分类更一致。AUC比较显示集成模型两类别分离能力最佳（AUC接近0.99），BiLSTM＋注意力模型AUC＝0.983 2，传统模型AUC略低但仍具竞争力（约0.97）。CNN–BiLSTM＋注意力架构之所以对虚假新闻检测高效，主要因其通过卷积层捕获局部语言模式（n?gram特征），通过双向LSTM捕获长程上下文依赖，注意力机制进一步强化模型对最具判别性文本片段的关注，从而提升F₁值与AUC。传统机器学习虽较简单，但能在高维稀疏TF–IDF特征空间建立强线性或树基决策边界，其稳定表现验证了融合现代与传统方法的有效性。集成法超越所有单一组件，原因是传统ML捕获词汇层面稳健决策边界，DL捕获语义层面模式，二者互补提升可靠性与泛化能力。定性评估显示事实性强且文风正规的报道被一致判为真，无证据支撑的确证虚假内容被正确识别；少数误分类出现在边界案例——具煽动语调的事实内容或模仿新闻体例但缺明确证据的文本，未来或可引入多模态特征改善。与近期研究对比：文献［32］分层注意力架构仅达准确率0.89、F₁＝0.88；文献［33］基于Transformer的模型准确率0.92、F₁＝0.91；本研究混合集成取得更高准确率、F₁值与AUC，证明卷积特征提取、BiLSTM上下文建模、注意力机制与TF–IDF融合的有效性。

6. Conclusions（结论——研究人员原文第6节内容翻译）

研究人员提出了一种融合深度学习与传统机器学习的虚假新闻检测混合框架，并证明两种方法协同可提升预测性能。利用CNN进行特征提取、双向长短期记忆网络（BiLSTM）学习长距离依赖特征，并叠加注意力层聚焦于文本中最相关信息，使深度学习更好地习得误导信息的语言特征与语境，从而提升检测能力；同时基于TF–IDF的支持向量机（SVM）、随机森林（RF）与逻辑回归（LR）在高维稀疏特征集上提供稳固决策边界，增强模型鲁棒性。集成模型在所有评估指标上表现良好（准确率0.96，F₁值0.945，AUC接近0.99）。研究结果证实，异质模型因能同时在文体、语义与结构层面捕获复合虚假信息特征，优于同质模型；混淆矩阵与评估指标进一步表明混合系统较单一模型具更强区分能力，整体系统性能得以提升。所提流程是实用、可扩展且易适配的虚假新闻检测方案，模块化架构可灵活扩展至更多数据集、特征或神经模型（含基于Transformer的模型及多模态系统）。本研究依赖单一训练–测试切分及数据集异质性，未来工作可考虑纳入用户行为模式、传播网络信号或跨语言表征，并可分析面向快速演变虚假信息活动的域适应（Domain Adaptation）。

联系信箱：

粤ICP备09063491号

热点排行