衡量虚假信息的（缺乏）质量

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

衡量虚假信息的（缺乏）质量

《Journal of Data and Information Quality》：Measuring the (lack of) quality of disinformation.

【字体：大中小】 时间：2026年04月06日 来源：Journal of Data and Information Quality

编辑推荐：

　　信息操纵在互联网时代呈现新特征，本文提出基于元数据和文本特征的定量分析方法，通过对比可靠与不可靠信源数据集，运用统计检验发现词汇连贯性和多样性是主要区分指标，结构错误次之，时效性和可读性区分力弱。构建新闻可靠性指数（NRI）作为辅助指标，强调语义分析不可替代性，并指出生成式AI可能削弱结构检测有效性，需加强自动化验证的复杂性应对。

要查看此由AI生成的摘要，您必须具有高级访问权限。

了解更多登录

摘要

尽管虚假信息是一种古老的现象，但随着互联网和社交媒体平台的兴起，其传播范围和速度达到了前所未有的程度。传统的事实核查方法侧重于信息的内容语义，而本文提出了一种基于元数据和正式文本特征的定量分析方法，从质量维度来研究虚假信息，假设错误或误导性的信息往往不符合信息质量标准。我们采用实验方法分析了来自可靠和不可靠来源的两个新闻数据集，并应用了统计方法（包括Mann-Whitney U检验、Cliff’s Delta和Rosenthal’s r）来衡量准确性、时效性、可读性、一致性和可靠性等质量维度上的差异和效应大小。研究结果表明，词汇凝聚力和词汇多样性是判断信息来源可靠性的最强指标，其次是结构错误率，而时效性和可读性的区分能力较弱。所提出的“新闻可靠性指数”（News Reliability Index，NRI）是一个中等但具有补充作用的指标。总体而言，可靠的信息来源始终表现出更高的信息质量，但仅凭结构差异不足以识别虚假信息，尤其是考虑到生成式AI能够生成语法连贯的文本。我们得出结论，语义内容分析对于识别虚假信息仍然至关重要，而结构特征最好作为检测模型中的辅助信号使用。最后，我们指出了未来的挑战，例如人工智能在生成高质量虚假信息方面的日益广泛应用，这可能会降低结构指标的有效性，并使自动化验证过程变得更加复杂。

AI摘要

AI生成的摘要（实验性摘要）

此摘要是由自动化工具生成的，并非由文章作者撰写或审核。它旨在帮助读者发现内容、评估相关性，并协助来自相关研究领域的读者理解本文。它是对作者提供的摘要的补充，作者提供的摘要仍是文章的官方摘要。完整文章才是权威版本。点击此处了解更多。

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由AI生成的通俗语言摘要，您必须具有高级访问权限。

联系信箱：

粤ICP备09063491号

摘要

摘要

AI摘要

AI生成的摘要（实验性摘要）

热点排行