衡量虚假信息（的缺乏）的质量

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

衡量虚假信息（的缺乏）的质量

《Journal of Data and Information Quality》：Measuring the (lack of) quality of disinformation.

【字体：大中小】 时间：2026年04月22日 来源：Journal of Data and Information Quality

编辑推荐：

　　本研究通过元数据分析和文本特征量化评估，对比可靠与不可靠新闻源的信息质量。实验发现词汇连贯性和多样性是区分信源最显著的指标，结构错误率次之，而时效性和可读性区分能力较弱。提出的新闻可靠性指数（NRI）可作为补充指标，但需结合语义分析。研究指出生成式AI可能降低结构指标有效性，验证自动化仍需语义核心分析。

要查看此由人工智能生成的摘要，您必须具有高级访问权限。

了解更多登录

摘要

尽管虚假信息是一个古老的现象，但随着互联网和社交媒体平台的兴起，它的传播范围和速度达到了前所未有的程度。传统的事实核查方法主要关注信息的语义内容，而本文提出了一种基于元数据和形式化文本特征的定量分析方法，从质量维度来研究虚假信息。我们认为，错误或具有误导性的信息往往无法满足信息质量的标准。通过实验方法，我们分析了来自可靠和不可靠来源的两组新闻数据，并应用了统计方法（包括Mann-Whitney U检验、Cliff’s Delta和Rosenthal’s r）来衡量准确性、时效性、可读性、一致性和可靠性等质量维度的差异及效应大小。研究结果表明，词汇凝聚力和词汇多样性是判断信息来源可靠性的最强指标，其次是结构错误率；而时效性和可读性的区分能力较弱。所提出的“新闻可靠性指数”（News Reliability Index，NRI）作为一个中等但具有补充作用的指标脱颖而出。总体而言，可靠来源的信息质量始终更高，但仅依靠结构差异不足以识别虚假信息，尤其是考虑到生成式人工智能能够生成语法连贯的文本的能力。我们得出结论，语义内容分析对于识别虚假信息仍然至关重要，而结构特征最好作为检测模型中的辅助信号使用。最后，我们指出了未来的挑战，例如人工智能在生成高质量虚假信息方面的应用日益增多，这可能会降低结构指标的有效性，并使自动化验证过程变得更加复杂。

人工智能摘要

人工智能生成的摘要（实验结果）

该摘要是通过自动化工具生成的，并非由文章作者撰写或审核。它旨在帮助读者发现内容、评估其相关性，并协助相关领域的读者理解本文的研究成果。它是对作者提供的摘要的补充，作者提供的摘要仍是文章的官方总结。完整文章才是权威版本。点击此处了解更多。

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由人工智能生成的通俗语言摘要，您必须具有高级访问权限。

联系信箱：

粤ICP备09063491号

摘要

摘要

人工智能摘要

人工智能生成的摘要（实验结果）

热点排行