衡量虚假信息的(缺乏)质量

《Journal of Data and Information Quality》:Measuring the (lack of) quality of disinformation.

【字体: 时间:2026年04月06日 来源:Journal of Data and Information Quality

编辑推荐:

  信息操纵在互联网时代呈现新特征,本文提出基于元数据和文本特征的定量分析方法,通过对比可靠与不可靠信源数据集,运用统计检验发现词汇连贯性和多样性是主要区分指标,结构错误次之,时效性和可读性区分力弱。构建新闻可靠性指数(NRI)作为辅助指标,强调语义分析不可替代性,并指出生成式AI可能削弱结构检测有效性,需加强自动化验证的复杂性应对。

  
要查看此由AI生成的摘要,您必须具有高级访问权限。

摘要

摘要

尽管虚假信息是一种古老的现象,但随着互联网和社交媒体平台的兴起,其传播范围和速度达到了前所未有的程度。传统的事实核查方法侧重于信息的内容语义,而本文提出了一种基于元数据和正式文本特征的定量分析方法,从质量维度来研究虚假信息,假设错误或误导性的信息往往不符合信息质量标准。我们采用实验方法分析了来自可靠和不可靠来源的两个新闻数据集,并应用了统计方法(包括Mann-Whitney U检验、Cliff’s Delta和Rosenthal’s r)来衡量准确性、时效性、可读性、一致性和可靠性等质量维度上的差异和效应大小。研究结果表明,词汇凝聚力和词汇多样性是判断信息来源可靠性的最强指标,其次是结构错误率,而时效性和可读性的区分能力较弱。所提出的“新闻可靠性指数”(News Reliability Index,NRI)是一个中等但具有补充作用的指标。总体而言,可靠的信息来源始终表现出更高的信息质量,但仅凭结构差异不足以识别虚假信息,尤其是考虑到生成式AI能够生成语法连贯的文本。我们得出结论,语义内容分析对于识别虚假信息仍然至关重要,而结构特征最好作为检测模型中的辅助信号使用。最后,我们指出了未来的挑战,例如人工智能在生成高质量虚假信息方面的日益广泛应用,这可能会降低结构指标的有效性,并使自动化验证过程变得更加复杂。

AI摘要

AI生成的摘要(实验性摘要)

此摘要是由自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现内容、评估相关性,并协助来自相关研究领域的读者理解本文。它是对作者提供的摘要的补充,作者提供的摘要仍是文章的官方摘要。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由AI生成的通俗语言摘要,您必须具有高级访问权限。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号