衡量虚假信息(的缺乏)的质量

《Journal of Data and Information Quality》:Measuring the (lack of) quality of disinformation.

【字体: 时间:2026年04月22日 来源:Journal of Data and Information Quality

编辑推荐:

  本研究通过元数据分析和文本特征量化评估,对比可靠与不可靠新闻源的信息质量。实验发现词汇连贯性和多样性是区分信源最显著的指标,结构错误率次之,而时效性和可读性区分能力较弱。提出的新闻可靠性指数(NRI)可作为补充指标,但需结合语义分析。研究指出生成式AI可能降低结构指标有效性,验证自动化仍需语义核心分析。

  
要查看此由人工智能生成的摘要,您必须具有高级访问权限。

摘要

摘要

尽管虚假信息是一个古老的现象,但随着互联网和社交媒体平台的兴起,它的传播范围和速度达到了前所未有的程度。传统的事实核查方法主要关注信息的语义内容,而本文提出了一种基于元数据和形式化文本特征的定量分析方法,从质量维度来研究虚假信息。我们认为,错误或具有误导性的信息往往无法满足信息质量的标准。通过实验方法,我们分析了来自可靠和不可靠来源的两组新闻数据,并应用了统计方法(包括Mann-Whitney U检验、Cliff’s Delta和Rosenthal’s r)来衡量准确性、时效性、可读性、一致性和可靠性等质量维度的差异及效应大小。研究结果表明,词汇凝聚力和词汇多样性是判断信息来源可靠性的最强指标,其次是结构错误率;而时效性和可读性的区分能力较弱。所提出的“新闻可靠性指数”(News Reliability Index,NRI)作为一个中等但具有补充作用的指标脱颖而出。总体而言,可靠来源的信息质量始终更高,但仅依靠结构差异不足以识别虚假信息,尤其是考虑到生成式人工智能能够生成语法连贯的文本的能力。我们得出结论,语义内容分析对于识别虚假信息仍然至关重要,而结构特征最好作为检测模型中的辅助信号使用。最后,我们指出了未来的挑战,例如人工智能在生成高质量虚假信息方面的应用日益增多,这可能会降低结构指标的有效性,并使自动化验证过程变得更加复杂。

人工智能摘要

人工智能生成的摘要(实验结果)

该摘要是通过自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现内容、评估其相关性,并协助相关领域的读者理解本文的研究成果。它是对作者提供的摘要的补充,作者提供的摘要仍是文章的官方总结。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由人工智能生成的通俗语言摘要,您必须具有高级访问权限。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号