阅读量:4
《适应大规模语言模型时代的假新闻检测》
康奈尔大学
摘要重点:在大型语言模型(llm)和广泛采用人工智能驱动的内容创作的时代,信息传播的格局发生了范式的转变。随着人工撰写和机器生成的真假新闻的激增,稳健而有效地识别新闻文章的真实性已成为一项复杂的挑战。尽管大量研究致力于假新闻检测,但这些研究要么假设所有新闻文章都是人类撰写的,要么突然假设所有机器生成的新闻都是假的。因此,在理解机器释义的真实新闻、机器生成的假新闻、人工撰写的假新闻和人工撰写的真实新闻之间的相互作用方面存在着重大差距。本文通过对在各种场景下训练的假新闻检测器进行全面评估来研究这一差距。本文的主要目标围绕以下关键问题:如何使假新闻检测器适应LLM时代?
1 介绍
1.1 研究背景
以前,当生成式人工智能还不太流行的时候,可以合理地假设大多数自动生成的新闻文章主要被恶意行为者用来制造假新闻。然而,随着生成式AI在过去两年的显著进步,以及它们在我们生活的各个方面的引入,这些工具现在被广泛用于合法的目的,例如帮助记者进行内容创作。例如,著名的新闻机构使用人工智能起草或增强他们的文章(Hanley和Durumeric, 2023)。然而,人工撰写假新闻的老问题仍然存在。机器生成的真新闻、机器生成的假文章、人工撰写的虚构文章和人工撰写的事实文章的多样化混合,已经改变了新闻生成的方式,内容来源的复杂混合很可能在可预见的未来持续下去。
为了适应LLM时代,下一代假新闻检测器应该能够处理人/机器生成的真/假新闻的混合内容景观。虽然存在大量关于假新闻检测的研究,但它们通常只关注人工撰写的