BBC研究发现四大AI聊天机器人新闻摘要存在严重失实问题

【纬度新闻网】英国广播公司(BBC)近日发布的一项研究显示,四大人工智能(AI)聊天机器人在总结新闻报道时存在严重失实问题,包括重大错误和内容扭曲。这些AI工具包括OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini以及Perplexity AI。
BBC在研究中向上述AI提供了BBC网站上的新闻内容,并随后就相关报道向它们提问。结果显示,这些AI的回答中有51%被评估为存在重大问题,且19%引用BBC内容的回答包含事实性错误,如错误的事实陈述、数字和日期。
BBC新闻与时事首席执行官黛博拉·特内斯(Deborah Turness)在一篇博客文章中表示,AI技术带来了“无限可能”,但开发这些工具的公司正在“玩火”。她质疑道:“我们正处于动荡时代,AI扭曲的新闻标题会在多久后造成严重的现实世界危害?”
BBC研究团队对100篇新闻报道进行测试,并邀请相关领域的资深记者评估AI助手的回答质量。研究发现,微软的Copilot和谷歌的Gemini存在的问题比OpenAI的ChatGPT和Perplexity更严重。
部分错误示例如下:
- Gemini 错误地表示英国国家医疗服务体系(NHS)不建议使用电子烟作为戒烟辅助工具;
- ChatGPT和Copilot 在总结报道时,错误地称英国前首相里ishi Sunak和苏格兰前首席部长Nicola Sturgeon仍在任,尽管他们已卸任;
- Perplexity 在一篇关于中东的新闻报道中,错误引用BBC新闻,称伊朗最初表现出“克制”,并将以色列的行动描述为“侵略性”。
BBC呼吁科技公司“收回”AI新闻摘要功能,并与媒体机构展开合作,以确保内容准确性。特内斯特别提到,苹果公司在收到BBC投诉后,已撤回其AI摘要功能。
BBC生成式AI项目总监皮特·阿彻(Pete Archer)强调,出版商“应该拥有对其内容的控制权”,AI公司则应公开其助手如何处理新闻,并披露错误的规模和范围。
BBC通常会屏蔽AI聊天机器人对其内容的访问,但在2024年12月的测试期间,临时向这些AI工具开放了其网站,以评估它们的表现。研究报告指出,除了事实性错误,这些AI还难以区分观点与事实,存在主观编辑倾向,并且经常忽略关键信息。
目前,BBC正寻求与AI技术提供商展开对话,以探索解决方案,确保新闻信息的准确性和客观性。