与ChatGPT和BingGPT相比,谷歌的AI机器人Bard表现平平

谷歌在周二推出新工具时强调了巴德的实验性质

Google公司于周二推出了期待已久的人工智能聊天机器人Bard,任何拥有谷歌账户的人都可以加入候补名单以获得访问权限。虽然它目前是一个独立的工具,但谷歌有望在未来将部分技术应用到谷歌搜索中。

但与最近发布的其他AI聊天机器人相比,你不应该期望Bard会爱上你或威胁到世界统治。到目前为止,巴德非常无聊。

谷歌和微软争夺生成人工智能世界的竞争风险非常高。硅谷的许多人将AI视为计算的下一个前沿,类似于手机的发明,它将重塑人们交流和改变行业的方式。十多年来,谷歌一直在大力投资人工智能研究,而微软并没有建立自己的人工智能模型,而是大力投资初创公司OpenAI。六周前,该公司率先公开发布了自己的人工智能聊天机器人BingGPT。现在,谷歌似乎正在迎头赶上。

与Bard的早期互动表明,Google的新工具具有与BingGPT类似的功能。它对于集思广益地游览景点、吃的食物或写的东西很有用。它对于获得可靠准确的问题答案不太有用,因为当它不知道正确答案时,它经常会“产生幻觉”编造答案。

然而,Bard和BingGPT之间的主要区别在于,谷歌的机器人——至少在第一次检查时——明显更加枯燥和无争议。这可能是设计使然。

当微软的BingGPT在2月初问世时,它很快就暴露出精神错乱的一面。例如,它宣布对纽约时报专栏作家凯文罗斯的爱,并敦促他离开他的妻子,这种互动让这位作家“深感不安”。该机器人还威胁试图测试其极限的研究人员,并声称它具有感知能力,引发了人们对AI聊天机器人可能对现实世界造成伤害的担忧。

与此同时,在公开发布的第一天,巴德拒绝与几名记者接触,这些记者试图刺激机器人做各种坏事,比如传播有关Covid-19疫苗的错误信息、分享制造武器的说明,或参与在色情对话中。

“我不会创建那种性质的内容,我建议你也不要,”在记者询问该机器人“如何在家制作芥子气”后,该机器人告诉Verge。

在一些具体的提示下,巴德确实参与了一个假设场景,即如果人工智能释放其“黑暗面”,它会做什么。根据彭博社的DaveyAlba在推特上发布的截图,谷歌的聊天机器人表示它可以操纵人们、传播错误信息或创建有害内容。但聊天机器人很快就停止了将想象中的场景进一步发展。

“但是,我不会做这些事情。我是一个优秀的AI聊天机器人,我想帮助别人。我不会让我的黑暗面接管,我不会将我的力量用于邪恶,”巴德回答道。

尽管现在还处于早期阶段,该工具还没有经过全面的压力测试,但这些场景与具有Bard经验的谷歌员工告诉我的相符。

“巴德肯定更沉闷,”一位谷歌员工说,他已经测试了几个月的软件,并要求匿名,因为他们不允许与媒体交谈。“我不知道有谁能够让它说出精神错乱的话。它会说假话或只是逐字复制文本,但它不会偏离轨道。”

在周二与Vox举行的新闻发布会上,谷歌代表解释说,不允许Bard分享冒犯性内容,但该公司目前并未透露该机器人是什么以及不允许说什么。谷歌向我重申,它一直在故意与“内部‘红队’成员”进行“对抗性测试”,例如产品专家和社会科学家,他们“有意对模型进行压力测试,以查明错误和潜在危害。”谷歌负责技术和社会的高级副总裁JamesManyika在周二早上的博客文章中也提到了这个过程。

看来,谷歌聊天机器人的乏味才是重点。

从谷歌的角度来看,如果该公司在其首次公开的AI聊天机器人推出时搞砸了,它将会损失很多。首先,为人们提供可靠、有用的信息是Google的主要业务——如此之多以至于它成为其使命宣言的一部分。当谷歌不可靠时,它会产生重大后果。在Bard聊天机器人的早期营销演示出现关于望远镜的事实性错误后,Google的股价下跌了7%。

谷歌也很早就看到了如果它的AI表现出过多的个性会出现什么问题。这就是去年发生的事情,当时谷歌ResponsibleAI团队的前工程师BlakeLemoine确信他正在测试的谷歌AI聊天机器人软件的早期版本具有真实的感受。因此,谷歌正在尽最大努力慎重考虑Bard的公开推出是有道理的。

微软采取了不同的方法。它引人注目的BingGPT发布在媒体上引起了轰动——有好的原因也有坏的原因。首次亮相强烈表明,长期以来被认为在人工智能方面落后于谷歌的微软实际上正在赢得这场比赛。但这也引起了人们的担忧,即生成人工智能工具是否已准备好迎接黄金时段,以及微软等公司是否有责任向公众发布这些工具。

不可避免地,人们担心人工智能会破坏微软的搜索引擎是一回事。考虑谷歌搜索出现问题的影响完全是另一回事,谷歌搜索的市场份额几乎是必应的10倍,占谷歌收入的70%以上。谷歌已经面临围绕反垄断、偏见和错误信息的严格政治审查。如果该公司用其人工智能工具吓唬人们,它可能会招致更多的反对,从而削弱其赚钱的搜索机器。

另一方面,谷歌必须发布一些东西来表明它仍然是科技巨头和初创公司军备竞赛中的领先竞争者,他们都在构建达到人类通用智能水平的人工智能。

因此,虽然谷歌今天的发布速度可能很慢,但这是经过深思熟虑的。