谷歌人工智能将提升 Gmail、照片应用性能

Google I/O 开发者大会
Google I/O 开发者大会

在 OpenAI 对 ChatGPT 人工智能模型的惊人改进印象深刻的第二天,谷歌展示了同样令人惊叹的愿景,即人工智能将如何改进数十亿人每天使用的产品。

这些更新是在年度 Google I/O 开发者大会上宣布的,当时该公司正试图通过新设备和人工智能工具来超越其核心广告业务。人工智能在此次活动中成为了人们关注的焦点,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在演讲结束时表示,“人工智能”一词被提及了 120 次——这一数字是由其人工智能平台 Gemini 统计的。

在主题演讲中,谷歌展示了它如何希望其人工智能产品成为用户生活中更重要的一部分,例如通过共享信息、与他人互动、寻找房子周围的物体、制定时间表、购物和使用 Android 设备。谷歌本质上希望它的人工智能成为你所做的一切的一部分。

Pichai 首先强调了其最新人工智能模型 Gemini 1.5 Pro 所支持的各种新功能,从而拉开了此次活动的序幕。一项名为“询问照片”的新功能允许用户搜索照片以获得更深入的见解,例如通过查看保存的照片来询问您的女儿何时学会游泳或回忆起您的车牌号码。

他还展示了用户如何要求 Gemini 1.5 Pro 通过分析附件、总结要点并提出行动项目来总结您孩子学校最近的所有电子邮件。

与此同时,谷歌高管轮流展示了其他功能,例如最新模型如何“阅读”一本教科书,并将其变成一种人工智能讲座,由听起来自然的老师回答问题。

就在一天前,科技行业人工智能领域的领导者之一 OpenAI推出了一种新的人工智能模型,据称该模型将使聊天机器人 ChatGPT 变得更智能、更易于使用。 GPT-4o 旨在将 ChatGPT 转变为数字个人助理,可以进行实时口头对话并使用文本和“视觉”进行交互。它可以查看用户上传的屏幕截图、照片、文档或图表,并就它们进行对话。

谷歌还展示了 Gemini 接受不同类型输入的最新能力——接受文本、语音或图像的“多模式”能力——作为对 ChatGPT 努力的直接回应。一位谷歌高管还演示了一个虚拟“队友”,它可以帮助掌握待办事项列表、组织数据和管理工作流程。

该公司还强调了搜索改进,允许用户提出更自然或更集中的问题,并提供各种版本的答复,例如深入或总结的结果。它还可以提出有针对性的建议,例如推荐某些地点适合儿童的餐厅,或者通过 Google Lens 拍摄问题视频来记录相机等小工具可能出现的问题。该公司表示,其目标是减少谷歌搜索中的跑腿工作。

该公司还简要介绍了由谷歌 DeepMind 人工智能实验室开发的 Project Astra,该项目将允许人工智能助手通过使用手机摄像头解释现实世界的信息来帮助用户的日常生活,例如识别物体,甚至找到放错地方的物品。它还暗示了它将如何在增强现实眼镜上发挥作用。

谷歌表示,今年晚些时候将把更多人工智能功能集成到手机中。例如,用户将能够将人工智能创建的图像拖放到 Google Messages 和 Gmail 中,并在 Android 设备上提出有关 YouTube 视频和 PDF 的问题。

此举可能会吸引许多人,Android 的新内置工具将有助于检测通话过程中的可疑活动,例如试图模仿用户银行的诈骗者。

市场研究公司 Emarketer 的分析师 Jacob Bourne 表示,人工智能成为今年谷歌开发者大会的中心舞台也就不足为奇了。

“通过展示其最新型号以及它们如何为现有产品提供强大的消费者影响力,谷歌正在展示如何有效地将自己与竞争对手区分开来,”他说。

他认为,新工具的受欢迎程度将表明谷歌如何调整其搜索产品以满足生成人工智能时代的需求。

他表示:“为了保持竞争优势并满足投资者的需求,谷歌需要专注于将其人工智能创新大规模转化为可盈利的产品和服务。”

随着该公司扩大人工智能业务,该公司表示将引入更多保护措施以减少潜在的滥用。谷歌正在扩展其现有的 SynthID 功能来检测人工智能生成的内容。去年,该工具为人工智能生成的图像和音频添加了水印。

谷歌表示,它还与专家和机构合作,测试和改进其新模型的功能。

尽管该公司去年在人工智能方面加倍努力,但也遇到了重大障碍。去年,在推出生成式人工智能工具(当时称为 Bard,后来更名为 Gemini)后不久,谷歌的股价在该工具的演示视频发布后下跌显示它产生对有关詹姆斯·韦伯太空望远镜的问题的回答实际上不准确。

最近,该公司在二月份暂停了 Gemini 生成人物图像的能力,因为该公司在社交媒体上遭到抨击,因为它生成的图像在历史上不准确,大部分显示的是有色人种而不是白人。

与 ChatGPT 等其他人工智能工具一样,Gemini 也接受了大量在线数据的训练。专家有长期警告关于人工智能工具的缺点,例如潜在的不准确、偏见和错误信息的传播。尽管如此,许多公司仍在人工智能工具或合作伙伴关系方面取得进展。

彭博社报道称,苹果可能有兴趣将谷歌的 Gemini AI 引擎(包括聊天机器人和其他人工智能工具)授权并构建到即将推出的 iPhone 及其 iOS 18 功能中。报道三月。据报道,该公司还在与 ChatGPT 创建者 OpenAI 进行洽谈。