OpenAI:GPT-4o 允许聊天机器人表达表情,给出更快的响应
OpenAI周一宣布 ChatGPT 升级至 GPT-4o,使聊天机器人“更加自然的人机交互”。
这一消息是在谷歌宣布其搜索引擎升级以利用更多人工智能的前一天发布的。
OpenAI 对其人工智能模型的最新更新可以模仿人类言语反应的节奏,甚至可以尝试检测人们的情绪。
什么是 GPT-4o?
OpenAI 的新 GPT-4o(“o”代表“omni”)将为该公司广受欢迎的 ChatGPT 聊天机器人提供支持。
最新的更新将允许比以前的版本对所有文本、音频和视频输入做出更快的响应。
GPT-4o 有什么新功能?
最新版本的 ChatGPT 将能够在与用户交谈时使用更多人性化的语气,并且能够捕捉情感线索。 GPT-4o 还将能够输出自己的模拟情绪反应。
在视频演示中,聊天机器人帮助一名学生解决了数学问题,其语音响应非常人性化,甚至富有同理心。
GPT-4o 甚至能够在“遇见”一只狗时表现出喜爱的语气,称它为“可爱”并询问“绒毛球”的名字是什么。
它尝试通过观看一个人脸部的自拍照视频来推断他的情绪状态(因为他在微笑,因此确定他很高兴)。
该聊天机器人还翻译了英语和意大利语,以展示它如何帮助讲不同语言的人们进行对话。
Gartner 分析师 Chirag Dekate 告诉美联社,此次更新给人的印象是 OpenAI 正在追赶更大的竞争对手。
“OpenAI 展示的许多演示和功能看起来很熟悉,因为我们在 Google 在 Gemini 1.5 专业版发布中看到了这些演示的高级版本,”Dekate 说。 “虽然 Open AI 去年在 ChatGPT 和 GPT3 方面拥有先发优势,但与同行(尤其是 Google)相比,我们现在看到了能力差距的出现。”
GPT-4o 何时可用?
OpenAI 表示,GPT-4o 文本和图像功能将从周一开始向拥有免费帐户的用户以及 Plus 用户开放。
该公司网站称,升级后的语音模式也将在未来几周内为 ChatGPT Plus 提供。
谷歌推出人工智能搜索引擎
谷歌在周二的 I/O 开发者大会上推出了最新的人工智能搜索引擎。
这项改造将于本周在美国开始,届时数亿人将开始定期在搜索引擎结果页面的顶部看到该公司人工智能技术生成的对话摘要。
人工智能概述应该只有在谷歌的技术确定它将是满足用户好奇心的最快、最有效的方式时才会出现——这种解决方案最有可能发生在复杂的主题上或当人们集思广益或计划时。人们可能仍然会看到谷歌的传统网站链接和广告,用于简单搜索商店推荐或天气预报等内容。
接下来的人工智能步骤包括由 Gemini(一项五个月前推出的技术)支持的更复杂的分析以及更智能的助手或“代理”,其中包括一个名为“Astra”的新兴版本,它将能够理解、解释和记住它所识别的事物。通过智能手机的相机镜头显示。