谷歌正在大力推广其新的 Gemini 2.0 型号。第一个模型 Gemini 2.0 Flash 已经上线,并伴随着新的 AI 代理体验,例如 Project Astra 和 Project Mariner。
最初,谷歌只发布了 Gemini 2.0 系列中的一款型号:Gemini 2.0 Flash 实验版,这是一款支持多模态输入和输出的超高速轻量级型号。它可以原生生成混合了文本和多语言音频的图像,并且可以无缝利用 Google 搜索、代码执行和其他工具。这些功能目前为开发人员和 beta 测试人员提供预览版。尽管体积小,但 2.0 Flash 在事实、推理、编码、数学等多个方面都优于 Gemini 1.5 Pro,而且速度也是 Gemini 1.5 Pro 的两倍。从今天开始,普通用户可以在网络上试用 Gemini 2.0 Flash 的聊天优化版本,它很快就会出现在 Gemini 移动应用程序中。
谷歌还展示了使用 Gemini 2.0 构建的几项令人印象深刻的体验。首先是 Project Astra 的更新版本,这是谷歌于 2024 年 5 月首次展示的实验性虚拟 AI 代理。借助 Gemini 2.0.它现在可以用多种语言进行对话;使用 谷歌搜索、Lens 和 Maps 等工具;记住您过去与 IT 对话的内容,并在人类对话的延迟下理解语言。Project Astra 旨在在智能手机和眼镜上运行,但目前仅限于一小群受信任的测试人员。那些有兴趣在 Android 手机上试用原型的人可以加入候补名单 此处.还有一个非常酷的 Multimodal Live API 演示,它有点类似于 Project Astra,允许您使用视频、语音和屏幕共享与聊天机器人实时交互。
接下来是 Project Mariner,这是一个实验性的 Chrome 浏览器扩展,可以浏览互联网并为您完成任务。该扩展目前可供美国的部分测试人员使用,它利用 Gemini 2.0 的多模态功能“来理解和推理浏览器屏幕中的信息,包括像素和文本、代码、图像和表单等 Web 元素。谷歌承认这项技术仍处于起步阶段,并不总是可靠的。但即使是目前的原型形式,它也无疑令人印象深刻,正如您在此 YouTube 演示中亲眼看到的那样。
谷歌 还发布了 Jules,这是一个由 Gemini 2.0 提供支持的 AI 驱动的代码代理。它直接集成到你的 GitHub 工作流程中,该公司表示,它可以处理错误修复和重复耗时的任务,“同时你专注于你真正想要构建的东西”。
目前,许多新发布的内容仅限于早期测试人员和应用程序开发人员。谷歌表示,它计划在明年初将 Gemini 2.0 集成到其产品组合中,包括搜索、工作区、地图等。届时,我们将更好地了解这些新的多模式功能和改进如何转化为实际用例。目前还没有关于 Gemini 2.0 Ultra 和 Pro 型号的消息。