网页浏览交给 AI 自已来,Google Project Mariner 正式发表
今天稍早,Google 发表了新一代的 Gemini 2.0 模型,并在同一时间表示,其新的 AI 模型不仅能增强其现有产品与服务,还将推动全新的体验。我们不用等多久就有了具体的範例:Google 预览了「Project Mariner」,一个可以在网路浏览器内协助用户自动化部份功能的 AI 代理。Project Mariner 是以一个实验性的 Chrome 扩充功能的形式推出,目前仅提供给少数 Google「信任的测试者」。
在分享的影片中,Google 的 Jaclyn Konzelmann 开启了一个 Google Spreadsheet 文件,上面有五间公司的名字。由侧边栏呼叫出 Project Mariner 后,Kozelmann 要求它以公司名称搜寻到公司的网站,再由网站上找到五间公司的联络电邮。在开始后,Project Mariner 的代理完全在当前的网页视窗中进行操作(而不是在背景执行),并且还会一步一步在对话视窗中告诉你它正在做的事。不过,这毕竟还是个研究原型,整个过程花了足足 12 分钟才完成任务呢。
如果 Project Mariner 听起来似曾相识,那是因为早前在 10 月时就有《The Information》的报导称,Google 正在开发一个名为「Project Jarvis」的 AI 代理,同样是可以自动浏览网页。据知情人士称,Jarvis 与 Mariner 确实是相同的产品。
几间大的 AI 公司都在开发自己的 AI 代理,像是 OpenAI 的 Operator、或是 Anthropic 的 Computer Use,具体的操作方式和能力也都各有不同。Google 这里选择了比较专注在网页浏览与操作,也是其自家的优势所在了。
相关文章: