Google Gemini 2.0 登场：原生图像、音讯输出，现已开放预览

2024-12-14 生活 258℃ 0

在 OpenAI 向公众推出 o1 模型后不久，Google 也在今天公开了下一代模型 Gemini 2.0 的首个预览体验版 Gemini 2.0 Flash。其关键升级点在于提供了原生图像、音讯输出，在关键基準测试中的速度达到了 Gemini 1.5 Pro 的两倍。除此之外，它还能原生生成可控的多语言文本转语音音讯，并能原生调用 Google 搜寻、代码执行以及第三方使用者定义的函数等工具。

「Gemini 2.0，这是我们迄今为止最强大的模型。凭借在多模态方面的新进展，例如原生图像和原生音频的输出以及原生工具使用，Gemini 2.0 使我们能够构建新的 AI 智能体，从而让我们离构建通用助手的愿景更进一步。」Google CEO Sundar Pichai 在官方部落格中如此写道。

目前开发者已经可以透过 Google AI Studio、Vertex AI 使用 Gemini 2.0 Flash 的多模态输出和文本输出功能，抢先体验的合作伙伴则能率先使用原生文本转语音和图像生成功能。该产品将于 2025 年 1 月「全面上市」，而 Gemini 普通用户现在也能在电脑版和行动网页版的模型下拉选单中，选择 Gemini 2.0 Flash 并体验基于新模型的聊天对话。Gemini 的行动 app 很快也会跟进，等到明年初官方还会将 Gemini 2.0 扩展到更多 Google 产品中。

紧贴最新科技资讯、网购优惠，追随 Yahoo Tech 各大社交平台！

香港地球之友欢迎资助购电巴促改善土地规划增充电设施

异空感应／说英雄谁是英雄／爱．回家之开心速递／使徒行者3︳每日剧情(12月10日）

Google Gemini 2.0 登场：原生图像、音讯输出，现已开放预览

相关推荐

2024年度央企十大国之重器投票：歼35A、华为打造700亿参数大模型入围

小米米家空调中国漠河-30℃冬测：六大项目挑战极限 全面对标行业第一梯队

天玑8400支持AI作曲家应用 用端侧AI实现每一个人的音乐梦！

迄今最强性能手机！一加Ace 5 Pro图赏

车企竞相押注低空经济：飞行汽车将如何破局前行？

硬核检测+市场热销！爱玛A7Plus打造行业产品风向标 再掀市场新潮流！

小米米家空调中国漠河-30℃冬测：六大项目挑战极限全面对标行业第一梯队

天玑8400支持AI作曲家应用用端侧AI实现每一个人的音乐梦！

硬核检测+市场热销！爱玛A7Plus打造行业产品风向标再掀市场新潮流！