狙击Open AI！谷歌一个月内连发“数弹”

“为速度而生的前沿智能”，12月18日凌晨，谷歌发布博客，官宣推出了全新模型Gemini 3 Flash。这是Gemini 3 系列中速度最快、性价比最高的版本，同时也是行业关注的焦点——该Flash模型在实现快速且低成本的同时，部分性能甚至优于旗舰型号。

值得注意的是，这已是谷歌在过去一个月内，大模型领域的第四次重大更新。

谷歌CEO桑达尔·皮查伊（Sundar Pichai）在发帖中介绍，Gemini 3 Flash在性能和效率上均突破了帕累托极限。其性能超越了上一代旗舰模型2.5 Pro，同时速度提升了3倍，而价格却大幅下降。

官方博客中豪言道：“Gemini 3 Flash 证明，速度和规模无需以牺牲智能为代价。”从各项评测数据来看，这一说法得到了验证。

在衡量编程能力的基准测试SWE-bench Verified中，Gemini 3 Flash取得了高达78%的得分，超越了自家的旗舰模型Gemini 3 Pro以及Anthropic旗下的Claude Sonnet 4.5；在多模态理解基准MMMU-Pro上，Flash得分81.2%，不仅领先于GPT-5.2（79.5%），还大幅甩开Claude Sonnet 4.5十几个百分点。

这些数据表明，Flash模型完成了重要突破，颠覆了“轻量化模型快且便宜但性能打折”的传统印象。Gemini 3 Flash不仅接近旗舰模型的能力，还兼顾了效率与性价比。

根据大模型竞技场Imarena.ai的数据，目前Gemini 3 Flash在文本、图像及编程领域均排名前五，数学和创意写作类别排名第二，是性价比最高的前沿模型。其输入成本仅为0.5美元/百万Tokens，输出成本为3美元/百万Tokens。

相比之下，Claude Sonnet 4.5的输出成本为15美元/百万Tokens，GPT-5.2则为14美元/百万Tokens，是Gemini 3 Flash价格的近五倍。

谷歌表示，Gemini 3 Flash在处理最高复杂度思维任务时，能够灵活调整思考时间。对于更复杂应用，它可能需要更长的推理周期，但在典型使用场景中，平均令牌使用量比上一代2.5 Pro减少30%，因此能以更高效率和准确度完成日常任务。

Gemini 3 Flash保留了Gemini 3在复杂推理、多模态处理、智能体以及编程任务中的突破性性能，同时结合了Flash级别的低延迟、高效率与低成本优势。谷歌称：“这是迄今为止智能体工作流程中最出色的模型。”

一位开发者使用Gemini 3 Flash对比了“两个性价比之王”的Python执行表现，分别是OpenAI的GPT-5 Mini和国产开源模型DeepSeek-V3.2。

结果显示，三款模型在成本上相当，但速度方面Gemini 3 Flash仅耗时9秒，而GPT-5 Mini和DeepSeek-V3.2分别需要35秒和41秒；性能上，Gemini 3 Flash表现最佳，成功平衡了速度与效果。

一位独立开发者评论道：“更快、更便宜、还能免费用，这才是独立开发者和小团队真正需要的东西。”他指出，若之前使用GPT-4o或Gemini 3 Pro来运行应用，换成Gemini 3 Flash后，成本预计可降低50%至70%。

从即日起，Gemini 3 Flash将面向所有用户推出，免费用户也能够使用。在Gemini App中，Gemini 3 Flash将取代2.5 Flash成为默认模型，而Gemini 3 Pro则留作处理高难度数学与代码任务的选择。

上个月，谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think，获得广泛市场认可，且在大模型领域反超OpenAI成为领先者。博客提及，发布以来，内部API每天处理超过1万亿个tokens。用户频繁利用Gemini 3做代码模拟、深入学习复杂主题、构建交互式游戏，并理解多模态内容。

凭借卓越的性价比与性能，此次推出的Flash版本预计将受到更广泛欢迎。谷歌表示，Flash一直是公司内部最受欢迎的版本，之前的Flash 2和Flash 2.5已处理数百万开发者构建的数十万个应用程序中的数万亿tokens。

谷歌强调：“Flash模型真正为开发者量身打造，而Flash 3则让他们无需在速度和智能之间做出妥协。”随着这张王牌的亮相，留给OpenAI的回应时间已不多。

https://news.sina.com.cn/o/2025-12-18/doc-inhceprt8703706.shtml

狙击Open AI！谷歌一个月内连发“数弹”

延伸阅读

Comments

发表回复取消回复

延伸阅读

Comments

发表回复 取消回复

发表回复取消回复