“为速度而生的前沿智能”,12月18日凌晨,谷歌发布博客,官宣推出了全新模型Gemini 3 Flash。这是Gemini 3 系列中速度最快、性价比最高的版本,同时也是行业关注的焦点——该Flash模型在实现快速且低成本的同时,部分性能甚至优于旗舰型号。
值得注意的是,这已是谷歌在过去一个月内,大模型领域的第四次重大更新。

谷歌CEO桑达尔·皮查伊(Sundar Pichai)在发帖中介绍,Gemini 3 Flash在性能和效率上均突破了帕累托极限。其性能超越了上一代旗舰模型2.5 Pro,同时速度提升了3倍,而价格却大幅下降。
官方博客中豪言道:“Gemini 3 Flash 证明,速度和规模无需以牺牲智能为代价。”从各项评测数据来看,这一说法得到了验证。
在衡量编程能力的基准测试SWE-bench Verified中,Gemini 3 Flash取得了高达78%的得分,超越了自家的旗舰模型Gemini 3 Pro以及Anthropic旗下的Claude Sonnet 4.5;在多模态理解基准MMMU-Pro上,Flash得分81.2%,不仅领先于GPT-5.2(79.5%),还大幅甩开Claude Sonnet 4.5十几个百分点。

这些数据表明,Flash模型完成了重要突破,颠覆了“轻量化模型快且便宜但性能打折”的传统印象。Gemini 3 Flash不仅接近旗舰模型的能力,还兼顾了效率与性价比。
根据大模型竞技场Imarena.ai的数据,目前Gemini 3 Flash在文本、图像及编程领域均排名前五,数学和创意写作类别排名第二,是性价比最高的前沿模型。其输入成本仅为0.5美元/百万Tokens,输出成本为3美元/百万Tokens。
相比之下,Claude Sonnet 4.5的输出成本为15美元/百万Tokens,GPT-5.2则为14美元/百万Tokens,是Gemini 3 Flash价格的近五倍。
谷歌表示,Gemini 3 Flash在处理最高复杂度思维任务时,能够灵活调整思考时间。对于更复杂应用,它可能需要更长的推理周期,但在典型使用场景中,平均令牌使用量比上一代2.5 Pro减少30%,因此能以更高效率和准确度完成日常任务。
Gemini 3 Flash保留了Gemini 3在复杂推理、多模态处理、智能体以及编程任务中的突破性性能,同时结合了Flash级别的低延迟、高效率与低成本优势。谷歌称:“这是迄今为止智能体工作流程中最出色的模型。”
一位开发者使用Gemini 3 Flash对比了“两个性价比之王”的Python执行表现,分别是OpenAI的GPT-5 Mini和国产开源模型DeepSeek-V3.2。
结果显示,三款模型在成本上相当,但速度方面Gemini 3 Flash仅耗时9秒,而GPT-5 Mini和DeepSeek-V3.2分别需要35秒和41秒;性能上,Gemini 3 Flash表现最佳,成功平衡了速度与效果。
一位独立开发者评论道:“更快、更便宜、还能免费用,这才是独立开发者和小团队真正需要的东西。”他指出,若之前使用GPT-4o或Gemini 3 Pro来运行应用,换成Gemini 3 Flash后,成本预计可降低50%至70%。
从即日起,Gemini 3 Flash将面向所有用户推出,免费用户也能够使用。在Gemini App中,Gemini 3 Flash将取代2.5 Flash成为默认模型,而Gemini 3 Pro则留作处理高难度数学与代码任务的选择。
上个月,谷歌推出了Gemini 3 Pro和Gemini 3 Deep Think,获得广泛市场认可,且在大模型领域反超OpenAI成为领先者。博客提及,发布以来,内部API每天处理超过1万亿个tokens。用户频繁利用Gemini 3做代码模拟、深入学习复杂主题、构建交互式游戏,并理解多模态内容。
凭借卓越的性价比与性能,此次推出的Flash版本预计将受到更广泛欢迎。谷歌表示,Flash一直是公司内部最受欢迎的版本,之前的Flash 2和Flash 2.5已处理数百万开发者构建的数十万个应用程序中的数万亿tokens。
谷歌强调:“Flash模型真正为开发者量身打造,而Flash 3则让他们无需在速度和智能之间做出妥协。”随着这张王牌的亮相,留给OpenAI的回应时间已不多。
https://news.sina.com.cn/o/2025-12-18/doc-inhceprt8703706.shtml

