Google Gemini 2.5 Pro与DeepSeek-V3 0324模型更新发布

科技先锋

事件:DeepSeek发布V3模型的小更新0324版。北京时间3月26日Google发布最新大模型Gemini 2.5 Pro

1核心能力对比n推理能力:Gemini2.5 Pro在GPQA、AIME 2025等高难度推理基准测试中保持领先，GPQA 84%大幅领先o3mini的79.7%与GPT 4.5的71.4%，nHumanity's Last Exam无工具模式达18.8%准确率，大幅领先o3mini的14%。 DeepSeek-V3则在数学与代码类评测集超越GPT-4.5，尤其在中长篇内容生成质量上实现突破性提升。

代码实现:nGemini 2.5 Pro在SWE-Bench Verified基准测试中智能体模式达63.8%准确率，支持复杂代码智能体应用开发，仅仅略逊于3.7 Sonnet。nDeepSeek-V3新版本生成代码视觉效果更优，HTML/CSS代码可用性提升显著，实测赛博朋克贪吃蛇游戏代码完整度与界面细节优于竞品，且文学能力也有一定进步。

2技术架构与部署

Gemini 2.5 Pro采用内建式思考架构，表示结合预训练和强化学习，DeepSeek-V3 0324参数量约660B，提供128K上下文开源版本(商用部署仅需 MIT协议)。3商业化进展nGemini 2.5 Pro目前尚未公布定价nV3 0324定价与此前V3一致

4未来模型还有什么发布?

我们认为Google 或在一季度末二季度初最新端侧多模态与Agent应用

Astra/Mariner，DeepSeek后续R2也为最核心关注重点。我们认为未来核心关注端侧与Agent方向。

来源：戈壁淘金

展开阅读全文

Google Gemini 2.5 Pro与DeepSeek-V3 0324模型更新发布

相关标的