
科技先锋
事件:DeepSeek发布V3模型的小更新0324版。北京时间3月26日Google发布最新大模型Gemini 2.5 Pro
1核心能力对比n推理能力:Gemini2.5 Pro在GPQA、AIME 2025等高难度推理基准测试中保持领先,GPQA 84%大幅领先o3mini的79.7%与GPT 4.5的71.4%,nHumanity's Last Exam无工具模式达18.8%准确率,大幅领先o3mini的14%。 DeepSeek-V3则在数学与代码类评测集超越GPT-4.5,尤其在中长篇内容生成质量上实现突破性提升。
代码实现:nGemini 2.5 Pro在SWE-Bench Verified基准测试中智能体模式达63.8%准确率,支持复杂代码智能体应用开发,仅仅略逊于3.7 Sonnet。nDeepSeek-V3新版本生成代码视觉效果更优,HTML/CSS代码可用性提升显著,实测赛博朋克贪吃蛇游戏代码完整度与界面细节优于竞品,且文学能力也有一定进步。
2技术架构与部署
Gemini 2.5 Pro采用内建式思考架构,表示结合预训练和强化学习,DeepSeek-V3 0324参数量约660B,提供128K上下文开源版本(商用部署仅需 MIT协议)。3商业化进展nGemini 2.5 Pro目前尚未公布定价nV3 0324定价与此前V3一致
4未来模型还有什么发布?
我们认为Google 或在一季度末二季度初最新端侧多模态与Agent应用
Astra/Mariner,DeepSeek后续R2也为最核心关注重点。我们认为未来核心关注端侧与Agent方向。
来源:戈壁淘金
展开阅读全文
文章观点仅代表作者观点,或基于大数据智能生产,不构成投资建议。投资者依据此做出的投资决策需自担风险,与通联数据无关。