开源模型“逆袭”！DeepSeek V3.2 炸裂发布，正面硬刚 Gemini！

搜星网北京时间 12 月 1 日，开源阵营迎来重磅“核弹”！国内大模型新锐 DeepSeek（深度求索）再次出手，正式发布其最新一代模型 DeepSeek V3.2 及其高性能版本 DeepSeek-V3.2-Speciale。

此次更新标志着开源模型在追赶国际巨头的道路上迈出了关键一步：标准版 DeepSeek V3.2 已能与 GPT-5 展开激烈“对攻”，而高性能的 V3.2 Speciale 版本，更是直接将目标锁定在闭源模型的“天花板”—— Gemini，实现了性能上的“五五开”！

在模型算力和数据投入普遍低于国际巨头的情况下，DeepSeek 凭借其独特的“算法流”路线，实现了惊人的性能飞跃。其核心秘诀在于三项重大改进：

稀疏注意力（DSA）转正：引入固定“目录页”式的稀疏注意力机制，彻底解决了长文本对话中计算量呈指数级增长的问题。论文数据显示，在长句推理中，V3.2 的推理成本几乎保持不变，堪称“超级省钱冠军”。
后训练投入翻倍：DeepSeek 首次将超过总训练算力 10% 的资源投入到模型的后期强化学习（名师辅导班）环节，弥补了以往开源模型“基础稳但刷题少”的短板。
Agent 能力重构：彻底推翻了以往“思考和工具调用分离”的低效逻辑，实现了思考过程的持续保留和工具调用记录的上下文存储，极大地提升了模型在复杂任务和智能体场景下的表现。

值得一提的是，DeepSeek V3.2 Speciale 在国际数学奥林匹克（IMO 2025）等一系列权威测试中斩获金牌，展现了其卓越的深度思考能力。

尽管在回答某些复杂问题时，DeepSeek V3.2 Speciale 的 Token 消耗量会比 Gemini 稍高，但其惊人的低成本优势使其成为真正的“性价比之王”。经实际测试，处理相同的深度思考任务，DeepSeek 的 API 价格比谷歌 便宜了近 20 倍。

正如 DeepSeek 所坚持的，算法和效率的研究，比单纯堆砌算力更加重要。此次 V3.2 的发布，不仅是 DeepSeek 自身的胜利，更是为整个开源社区注入了一剂强心针，证明了“巧妇亦能狂作无米之炊”。

标题：开源模型“逆袭”！DeepSeek V3.2 炸裂发布，正面硬刚 Gemini！

链接：https://www.msostar.com/794804.html

请登录之后再进行评论