首页 - 科技 > DeepSeek官宣R1 0528版本更新：表现接近o3、Gemini-2.5-Pro！

DeepSeek官宣R1 0528版本更新：表现接近o3、Gemini-2.5-Pro！

发布于：2025-05-29 作者：凹凸曼阅读：32

今晚，DeepSeek官宣R1模型完成小版本升级，当前版本为DeepSeek-R1-0528。

据介绍，DeepSeek-R1-0528仍然使用2024年12月所发布的DeepSeek V3 Base模型作为基座，但在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力。

更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩，并且在整体表现上已接近其他国际顶尖模型，如o3与Gemini-2.5-Pro。

相较于旧版R1，新版模型在复杂推理任务中的表现有了显著提升。

例如在AIME 2025测试中，新版模型准确率由旧版的70% 提升至87.5%，这一进步得益于模型在推理过程中的思维深度增强。

在AIME 2025测试集上，旧版模型平均每题使用12K tokens，而新版模型平均每题使用23K tokens，表明其在解题过程中进行了更为详尽和深入的思考。

DeepSeek官宣R1 0528版本更新：表现接近o3、Gemini-2.5-Pro

同时，DeepSeek蒸馏 DeepSeek-R1-0528的思维链后训练Qwen3-8B Base，得到了DeepSeek-R1-0528-Qwen3-8B。

据了解，该8B模型在数学测试AIME 2024中仅次于DeepSeek-R1-0528，超越Qwen3-8B （+10.0%），与Qwen3-235B相当。

DeepSeek相信，DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

其他能力更新

幻觉改善：新版DeepSeek R1针对“幻觉”问题进行了优化。

与旧版相比，更新后的模型在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了45～50%左右，能够有效地提供更为准确、可靠的结果。

创意写作：在旧版R1的基础上，更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写作风格。

DeepSeek官宣R1 0528版本更新：表现接近o3、Gemini-2.5-Pro

扫一扫关注我们

上一篇：极速接入！百度千帆大模型平台宣布上线DeepSeek-R1-0528！

下一篇：夫妻为二胎儿子跟谁姓离婚法院审理了！

北京现代断尾求生：伊兰特最低仅需6.98万元！

北京现代推出4款车型的置换补贴，包含国补在内至高可补贴2.7万元，补贴车型包括伊兰特、索纳塔、途胜L、库斯途，活动截止时间至8月31日。...

2025-08-18
女子骑万元公路车送外卖：十天赚千元！

据媒体博鳌大，一名女子在短视频平台上分享了自己骑公路自行车送外卖的经历。据了解，这名女子今年28岁，目前处于工作过渡期，白天学习，晚上利用空闲时间在江苏兼职送外...

2025-08-18
李想回应罗永浩节目邀请：从中午聊到晚上有史以来做过最长的一次访谈！

今日，罗永浩微博改名为“罗永浩的十字路口”，同时换了头像，其微博原来名字叫“罗永浩·钮钴禄”。预告中，罗永浩的首个深度长谈播客将于明天中午12点上线，第一期播客...

2025-08-18
小米16首发骁龙8 Elite 2 博主：产品定位定义都有非常大的变化！

博主数码闲聊站表示，小米16系列产品定义和定位都有非常大的变化，ID设计和硬件都有新东西，目前新机已备案但还没公示，首发骁龙8Elite2，可以根据高通峰会...

2025-08-18
18马力水冷发动机标致全新欧系大踏板摩托发布：1.88万！

标致摩托今日在中国发布了全新的欧系中型踏板车，分为ALLURE版和GT版，起售价为18800元。整车采用具有强烈运动风格的龙骨式车架结构，车身线条流畅，并能呈现...

2025-08-18
11岁女孩长期吃素食查出矮小症比同龄人低一头仅1米36.5！

据媒体报道，河南郑州一名11岁女孩因身高明显落后于同龄人（仅1.36米），就医后被诊断为矮小症。医生询问生活习惯发现，女孩母亲因个人不吃肉，日常饮食也以素食为主...

2025-08-18