DeepSeek-R1更新，官方說明來了！多項表現(xiàn)已接近其他國際頂尖模型

每日經(jīng)濟(jì)新聞 2025-05-29 21:06:59

每經(jīng)編輯｜黃勝

5月29日晚間，深度求索微信公眾號公布了 DeepSeek-R1-0528 更新的詳細(xì)升級內(nèi)容，DeepSeek-R1-0528 仍然使用 2024年12月所發(fā)布的 DeepSeek V3 Base 模型作為基座，但在后訓(xùn)練過程中投入了更多算力，顯著提升了模型的思維深度與推理能力。更新后的 R1 模型在數(shù)學(xué)、編程與通用邏輯等多個基準(zhǔn)測評中取得了當(dāng)前國內(nèi)所有模型中首屈一指的優(yōu)異成績，并且在整體表現(xiàn)上已接近其他國際頂尖模型，如 o3 與 Gemini-2.5-Pro。

圖片來源：視覺中國

其他能力更新比如：

1.幻覺改善：新版 DeepSeek R1 針對“幻覺”問題進(jìn)行了優(yōu)化。與舊版相比，更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中，幻覺率降低了 45～50% 左右，能夠有效地提供更為準(zhǔn)確、可靠的結(jié)果。

2.創(chuàng)意寫作：在舊版 R1 的基礎(chǔ)上，更新后的 R1 模型針對議論文、小說、散文等文體進(jìn)行了進(jìn)一步優(yōu)化，能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品，同時呈現(xiàn)出更加貼近人類偏好的寫作風(fēng)格。

3.工具調(diào)用：DeepSeek-R1-0528 支持工具調(diào)用（不支持在 thinking 中進(jìn)行工具調(diào)用）。當(dāng)前模型 Tau-Bench 測評成績?yōu)?airline 53.5% / retail 63.9%，與 OpenAI o1-high 相當(dāng)，但與 o3-High 以及 Claude 4 Sonnet 仍有差距。

5月29日凌晨，DeepSeek-R1-0528正式在Hugging Face平臺開源。此前一日（5月28日），DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級，用戶可通過官方網(wǎng)頁、App、小程序進(jìn)行測試（打開深度思考），API接口和使用方式保持不變。