四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek-R1更新,官方說明來了!多項表現(xiàn)已接近其他國際頂尖模型

每日經(jīng)濟(jì)新聞 2025-05-29 21:06:59

每經(jīng)編輯|黃勝    

5月29日晚間,深度求索微信公眾號公布了 DeepSeek-R1-0528 更新的詳細(xì)升級內(nèi)容,DeepSeek-R1-0528 仍然使用 2024年12月所發(fā)布的 DeepSeek V3 Base 模型作為基座,但在后訓(xùn)練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新后的 R1 模型在數(shù)學(xué)、編程與通用邏輯等多個基準(zhǔn)測評中取得了當(dāng)前國內(nèi)所有模型中首屈一指的優(yōu)異成績,并且在整體表現(xiàn)上已接近其他國際頂尖模型,如 o3 與 Gemini-2.5-Pro。

圖片來源:視覺中國

其他能力更新比如:

1.幻覺改善:新版 DeepSeek R1 針對“幻覺”問題進(jìn)行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更為準(zhǔn)確、可靠的結(jié)果。

2.創(chuàng)意寫作:在舊版 R1 的基礎(chǔ)上,更新后的 R1 模型針對議論文、小說、散文等文體進(jìn)行了進(jìn)一步優(yōu)化,能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風(fēng)格。

3.工具調(diào)用:DeepSeek-R1-0528 支持工具調(diào)用(不支持在 thinking 中進(jìn)行工具調(diào)用)。當(dāng)前模型 Tau-Bench 測評成績?yōu)?airline 53.5% / retail 63.9%,與 OpenAI o1-high 相當(dāng),但與 o3-High 以及 Claude 4 Sonnet 仍有差距。 

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平臺開源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,用戶可通過官方網(wǎng)頁、App、小程序進(jìn)行測試(打開深度思考),API接口和使用方式保持不變。

每日經(jīng)濟(jì)新聞綜合公開消息

免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風(fēng)險自擔(dān)。

 

封面圖片來源:每日經(jīng)濟(jì)新聞

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 DeepSeek 數(shù)學(xué) 編程

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0