DeepSeek R1模型近期迎來了其發展歷程中的又一重要里程碑,全新版本DeepSeek-R1-0528正式亮相。此次迭代通過深度優化訓練流程,顯著增強了模型的邏輯推理與深度思考能力,使其在多個測試場景中均展現出了前所未有的高水平表現。
在深度思考領域,DeepSeek-R1-0528基于2024年底發布的DeepSeek V3 Base模型進行了全面升級,借助更為強大的計算能力,實現了性能上的飛躍。在數學解題、編程挑戰以及通用邏輯推理等測試中,新模型均取得了國內領先、接近國際頂尖水平的成績,如與o3和Gemini-2.5-Pro等模型比肩。尤其在備受矚目的AIME 2025競賽中,DeepSeek-R1-0528的準確率從舊版的70%大幅提升至87.5%,這一顯著進步得益于其更為細致和深入的解題策略,平均每題思考所使用的tokens數量從12K增加到了23K。
除了深度思考能力的顯著增強,DeepSeek-R1-0528在解決“幻覺”問題上也取得了重要突破。在文本改寫、內容總結、閱讀理解等多個應用場景中,新模型的幻覺率降低了近半,提供了更加準確和可靠的結果。在創意寫作領域,DeepSeek-R1-0528針對議論文、小說、散文等多種文體進行了細致優化,能夠生成篇幅更長、結構更為完整且風格貼近人類偏好的長篇作品。
DeepSeek-R1-0528還新增了工具調用功能,雖然在思考過程中暫不支持工具調用,但在Tau-Bench測評中展現出了與OpenAI o1-high相當的實力。同時,新模型在前端代碼生成、角色扮演等場景下的表現也有所提升,進一步拓寬了其應用場景。
在API方面,DeepSeek-R1-0528也進行了同步更新。雖然接口與調用方式保持不變,但新增了對Function Calling和JsonOutput的支持,為用戶提供了更為靈活和便捷的使用體驗。官方還對max_tokens參數進行了重新定義,用于限制模型單次輸出的總長度,包括其思考過程,從而幫助用戶更好地控制輸出內容。
此次DeepSeek-R1-0528的升級不僅展現了DeepSeek團隊在AI技術研發上的深厚實力,也為廣大用戶帶來了更為高效、智能和可靠的使用體驗。隨著技術的不斷進步,我們有理由相信,DeepSeek模型將在未來繼續引領AI領域的發展潮流。