近日,DeepSeek-V3模型迎來了其最新的小版本更新,版本號被標(biāo)記為DeepSeek-V3-0324。官方于昨晚詳細(xì)披露了此次升級的具體內(nèi)容,為用戶帶來了全新的使用體驗(yàn)。
據(jù)官方公告,此次更新后的DeepSeek V3模型,用戶只需在官方網(wǎng)頁、App以及小程序中關(guān)閉深度思考功能,即可直接體驗(yàn)。而API接口的使用方式則保持原樣,無需任何改動。對于非復(fù)雜推理任務(wù),官方強(qiáng)烈推薦用戶嘗試新版本V3模型,享受更加流暢的對話速度和全面提升的使用效果。
在新版V3模型中,最引人注目的變化在于其推理任務(wù)表現(xiàn)的大幅提升。通過借鑒DeepSeek-R1模型訓(xùn)練中的強(qiáng)化學(xué)習(xí)技術(shù),新版V3模型在數(shù)學(xué)、代碼類評測集上的表現(xiàn)甚至超過了GPT-4.5的得分,這無疑是對其技術(shù)實(shí)力的一次有力證明。
除此之外,新版V3模型在百科知識、數(shù)學(xué)以及代碼任務(wù)上的表現(xiàn)均有所提升。特別是在HTML等前端代碼任務(wù)上,新版模型生成的代碼不僅可用性更高,而且視覺效果也更加美觀,富有設(shè)計(jì)感。一張動圖展示了模型生成的p5.js程序,該程序能夠演示多個(gè)小球在指定空間范圍內(nèi)的運(yùn)動,并包含可調(diào)整重力、摩擦力等參數(shù)的滑動按鈕,整體以賽博朋克風(fēng)格的HTML呈現(xiàn),令人眼前一亮。
在中文寫作方面,新版V3模型同樣進(jìn)行了優(yōu)化。基于R1模型的寫作水平,新版V3模型進(jìn)一步提升了內(nèi)容質(zhì)量,尤其是在中長篇文本創(chuàng)作上,表現(xiàn)尤為突出。幾張展示新版模型中文寫作能力的圖片,更是讓人對其進(jìn)步刮目相看。
新版V3模型在中文搜索能力上也進(jìn)行了優(yōu)化。在聯(lián)網(wǎng)搜索場景下,對于報(bào)告生成類指令,新版模型能夠輸出內(nèi)容更為詳實(shí)準(zhǔn)確、排版更加清晰美觀的結(jié)果,進(jìn)一步提升了用戶的使用體驗(yàn)。
新版V3模型在工具調(diào)用、角色扮演、問答閑聊等方面也均有所提升,為用戶帶來了更加全面、豐富的使用體驗(yàn)。在模型開源方面,DeepSeek-V3-0324與之前的DeepSeek-V3使用相同的base模型,僅對后訓(xùn)練方法進(jìn)行了改進(jìn)。私有化部署時(shí),用戶只需更新checkpoint和tokenizer_config.json(tool calls相關(guān)變動)即可。模型參數(shù)約660B,開源版本上下文長度為128K(網(wǎng)頁端、App和API提供64K上下文)。用戶可在Huggingface平臺上下載V3-0324模型權(quán)重。
此次DeepSeek-V3模型的更新,無疑是一次全面的技術(shù)升級,為用戶帶來了更加優(yōu)質(zhì)的使用體驗(yàn)。我們期待在未來,DeepSeek能夠繼續(xù)發(fā)揮其技術(shù)優(yōu)勢,為用戶帶來更多驚喜。