在人工智能技術深度滲透各行業的當下,火山引擎于2025冬季Force原動力大會上拋出重磅消息:正式推出豆包大模型1.8與音視頻創作模型Seedance 1.5 pro。這一動作不僅標志著大模型技術從單一生成向多模態Agent場景的跨越,更以多項突破性技術指標重新定義了行業標桿。
據火山引擎總裁譚待披露,截至2025年12月,豆包大模型日均token使用量已突破50萬億,較去年同期激增超10倍,更有超百家企業客戶累計使用量突破萬億級。這一數據背后,是火山引擎通過技術封裝與成本優化持續降低AI應用門檻的戰略布局。"我們正推動AI從實驗室走向千行百業,讓每個企業都能擁有自己的智能體軍團。"譚待在接受采訪時強調。
作為新一代多模態Agent核心,豆包大模型1.8實現了三大技術躍遷:其視覺理解能力將單次視頻處理幀數從640幀提升至1280幀,支持低幀率長視頻分析與高幀率關鍵片段精讀,在在線教育領域可自動生成課程知識點圖譜,在工業質檢場景能實時捕捉0.01毫米級缺陷;工具調用能力方面,模型可自主規劃復雜任務流程,像項目經理般協調多步驟操作,支持256K長上下文窗口與API動態清理機制,使長程任務處理效率提升40%;成本優化層面,通過圖片壓縮比提升與思考長度可調設計,單次推理成本降低35%。
在權威評測中,該模型展現驚人實力:在視覺推理、空間理解等12項任務中登頂榜單,通用智能體測評集BrowseComp得分領先第二名12.7%,數學推理能力逼近GPT-5水平。這些突破使其迅速成為教育、金融、法律等領域的首選方案,某銀行客戶部署后,智能客服解決率從68%躍升至92%,單次服務成本下降60%。
如果說豆包大模型1.8是智能決策的"大腦",Seedance 1.5 pro則堪稱內容創作的"全能藝術家"。該模型首創原生音視頻聯合生成架構,徹底解決傳統方案"音畫脫節"的頑疾:通過毫秒級同步技術,使角色口型、語調與表演節奏完美契合,支持四川話、粵語等8種方言及英、法、西等30種語言混合對話;在運動捕捉方面,模型可精準還原發絲飄動、眼神流轉等微觀細節,其自研的希區柯克變焦算法更讓AI視頻具備電影級運鏡能力。
針對創作痛點,Seedance系列即將上線"Draft樣片"功能,創作者可先生成低分辨率預覽版,其場景布局、角色動作等核心要素與最終成片保持95%以上一致性。字節跳動內部測試顯示,該功能使視頻制作周期縮短65%,無效返工率下降60%。目前,個人用戶已可通過豆包、即夢AI等平臺體驗,企業客戶自12月23日起可通過火山引擎API接入服務。
技術突破的背后,是火山引擎對AI云原生架構的重構。其全新升級的AgentKit平臺覆蓋智能體開發全生命周期,通過權限隔離、模型路由等機制解決企業落地難題,幫助小米集團將手機服務資源交付周期從7天壓縮至10分鐘,汽車業務算法迭代速度提升3倍。而HiAgent智能體工作站則構建起企業級任務調度中心,已服務中國銀聯、招商銀行等數百家頭部客戶,單企業平均部署智能體數量從2024年的47個激增至2025年的213個。
為進一步降低使用門檻,火山引擎同步推出兩項創新計劃:豆包助手API將對話、搜索等核心能力標準化封裝,企業可像搭積木般快速構建專屬智能體;AI節省計劃則通過用量承諾折扣機制,最高可為企業節省47%的模型調用成本。這些舉措正推動AI應用從單點突破向生態化演進,譚待預測:"2025年將成為Agent技術爆發的元年,每個企業都將擁有自己的AI員工隊伍。"





















