近期,字節跳動旗下火山引擎于杭州成功舉辦AI創新巡展,會上,火山引擎總裁譚待隆重揭曉了豆包1.5深度思考模型這一最新研發成果。
豆包1.5深度思考模型在多個領域展現出了卓越的能力,特別是在數學、編程、科學推理等專業范疇,以及創意寫作等通用任務中,其表現尤為亮眼。該模型采用了先進的MoE架構,總參數高達200B,但激活參數僅為20B,相較于業界同類模型,其參數規模降低了50%,從而在推理成本上具備了顯著優勢。
譚待在演講中深入闡述了豆包1.5深度思考模型的各項強大功能。他指出,該模型能夠與視覺理解技術緊密結合,為用戶提供多樣化的服務。例如,用戶可以通過照片分析地貌特征,或在旅行時利用該模型輔助點餐,甚至在企業項目管理中,豆包1.5也能幫助繪制流程圖。
火山引擎還對豆包文生圖模型進行了全面升級,推出了3.0版本。新版本在文字排版上更加美觀,圖片生成能力更為精細,且支持直接輸出2K分辨率的圖片,為用戶帶來了更為出色的使用體驗。
值得注意的是,豆包新模型在視頻搜索領域也實現了突破。用戶只需輸入搜索問題,模型便能在視頻中精準定位并提取出相應答案,極大地提升了視頻搜索的效率和準確性。
譚待還透露,豆包大模型的使用量正持續高速增長。截至2025年3月,豆包大模型的日均tokens使用量已超過12.7萬億,與發布之初相比,增長了驚人的106倍。這一數據不僅彰顯了豆包大模型的強大吸引力,也預示著AI技術在未來具有廣闊的發展前景。