在第五屆字節跳動獎學金頒獎典禮上,字節跳動技術副總裁楊震原分享了公司自2014年以來在技術領域的探索歷程。作為一位資深技術愛好者,楊震原自2014年加入字節跳動后,從搭建推薦系統起步,至今已參與公司多項重大技術突破,帶領團隊在多個前沿領域取得顯著成果。
2014年,字節跳動在推薦系統領域設定了一個極具挑戰性的目標:實現萬億級特征規模。當時,工業界最大規模的機器學習系統主要用于搜索廣告,而將這套技術應用于推薦系統面臨諸多難題。團隊不僅需要攻克系統建模和算法優化等工程難題,還要處理存儲和計算等基礎設施問題。通過引入FM類算法并構建streaming training系統,團隊最終實現了目標,并發現淺層神經網絡在推薦場景中仍具有顯著優勢。
2020年,字節跳動將目光投向科學計算領域。團隊認為,除了線上應用,現實世界和科學計算能夠產生大量有價值的數據。在第一性原理計算方面,公司持續投入研發神經網絡量子蒙特卡洛方法(NNQMC),通過神經網絡表示波函數并優化計算過程,在仿真精度上達到行業領先水平。最新成果Scaling Laws with LAVA顯示,增加參數數量可持續提升仿真精度,為實用化突破帶來可能。
在分子動力學領域,團隊通過GPU加速密度泛函分析(DFT)計算,實現1個GPU相當于500至1000個CPU核心的加速效果,大幅降低算力成本。開發的Bamboo-MLFF和ByteFF力場模型在預測分子和固體體系性質方面表現優異,其中ByteFF-Pol在無實驗數據條件下預測電解液性質達到行業最高精度。這些技術已與比亞迪合作,推動AI for Science在電池材料領域的工業應用。
2021年,字節跳動收購Pico團隊后,在XR領域展開雙路線探索:一方面優化現有產品形態并加強內容運營,另一方面投入基礎技術研發以提升核心體驗。2023年,公司決定減少內容投入,轉而加大技術研發投入。在顯示技術方面,團隊與供應商定制MicroOLED屏幕,結合微透鏡技術實現單眼4K分辨率,同時保持設備輕便性。針對MR技術的眩暈問題,全鏈路自研專用芯片,將系統延遲控制在12毫秒左右,達到行業領先水平。
大模型領域,字節跳動自2022年開始重點布局,推出豆包AI對話助手和火山引擎大模型服務。技術層面,公司建設的大規模穩定訓練系統MegaSacle使浮點運算利用率超過55%,顯著優于主流開源框架。通過優化模型結構和自研服務器,公司成功降低大模型應用成本,火山引擎在中國MaaS市場占據領先地位。當前研究重點包括提升模型持續學習能力,使其能夠像人類一樣通過交互不斷優化,以及增強模型與物理世界的交互能力,縮小在內容理解和界面操作等方面與人類的差距。



















