在第五屆字節(jié)跳動獎學(xué)金頒獎典禮上,字節(jié)跳動技術(shù)副總裁楊震原分享了公司自2014年起在技術(shù)領(lǐng)域的探索歷程。作為技術(shù)愛好者,楊震原自2014年加入字節(jié)跳動后,從搭建推薦系統(tǒng)起步,參與了多項關(guān)鍵技術(shù)突破,逐步推動公司技術(shù)體系的發(fā)展。
2014年,字節(jié)跳動在推薦系統(tǒng)領(lǐng)域設(shè)定了極具挑戰(zhàn)的目標:實現(xiàn)萬億級特征規(guī)模。當時,工業(yè)界最大規(guī)模的機器學(xué)習(xí)系統(tǒng)是搜索廣告中的離散邏輯回歸模型,而將其應(yīng)用于推薦系統(tǒng)面臨諸多難題,包括軟硬件工程與機器學(xué)習(xí)的交叉人才稀缺,以及高硬件成本投入的顧慮。團隊通過優(yōu)化系統(tǒng)建模、存儲計算架構(gòu)和算法設(shè)計,最終在年底引入FM類算法,并逐步構(gòu)建起基于深度學(xué)習(xí)的通用體系。這一系統(tǒng)從上線之初便采用流式訓(xùn)練模式,至今仍被證明在推薦場景中具有高效性。
2021年,字節(jié)跳動通過收購Pico團隊布局XR技術(shù),并制定雙路線戰(zhàn)略:一方面持續(xù)運營視頻、直播等內(nèi)容生態(tài),另一方面加大基礎(chǔ)技術(shù)研發(fā)投入。2023年,公司調(diào)整策略,聚焦技術(shù)突破,減少內(nèi)容營銷投入。針對XR設(shè)備清晰度問題,團隊與供應(yīng)商合作定制MicroOLED顯示技術(shù),通過微透鏡陣列優(yōu)化亮度與色均勻性,實現(xiàn)單眼4K分辨率與輕量化設(shè)計。在運動追蹤(MR)領(lǐng)域,團隊自研專用芯片,將系統(tǒng)延遲壓縮至12毫秒,顯著優(yōu)于行業(yè)平均水平。公司還構(gòu)建了高精度測試系統(tǒng),以支撐虛實融合場景的識別與交互需求。
2023年,大模型技術(shù)成為字節(jié)跳動技術(shù)布局的核心方向之一。盡管公司早在2021年已開展相關(guān)研究,但直至ChatGPT引發(fā)全球關(guān)注后,才加速商業(yè)化進程。目前,其AI對話助手“豆包”已成為國內(nèi)用戶規(guī)模最大的產(chǎn)品,火山引擎的大模型服務(wù)也占據(jù)中國MaaS市場首位。技術(shù)層面,公司依托早期積累的基建優(yōu)勢,構(gòu)建了高效訓(xùn)練系統(tǒng)MegaScale,浮點運算利用率(MFU)超越主流開源框架1.3倍。通過優(yōu)化模型結(jié)構(gòu)與自研服務(wù)器,公司成功降低大模型服務(wù)成本,在保持毛利率的同時打破行業(yè)價格底線。
楊震原指出,當前大模型能力存在顯著不均衡性:例如在數(shù)學(xué)競賽中表現(xiàn)超越99.9%人類,卻難以勝任初中生水平的電話客服工作。這一差距源于模型學(xué)習(xí)機制與人類本質(zhì)差異——現(xiàn)有模型訓(xùn)練與推理階段分離,部署后僅能通過上下文學(xué)習(xí),而人類具備持續(xù)學(xué)習(xí)能力并可利用社會環(huán)境反饋。模型在交互能力(IO)上仍與人類存在差距,尤其在內(nèi)容理解與界面操作等基礎(chǔ)領(lǐng)域。這些挑戰(zhàn)將成為技術(shù)團隊未來探索的重點方向。




















