在北航的校園里,有一位年輕學子以其卓越的學術成就和開源項目的巨大影響力,成為了人工智能領域的璀璨新星,他就是計算機學院2022級博士研究生鄭耀威。
自高中時期被谷歌AlphaGo擊敗人類世界冠軍的新聞所吸引,鄭耀威便立志投身于人工智能領域。考入北航后,他迅速展現出了對知識的渴望和科研的熱情。大一期間,他利用課余時間自學了Python、概率論、機器學習、深度學習等多門專業課程,累計課時超過800小時,為日后的科研之路打下了堅實的基礎。
大二時,鄭耀威主動加入張日崇教授的科研團隊,開始了自己的科研創新之旅。他堅持每天進步一點點,從跑實驗、讀代碼做起,逐漸深入到科研的核心領域。在本科二年級的暑假,他選擇留校科研,每天沉浸在實驗室的討論、建模與調試中,這段經歷讓他收獲頗豐。
“博觀而約取,厚積而薄發”是鄭耀威的人生信條。他心無旁騖地鉆研科研問題,與導師和高年級同學頻繁碰撞思想,不斷激發靈感與創新思維。憑借在低資源場景機器學習技術領域的深入研究,他以第一作者身份在ACL、CVPR、AAAI、WWW等國際頂級會議上發表了多篇高水平學術論文,其中學生一作的論文就有6篇,谷歌學術引用量超過600次,第一作者論文引用量更是超過500次。
除了學術研究,鄭耀威還積極參與各類課外科技競賽。他提出的“基于語法圖上隨機游走的多方面情感分類”算法,榮獲北航馮如杯科技競賽一等獎。在全國數字健康創新應用大賽中,他開發的自動檢查心腦血管疾病算法脫穎而出,榮獲算法模型一等獎。他還獲得了全國大學生冰壺人工智能挑戰賽總冠軍、藍橋杯信息技術大賽全國一等獎等眾多獎項,展現了北航學子的卓越風采。
然而,鄭耀威的成就遠不止于此。他敏銳地察覺到大模型微調和推理資源消耗巨大的問題,阻礙了AI的落地應用。為此,他將研究重心放在了大模型微調框架上,成功實現了大語言模型的量化和低秩分解技術,大幅降低了模型的顯存消耗和訓練成本。依托這一技術,他構建了大模型高效微調框架LLaMA-Factory,并開源至GitHub平臺。
LLaMA-Factory項目一經提出就受到了廣泛關注,社區開發者的需求紛至沓來。鄭耀威不斷學習各類型號硬件平臺文檔,實現了硬件感知的自動優化方案,使LLaMA-Factory在英偉達芯片和國產芯片上均能無痛運行。這一貢獻贏得了華為昇騰芯片部門官方的高度認可,他也因此榮獲華為昇騰生態開源卓越貢獻獎。
在鄭耀威的不懈努力下,LLaMA-Factory項目逐漸贏得了社區開發者的廣泛贊譽與熱烈歡迎。項目累計獲得超過40000星標,成為了國內最熱門的大語言模型微調框架,并登頂Github熱門項目榜單全球第一。他還多次受邀參加行業峰會、開發者大會,與全球各地的LLaMA-Factory用戶面對面交流,共同探討技術難題。
鄭耀威積極將學術成果與社會應用緊密結合。他介紹了LLaMA-Factory在山西文旅AI導游場景中的實際應用,還與業界大咖共話DeepSeek帶來的AI應用加速創新。他的開源精神和技術實力得到了業界的廣泛認可。
對于自己的成長過程,鄭耀威尤為感謝身邊老師的支持。他回憶起在項目受挫時,導師張日崇教授花一整天陪他一起分析代碼、逐句討論論文的經歷,至今仍銘記在心。他也希望更多同學能夠走進創新,用好大模型,通過參與開源社區的形式接觸前沿技術,與學者碰撞觀點。