在人工智能與機器人領域,陳佳玉的學術軌跡呈現出獨特的跨學科特征。這位兼具香港大學博士生導師與原力無限首席科學家雙重身份的學者,其研究領域橫跨自動駕駛、核聚變控制與通用家用機器人開發,始終圍繞復雜系統的智能控制展開探索。2025年開啟的全新職業階段,標志著他正式將研究重心轉向具身智能領域,試圖打通學術理論與產業實踐的壁壘。
從北京大學工學院本科畢業后,陳佳玉的早期研究聚焦自動駕駛技術,逐步深入強化學習理論。在卡內基梅隆大學博士后階段,他創新性地將強化學習應用于核聚變反應堆的等離子體控制,解決了高維非線性系統的建模難題。這段經歷讓他深刻認識到,無論是核聚變裝置的精密調控還是機器人執行日常任務,本質上都是通過馬爾可夫決策過程構建的數學問題。"觀測空間、動作空間與獎勵函數的設計,決定了控制系統的最終效能。"他解釋道。
在研究方法論上,陳佳玉形成了獨特的雙重思維模式。博士導師Vanita Gawva培養的數學抽象能力,使他能夠從統計學與優化理論視角剖析算法本質;博后導師Joshua Rendell強調的工程迭代思維,則讓他學會根據實際需求動態調整技術路線。這種理論嚴謹性與工程實用性的融合,在其主導的持續性強化學習研究中得到充分體現——該技術旨在解決人工智能系統學習新任務時遺忘舊知識的難題,目前正嘗試在機器人平臺上實現算法突破。
選擇加入原力無限創業團隊,源于陳佳玉對具身智能落地路徑的深刻認知。他指出,香港高校在設備采購、實驗室空間與算力支持方面存在顯著局限,而產業界提供的聯合實驗室環境恰好能彌補這些短板。公司已商業化的FORCE系列機器人與MASTER COFFEE服務機器人,為其研究提供了真實場景驗證平臺。"真正的技術突破需要形成商業-技術正向循環,"他強調,"當1000臺機器人部署到家庭場景持續產生數據時,數據飛輪效應將推動通用物理世界模型的構建。"
針對具身智能的發展路線,陳佳玉提出"任務泛化-場景泛化"的雙階段論。預計未來2-3年內,機器人將首先實現特定場景下的多任務穩定執行,隨后通過海量跨場景數據訓練突破場景限制。他特別指出,當前行業過度追求泛化性卻缺乏理論保障,而持續學習能力的缺失更被嚴重低估。"Richard Sutton提出的持續學習難題,需要跨學科協作才能突破。"這位青年學者透露,其團隊正在開發以智能體為中心的世界模型,通過構建因果推理機制提升機器人任務遷移能力。
在研究資源獲取方面,陳佳玉形成了一套務實策略。他建議年輕研究者首先建立完整的研究體系框架:"先拆解領域內標桿學者的思維模式,再結合自身優勢定義核心問題。"對于學術與產業的平衡,他采取"80-20法則":將主要精力投入具有長期影響力的核心研究,同時保留20%資源用于探索性工作。這種策略既保證了研究深度,又維持了學術產出效率。
面對"天才少年"的標簽,陳佳玉表現出超越年齡的成熟。"標簽本身沒有意義,"他坦言,"真正重要的是能否在資源約束下找到最優解。"這種務實態度貫穿其研究生涯——從自動駕駛感知決策到核聚變控制,再到通用機器人開發,每次方向調整都基于對技術本質與產業需求的深刻理解。正如他所強調的:"具身智能是人工智能的終極試驗場,這里需要的不只是算法創新,更是系統級解決方案。"






















