午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

智譜發布GLM-4.1V-Thinking大模型,獲浦東創投、張江集團10億戰略投資

   發布時間:2025-07-02 14:24 作者:趙靜

在上海浦東張江科學會堂,一場聚焦于人工智能前沿技術的盛會——智譜開放平臺產業生態大會圓滿舉行。會上,智譜公司震撼發布了其最新科研成果,一款名為GLM-4.1V-Thinking的新一代通用視覺語言模型。

本次大會不僅見證了技術的革新,還迎來了資本的重磅加持。智譜公司宣布,浦東創投集團與張江集團將共同向其注入總額高達10億元的戰略投資,且首筆資金已順利交割。三方攜手啟動了一項旨在構建人工智能新型基礎設施的合作項目,為人工智能的未來發展奠定了堅實基礎。

GLM-4.1V-Thinking模型是智譜公司精心打造的一款多模態輸入通用推理型大模型,專為應對復雜認知任務而生。它不僅能夠處理圖像、視頻、文檔等多種數據類型,還在GLM-4V架構的基礎上融入了創新的“思維鏈推理機制”,通過“課程采樣強化學習策略”,顯著提升了模型的跨模態因果推理能力和運行穩定性。

值得注意的是,GLM-4.1V-Thinking的輕量版——GLM-4.1V-9B-Thinking,在保持模型參數控制在10B級別的同時,實現了性能上的重大突破。在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項權威評測中,該模型取得了23項10B級模型的最佳成績,其中有18項表現甚至與參數量高達72B的Qwen-2.5-VL相當或更優,充分證明了其在小體積下展現出的極限性能潛力。

GLM-4.1V-9B-Thinking模型在多個任務領域均展現出卓越的通用性和穩健性。在圖文理解方面,它能夠精準識別并綜合分析圖像與文本信息;在數學與科學推理領域,它支持復雜題解、多步演繹與公式理解;在視頻理解方面,它具備時序分析與事件邏輯建模能力;在GUI與網頁智能體任務中,它能夠理解界面結構,輔助自動化操作;在視覺錨定與實體定位方面,它實現了語言與圖像區域的精準對齊,極大地提升了人機交互的可控性。

為了讓更多研究者能夠探索視覺語言模型的能力邊界,GLM-4.1V-9B-Thinking已在Hugging Face與魔搭社區同步開源。開源的版本包括GLM-4.1V-9B-Base基座模型和具備深度思考和推理能力的GLM-4.1V-9B-Thinking模型,用戶可正常使用和體驗后者。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新