近期,科技界迎來了一波人工智能領(lǐng)域的重大進(jìn)展。特斯拉創(chuàng)始人埃隆·馬斯克宣布,其旗下的人工智能實驗室xAI即將推出Grok 3.5版本,這一版本的人工智能據(jù)稱能夠準(zhǔn)確解答關(guān)于火箭發(fā)動機和電化學(xué)技術(shù)的專業(yè)問題,并且能夠從第一原理出發(fā)進(jìn)行推理,生成互聯(lián)網(wǎng)上未曾存在的答案。
xAI實驗室將Grok 3.5定位為全球首個能從第一性原理出發(fā)進(jìn)行推理,并生成獨特答案的人工智能系統(tǒng)。這一消息發(fā)布后,引起了業(yè)界的廣泛關(guān)注。此前,xAI已經(jīng)在今年2月推出了Grok 3版本,并在發(fā)布后的兩天內(nèi),將該應(yīng)用免費向公眾開放。這一舉措迅速提升了Grok 3的知名度,使其超越了ChatGPT,登上了蘋果應(yīng)用商店免費應(yīng)用下載排行榜的首位。馬斯克甚至曾稱贊Grok 3為“地球上最聰明的人工智能”。
然而,就在馬斯克宣布即將推出Grok 3.5的前夕,中國科技巨頭阿里巴巴也發(fā)布了其新一代通義千問模型——Qwen3。這一發(fā)布時機不禁讓人將兩者聯(lián)系起來。Qwen3在參數(shù)量上僅為DeepSeek-R1的三分之一,成本大幅降低,但性能卻全面超越了R1、OpenAI-o1等全球頂尖模型,成功登頂全球最強開源模型的寶座。
Qwen3作為國內(nèi)首個“混合推理模型”,集成了“快思考”與“慢思考”兩種模式,能夠針對簡單需求以低算力迅速給出答案,而對于復(fù)雜問題,則能夠進(jìn)行多步驟的“深度思考”。這一設(shè)計大大節(jié)省了算力消耗,提高了模型的效率。
在多個權(quán)威評測中,Qwen3展現(xiàn)出了其卓越的性能。在奧數(shù)水平的AIME25測評中,Qwen3獲得了81.5分的高分,刷新了開源模型的紀(jì)錄。在考察代碼能力的LiveCodeBench評測中,Qwen3突破了70分大關(guān),表現(xiàn)甚至優(yōu)于Grok3。在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分的成績超越了OpenAI-o1及DeepSeek-R1。
Qwen3在性能大幅提升的同時,部署成本也大幅下降。僅需4張H20顯卡即可部署Qwen3的滿血版,顯存占用僅為性能相近模型的三分之一。這一優(yōu)勢使得Qwen3在實際應(yīng)用中具有更強的競爭力。
隨著Grok 3.5和Qwen3的相繼發(fā)布,人工智能領(lǐng)域的競爭愈發(fā)激烈。這些創(chuàng)新不僅推動了技術(shù)的進(jìn)步,也為未來的應(yīng)用提供了更多的可能性。