午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

Llama 4遭質(zhì)疑:AI發(fā)展停滯?NYU教授斷言規(guī)模化時代已終結(jié)

   發(fā)布時間:2025-04-09 01:00 作者:沈瑾瑜

近期,人工智能領(lǐng)域掀起了一場關(guān)于Llama 4模型的熱烈討論,多位業(yè)界領(lǐng)袖和學(xué)者紛紛發(fā)聲,對Llama 4的表現(xiàn)提出了質(zhì)疑,并探討了其對AI未來發(fā)展的影響。

一位知名AI公司CEO深入剖析了Llama 4存在的五大疑點,引發(fā)了廣泛共鳴。他指出,Llama 4所宣稱的突破并未如愿帶來顯著的智能提升,反而暴露出一系列問題。同時,有圈內(nèi)人士悲觀地認(rèn)為,Llama 4的表現(xiàn)或許標(biāo)志著單純依靠模型規(guī)模擴(kuò)大(Scaling)來提升AI能力的時代已經(jīng)結(jié)束,大型語言模型(LLM)在推理能力上的欠缺依然難以彌補(bǔ)。

Anthropic公司的CEO Dario也制作了一段長視頻,詳細(xì)列舉了Llama 4的六大疑點。他逐一剖析了Llama 4在性能、發(fā)布時機(jī)、測試數(shù)據(jù)等方面的爭議,指出其可能存在的夸大宣傳和測試作弊等問題。Dario的剖析進(jìn)一步加劇了業(yè)界對Llama 4真實能力的懷疑。

紐約大學(xué)教授馬庫斯則在博客中總結(jié)了當(dāng)前AI領(lǐng)域的現(xiàn)狀,直言不諱地表示,Scaling時代已經(jīng)結(jié)束,模型仍然無法可靠推理,金融泡沫正在破裂,GPT-5的推出遙遙無期,對不可靠語言模型的過度依賴已經(jīng)讓世界陷入了困境。他此前做出的多項預(yù)測,如今看來一一應(yīng)驗。

馬庫斯強(qiáng)調(diào),大語言模型并非解決問題的萬能鑰匙,我們需要探索更可靠的方法。他指出,像OpenAI和Anthropic這樣的公司,雖然致力于推動AI技術(shù)的發(fā)展,但面對高昂的研發(fā)成本,它們的資金儲備顯然難以為繼。如果投資者對經(jīng)濟(jì)衰退的預(yù)期增強(qiáng),AI領(lǐng)域的投資將進(jìn)一步縮減,從而導(dǎo)致AI進(jìn)展放緩。

Dario在之前的采訪中曾提到,戰(zhàn)爭可能是阻止AI進(jìn)步的一個因素。然而,如今看來,系統(tǒng)的另一種混沌狀態(tài)似乎已經(jīng)提前到來。他預(yù)測,如果技術(shù)無法繼續(xù)向前發(fā)展,資本化不足將成為AI進(jìn)步的重大阻礙。Llama 4的爭議無疑加劇了這一趨勢。

關(guān)于Llama 4的具體疑點,首先在于其所謂的業(yè)界領(lǐng)先的一千萬個token的上下文窗口是否名副其實。有對比數(shù)據(jù)顯示,早在Llama 4發(fā)布之前,Gemini 1.5 Pro就已經(jīng)達(dá)到了這一標(biāo)準(zhǔn),并且在長上下文深度理解基準(zhǔn)測試中表現(xiàn)優(yōu)異,而Llama 4的中等模型和小模型則表現(xiàn)不佳。

其次,Llama 4選擇在周六發(fā)布也引發(fā)了諸多猜測。這一非典型的發(fā)布時間,以及模型訓(xùn)練數(shù)據(jù)截止時間的滯后,都讓人懷疑meta是否在刻意避開公眾視線,試圖掩蓋模型的不足。關(guān)于Llama 4在LM Arena上是否存在作弊行為的質(zhì)疑也甚囂塵上,盡管LM Arena已經(jīng)公開了測試數(shù)據(jù)并表示將重新評估排行榜,但這一事件依然對Llama 4的聲譽(yù)造成了不可磨滅的影響。

Llama 4在編碼基準(zhǔn)測試中的糟糕表現(xiàn),也與其宣傳的“取代中級程序員”的言論形成了鮮明對比。在ADA的Polyglot編碼基準(zhǔn)測試中,Llama 4 Maverick的得分慘不忍睹,遠(yuǎn)低于Gemini 2.5 Pro等競爭對手。這一系列爭議和質(zhì)疑,無疑給Llama 4的前景蒙上了一層陰影。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新