久久久www免费人成看片,国产成人18黄禁网站免费观看,亚洲精品久久久久久久无

Llama 4遭質(zhì)疑：AI發(fā)展停滯？NYU教授斷言規(guī)模化時代已終結(jié)

發(fā)布時間：2025-04-09 01:00 來源：ITBEAR 作者：沈瑾瑜

近期，人工智能領(lǐng)域掀起了一場關(guān)于Llama 4模型的熱烈討論，多位業(yè)界領(lǐng)袖和學(xué)者紛紛發(fā)聲，對Llama 4的表現(xiàn)提出了質(zhì)疑，并探討了其對AI未來發(fā)展的影響。

一位知名AI公司CEO深入剖析了Llama 4存在的五大疑點，引發(fā)了廣泛共鳴。他指出，Llama 4所宣稱的突破并未如愿帶來顯著的智能提升，反而暴露出一系列問題。同時，有圈內(nèi)人士悲觀地認(rèn)為，Llama 4的表現(xiàn)或許標(biāo)志著單純依靠模型規(guī)模擴(kuò)大（Scaling）來提升AI能力的時代已經(jīng)結(jié)束，大型語言模型（LLM）在推理能力上的欠缺依然難以彌補(bǔ)。

Anthropic公司的CEO Dario也制作了一段長視頻，詳細(xì)列舉了Llama 4的六大疑點。他逐一剖析了Llama 4在性能、發(fā)布時機(jī)、測試數(shù)據(jù)等方面的爭議，指出其可能存在的夸大宣傳和測試作弊等問題。Dario的剖析進(jìn)一步加劇了業(yè)界對Llama 4真實能力的懷疑。

紐約大學(xué)教授馬庫斯則在博客中總結(jié)了當(dāng)前AI領(lǐng)域的現(xiàn)狀，直言不諱地表示，Scaling時代已經(jīng)結(jié)束，模型仍然無法可靠推理，金融泡沫正在破裂，GPT-5的推出遙遙無期，對不可靠語言模型的過度依賴已經(jīng)讓世界陷入了困境。他此前做出的多項預(yù)測，如今看來一一應(yīng)驗。

馬庫斯強(qiáng)調(diào)，大語言模型并非解決問題的萬能鑰匙，我們需要探索更可靠的方法。他指出，像OpenAI和Anthropic這樣的公司，雖然致力于推動AI技術(shù)的發(fā)展，但面對高昂的研發(fā)成本，它們的資金儲備顯然難以為繼。如果投資者對經(jīng)濟(jì)衰退的預(yù)期增強(qiáng)，AI領(lǐng)域的投資將進(jìn)一步縮減，從而導(dǎo)致AI進(jìn)展放緩。

Dario在之前的采訪中曾提到，戰(zhàn)爭可能是阻止AI進(jìn)步的一個因素。然而，如今看來，系統(tǒng)的另一種混沌狀態(tài)似乎已經(jīng)提前到來。他預(yù)測，如果技術(shù)無法繼續(xù)向前發(fā)展，資本化不足將成為AI進(jìn)步的重大阻礙。Llama 4的爭議無疑加劇了這一趨勢。

關(guān)于Llama 4的具體疑點，首先在于其所謂的業(yè)界領(lǐng)先的一千萬個token的上下文窗口是否名副其實。有對比數(shù)據(jù)顯示，早在Llama 4發(fā)布之前，Gemini 1.5 Pro就已經(jīng)達(dá)到了這一標(biāo)準(zhǔn)，并且在長上下文深度理解基準(zhǔn)測試中表現(xiàn)優(yōu)異，而Llama 4的中等模型和小模型則表現(xiàn)不佳。

其次，Llama 4選擇在周六發(fā)布也引發(fā)了諸多猜測。這一非典型的發(fā)布時間，以及模型訓(xùn)練數(shù)據(jù)截止時間的滯后，都讓人懷疑meta是否在刻意避開公眾視線，試圖掩蓋模型的不足。關(guān)于Llama 4在LM Arena上是否存在作弊行為的質(zhì)疑也甚囂塵上，盡管LM Arena已經(jīng)公開了測試數(shù)據(jù)并表示將重新評估排行榜，但這一事件依然對Llama 4的聲譽(yù)造成了不可磨滅的影響。

Llama 4在編碼基準(zhǔn)測試中的糟糕表現(xiàn)，也與其宣傳的“取代中級程序員”的言論形成了鮮明對比。在ADA的Polyglot編碼基準(zhǔn)測試中，Llama 4 Maverick的得分慘不忍睹，遠(yuǎn)低于Gemini 2.5 Pro等競爭對手。這一系列爭議和質(zhì)疑，無疑給Llama 4的前景蒙上了一層陰影。

更多>同類內(nèi)容

午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

Llama 4遭質(zhì)疑：AI發(fā)展停滯？NYU教授斷言規(guī)模化時代已終結(jié)