在科技界的萬(wàn)眾矚目下,OpenAI于近日低調(diào)發(fā)布了其最新聊天模型GPT-4.5的研究預(yù)覽版。與兩年前GPT-4發(fā)布時(shí)的盛況相比,此次發(fā)布顯得尤為簡(jiǎn)潔,甚至CEO Sam Altman也未現(xiàn)身直播現(xiàn)場(chǎng),官方更是直言GPT-4.5并非前沿模型,種種跡象似乎預(yù)示著這次更新并非一次顛覆性的飛躍。
然而,盡管缺乏轟動(dòng)效應(yīng),GPT-4.5作為OpenAI目前最新、最強(qiáng)的聊天模型,仍展現(xiàn)出了一定的進(jìn)步。尤其在情商表現(xiàn)和減少幻覺方面,GPT-4.5相較于其前身GPT-4o有了顯著提升,準(zhǔn)確率提高了24%,幻覺率降低了24.7%。這兩項(xiàng)改進(jìn)直擊當(dāng)前大模型使用中的痛點(diǎn),對(duì)于提升用戶體驗(yàn)具有重要意義。
但進(jìn)步的背后,是令人咋舌的推理成本。GPT-4.5的API定價(jià)遠(yuǎn)高于預(yù)期,輸入(緩存未命中)價(jià)格高達(dá)75美元/百萬(wàn)tokens,是GPT-4o的30倍,更是DeepSeek-V3的277倍之多。如此高昂的價(jià)格,無(wú)疑給開發(fā)者的使用熱情澆上了一盆冷水,讓人不禁質(zhì)疑其市場(chǎng)接受度。
盡管如此,GPT-4.5在對(duì)話理解上的提升仍值得肯定。在直播演示中,GPT-4.5展現(xiàn)出了對(duì)用戶需求和意圖的更好理解,能夠給出更加貼合人類情感的回應(yīng)。例如,當(dāng)用戶表示想發(fā)短信罵放鴿子的朋友時(shí),GPT-4.5沒有直接提供憤怒的信息,而是提供了建設(shè)性的建議,相比之下,GPT-4o則顯得更為“機(jī)械”。
GPT-4.5在內(nèi)部測(cè)試中也被認(rèn)為與人類的對(duì)話方式更為接近,自然度有所提升。雖然這種提升在數(shù)據(jù)上并不顯著,但在實(shí)際體驗(yàn)中,用戶往往能夠感受到GPT-4.5更加“人性化”的一面。
然而,與情商提升相比,幻覺減少或許更受用戶關(guān)注。在SimpleQA常識(shí)問(wèn)答測(cè)試中,GPT-4.5編造答案或產(chǎn)生幻覺的比例約為37%,遠(yuǎn)低于GPT-4o的近60%。這一改進(jìn)對(duì)于提升模型的可信度和實(shí)用性具有重要意義。
盡管GPT-4.5在交互體驗(yàn)和準(zhǔn)確性上有所進(jìn)步,但其高昂的推理成本仍是難以回避的問(wèn)題。Sam Altman在社交平臺(tái)上透露,GPT-4.5是一個(gè)巨型、昂貴的模型,甚至需要增加數(shù)萬(wàn)個(gè)GPU才能滿足更多用戶的需求。這一消息無(wú)疑加劇了開發(fā)者對(duì)成本的擔(dān)憂。
面對(duì)GPT-4.5的高價(jià)策略,業(yè)界反應(yīng)不一。有觀點(diǎn)認(rèn)為,GPT-4.5在特定用例上如寫作和頭腦風(fēng)暴具有潛力,但整體而言只是交互變得更加順滑,并未帶來(lái)顛覆性的變革。這一評(píng)價(jià)或許能夠較為客觀地反映GPT-4.5的升級(jí)定位。
GPT-4.5在訓(xùn)練上引入了“無(wú)監(jiān)督學(xué)習(xí)擴(kuò)展”技術(shù),這是其在情商和幻覺方面有所改進(jìn)的關(guān)鍵創(chuàng)新之一。無(wú)監(jiān)督學(xué)習(xí)使模型能夠從大量未標(biāo)注的數(shù)據(jù)中學(xué)習(xí)語(yǔ)言模式和知識(shí),從而提高了模型的準(zhǔn)確性和直覺能力。這一技術(shù)的引入,或許能夠?yàn)槲磥?lái)大模型的發(fā)展提供新的思路。
盡管GPT-4.5的推理成本高昂,但其仍不失為一款值得期待的聊天模型。對(duì)于ChatGPT的訂閱用戶而言,GPT-4.5的引入或許能為他們提供更多的續(xù)訂理由。而對(duì)于整個(gè)大模型行業(yè)而言,GPT-4.5的發(fā)布無(wú)疑將進(jìn)一步推動(dòng)技術(shù)的進(jìn)步和市場(chǎng)的競(jìng)爭(zhēng)。
在DeepSeek等競(jìng)爭(zhēng)對(duì)手的強(qiáng)勁勢(shì)頭下,GPT-4.5的發(fā)布無(wú)疑為行業(yè)注入了新的活力。盡管面臨諸多挑戰(zhàn),但OpenAI仍以其不懈的努力和創(chuàng)新精神,持續(xù)推動(dòng)著大模型技術(shù)的發(fā)展。未來(lái),我們期待看到更多優(yōu)秀的大模型涌現(xiàn),為人類社會(huì)帶來(lái)更多的便利和驚喜。