本周三,OpenAI宣布了一項(xiàng)重大更新,將其ChatGPT中最新升級(jí)的圖像生成技術(shù)開放給API用戶。這一舉措意味著開發(fā)者現(xiàn)在可以將ChatGPT的圖像生成功能融入他們的應(yīng)用程序和服務(wù)中,為用戶提供更多樣化的體驗(yàn)。
今年3月底,ChatGPT的圖像生成功能一經(jīng)推出便引發(fā)了廣泛關(guān)注。該功能以其能夠創(chuàng)造出逼真的吉卜力風(fēng)格圖片和“AI人偶”而迅速走紅,吸引了大量新用戶。據(jù)統(tǒng)計(jì),在該功能上線的第一周,就有超過1.3億ChatGPT用戶生成了7億多張圖像,這對(duì)OpenAI的服務(wù)器構(gòu)成了巨大挑戰(zhàn)。
OpenAI此次開放的API中的圖像生成能力,由名為“gpt-image-1”的AI模型提供支持。這是一個(gè)多模態(tài)模型,能夠生成多種風(fēng)格的圖像。開發(fā)者不僅可以通過gpt-image-1生成單張圖像,還可以同時(shí)生成多張,并通過調(diào)整生成質(zhì)量來控制生成速度,從而滿足不同的應(yīng)用需求。
為了保障內(nèi)容的合規(guī)性,gpt-image-1采用了與ChatGPT圖像生成相同的“安全護(hù)欄”機(jī)制。開發(fā)者可以根據(jù)需要調(diào)整內(nèi)容審核的敏感度,選擇“自動(dòng)”模式進(jìn)行標(biāo)準(zhǔn)過濾,或者選擇“低”模式進(jìn)行較為寬松的過濾。然而,值得注意的是,在低過濾模式下,模型對(duì)潛在的不適合特定年齡段的內(nèi)容限制較少,因此開發(fā)者需要謹(jǐn)慎使用。
OpenAI還強(qiáng)調(diào),所有通過gpt-image-1生成的圖像都將嵌入C2PA元數(shù)據(jù)水印。這一舉措旨在幫助支持的平臺(tái)和應(yīng)用程序識(shí)別這些圖像是由AI生成的,從而為用戶提供更準(zhǔn)確的信息。
在定價(jià)方面,gpt-image-1的收費(fèi)標(biāo)準(zhǔn)相對(duì)合理。文本輸入每百萬token收費(fèi)5美元,圖像輸入每百萬token收費(fèi)10美元,而圖像輸出每百萬token則收費(fèi)40美元。根據(jù)OpenAI的計(jì)算,生成低質(zhì)量、中質(zhì)量和高質(zhì)量正方形圖像的成本分別約為每張2美分、7美分和19美分。這一價(jià)格策略使得更多開發(fā)者能夠負(fù)擔(dān)得起使用gpt-image-1的費(fèi)用。
目前,已經(jīng)有多家公司開始使用或測(cè)試gpt-image-1。例如,Adobe、Airtable、Wix等知名企業(yè)已經(jīng)開始將其融入自己的產(chǎn)品中。Figma的設(shè)計(jì)平臺(tái)現(xiàn)在允許用戶通過gpt-image-1生成和編輯圖像,而Instacart則正在測(cè)試該模型,用于生成食譜和購(gòu)物清單的圖像。這些公司的加入無疑將進(jìn)一步推動(dòng)gpt-image-1的應(yīng)用和發(fā)展。