在科技界的萬眾矚目下,OpenAI于4月17日凌晨通過一場直播活動,震撼發(fā)布了其o系列推理模型家族的兩位新成員——o3與o4-mini。據(jù)OpenAI官方宣稱,這兩款模型代表了他們迄今為止在智能領(lǐng)域的巔峰之作,它們不僅能夠更深入地思考問題,還在響應(yīng)速度上實現(xiàn)了顯著提升。
尤為引人注目的是,o3與o4-mini在工具使用上的智能表現(xiàn)令人贊嘆。它們能夠無縫集成ChatGPT內(nèi)的各種工具,包括但不限于網(wǎng)絡(luò)搜索、Python數(shù)據(jù)分析、視覺信息深度解析,甚至圖像生成。這些模型經(jīng)過特殊訓(xùn)練,能夠自主判斷何時、以何種方式運(yùn)用這些工具,從而在極短時間內(nèi)(通常不足一分鐘)給出詳盡且經(jīng)過深思熟慮的答案,解決復(fù)雜問題。
尤為o3與o4-mini是OpenAI首次推出的具備“圖像思考”能力的模型。用戶只需上傳白板照片、教科書圖表或手繪草圖,即便圖像質(zhì)量欠佳,這兩款模型也能準(zhǔn)確解讀并進(jìn)行深入分析。更令人驚嘆的是,它們還能實時對圖像進(jìn)行旋轉(zhuǎn)、縮放等操作,以輔助推理過程。
在性能表現(xiàn)上,o3無疑成為了OpenAI當(dāng)前最強(qiáng)大的推理模型,其在編碼、數(shù)學(xué)、科學(xué)、視覺感知等多個領(lǐng)域均展現(xiàn)出領(lǐng)先實力。而o4-mini則以其小巧、高效的特點(diǎn),專為追求速度與成本效益的推理任務(wù)而設(shè)計。在基準(zhǔn)測試中,o3與o4-mini在數(shù)學(xué)、編碼及視覺任務(wù)上的卓越表現(xiàn)令人矚目。
除了卓越的推理能力,o3與o4-mini在有害提示的拒絕方面也展現(xiàn)出了高超技巧。OpenAI在訓(xùn)練數(shù)據(jù)中融入了新的拒絕提示,并在系統(tǒng)層面開發(fā)了緩解措施,以有效標(biāo)記潛在風(fēng)險領(lǐng)域的危險提示。通過訓(xùn)練一個推理LLM監(jiān)控器,該監(jiān)控器能夠從人類編寫的可解釋安全規(guī)范中工作,當(dāng)應(yīng)用于生物風(fēng)險領(lǐng)域時,成功標(biāo)記了約99%的對話。
在用戶權(quán)限方面,ChatGPT Plus、Pro和Team用戶將率先體驗到o3、o4-mini及o4-mini-high,這些新模型將替代原有的o1、o3-mini及o3-mini-high。而ChatGPT Enterprise和Edu用戶則將在一周后獲得訪問權(quán)限。對于免費(fèi)用戶而言,他們可以在提交查詢前選擇“思考”功能,嘗試使用o4-mini。值得注意的是,所有計劃中的速率限制均保持不變。
此次更新不僅標(biāo)志著OpenAI在模型發(fā)展上的重要里程碑,也預(yù)示著未來ChatGPT將朝著更智能、更獨(dú)立執(zhí)行任務(wù)的方向邁進(jìn)。通過將o系列的專業(yè)推理能力與GPT系列的自然對話及工具使用能力相結(jié)合,OpenAI正逐步構(gòu)建一個更加全面、強(qiáng)大的AI生態(tài)系統(tǒng)。