在科技界的萬眾矚目下,OpenAI于4月17日凌晨通過一場直播活動,震撼發(fā)布了其o系列推理模型家族的兩位新成員——o3與o4-mini。據(jù)OpenAI官方宣稱,這兩款模型代表了他們迄今為止在智能領域的巔峰之作,它們不僅能夠更深入地思考問題,還在響應速度上實現(xiàn)了顯著提升。
尤為引人注目的是,o3與o4-mini在工具使用上的智能表現(xiàn)令人贊嘆。它們能夠無縫集成ChatGPT內(nèi)的各種工具,包括但不限于網(wǎng)絡搜索、Python數(shù)據(jù)分析、視覺信息深度解析,甚至圖像生成。這些模型經(jīng)過特殊訓練,能夠自主判斷何時、以何種方式運用這些工具,從而在極短時間內(nèi)(通常不足一分鐘)給出詳盡且經(jīng)過深思熟慮的答案,解決復雜問題。
尤為o3與o4-mini是OpenAI首次推出的具備“圖像思考”能力的模型。用戶只需上傳白板照片、教科書圖表或手繪草圖,即便圖像質(zhì)量欠佳,這兩款模型也能準確解讀并進行深入分析。更令人驚嘆的是,它們還能實時對圖像進行旋轉(zhuǎn)、縮放等操作,以輔助推理過程。
在性能表現(xiàn)上,o3無疑成為了OpenAI當前最強大的推理模型,其在編碼、數(shù)學、科學、視覺感知等多個領域均展現(xiàn)出領先實力。而o4-mini則以其小巧、高效的特點,專為追求速度與成本效益的推理任務而設計。在基準測試中,o3與o4-mini在數(shù)學、編碼及視覺任務上的卓越表現(xiàn)令人矚目。
除了卓越的推理能力,o3與o4-mini在有害提示的拒絕方面也展現(xiàn)出了高超技巧。OpenAI在訓練數(shù)據(jù)中融入了新的拒絕提示,并在系統(tǒng)層面開發(fā)了緩解措施,以有效標記潛在風險領域的危險提示。通過訓練一個推理LLM監(jiān)控器,該監(jiān)控器能夠從人類編寫的可解釋安全規(guī)范中工作,當應用于生物風險領域時,成功標記了約99%的對話。
在用戶權限方面,ChatGPT Plus、Pro和Team用戶將率先體驗到o3、o4-mini及o4-mini-high,這些新模型將替代原有的o1、o3-mini及o3-mini-high。而ChatGPT Enterprise和Edu用戶則將在一周后獲得訪問權限。對于免費用戶而言,他們可以在提交查詢前選擇“思考”功能,嘗試使用o4-mini。值得注意的是,所有計劃中的速率限制均保持不變。
此次更新不僅標志著OpenAI在模型發(fā)展上的重要里程碑,也預示著未來ChatGPT將朝著更智能、更獨立執(zhí)行任務的方向邁進。通過將o系列的專業(yè)推理能力與GPT系列的自然對話及工具使用能力相結合,OpenAI正逐步構建一個更加全面、強大的AI生態(tài)系統(tǒng)。