人工智能領域再次迎來重大突破,OpenAI公司近期發布了一項創新技術——ChatGPT智能體系統,這一消息由OpenAI的首席執行官山姆·奧特曼及其四位團隊領導在一場25分鐘的直播中揭曉。
這一智能體系統堪稱一項融合技術的杰作,它將Operator的遠程瀏覽器執行能力、Deep Research的網絡信息整合技術以及ChatGPT的對話優勢巧妙地結合在一起,形成了一個能夠“思考與行動”的統一平臺。智能體系統能從自身的技能庫中自主選擇工具,利用專屬的計算資源,為用戶執行各種任務。
奧特曼強調,這一智能體代表了AI系統能力的新里程碑。在此之前,Operator和Deep Research雖各有千秋,但各自存在局限。Operator雖能在網頁上處理內容,卻無法深入分析或撰寫詳細報告;而Deep Research雖擅長信息分析與匯總,卻難以與網站互動以優化結果或訪問受限內容。OpenAI此次將二者的優勢完美結合,推出了這一革命性的智能體系統。
在智能體模式下,ChatGPT將利用“虛擬電腦”執行復雜任務。用戶只需給出指令,智能體就能主動與網站互動,甚至在同一聊天窗口中直接從對話過渡到直接請求操作。這一創新功能極大地提升了用戶體驗和效率。
在發布會上,OpenAI展示了智能體執行多項任務的能力,如購買西裝、制作貼紙、預訂酒店等。智能體在啟動虛擬電腦后,會迅速詢問用戶的具體需求,然后自動瀏覽網頁、查看商品詳情,并給出相應的建議。智能體還能代替用戶完成下單操作,展現了其強大的實用性和便捷性。
值得注意的是,智能體在“虛擬電腦”中執行任務時,能夠保留任務所需的上下文信息。它可以選擇使用文本瀏覽器或可視化瀏覽器打開頁面,從網絡上下載文件,并在終端中運行命令進行操作。完成后,用戶還可以在可視化瀏覽器中查看輸出結果。同時,智能體在執行重要操作前會請求用戶授權,確保用戶對整個過程的控制和監督。
在性能評估方面,ChatGPT智能體模型在“人類最后一次考試”中的得分達到了41.6,通過簡單的并行部署策略擴展后,得分更是提升至44.4。在FrontierMath等基準測試中,智能體的準確率也遠超之前的模型,再次證明了其卓越的性能和潛力。
目前,OpenAI已為Pro、Plus和Team用戶提供了智能體模式的使用權限。企業版和教育版用戶也將在未來幾周內獲得訪問權限。對于Pro用戶而言,每月可免費使用400次智能體服務;其他付費用戶則每月有40次免費使用機會,當然也可以選擇付費增加使用量。