近期,一項跨學科的聯(lián)合研究項目取得了引人矚目的成果,斯坦福大學、華盛頓大學與Google DeepMind攜手,成功培育出一千個能夠精準預測人類行為的AI智能體。這些智能體在社會模擬實驗中的表現(xiàn)令人驚嘆,預測準確率最高可達85%,為經(jīng)濟學、社會學、組織學和科學等多個領(lǐng)域的研究開辟了全新的路徑。
為了實現(xiàn)這一目標,研究團隊首先對超過一千名具有代表性的美國民眾進行了深度訪談。這些訪談對象覆蓋了廣泛的年齡層、性別以及教育背景,確保了數(shù)據(jù)的多樣性和代表性。基于這些豐富的訪談資料,研究人員精心構(gòu)建了AI智能體模型,并將訪談記錄與先進的GPT-4o模型相結(jié)合,形成了獨特的智能體系統(tǒng)。
在后續(xù)的測試中,這些基于訪談數(shù)據(jù)的AI智能體展現(xiàn)出了驚人的預測能力。在面對《通用社會調(diào)查》等問題時,它們的準確率高達85%,遠超那些僅依賴人口統(tǒng)計信息的AI模型。在五項社會科學實驗中,AI智能體的表現(xiàn)與人類行為高度一致,相關(guān)系數(shù)高達0.98,充分證明了它們在模擬人類行為方面的卓越能力。
值得注意的是,與傳統(tǒng)的基于人口統(tǒng)計的預測方法相比,訪談驅(qū)動的AI在預測不同種族群體和觀點時表現(xiàn)出更高的準確性。這種方法有效減少了因人口統(tǒng)計類別差異而產(chǎn)生的偏差,為社會科學研究提供了更為可靠和精準的工具。
為了推動這一研究成果的廣泛應用,研究團隊已經(jīng)將包含一千個AI模型的數(shù)據(jù)集開放到了GitHub平臺上。為了確保數(shù)據(jù)的安全性和合規(guī)性,團隊還建立了兩層訪問機制。綜合性數(shù)據(jù)對研究人員完全開放,方便他們進行深入研究;而個別參與者的詳細數(shù)據(jù)則受到嚴格保護,需要經(jīng)過特殊審批才能訪問。