在第二屆CCF中國數(shù)據(jù)大會上,螞蟻數(shù)科宣布了一項重要舉措:正式開源其數(shù)據(jù)智能體核心技術Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細的使用指南。這一技術旨在讓非專業(yè)人士也能通過自然語言輕松完成商業(yè)數(shù)據(jù)的查詢與分析,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加精準、實用的智能數(shù)據(jù)分析基礎。
作為首期開源內(nèi)容,螞蟻數(shù)科推出了實時文本轉(zhuǎn)化結(jié)構(gòu)化查詢語言(Text-to-SQL)框架,為開發(fā)者提供了一套即插即用的數(shù)據(jù)查詢解決方案,顯著提升了文本與數(shù)據(jù)庫查詢之間的交互效率。未來,該公司計劃在2026年陸續(xù)開源更多技術框架,包括數(shù)據(jù)庫理解與挖掘、行業(yè)知識挖掘以及實時多輪交互技術,覆蓋從意圖理解到業(yè)務理解再到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。
由該技術支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL,已在全球權(quán)威的自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語言(NL2SQL)評測基準BIRD-SQL中脫穎而出,力壓Google等國內(nèi)外知名企業(yè),登頂排行榜。目前,該智能體在執(zhí)行準確率和執(zhí)行效率兩大榜單上均保持領先地位,持續(xù)領跑超過兩個月。BIRD-SQL評測要求AI模型將自然語言查詢精準轉(zhuǎn)換為SQL,并在真實復雜的大規(guī)模生產(chǎn)級數(shù)據(jù)庫中穩(wěn)定運行。其數(shù)據(jù)集涵蓋金融、電力、醫(yī)療等37個行業(yè)場景,總量達33GB,包含超過1萬條高復雜度查詢?nèi)蝿眨还J為全球最具挑戰(zhàn)性的NL2SQL測試。
研究機構(gòu)數(shù)據(jù)顯示,全球商業(yè)智能市場規(guī)模預計在2025年達到474.8億美元,而中國商業(yè)智能與分析軟件市場規(guī)模則有望達到12億美元。到2028年,中國商業(yè)智能軟件市場規(guī)模預計將增長至17.9億美元,未來五年年復合增長率(CAGR)為12.7%,成為企業(yè)智能技術投資的重要領域。
當前,中國企業(yè)在商業(yè)智能與分析產(chǎn)品的應用深度上存在較大差異,多數(shù)企業(yè)仍集中在數(shù)據(jù)可視化和簡單分析需求,如報表、駕駛艙、儀表板等。然而,如何在保證準確性的前提下,提升技術在真實生產(chǎn)環(huán)境中的可用性,仍是NL2SQL在產(chǎn)業(yè)中規(guī)模化落地的普遍難題。
螞蟻數(shù)科AI技術負責人章鵬在會上指出,NL2SQL在實際應用中面臨四大挑戰(zhàn):理解人類口語的模糊多義性、注入龐大的行業(yè)專業(yè)知識、解析復雜的數(shù)據(jù)庫結(jié)構(gòu)與關聯(lián),以及生成準確無誤的復雜SQL語句。這些挑戰(zhàn)表明,簡單的模型“套殼”無法滿足企業(yè)級應用的可靠性與準確性要求。
以金融領域為例,從業(yè)者需要結(jié)合復雜業(yè)務規(guī)則與多條件組合進行數(shù)據(jù)查詢,以有效分析產(chǎn)品數(shù)據(jù)。而在業(yè)務管理中,非專業(yè)數(shù)據(jù)分析人員的口語化提問,則需要產(chǎn)品能夠準確理解行業(yè)術語和詢問意圖,并與數(shù)據(jù)庫字段精準匹配,才能生成真實準確的結(jié)果。
章鵬強調(diào),BIRD-SQL主要評測SQL的復雜度生成能力(在線擴展OnlineScaling),但要實現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術,必須構(gòu)建更完整的能力棧。除了在線擴展,還需包括離線擴展(Offline Scaling),即對數(shù)據(jù)庫的深度理解與知識結(jié)構(gòu)化;人機交互(Human Interaction),即智能體識別自身不確定性,主動與用戶澄清意圖,實現(xiàn)白盒化、可糾錯的協(xié)作;以及自我進化(Self Evolution),即通過“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復用等“免調(diào)優(yōu)”技術,使智能體能夠從錯誤中學習,持續(xù)提升,降低對大量標注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。
螞蟻數(shù)科計劃逐步開源這些更全面的能力模塊,如理解數(shù)據(jù)庫的Agentar Profiling-SQL、實現(xiàn)免調(diào)優(yōu)進化的Agentar TuningFree-SQL等。目前,首期在線擴展框架Agentar-Scale-SQL的開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺,供開發(fā)者免費使用。





















