在2025年中國家電及消費電子博覽會(AWE2025)上,實時互動云服務商聲網推出了全新的對話式AI開發套件,并宣布將這一套件軟硬件全面開源,為開發者提供了全新的機遇。
聲網此次推出的對話式AI開發套件,是基于博通集成(Beken)的高性能AI芯片BK7258,結合聲網深度優化的對話式AI引擎,打造出的完整端側實時交互系統。這一系統旨在為開發者提供從“對話式AI”到“智能硬件開發”的一站式解決方案。
聲網的對話式AI開發套件,憑借語音活動檢測(VAD)、實時語音混合、智能打斷處理等技術和方案,展現了五大顯著優勢。首先,AI對話體驗接近真人交互,延遲低至650ms,打斷響應更是低至340ms,即使在復雜環境下也能準確識別用戶指令。其次,套件支持多模態交互,提供豐富的接口,支持文本、視頻、觸控等多種方式,滿足多樣化需求。
聲網的對話式AI開發套件兼容國內主流的AI大模型,如通義千問、豆包、DeepSeek等,同時也可接入開發者自研的大模型,提供了更多的選擇和自由。這一特性極大地降低了開發者的成本,無需再投入高昂的資金自研AI大模型。
在產品開發周期方面,聲網表示,開發者只需下載開源代碼,即可將AI能力集成到硬件設備中,1小時就能跑通Demo,1天即可完成產品原型送樣,極大地縮短了產品開發周期,降低了成本。
另一大優勢在于極低的功耗,聲網采用了低功耗設計方案,使得對話式AI開發套件可以實現超長待機,解決了移動便攜類產品的續航焦慮,進一步擴大了其適用范圍。
在應用場景上,聲網提到了AI玩具、AI教育硬件、AI陪伴設備、家庭語音助手、穿戴設備個人助手等多個領域。其中,AI玩具和AI陪伴設備以其獨特的陪伴功能受到廣泛關注,特別是在今年的CES和AWE大會上,陪伴機器人成為各大企業展示的亮點,展現了這一行業的巨大前景。
聲網透露,2024年全球AI玩具市場規模已達到181億美元,預計2033年將達到600億美元。例如,AI情感陪伴機器人初創公司珞博Robopoet發布的口袋AI毛絨寵物Fuzzoo,就搭載了聲網的對話式AI技術,為用戶提供了個性化的交互體驗。
隨著供應鏈的逐漸成熟,具身智能正逐步融入我們的生活。無論是機器人還是配備了各類傳感器的家電設備,關鍵在于能夠準確接收用戶的語音指令,并通過AI大模型解析和執行任務。聲網對話式AI開發套件的全面開源,意味著有志于具身智能行業的企業能夠以低成本、快速為產品加入AI對話能力。
聲網提供的這一平臺,不僅支持自由接入傳感器和大模型,還為開發者提供了極高的自由度。開發者可以基于聲網提供的平臺,快速適配自家的硬件設備,從而加速產品的開發和落地。