安謀科技Arm China近日宣布推出新一代NPU IP“周易”X3,標(biāo)志著其“All in AI”產(chǎn)品戰(zhàn)略正式落地。這款專為大模型設(shè)計(jì)的AI芯片,基于全新DSP+DSA架構(gòu),在性能、能效和軟件生態(tài)方面實(shí)現(xiàn)突破,旨在為基礎(chǔ)設(shè)施、智能汽車、移動(dòng)終端和智能物聯(lián)網(wǎng)等領(lǐng)域提供端側(cè)AI計(jì)算新標(biāo)桿。
“周易”X3的硬件架構(gòu)經(jīng)過全面升級(jí),單Cluster最高支持4個(gè)核心,算力范圍覆蓋8至80 FP8 TFLOPS,且可根據(jù)需求靈活配置。其單核帶寬高達(dá)256GB/s,相比前代產(chǎn)品“周易”X2,CNN模型性能提升30%至50%,多核算力線性度達(dá)到70%至80%。在同算力規(guī)格下,AIGC大模型能力較上一代增長10倍,這得益于FP16算力提升16倍、計(jì)算核心帶寬擴(kuò)大4倍,以及Softmax和LayerNorm性能提升超10倍的綜合優(yōu)化。
實(shí)測(cè)數(shù)據(jù)顯示,在Llama2 7B大模型推理中,“周易”X3在Prefill階段算力利用率達(dá)72%,配合安謀科技自研的解壓硬件WDC,Decode階段有效帶寬利用率突破100%,遠(yuǎn)超行業(yè)平均水平,充分滿足大模型解碼階段的高吞吐需求。產(chǎn)品研發(fā)副總裁劉浩表示,公司將持續(xù)加大投入,整合頂尖研發(fā)資源,為生態(tài)伙伴提供從硬件到服務(wù)的端到端解決方案,助力產(chǎn)品創(chuàng)新與商業(yè)化落地。
軟件層面,“周易”X3搭載全新升級(jí)的Compass AI平臺(tái),支持TensorFlow、PyTorch、ONNX等主流框架,覆蓋超160種算子和270多種模型,包括LLM、VLM等主流架構(gòu)。平臺(tái)提供GPTQ量化、動(dòng)態(tài)Shape支持等優(yōu)化工具,并將Parser、Optimizer等核心組件開源,支持自定義算子與編譯流程,幫助開發(fā)者實(shí)現(xiàn)白盒化部署。產(chǎn)品總監(jiān)鮑敏祺強(qiáng)調(diào),該平臺(tái)遵循“軟硬協(xié)同、全周期服務(wù)”準(zhǔn)則,通過專業(yè)團(tuán)隊(duì)與深度服務(wù),助力客戶產(chǎn)品成功。
應(yīng)用場(chǎng)景方面,“周易”X3覆蓋四大領(lǐng)域:在基礎(chǔ)設(shè)施領(lǐng)域支持加速卡高效推理;在智能汽車領(lǐng)域?yàn)锳DAS自動(dòng)泊車和IVI智能交互提供算力;在移動(dòng)終端實(shí)現(xiàn)AI PC與手機(jī)的超分渲染和AI Agent流暢運(yùn)行;在智能物聯(lián)網(wǎng)領(lǐng)域推動(dòng)智能IPC、網(wǎng)關(guān)等設(shè)備的本地化低延遲推理。此次發(fā)布標(biāo)志著安謀科技以“AI Arm CHINA”為方向,為千行百業(yè)智能化轉(zhuǎn)型注入核心動(dòng)力。





















