2025 年 11 月 13 日,中国上海讯 - 海内领先的芯片IP设计与办事提供商安谋科技(中国)有限公司(如下简称“安谋科技Arm China”)今日公布,于上海举办“周易”X3 NPU IP新品发布会。作为安谋科技Arm China“All in AI”产物战略下降生的首款重磅产物,以和“AI Arm CHINA”战略成长标的目的的要害实践,“周易”X3 NPU IP基在专为年夜模子而生的最新DSP+DSA架构,致力在打造端侧AI计较效率新标杆,于机能、功效与易用性等方面周全跃升,面向基础举措措施、智能汽车、挪动终端、智能物联网四年夜范畴,为加快卡、智能座舱、ADAS(高级驾驶辅助体系)、具身智能、AI PC、AI手机、智能网关、智能IPC(收集摄像机)等装备带来史无前例的AI计较体验。

安谋科技Arm China产物研发副总裁刘浩
安谋科技Arm China产物研发副总裁刘浩暗示:“于‘All in AI’产物战略的指引下,咱们将连续加年夜投入,之前瞻性视线整合顶尖研发资源,秉持开放互助理念,为生态伙伴提供业界领先的从硬件、软件到办事的端到端解决方案,全力赋能伙伴的产物立异及贸易化落地。”
“周易”X3 NPU IP新品发布会现场
于半导体IP范畴,“面向将来5年的产物标的目的举行前瞻结构”已经成为行业共鸣——涵盖IP研发、芯片和终端产物研发量产。安谋科技Arm China深谙这一纪律,前瞻性地于“周易”X3中采用统筹CNN与Transformer的通用架构设计,撑持全算力类型并加强浮点运算FLOPS,助力实现从定点到浮点计较的要害改变,并满意年夜模子计较需求,为将来5年Gen AI、Agentic AI与Physical AI的端侧落地奠基技能基石。
跟着AI年夜模子技能的飞速成长,智能手机、AI PC及智能汽车等端侧装备正迎来AI能力的发作性需求。从多模态语音助手到及时图象天生,从智能座舱交互到辅助驾驶决议计划,端侧装备需要承载愈来愈繁杂的AI计较使命。然而,端侧AI部署面对算力受限、能效要求高、带宽瓶颈、开发门坎高档多重挑战——怎样于有限的功耗及算力资源下实现年夜模子的高效运行,成为行业亟需冲破的要害难题。
“周易”X3基在专为年夜模子而生的最新DSP+DSA架构,从计较效率、带宽、精度适配、使命处置惩罚四年夜维度实现进级,精准解决端侧AI年夜模子运行难题,打造端侧AI计较效率的新标杆。
其单Cluster最高撑持4个Core,拥有8~80 FP8 TFLOPS算力且可矫捷配置,单Core带宽高达256GB/s。相较在“周易”X2产物,“周易”X3的CNN模子机能晋升30%~50%,多核算力线性度到达70%~80%。于同算力规格下,AIGC年夜模子能力较上一代产物实现10倍增加,这患上益在16倍的FP16 TFLOPS、4倍的计较焦点带宽、跨越10倍的Softmax及LayerNorm机能晋升配合驱动。
借助这些优化,端侧年夜模子推理将更高效:于Llama2 7B年夜模子实测中,“周易”X3 NPU IP于Prefill阶段算力使用率高达72%,并于安谋科技Arm China自研的解压硬件WDC的加持下,实现Decode阶段有用带宽使用率超100%,远超行业平均程度,满意年夜模子解码阶段的高吞吐需求。

“周易”X3 NPU IP新品亮点
此外,“周易”X3于架构层面实现了多项立异,集成如下要害特征:
集成自研解压硬件WDC:使年夜模子Weight软件无损压缩后经由过程硬件解压能得到分外15%~20%等效带宽晋升。新增端侧年夜模子运行必备的W4A8/W4A16计较加快模式:对于模子权重举行低比特量化,年夜幅降低带宽耗损,撑持云端年夜模子向端侧的高效迁徙。集成AI专属硬件引擎AIFF(AI Fixed-Function)与专用硬化调理器:实现超低至0.5%的CPU负载与低调理延迟,矫捷撑持端侧多使命场景及肆意优先级调理场景,确保高优先级使命的即时相应。撑持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度交融计较,强浮点计较:可矫捷适配智能手机边沿部署、AI PC推理、智能汽车等从传统CNN到前沿年夜模子的数据类型需求,均衡机能与能效。
安谋科技Arm China产物总监鲍敏祺
安谋科技Arm China产物总监鲍敏祺指出:“‘周易’X3遵照‘软硬协同、全周期办事与成绩客户’的产物准则,提供从硬件、软件到售后办事的全链路撑持,之前瞻性设计、专业团队交赋予深度办事投入,周全助力客户产物乐成与贸易化落地。”
软硬协同——从“好用”到“用好 ”,Compass“金牌辅助”晋升开发效率“周易”X3 NPU IP不仅提供高机能硬件,还有配套完美易用的“周易”Compass AI软件平台,经由过程“软硬一体”的协同设计,闪开发者从“好用”到“用好”,显著晋升开发部署效率。
Compass AI软件平台经由过程笼罩开发全流程的东西链、极致的易用性优化与开放的生态结构,破解端侧AI开发“适配难、周期长、门坎高”的痛点。作为焦点东西,平台中的NN Compiler(神经收集编译器)集成Parser(模子解析)、Optimizer(优化器)、GBuilder(天生器)和AIPULLM(年夜模子运行东西),可实现主流模子的高效转化、主动化优化与部署配置天生,并具有如下焦点能力:
广泛的框架与模子撑持:撑持超160种算子与270种模子,兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流AI框架,提供开箱即用的Model Zoo。立异的Hugging Face模子“一键部署”:经由过程AIPULLM东西链,直接撑持Hugging Face格局模子,实现“一站式”转化与部署,极年夜降低开发门坎。进步前辈的模子推理优化:实现业界领先的年夜模子动态shape撑持,高效处置惩罚肆意长度输入序列;同时提供包括Tensor/Channel/Token Level多样量化方式,以和GPTQ等年夜模子主流量化方案,并增长对于LLM/VLM/VLA和MoE等模子的高机能撑持,保障推理精度并实现云到端快速迁徙。矫捷的开发者赋能:提供多种开放接口,撑持用户模子与自界说算子的开发与调试;配备富厚的调试东西与Bit精度软件仿真平台,撑持多条理白盒开发与机能调优,极年夜简化算法移植与部署。周全的体系与异构兼容:撑持Android、Linux、RTOS、QNX等多种操作体系,并经由过程TVM/ONNX实现SoC异构计较,高效调理CPU、GPU、NPU等计较资源。安谋科技Arm China踊跃构建开放生态,Compass AI软件平台中的Parser、Optimizer、Linux Driver、TVM和内部IR格局等焦点组件已经接踵开源,并拥有富厚的调试东西,可满意开发者白盒部署需求,且撑持更容易用的DSL算子编程语言。于此基础上,平台付与开发者更深度的定制能力:客户不仅可使用平台中的Compiler、Debugger或者DSL语言开发出本身的自界说算子,也可经由过程Parser、Optimizer等东西打造出属在本身的模子编译器,从而实现差异化设计与开发效率晋升。
“周易”NPU Compass AI软件平台
不仅云云,安谋科技Arm China技能团队还有缭绕“周易”X3 NPU IP及Compass AI软件平台的软硬件协同举行精心设计及重复论证,方针是晋升客户终极落处所案的效率及能效。例如,于“周易”X3 NPU IP的AIFF模块软硬件设计中,硬件端充实联合软件利用场景,经由过程增年夜总线带宽、增长DMA(直接内存拜候)的outstanding(未处置惩罚的指令或者数据哀求)等方式晋升数据搬运、数据并行效率,软件端则针对于硬件特征设计专属利用模式,如对于模子举行合理切分以充实阐扬多核并行上风。
安谋科技Arm China NPU产物线卖力人兼首席架构师舒浩博士
安谋科技Arm China NPU产物线卖力人兼首席架构师舒浩博士认为:“‘周易’X3的产物上风,源在通用、矫捷、高效且软硬协同的体系架构设计,这一设计使其兼具广泛的行业合用性与矫捷的边端侧AI运用场景匹配能力。”
多场景落地——从无形IP到AI万象,端侧智能触手可和新一代“周易”X3 NPU IP将端侧智能的界限拓展至更广漠的运用场景,面向基础举措措施、智能汽车、挪动终端、智能物联网四年夜范畴,精准匹配当前发作的端侧AI需求,可广泛运用在加快卡、智能座舱、ADAS、具身智能、AI PC、AI手机、智能网关、智能IPC等AI装备:
基础举措措施范畴:于加快卡场景中,“周易”X3 NPU IP撑持CNN与年夜模子等多样布局的AI模子高效加快,为数据中央和边沿计较节点提供焦点算力。智能汽车范畴:“周易”X3 NPU IP同时赋能智能驾驶与智能座舱:于ADAS体系中,可为主动停车等辅助驾驶功效提供高机能AI算力撑持;于IVI(车载信息文娱体系)中,撑持基在语音与车表里视频图象输入的智能互动。挪动终端范畴:于AI PC、AI手机上,“周易”X3 NPU IP可实现超分衬着,晋升显示分辩率,并撑持基在年夜模子的AI Agent运用,为用户带来更智能、更流利的交互体验。智能物联网范畴:于智能网关、智能IPC等装备中,“周易”X3 NPU IP撑持当地AI推理,实现更快相应与更智能的终端体验,满意边沿装备对于及时性与隐私掩护的高要求。
“周易”NPU IP系列家族现场demo展示区
这次发布会现场体系展示了“周易”NPU产物家族的技能演进与落地结果,活泼诠释其怎样将无形的算力转化为触手可和的智能体验。
“周易”Z1:算力0.32~3.75 TOPS,赋能AIoT场景,广泛撑持人脸辨认、人脸和人体要害点检测及文字辨认等,且已经进入AI智能音箱等多种产物。“周易”Z2/Z3:算力1.25~5 TOPS,面向AIoT、入门级座舱等市场,撑持前视辅助驾驶方案、舱泊一体方案和安全仪表盘方案,以和图象超分辩率优化等。“周易”X1:算力10 TOPS,面向高端AIoT、汽车座舱等市场,撑持驾驶员监控、搭客监控、主动停车、AVM 360环顾,以和AI图象降噪等。“周易”X2:算力10-30 TOPS,面向高端AIoT、AI PC、AI Pad、手机等市场,现场展示了运行Stable Diffusion v1.5的文生图能力,运行CLIP的文搜图能力,可实现端侧多模态AI流利运行。“周易”X3:算力8-80 FP8 TFLOPS,面向基础举措措施、智能汽车、挪动终端、AIoT等市场,现场展示了基在“周易”X3的主流年夜模子效果,包括运行DeepSeek-R1-Distill-Qwen-1.5B模子的文生文AI流利对于话,运行Stable Diffusion v1.5的文生图效果,运行MiniCPM v2.6模子的图片辨认和图生文多模态运用等,均揭示出优秀的端侧年夜模子推理机能。从“周易”Z1的基础感知到“周易”X3的繁杂认知,这一技能演进路径清楚地注解,端侧AI正于从单一的功效实现,迈向交融多种模子、顺应动态场景的“全平易近普和”新阶段。“周易”X3 NPU IP的设计充实预判端侧AI的“场景深化”趋向:以极致算力体现破解“多模子交融”的算力需求,以全算力类型并加强浮点运算FLOPS适配“精度动态蜕变”的场景差异,借助软硬协同的生态打造端侧算力底座。
“周易”X3 NPU IP新品发布会现场
“周易”X3 NPU IP的发布,标记着安谋科技Arm China“All in AI”产物战略的正式开启。安谋科技Arm China以“AI Arm CHINA”为战略成长标的目的,踊跃相应“AI+”步履规划,连续深耕技能范畴立异,同时联袂伙伴共建开放生态,加速构开国内“AI+”财产进级的智能计较基石,为千行百业智能化转型提供更强IP“核芯”动力。
安谋科技Arm China
安谋科技Arm China是海内领先的芯片IP设计与办事提供商。作为一家自力运营的合资企业,公司安身本土立异,对峙以自研营业技能立异与Arm技能授权相共同,为中国集成电路财产提供富厚的产物组合及解决方案,赋能中国智能计较“芯”生态。
获取更多信息:
媒体接洽人安谋科技Arm ChinaYanYan XingDirector of Marketingyanyan.xing@armchina.com
媒体接洽人GeoMatrix公关公司George Qiao 乔治george.qiao@geomatrixpr.com
-新浦金350vip