云计算 已评论

从用不起到养得起:华为云三大引擎破解企业智能体落地难题

2026-3-24 14:28

  【天极网云计算频道】2026年开年,一款名为OpenClaw(俗称“龙虾”)的开源AI智能体迅速引爆全网。凭借出色的执行能力与极低的部署门槛,不仅打破了传统人工智能“只动口、难落地”的局限,更催生了企业对高性能、可落地智能体(Agentic)的广泛应用与深度部署,以实现降本增效与数智化升级的迫切需求。

  面对这一浪潮,企业如何抓住智能体时代机遇,实现AI技术的规模化落地与商业价值转化?3月20日,在华为中国合作伙伴大会2026上,华为云CEO周跃峰给出了清晰而坚定的答案:华为云将以行业智能体为中心,打造企业级AI创新的“黑土地”。


华为云CEO周跃峰

  告别算力浪费,柔性计算让AI走向好用

  “养龙虾”的火爆绝非偶然,它宣告了人工智能从对话走向行动的临界点已然到来。但智能体自主规划、多轮迭代、长上下文的特性,让Token消耗量呈指数级增长。

  据摩根大通证券研报,2025年至2030年,中国AI推理Token消耗量将从约10千万亿增长至约3900千万亿,五年间增长约370倍,年复合增长率高达330%。传统算力整租模式下,推理池平均利用率不足30%,重金投入的AI硬件算力池超半数处于“摸鱼”状态。算力浪费严重、成本居高不下,成为智能体规模化落地的最大拦路虎。

  华为云判断,智能体时代的算力供给,必须从资源模式转向效率模式,而柔性计算正是破解这一难题的钥匙。

  作为柔性计算的核心载体,华为云在本次大会上重磅推出柔性智算操作系统FlexNPU,打破传统服务器固定配比与算力整租模式,赋予NPU/GPU算力“柔性液态化”供给能力,可依据业务需求动态伸缩、随需而动,彻底告别算力浪费与成本失控。FlexNPU以三大极致属性,提供极致性价比的算力底座,让企业真正“养得起”智能体。我们具体来看:

  极致共享,终结算力闲置。针对大模型推理场景,FlexNPU创新采用PD动态混部、在离线推理混部技术,破解传统PD分离架构下Prefill与Decode集群资源不均衡、推理业务潮汐变化导致的算力空转难题,将大模型Token性价比提升至少40%;面向小模型推理场景,FlexNPU实现最小粒度1% NPU卡、128MB显存的AICore时分复用与显存空分复用,为小模型量身定制虚拟NPU资源,平均算力成本降低2-3倍。这一点对中小企业尤为关键,过去小模型不敢上云、用不起算力的困境,被柔性计算彻底打破。

  极致弹性,适配业务潮汐。FlexNPU打破传统服务器固定配比限制,支持算力资源按需定义、动态调度,无论是OpenClaw智能体突发的高并发请求,还是平稳期的低负载运行,都能精准匹配算力供给,无需为峰值资源长期付费,也无需担心低谷期资源闲置。这种按需取用、按量计费的模式,让算力从固定资产变为流动服务,适配智能体业务的动态特性。

  极致高可用,杜绝故障重算。针对智能体推理会话易中断、重算成本高昂的痛点,FlexNPU通过软硬解耦与Token级KVCache实时快照技术,实现硬件故障秒级恢复与断点续推,上层推理框架无需感知底层硬件异常,大幅减少重计算开销。在我看来,这一能力看似隐性,却直击智能体运行的核心痛点——中断即损失,稳定即收益,保障OpenClaw等智能体运行稳定流畅,本身就是在为企业降本增效。

  不难看出,FlexNPU早已不只是一项技术创新,它重新定义了智能体时代的算力供给规则:把算力从粗放到精细,从刚性到柔性,从浪费到高效,这不仅是算力基础设施的演进方向,也是华为云构建AI时代肥沃黑土地的底气。

  跨越落地鸿沟,搭建智能体发展快车道

  如果说FlexNPU解决了算力成本的“地基”问题,那么如何让企业快速“造得出”贴合自身业务的智能体,则是价值转化的关键一跃。

  实际上,智能体要想普及,必须让开发变得简单。就像移动互联网时代,低代码平台让普通人也能开发APP;智能体时代,同样需要一站式开发平台,让企业无需精通AI算法,也能快速打造专属智能体。

  对此,华为云发布一站式企业级智能体开发平台AgentArts。平台搭载自研自演进引擎,整合开发态、运行态、运营运维态三大组件,同时支持低代码与高代码双模式,以安全沙箱保障运行安全,把智能体开发变成“搭积木”一样简单,让企业可快速构建高质量行业智能体,直接把Token流量转化为业务收益。据华为云实测,使用AgentArts可将智能体交付周期缩短60%以上,原本3个月的开发任务,几周即可完成部署上线,大幅降低智能体落地的技术与时间成本。

  2026年被业界定义为智能体元年。麦肯锡联合QuantumBlack发布的《2025年人工智能的现状:智能体、创新和转型》报告,基于全球近2000位企业高管及从业者调研数据显示:62%的受访企业已启动智能体试点应用,其中23%的企业已在内部场景中扩大部署规模。AgentArts的推出,恰逢智能体从技术尝鲜走向规模应用的关键节点,提供了切实可行的落地方案,有效帮助企业跨越从技术尝鲜到规模应用之间的那道鸿沟。

  读懂代码宇宙,打通与业务之间的壁垒

  智能体的长期迭代与价值释放,最终回归代码本身。智能体要深度适配企业业务,离不开高效的代码开发工具,华为云码道(CodeArts)作为代码智能体,以“让AI理解企业整个代码宇宙”为目标,为智能体的开发和迭代提供了底层生产力工具,夯实了“用得好”的根基。

  码道的竞争力来自“代码大模型+Codebase索引”的双重优势。一方面,码道融合了华为自研的代码大模型,能够精准理解代码的语义和逻辑,支持多种编程语言的自动生成、代码优化、bug修复等功能,大幅提升代码编写的效率和质量;另一方面,码道接入了企业的Codebase索引,能够全面掌握企业的代码体系、业务逻辑,让AI不仅能够写代码,还能懂业务,能够根据企业的业务需求,生成符合业务场景的高质量代码,避免了代码与业务脱节的问题。

  同时,码道还适配鸿蒙、昇腾生态,能够为基于鸿蒙系统、昇腾芯片的智能体开发提供针对性的代码支持。数据显示,CodeArts自2月公测以来,获得了市场的广泛认可。周跃峰透露,其用户量增长7倍,日活用户增长12倍。

  可以说,码道的推出,不仅升级了企业的代码生产力,更重塑了智能体开发的全流程模式。传统模式下,智能体开发高度依赖大量专业研发人员,周期长、成本高、代码质量参差不齐;而码道通过AI深度赋能,让代码生成、优化与修复变得更高效、更精准、更贴合业务逻辑,帮助企业把宝贵人力从重复繁琐的编码工作中解放出来,将更多精力聚焦于业务创新与价值创造。

  写在最后

  Token流量的爆发式增长,为产业带来前所未有的时代红利,也让企业直面算力成本高、开发门槛高、落地难度高的三重挑战。华为云以FlexNPU柔性算力破解“用不起”,以AgentArts智能体平台破解“造不出”,以码道CodeArts破解“用不好”,三大引擎层层递进、环环相扣,共同构筑起从算力供给、开发构建到长期迭代的全链路智能体落地体系。

  正如周跃峰所言:“AI要健康地发展,不成为泡沫,一定要能够成为提升企业生产力的工具,而不仅仅是提供情绪价值。”华为云的这场战略跃迁,本质上是在引领AI技术走向真正的商业回报。对于所有渴望抓住AI时代机遇的企业和开发者来说,选择与华为云同行,或许就意味着选择了一条将AI从宏大构想付诸现实的可行路径。

  当AI的喧嚣褪去,真正的价值沉淀才刚刚开始。相信随着华为云各项战略的持续落地,以及更多伙伴的加入,这片“黑土地”必将孕育出更多可落地、可创造、可复制的AI成果,让智能体真正走进千行百业,成为驱动企业降本增效、数智转型的重要力量。

#+1你赞过了
人已赞
#
分享
查看更多内容

取消

©2026 天极网旗下网站

#
第三方账号登录
X
发布