华为21日在位于上海的练秋湖研发基地举办2025 ai容器应用落地与发展论坛,在现场宣布ai容器软件flex:ai正式开源。该ai(人工智能)领域的创新成果将显著提升gpu(图形处理器)和npu(神经网络处理器)等算力资源的利用率,为ai训练推理提供更高效的资源支撑。
| --> |
华为公司副总裁、数据存储产品线总裁周跃峰接受媒体采访时,多次强调“要让ai在千行百业落地”。然而,在赋能行业生产过程中,ai硬件资源有限,需精细化利用,否则易造成浪费。
此次,华为联合国内三大高校共同打造了ai容器软件flex:ai,提供智能资源管理调度新方案,并通过开源开放,降低软件开发难度。
具体而言,该容器软件可将单张算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个ai工作负载,在无法充分利用整卡算力的ai工作负载场景下,算力资源平均利用率可提升30%。
此外,因为不同ai模型性能、适配场景存在差异,或出现计算集群负载不均衡、资源利用不充分等情况。针对此痛点,该容器实现了多级智能调度,将ai工作负载与算力资源进行“精准匹配”;并能在负载频繁波动的场景下,保障ai工作负载平稳运行,让每一份算力都“物尽其用”。
据悉,flex:ai发布后会在魔擎社区同步开源,与华为此前开源的nexent智能体开发框架、appengine应用编排、datamate数据工程、ucm推理记忆数据管理器等ai工具共同组成完整的modelengine开源生态。
“ai容器软件一定要和更多模型生态和多样性算力生态进行适配、对接以及调优。我们希望通过开源共建让ai真正走向平民化。”周跃峰说,目前,该容器软件已在教育、医疗和金融等行业试点应用。




