寒武纪拥抱众智 FlagOS 生态,打破不同架构芯片间的软件生态壁垒

内容摘要IT之家 11 月 12 日消息,寒武纪今日宣布拥抱众智 FlagOS 生态。寒武纪表示,单一芯片架构难以满足多元化的业务需求,大模型应用厂商为部署不同类型业务往往需要引入多种不同架构 AI 芯片,造成跨芯片架构间业务代码迁移与维护工作往往

IT之家 11 月 12 日消息,寒武纪今日宣布拥抱众智 FlagOS 生态。寒武纪表示,单一芯片架构难以满足多元化的业务需求,大模型应用厂商为部署不同类型业务往往需要引入多种不同架构 AI 芯片,造成跨芯片架构间业务代码迁移与维护工作往往耗时数月,成为业务迁移流程主要瓶颈。

据介绍,北京智源人工智能研究院联手社区伙伴启动了众智 FlagOS 项目,目的通过统一软件层解耦 AI 模型与异构硬件,打破不同架构芯片之间的软件生态壁垒,为芯片硬件与上层 AI 应用之间搭建统一且高效衔接的桥梁,系统性解决“适配难、调优慢、协同弱”行业难题,实现“一次开发,处处运行”。

寒武纪和智源研究院从 2024 年初起就开始进行 FlagGems(基于 Triton 的高性能通用 AI 算子库)的联合开发工作,后续进一步拓展到 FlagTree(统一多后端的增强版 Triton 编译器)、FlagCX(统一通信库)、FlagScale(并行训推一体框架)等组件。

寒武纪与 FlagOS 的适配与优化主要集中在算子、编译器、分布式通信库和并行框架组件等方面。

IT之家查询获悉,FlagOS 是由北京智源人工智能研究院牵头研发的面向多种 AI 芯片的开源系统软件栈,支持超 20 种国内外主流 AI 芯片型号。该系统融合并行训推框架 FlagScale、高性能算子库 FlagAttention 和 FlagGems、统一通信库 FlagCX 等技术组件,平均性能超过芯片厂商原生算子。

今年 9 月,众智 FlagOS 1.5 发布,支持超过 12 家国内外主流芯片厂商的 20 余种芯片型号,降低硬件适配的复杂性;改进并行策略与调度算法,在典型大模型任务中实现最高 36.8% 训练加速与 20% 推理加速;全面支持机器人“大脑”(如智源 RoboBrain)与“小脑”(如 VLA)模型的开发与部署等。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: