10 月 20 日消息,英特尔在 2025 OCP 全球峰会上展示了其打造的一款高效异构 AI 系统,这一混合计算基础设施结合了英特尔自家的 Gaudi3 AI 加速器与英伟达的 B200 Tensor Core GPU。
具体而言,在该平台上 B200 负责 AI 模型的预填充而解码部分则由 Gaudi3 负责,相较仅 B200 的同构解决方案在 Llama 开源模型上实现了至高 70% 的同 TCO 性能增益。
根据外媒 SemiAnalysis 的补充,这一混合机架系统采用了英伟达的 ConnectX-7 400GbE NIC、BlueField-3 DPU 和博通的 Tomahawk 5 51.2Tb/s 交换芯片,实现了更大的扩展域。
文章来源:
IT之家
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!