博通推出 Tomahawk 5 芯片解锁 AI 网络

2026-02-07 0 742

博通推出 Tomahawk 5 芯片解锁 AI 网络

一段时间以来,计算机网络领域的专家一直在谈论第二个网络。 通常的网络是将客户端计算机连接到服务器的网络,即 LAN。 人工智能的兴起在该网络“背后”创建了一个网络,一个“横向扩展”网络,用于运行 AI 任务,例如必须在数千个 GPU 上进行训练的深度学习程序。

这导致了开关芯片供应商 Broadcom 所说的严重僵局。 Nvidia 是运行深度学习的 GPU 芯片的主要供应商,它也正在成为互连芯片的网络技术的主要供应商,使用它在 2020 年收购 Mellanox 时添加的 InfiniBand 技术。

一些人认为,危险在于一切都与一家公司捆绑在一起,没有多元化,也没有办法建立一个由许多芯片竞争的数据中心。

“Nvidia 正在做的是说,我可以以几千美元的价格出售一个 GPU,或者我可以以 50 万到 100 万美元以上的价格出售相当于一个集成系统,”高级副总裁 Ram Velaga 说 在接受 ZDNet 采访时,他是网络芯片巨头 Broadcom 核心交换事业部的总经理。

Velaga 对 ZDNet 表示:“这与云提供商的关系并不顺利,”意思是亚马逊和 Alphabet 的谷歌以及 Meta 和其他公司。 这是因为这些云计算巨头的经济基础是在扩展计算资源时削减成本,这要求避免单一采购。

“所以现在这个行业存在这种紧张局势,”他说。

为了解决这种紧张局势,Broadcom 表示解决方案是遵循以太网技术的开放网络路径,远离 InfiniBand 的专有路径。

Broadcom 周二推出了该公司最新的交换芯片 Tomahawk 5,能够在端点之间互连总计每秒 51.2 太比特的带宽。

“与我们进行了接触,说,嘿,看,如果以太网生态系统能够帮助解决 InfiniBand 能够为 GPU 互连带来的所有好处,并将其带入像以太网这样的主流技术,那么它就可以普遍使用 ,并创建一个非常大的网络结构,它将帮助人们凭借 GPU 的优点而不是专有网络的优点取胜,”Velaga 说。

Tomahawk 5 现已上市,紧随其后的是两年前 Broadcom 的前一部分 Tomahawk 4,后者是每秒 25.6 太比特的芯片。

Tomahawk 5 部分旨在通过添加 InfiniBand 保留的功能来平衡竞争环境。 关键区别在于延迟,即从 A 点向 B 点发送第一位数据的平均时间。延迟一直是 InfiniBand 的优势,这对于从 GPU 到内存再返回的过程尤为重要, 为 AI 中的大型神经网络获取输入数据或获取参数数据。

一种称为 RDMA over Converged Ethernet 或 RoCE 的新技术缩小了 InfiniBand 和以太网之间的延迟差距。 借助 RoCE,开放标准胜过 Nvidia GPU 和 Infiniband 的紧密耦合。

Velaga 说:“一旦获得 RoCE,就不再有无限带宽的优势了。” “以太网的性能实际上与 InfiniBand 的性能相当。”

“我们的论点是,如果我们能够执行 InfiniBand,芯片到芯片,并且你有一个实际上正在寻找以太网成功的整个生态系统,你就有了用以太网取代 infiniband 的方法,并允许广泛的 GPU 生态系统 成功,”Velaga 说。

提及广泛的 GPU 生态系统实际上是在暗指 AI 市场中提供新颖芯片架构的众多竞争硅供应商。

它们包括大量资金雄厚的初创公司,例如 Cerebras Systems、Graphcore 和 SambaNova,但它们也包括云供应商自己的芯片,例如谷歌自己的 Tensor Processing Unit 或 TPU,以及亚马逊的 Trainium 芯片。 如果计算资源不依赖于 Nvidia 出售的单一网络,那么所有这些努力可能会有更多机会。

“今天的云计算巨头们说,我们想构建自己的 GPU,但我们没有 InfiniBand 结构,”Velaga 观察到。 “如果你们能给我们一种等效于以太网的结构,我们就可以自己完成剩下的工作。”

Broadcom 认为,随着延迟问题的解决,InfiniBand 的弱点将变得明显,例如该技术可以支持的 GPU 数量。 “InfiniBand 一直是一个有一定规模限制的系统,可能有 1000 个 GPU,因为它并没有真正的分布式架构。”

此外,以太网交换机不仅可以服务于 GPU,还可以服务于 Intel 和 AMD CPU,因此将网络技术整合为一种方法具有一定的经济效益,Velaga 建议。

Velaga 说:“我预计这个市场的最快采用将来自 GPU 互连,并且在一段时间内,我可能预计平衡将是 550,因为你将拥有可以使用的相同技术 对于 CPU 互连和 GPU 互连,以及 CPU 的销量远远超过 GPU 的事实,你将对数量进行标准化。” GPU 将消耗大部分带宽,而 CPU 可能会消耗以太网交换机上的更多端口。

根据这一愿景,Velaga 指出了 AI 处理的特殊功能,例如总共 256 个 200 千兆位/秒以太网端口,是所有交换芯片中最多的。 Broadcom 声称这种密集的 200-gig 端口配置对于实现“平坦、低延迟的 AI/ML 集群”非常重要。

尽管 Nvidia 在数据中心领域有很大的影响力,今年数据中心 GPU 的销售额预计将达到 160 亿美元,但买家,即云公司,也有很大的影响力,而且优势在他们这一边。

“大云公司想要这个,”Velaga 谈到从 InfiniBand 转向以太网时说。 Velaga 说:“当你拥有这些具有强大购买力的庞大云时,他们已经表明他们有能力迫使供应商分解,这就是我们正在驾驭的势头。” “所有这些云确实不希望这样,他们坚持认为 GPU 可以卖给他们的唯一方法是使用可以通过以太网传输的标准 NIC 接口。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 开发教程 博通推出 Tomahawk 5 芯片解锁 AI 网络 https://www.zuozi.net/55825.html

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务