首页  >  科技资讯  > >  英伟达

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

2024-01-06 12:47:24 科技资讯 作者:付晓红

智能推荐中...

本文给大家分享的是英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创的相关内容!

英伟达25年秘密路线图曝光,老黄豪赌B100,AMD秘密武器X100遭重创。这是一则令人震惊的消息。英伟达和AMD一直是竞争对手,而这次的曝光无疑给AMD带来了巨大的打击。

那么,英伟达的秘密路线图究竟是什么?它又将如何影响未来的竞争格局呢?

英伟达的AI硬件霸主,当得太久了!

现在,各大科技公司都在虎视眈眈,等待一举颠覆其霸主地位。

英伟达也不会坐以待毙。

外媒SemiAnalysis曝光了英伟达未来几年的硬件路线图,包括备受关注的H200、B100和「X100」GPU。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

现在,软件上的差距仍然存在,但远没有以前那么大了。

在软件堆栈上,AMDGPU、英特尔的Gaudi、MTIA和微软的Athena都取得了一定的发展。

虽然英伟达仍然保持着硬件领先地位,但差距的缩小会越来越快。

英伟达H100,也不会领先太久。

未来几个月,AMDMI300和英特尔Gaudi3都将推出技术优于H100的硬件产品。

除谷歌、AMD、英特尔这些难缠的对手,以及一些公司,也给英伟达带来了很大的压力。

虽然这些公司在硬件设计上暂时落后,但他们可以得到背后巨头的补贴——长期以来,这些公司都希望打破英伟达在HBM上的巨额利润垄断。

亚马逊即将推出的Trainium2和Inferentia3,微软即将推出的Athena,都是布局多年的投资。

竞争对手来势汹汹,英伟达当然不会坐以待毙。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

在外媒SemiAnalysis看来,无论是管理风格还是路线决策,英伟达都是「行业内最可疑的公司之一」。

黄仁勋体现了一股安迪·格鲁夫的精神。

成功导致自满。自满导致失败。只有偏执狂才能生存。

为了稳坐第一位,英伟达雄心勃勃,采取了多管齐下的冒险策略。

他们不屑于在传统市场上与英特尔和AMD竞争,而是想成为谷歌、微软、亚马逊、Meta、像苹果这样的科技巨头。而英伟达的DGXCloud、软件,以及非半导体领域的收购策略,背后都是一盘大棋。

路线图最新细节曝光!

英伟达最新路线图的重要细节已被曝光。

内容包括使用的网络、内存、包装和工艺节点、各种GPU、Serdes选择,PCIE6.0、协同包装光学器件和光路交换机等细节。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

显然,由于谷歌、亚马逊、微软、AMD和英特尔的竞争压力,英伟达连夜加快了B100和「X100」的研发。

B100:上市时间高于一切

根据内部消息,英伟达的B100将于2024年第三季度量产,部分早期样品将于2024年第二季度出货。

从性能和TCO来看,无论是亚马逊的Trainium2、谷歌TPUV5、AMD的MI300X,或者英特尔的Gaudi3或者微软的Athena,都比它弱爆了。

即使考虑到从设计合作伙伴、AMD或台积电获得的补贴,他们也打不过。

英伟达为了尽快将B100推向市场,做了很多妥协。

比如英伟达本想把功耗定在更高的水平(1000W),但最终,他们还是选择了继续使用H100的700W。

这样,当B100推出时,风冷技术就可以继续使用。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

在B100早期系列中,英伟达还将坚持使用PCIE5.0。

5.0和700W的结合意味着它可以直接插入现有的H100HGX服务器,从而大大提高供应链能力,提前量产和出货。

之所以决定坚持使用5.0,部分原因是AMD和英特尔在PCIE6.0集成方面远远落后。即使是英伟达自己的内部团队也没有准备好使用PCIE6.0CPU。

它们还将使用更快的C2C链接。

在以后,ConnectX-8将配备集成PCIE6.0交换机,但目前还没有人准备好。

据悉,博通和Asteralabs要到年底才能准备好量产的PCIE6.0重定时器,考虑到这些基板的大小,只需要更多的重定时器。

这也意味着原来的B100将限制在3.2T,使用Connectx-7时的速度只有400G,而不是英伟达在上宣称的每个GPU800G。

如果空气保持冷却,电源、电脑和网络速度保持不变,制造和部署都很容易。稍后,英伟达将推出1000W需要水冷版本B100。

B100将通过Connectx-8为每个GPU提供完整的800G网络连接。

以太网/InfiniBand,这些Serdes仍然是8x100g。

虽然每个GPU的网络速度翻了一番,但基数减半了,因为它们仍然需要同样的51.2T交换机。B100一代将不再使用102.4T交换机。

有趣的是,据透露,B100上的NVLink组件将采用224GSerdes,如果英伟达真的能做到这一点,那无疑是一个巨大的进步。

业内人士大多认为224G不可靠,2024年不可能实现,英伟从业者除外。

要知道,无论是谷歌,Meta,或者亚马逊,他们的224GAI加速器量产目标定在2026/2027年。

如果英伟达在2024/2025年实现了这一点,肯定会把对手打得落花流水。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

B100仍然是台积电的N4P,而不是基于3nm工艺的技术。显然,对于如此大的芯片尺寸,台积电的3nm工艺还不成熟。

根据英伟达基板供应商Ibiden透露的基板尺寸,英伟达似乎采用了由两个单片大芯片MCM组成的设计,包括8或12个HBM堆叠。

SambaNova和英特尔明年的芯片都采用了类似的宏观设计。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

英伟达之所以不像AMD那样使用混合键合技术,是因为他们需要大规模生产,而成本是他们的一大顾虑。

根据SemiAnalysis的估计,这两款B100芯片的内存容量将与AMDMI300X相似或更高,达到24GB堆叠。

风冷版B100的速度可达6.4Gbps,液冷版可高达9.2.2Gbps。

英伟达还在路线图上展示了GB200和B40。

GB200和GX200都使用G,这显然是一个占位符,因为英伟达将推出基于Arm架构的新CPU。Grace不会长期使用。

B40很可能只是B100的一半,只有一个单一的N4P芯片和最多4或6层的HBM。与L40S不同,这对小型模型的推理非常有意义。

「X100」:致命一击

最引人注目的路线图曝光是英伟达的「X100」时间表了。

有趣的是,它与AMD目前的MI400时间表完全一致。H100推出一年后,AMD发布了MI300X战略。

AMD给MI300X的包装留下了深刻的印象。他们插入了更多的计算和内存,希望超越一年前的H100,从而在纯硬件上超越英伟达。

英伟达还发现,他们每两年发布一次新的GPU节奏,给了竞争对手一个抢占市场的好机会。

被迫着急的英伟达每年加快一次产品周期,不给对手任何机会。

例如,他们计划于2025年推出「X100」,只比B100晚一年。

「X100」目前还没有量产(不像B100),所以一切都悬而未决。

在过去,英伟达可从来没有讨论过下一代产品之后的产品,这次是前所未有的。

而且名字大概率也不叫「X100」。

英伟达一直以来的传统都是以Adalovelace为基础的、以GraceHoper、ElizabethBlackwell等优秀女科学家的名字命名GPU。

至于「X」,唯一合乎逻辑的是研究半导体和金属带结构的Xiexide,但考虑到她的身份,概率应该不大。

供应链大师:老黄

自英伟达成立以来,黄仁勋一直在积极推动对供应链的掌握,从而支持巨大的增长目标。

他们不仅愿意承担不可取消的订单——采购、产能和库存承诺高达11.5亿美元,预付款协议高达38.1亿美元。

可以说,没有一家供应商能与之相比。

英伟达的事迹不止一次表明,他们可以在供应短缺时创造性地增加供应。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

2007年黄仁勋与张忠谋的对话

1997年,当张忠谋遇到我时,只有100人的英伟达在那一年完成了2700万美元的收入。

你可能不相信,但张忠谋以前经常打电话卖,也会来拜访。我会向张忠谋解释英伟达是做什么的,我们的芯片需要多大,每年都会越来越大。

后来,英伟达制作了1.27亿个晶圆。从那时起,英伟达每年增长近100%,直到现在。也就是说,在过去的10年里,复合年增长率达到了70%左右。

当时,张忠谋不敢相信英伟达需要这么多晶圆,但黄仁勋坚持了下来。

英伟达通过大胆的供应尝试,取得了巨大的成功。

尽管不时减记数十亿美元的库存,但他们仍然从过度订购中获得正回报。

这一次,英伟达直接抢占了GPU上游部件的大部分供应——他们向三家HBM供应商SK海力士、三星和美光下了非常大的订单,占据了除博通和谷歌以外的所有供应。同时,我们还购买了台积电CoWoS的大部分供应和Amkor的生产能力。

英伟达还充分利用HGX板卡和服务器所需的下游组件,如重定时器、DSP、光学器件等。

如果供应商对英伟达的要求充耳不闻,那么他们就会面对老黄的要求「萝卜加大棒」——一方面,他们会从英伟达那里得到难以想象的订单;另一方面,他们可能会被英伟达从现有的供应链中删除。

英伟达只使用承诺和不可取消的订单,供应商至关重要,不能被淘汰或多样化。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

每个供应商似乎都认为自己是AI的赢家,部分原因是因为英伟达向所有供应商都下了大量的订单,而他们也都认为自己赢得了大部分业务。但实际上,只是因为英伟达的增长速度太快了。

回到市场动态上,虽然英伟达的目标是在明年实现超过700亿美元的数据中心销售额,但只有谷歌在上游有足够的产能——拥有超过100万台的设备。AMD在AI领域的总产能仍然非常有限,最高也不过几十万台。

商业策略:潜在的反竞争

众所周知,英伟达正在利用对GPU的巨大需求,来向客户推销和交叉销售产品。

供应链中有大量信息透露,英伟达会根据一系列因素向某些公司提供优先分配。

包括但不限于:多元化采购计划、自主研发AI芯片计划、购买英伟达的DGX、NIC、交换机和/或光学设备等。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

事实上,英伟达的捆绑销售非常成功。尽管之前只是一家规模很小的光纤收发器供应商,但他们的业务量在一个季度内增长了两倍,预计明年的出货量将超过10亿美元——远远超过了自家GPU或网络芯片业务的增长速度。

这些策略,可以说是相当周密。

比如,想要在英伟达的系统上实现3.2T网络和可靠的RDMA/RoCE,唯一方法就是使用英伟达的NIC。

一方面也是因为英特尔、AMD和博通的产品实在是缺乏竞争力——仍然停留在200G的水平上。

而通过对供应链的管理,英伟达还促使400GInfiniBandNIC的交付周期,能够比400G以太网NIC明显缩短。而这两种NIC(ConnectX-7)在芯片和电路板设计上,其实是完全相同的。

其原因在于英伟达的SKU配置,而非实际的供应链瓶颈——迫使企业不得不购买成本更高的InfiniBand交换机,而不是标准的以太网交换机。

这还不止,看看供应链对L40和L40SGPU有多么着迷,就知道英伟达又在分配上做手脚了——为了赢得更多H100的分配,OEM厂商就需要购买更多的L40S。

这与英伟达在PC领域的操作,也是如出一辙——笔记本制造商和AIB合作伙伴必须购买更大量的G106/G107(中/低端GPU)才能获得更稀缺、更高利润的G102/G104(高端和旗舰GPU)。

作为配合,供应链中的人也被灌输了这样的说法——L40S比A100更好,因为它具有更高的FLOPS。

但实际上,这些GPU并不适合LLM推理,因为它们的显存带宽还不到A100的一半,而且也没有NVLink。

这意味着在L40S上运行LLM并实现良好的TCO几乎是不可能的,除非是非常小的模型。而大批量的处理也会导致分配到每个用户上的token/s几乎是不可用的,从而使理论上的FLOPS在实际应用中变得毫无用处。

英伟达的MGX模块化平台,虽然省去了服务器设计的艰苦工作,但也同时降低了OEM的利润率。

戴尔、惠普和联想等公司显然对MGX持抵制态度,但诸如超微、广达、华硕、技嘉等公司则争相填补这一空白,将低成本的「企业人工智能」商品化。

而这些参与L40S和MGX炒作的OEM/ODM,也可以从英伟达那里获得更好的主线GPU产品分配。

光电共封装(Co-PackagedOptics)

在CPO方面,英伟达也是相当重视。

他们一直在研究各种解决方案,包括来自AyarLabs的解决方案,以及他们自己从GlobalFoundries和台积电获得的解决方案。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

目前,英伟达已经考察了几家初创公司的CPO方案,但暂时还没有做出最终的决定。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

分析认为,英伟达很有可能将CPO集成到「X100」的NVSwitch上。

因为直接集成到GPU本身可能成本太高,而且在可靠性方面也很困难。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

光路交换机(OpticalCircuitSwitch)

谷歌在人工智能基础设施方面最大的优势之一,就是它的光路交换机。

显然,英伟达也在追求类似的东西。

目前,他们已经接触了多家公司,希望能够进行合作开发。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

英伟达意识到,FatTree在继续扩展方面已经走到了尽头,因此需要另一种拓扑结构。

与谷歌选择6DTorus不同,英伟达更倾向于采用Dragonfly结构。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

据了解,英伟达距离OCS的出货还遥遥无期,但他们希望在2025年时能够更加接近这一目标,但大概率无法实现。

英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创

OCS+CPO是圣杯,尤其是当OCS可以实现按数据包交换时,将会直接改变游戏规则。

不过,目前还没有人展示过这种能力,甚至连谷歌也没有。

虽然英伟达的OCS和CPO还只是研究部门的两套,但分析人士认为,CPO会在2025至2026年内离产品化更进一步。

这次,和英伟达25年秘密路线图曝光:老黄豪赌B100,AMD秘密武器X100遭重创有关内容就为朋友们整理到这里,更多优惠活动资讯信息可查看本站其他栏目。

已阅读:0
本站文章来自网络收集整理和网友投稿,如需申请删除,请与站长联系。
上一篇:揭秘手机背后:厂商可能隐瞒的这些关键隐形参数
下一篇:苹果VisionPro即将上市,供应链计划年产量达百万台
英伟达
相关热门科技资讯优惠信息
1
查看更多科技资讯优惠信息