大厂疯抢GPU,Elon Musk要买100万个?
发布日期:2024-12-06 11:27 点击次数:195
(原标题:大厂疯抢GPU,Elon Musk要买100万个?)
要是您但愿不错时常碰面,接待标星保藏哦~
畴前几年,因为东谈主工智能的火热,GPU的销量猛增。
笔据英伟达的数据自大,在2023年,公司与 AI 做事负载联系的英伟达数据中心部门的销售收入为 184 亿好意思元,比前年同期增长了 409%。2023 年,Nvidia 在数据中心GPU商场占有约 98% 的份额,因为其旗舰 H100 芯片险些莫得竞争敌手。
进入2024年,英伟达的GPU销量依然猛增,英伟达CEO黄仁勋也直言,公司新推出的Blackwell在商场的柔顺度相配高,也有许多客户在买。笔据 Jon Peddie Research 的数据,本年寰球 GPU 商场预测将进步 985 亿好意思元。黄仁勋也觉得,数据中心运营商将在畴昔四年内滥用 1 万亿好意思元升级其基础步伐,以悠闲 AI 开发东谈主员的需求,因此这个契机足以支捏多家 GPU 供应商。
最近几天的讯息看来,Elon Musk和Mark Zuckerberg还是领先启动了新一轮GPU争夺赛。
Elon Musk要打造100万GPU集群
据金融时报最新报谈,埃隆·马斯克的东谈主工智能初创公司 xAI 原意将其 Colossus 超等诡计机扩大十倍,以容纳进步 100 万个图形护士单位,以突出谷歌、OpenAI 和 Anthropic 等竞争敌手。
Colossus 于本年早些时候建成,仅用了三个月时期,被觉得是寰球上最大的超等诡计机,运行着一个由 100,000 多个互连的 Nvidia GPU 构成的集群。马斯克位于孟菲斯的超等诡计机相配引东谈主细心,因为他的初创公司大约快速将 GPU 拼装成一个 AI 护士做事集群。“从启动到扫尾,只用了 122 天,”马斯克说。超等诡计机经常需要数年时期才能建成。(联系Elon musk的集群,不错参考半导体行业不雅察之前的著述)
他的公司可能还滥用了至少 30 亿好意思元来拼装这台超等诡计机,因为目下这台超等诡计机由 10 万块 Nvidia H100 GPU 构成,每块 GPU 的价钱经常约为 3 万好意思元。马斯克目下想用 H200 GPU 来升级这台超等诡计机,H200 GPU 的内存更大,但每块 GPU 的价钱接近 4 万好意思元。
Nvidia也露馅,称xAI 的“Colossus”超等诡计机的边界正在扩大一倍。马斯克还在推特上示意,这台超等诡计机行将在一座占地 785,000 往常英尺的建筑物内整合 200,000 个 H100 和 H200 Nvidia GPU。
戴尔首席运营官杰夫·克拉克周四在领受采访时示意:“咱们从一张白纸启动,在短短几个月内大边界部署了数万个 GPU。”“该集群仍在确立中,咱们正在脱颖而出。”
如上所述,马斯克的初创公司 xAI 正在开发一个大型步伐,以赞助其在打造东谈主工智能用具的竞赛中的诡计才气。大孟菲斯商会周三也发表声明称,扩大田纳西州孟菲斯工场边界的做事还是启动。商会示意, Nvidia、戴尔和超微电脑也将在孟菲斯建立业务以支捏彭胀,同期将成立一支“xAI 尽头作为团队”,以“为公司提供全天候礼宾服务”。
联系报谈指出,目下尚不明晰 xAI 筹划在扩缓期间使用面前一代 Hopper 如故下一代 Blackwell GPU。Blackwell 平台的扩展性预测比 Hopper 更好,因此使用行将推出的期间而不是现存期间更出奇想。但无论怎样,得回 800,000 – 900,000 个 AI GPU 皆很难,因为 Nvidia 家具的需求量宏大。另一个挑战是让 1,000,000 个 GPU 以最高驱散协同做事,而 Blackwell 再次更出奇想。
据华尔街日报之前的报到,英伟达的一位销售诈欺告诉共事,马斯克对芯片的需求给公司的供应链带来了压力。Nvidia 的一位发言东谈主示意,公司一直尽力悠闲统统客户的需求。
虽然,这次彭胀的资金需求是宏大的。购买 GPU(每个滥用数万好意思元)以及电力和冷却基础步伐可能会将投资推高至数百亿好意思元。xAI 本年已筹集了 110 亿好意思元,最近又得回了 50 亿好意思元。目下,该公司的估值为 450 亿好意思元。
Meta也砸百亿确立数据中心
在Elon Musk抢购GPU的同期,Mark Zuckerberg也出头出头。
Meta Platforms Inc周三示意,公司筹划在路易斯安那州东北部确立一个价值 100 亿好意思元的东谈主工智能数据中心园区,这将是该公司迄今为止确立的最大数据中心。该园区占地 400 万往常英尺,将坐落于里奇兰教区,这是一个以农田为主的农村地区,围聚现存的公用步伐基础步伐,预测本月破土动工,并捏续到 2030 年。
数据中心筹划的基础步伐将容纳护士海量数据所需的网络和服务器,以支捏日益增长的数字期间使用,并将针对东谈主工智能做事负载进行优化,这些做事负载尤其需要数据和诡计。一进取线,它将大约支捏Meta 的统统服务,包括 Facebook、Messenger、Instagram、WhatsApp 和 Threads。
在这次数据中心投资讯息公布之前,其他公司也在尽力扩大其数据和诡计才气,以悠闲东谈主工智能和机器学习应用才气和做事负载日益增长的需求。
Meta 数据中心策略总监 Kevin Janda 示意:“Meta正在构建东谈主类连合的畴昔以及完了这一缠绵的期间。这个数据中心将成为这一做事的紧迫构成部分。”
路易斯安那州州长杰夫·兰德里示意,新数据中心将为该地区带来新的期间机遇。路易斯安那州经济发展局是一家悉力于改善该州贸易环境的政府机构,据该机构预计,该园区将创造约 1,500 个作事岗亭。
“ Meta 的投资将使该地区成为路易斯安那州快速发展的科技行业的支捏 ,振兴咱们州艳丽的乡村地区之一,并为路易斯安那州的工东谈主创造畴昔高薪做事的契机,”兰德里说。
Meta 莫得露馅新步伐将支捏若干 GPU,也莫得露馅联想使用哪家公司的芯片。据 Entergy称 ,该中心将由三座自然气厂提供电力,总发电量为 2.2 千兆瓦。他们也强调,其中大部分资本将用于加快器以及支捏它们的主机、存储和网络。要是你假定东谈主工智能步伐 90% 的资本用于 IT 开拓,那么确立该步伐的资本为 10 亿好意思元,而开拓资本为 90 亿好意思元。假定 IT 开拓资本的一半多少许用于加快器,那么目下等于 50 亿好意思元。以平均 25,000 好意思元的价钱诡计,这十分于 200,000 个东谈主工智能加快器。要是你假定这里将挤满畴昔自主研发的 MTIA 加快器,而这些加快器的资本唯有这里一半,那么这些加快器的资本将达到 400,000 好意思元。
Meta 首席推论官马克·扎克伯格此前曾示意,到 2024 年底,公司将在公司数据中心运行 350,000 块 Nvidia H100 芯片,尽管该公司也在开发我方的 AI 硬件。
谁领有最多的GPU?
除了上述两家厂商除外,包括微软、谷歌、AWS和CoreWeave以及国内一众的云厂商皆成为了英伟达GPU的追赶者。资产在日前的报谈中指出,一个由三家尽头财力淳朴的客户构成的精英群体,在扫尾10月底的前九个月内,诀别购买了价值100亿至110亿好意思元的商品和服务。(具体参考著述)。
而统计面前的GPU领有量,按博客lesswrong的预估,要是皆换成以H100的等效算力。截止目下,寰球五大科技公司的2024年领有的算力,以及2025年的预测:
微软有75万-90万块H100,来岁预测达到250万-310万;
谷歌有100万-150万块H100,来岁预测达到350万-420万;
Meta有55万-65万块H100,来岁预测达到190万-250万;
亚马逊有25万-40万块H100,来岁预测达到130万-160万;
xAI有10万块H100,来岁预测达到55万-100万;
该博客同期指出,按照2024 年东谈主工智能景况敷陈 主要供应商购买 Blackwell 芯片的情况进行了预计——大型云公司正在无数购买这些 GB200 系统:微软购买了 70 万到 140 万个,谷歌购买了 40 万个,AWS 购买了 36 万个。据传,OpenAI 至少领有 40 万个 GB200。
由此可见,新一代的Blackwell 的接待历程很高。目下正在确立的数据中心可能会采选 Nvidia 的 Blackwell 芯片,该公司预测来岁将无数出货。不外,商场还是启动期待该公司推出的 Rubin 芯片,这是 Blackwell 之后的下一代芯片。
英伟达首席推论官黄仁勋在10月初领受CNBC 的《Closing Bell Overtime》节目采访时示意,该公司下一代东谈主工智能芯片 Blackwell 的需求“落拓”。他说谈:“每个东谈主皆想领有最多,每个东谈主皆想成为第一。”
黄仁勋在领受 CNBC 采访时示意:“在期间发展如斯飞速的时间,咱们有契机三倍进入,真确鼓励革命周期,从而赞助产能、赞助产量、裁汰资本、降古板耗。咱们正在野着这个倡导尽力,一切皆在按筹划进行。”
首席财务官科莱特·克雷斯 (Colette Kress)八月份曾示意,公司预测第四财季 Blackwell 营收将达数十亿好意思元。
Jensen 示意,Nvidia 筹划每年更新其 AI 平台,将性能赞助两到三倍。
Melius Research 分析师 Ben Reitzes 在一份扣问敷陈中写谈:“越来越多的猜度觉得,Nvidia 的下一代 GPU(继 Blackwell 之后)——名为 Rubin——可能会比大多数投资者预测的 2026 年提前 6 个月准备就绪。”
Reitzes 造就称,芯片的发布很少会提前,并保管该股 195 好意思元的缠绵价,他示意,这是假定 Rubin 在 2026 年下半年进行部署。
在GPU广受接待确当下,英伟达无疑是最大的赢家。但AMD也不甘东谈主后,正在尽力成为这个商场的另一个紧迫扮装。除此除外,微软、Meta、谷歌、AWS等巨头,也皆在打造自主的AI芯片,但愿在这个商场凭借自研的加快器,去英伟达GPU之间找到另一个均衡点。
举例AWS 首席推论官马特·加曼 (Matt Garman) 在日前的大会中所说:“如今,GPU 方面本体上唯有一个弃取,那等于 Nvidia。咱们觉得客户会心爱有多种弃取。”
https://www.ft.com/content/9c0516cf-dd12-4665-aa22-712de854fe2f
https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-plans-to-scale-the-xai-supercomputer-to-a-million-gpus-currently-at-over-100-000-h100-gpus-and-counting
https://siliconangle.com/2024/12/05/meta-invest-10-billion-louisiana-ai-data-center/
https://www.lesswrong.com/posts/bdQhzQsHjNrQp7cNS/estimates-of-gpu-or-equivalent-resources-of-large-ai-players#Nvidia_chip_production
https://www.cnbc.com/2024/10/03/nvidia-ceo-demand-for-blackwell-ai-chip-is-insane.html
半导体宏构公众号保举
专注半导体领域更多原创内容
柔顺寰球半导体产业动向与趋势
*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或支捏,要是有任何异议,接待辩论半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3968期内容,接待柔顺。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的内容就点“在看”共享给小伙伴哦
相关资讯