电话: 邮箱:

kaiyun(中国)2026世界杯官方网站 AI数据中心, 投资崩溃点在那儿?

发布日期:2026-06-04 12:16 作者:admin 来源:未知 点击:193

本文将基于GPU、HBM和电力成本,反向推算出“东谈主工智能数据中心投资的崩溃点”。

对东谈主工智能数据中心的投资较着已达到前所未有的水平。微软、谷歌、亚马逊和Meta等超大规模数据中心巨头竞相每年投资数千亿好意思元。据TrendForce预测,到2026年,这四大超大规模数据中心巨头的总投资额将高达7550亿好意思元(图1)。按1好意思元兑160日元的汇率狡计,这额外于约120.8万亿日元,卓越了日本2025财年的国度预算(一般账户预算总数约为115万亿日元,数据起首:日本财务省)。

图1:前 4 大超大规模数据中心运营商对数据中心的淘气成本投资

之是以需要如斯多量的投资,是因为东谈主工智能就业器中使用的AI半导体价钱飞涨。以最初的AI半导体制造商NVIDIA的GPU为例,其目下的旗舰架构“Blackwell”中,单颗“B200”GPU的价钱在500万至800万日元之间,一台配备8颗B200 GPU的“DGX B200”就业器的价钱在4000万至7000万日元之间,而基于该就业器的AI机架的价钱则高达数亿至10亿日元(图2)。由于构建AI数据中心需要多量部署这些AI机架,因此每个超大规模数据中心运营商的投资额都卓越1000亿至2000亿好意思元。

图2:NVIDIA GPU AI 就业器和数据中心(Hopper、Blackwell、Rubin)的订价结构

然而,这也曾超出了“增长投资”一词所能讲授的限制,而更像是“为了竞争而进行的军事开垦”。

在这种情况下,有一个很少被成功究诘的环节问题:“这项投资确凿不错收回成本吗?”天然东谈主工智能激越强调的是强盛的需乞降技巧立异,但关于成本密集型行业来说,最终的问题是投资能否收回成本。

本文将东谈主工智能数据中心的成本结构理解为三个要素:GPU、宽带内存(HBM)和电力。此外,本文愚弄微软和谷歌公开的施行数据,对面前东谈主工智能投资的收入结构进行了定量分析。基于此分析,本文试图估算“崩溃线”,即投资无法收回的临界点。

请留意,天职析侧重于GPU基础步调按小时计费带来的直秉承入,并不包括东谈主工智能带来的波折收入(举例搜索告白质地提高或SaaS价值增多)。阅读本文时,请谨记这小数。

直肚直肠地说,好意思国超大规模数据中心运营商在东谈主工智能数据中心看似淘气的投资很可能也曾注定失败。借用动漫《北斗神拳》中健次郎的一句名言:“你也曾死了。”

从微软和谷歌的案例看投资规模的现实

图3以量化神志展示了微软和谷歌的施行投资规模。基于这些数据,它充分评释了微软和谷歌(Alphabet 的子公司)在数据中心边界的投资规模之弘远令东谈主难得。

图3:微软和谷歌的施行投资规模

微软的案例

阐发微软2025财年年度呈文,成本开销(不包括固定钞票和开垦)瞻望将达到645亿好意思元。此外,该公司示意,投资(主要用于东谈主工智能基础步调)瞻望将卓越800亿好意思元。

与微软云业务1680亿好意思元的营收比拟,成本开销约占营收的38%,或阐发公司声明约为48%。频繁情况下,在清静的基础步调业务中,成本开销很少卓越营收的30%,因此这一比例极其凄迷。

更伏击的是,折旧用度已达220亿好意思元。这意味着畴前的投资包袱也曾入手影响公司的损益,况兼这种包袱在改日几年可能会不息增多。此外,如上图1所示,微软2026年的成本开销瞻望将达到1900亿好意思元,约为上年的2.4倍。因此,微软的利润和亏蚀瞻望将大幅下降。

谷歌的案例

与此同期,谷歌母公司Alphabet正在进行更大规模的投资。其2025年的成本开销达到914亿好意思元,其中大部分将用于就业器和数据中心等技巧基础步调。比拟之下,谷歌云的年收入约为588亿好意思元,商业利润约为139亿好意思元。

天然,这914亿好意思元的成本开销不仅扶植云狡计业务,也扶植公司范围内的基础步调,举例搜索引擎和东谈主工智能规划平台。然而,即使其中一半用于云狡计就业,也仍然高达约457亿好意思元,约占云狡计销售额的80%,约为商业利润的3.3倍。即便接头到这小数,较着目下的投资规模与传统的答复模式存在权臣偏差。

此外,与微软近似,谷歌2026年的举座成本开销瞻望将达到1800亿至1900亿好意思元,约为上一年的2.4至2.5倍。鉴于如斯高的成本开销水平,不难思象,收回对云狡计业务的投资将变得愈加艰难。

东谈主工智能数据中心的成本结构

这项多量投资的原因在于东谈主工智能数据中心特有的成本结构。发轫,咱们将估算东谈主工智能数据中心的成本结构和商场范围(图4)。

图4:AI 数据中心的成本结构和商场范围

发轫,咱们来望望GPU。目下的AI基础步调简直都备依赖于NVIDIA的GPU。举例,H100系统的单价估量在2.5万好意思元到4万好意思元之间,具体价钱取决于确立,而一个包含8个H100的就业器机架价钱将达到约300万好意思元。此外,GB200系列的机架价钱瞻望将上升至数百万好意思元(约350万好意思元到550万好意思元)。

另一个伏击身分是投资对象不是单个GPU,而是“集群单元”。在目下的AI数据中心,每个集群部署数千到数万个GPU已是司空见惯,单个集群的投资额从数亿好意思元到约7亿好意思元不等。

其次是HBM显存。在H100和GB200芯片中,每个GPU频繁配备6到8个HBM堆栈。HBM的单价会阐发代数和合约条件而有所不同,但据称HBM3/3E的单价在1000好意思元到1500好意思元之间。因此,每个GPU的HBM成本约为10000好意思元,这在GPU价钱中占了额外大的比例。

更伏击的是供应限制。HBM商场简直都备由三家公司主导:SK海力士、三星电子和好意思光科技。特殊是,据称SK海力士在先进HBM商场占有卓越50%的份额。这种供应蚁合度变成了一种扼制价钱下降的结构。

第三,还有功耗问题。东谈主工智能数据中心的功耗比传统云平台高出几个数目级(图5)。举例,H100 的 TDP(注:热想象功耗,指冷却芯片所需的估量最大发烧量)约为 700W,而 GB200 的 TDP 则在 1kW 级别。要是确立一个包含 10,000 个 GPU 的集群,仅 GPU 本身的功耗就将达到 10MW,加上网罗和冷却等其他功耗,总功耗将达到20-30MW。

图5:东谈主工智能数据中心的年度功耗和总成本

回到图5的讲授,换算成年耗电量,一个20兆瓦的系统需要20兆瓦×24小时×365天≈1.75亿千瓦时/年。假定电价为0.14好意思元/千瓦时,则年电费约为2500万好意思元。施行上,接头到冗余确立和冷却损耗,成本达到每年3500万好意思元阁下的情况并不稀有。

因此,GPU(成本开销)、HBM(供应限制)和电力(运营开销)这三个要素都会跟着规模的扩大呈指数级增长。收尾,东谈主工智能基础步调的成本仍然居高不下,况兼似乎很难像畴前那样通过规模延长来责问成本。

传统的规复模式不能行

传统云基础步调受益于规模经济,这获利于就业器单元成本的捏续下降和愚弄率的提高。摩尔定律和造谣化技巧的跳动使得单台就业器随机跟着时候的推移“以更低的成本不休更多就业”,这为规复模子提供了扶植。然而,东谈主工智能数据中心的情况则人大不同。图6展示了其成本结构的前提条件,图 7则展示了基于这些条件狡计出的东谈主工智能数据中心规复线。

图6:AI 数据中心规复模子狡计的假定

图7:AI 数据中心投资回收期狡计

假定入手投资7亿好意思元用于开垦一个领有1万个GPU的集群(包括GPU、就业器、网罗和冷却系统),并出于管帐标的将其摊销在5年内,则每年的摊销用度为1.4亿好意思元。加上3500万好意思元的电力成本和3500万好意思元的运营成本(珍贵、东谈主员成本、数据中心房钱等),每年的总成本约为2.1亿好意思元。

由此可知,规复所需的每个GPU 的计费成本不错用以下公式示意。

所需计费成本= 年度总成本 ÷ (GPU 数目 × 8760 小时 × 平淡运行时候)

假定运行率为70%,2.1亿好意思元 ÷ (10,000 × 8,760 小时 × 0.7) ≈ 约 3.43 好意思元/GPU 小时

换句话说,除非每块GPU在接近恒定的运行条件下每小时至少产生3.43好意思元的收益,不然投资无法收回。这是“下限”,而非“平均值”,要是愚弄率下降,所需的单元成本还会更高。

然而,在施行商场中,生成式东谈主工智能推理的价钱正在赶快下降。举例,据报谈,大规模言语模子(LLM)的应用环节编程接口(API)价钱在2023年至2025年间将降至原价的十分之一以下。此外,开源模子的激增进一步加重了价钱竞争。

环节在于,尽管API价钱大幅下降,但GPU、HBM和电力成本施行上却在上升。此时,传统的规复模式已不再可行。东谈主工智能基础步调正在从“规模越大,上风越显然”的模式转向“规模越大,固定成本风险越高”的模式。那么,规复会在什么规模下变得不能能呢?让咱们基于微软和谷歌的真实数据来分析规复条件

回收线的现实

正如前文所述,微软每年捏续投资600亿至800亿好意思元,而到2025年,其折旧用度已卓越200亿好意思元。要是微软试图用微软云的运谋利润来支付这220亿好意思元的折旧用度,将会大幅责问其云业务的运谋利润率。另一方面,谷歌云业务的运谋利润为139亿好意思元,kaiyun(中国)2026世界杯官方网站而其仅云业务的成本开销就高达约457亿好意思元,这意味着即使按单年狡计,其投资额也卓越了运谋利润的三倍。

这标明存在结构性问题。东谈主工智能基础步调必须保捏极高的投资答复率才能盈利。然而,现实情况是,东谈主工智能就业的价钱正鄙人降,GPU和HBM的成本仍然很高,而电力成本却在上升。

在上述三个身分同期作用的环境下,投资回收的条件会赶快恶化。不错说,面前的AI投资也曾参加了一种结构性窘境:除非同期已毕极高的愚弄率和极高的单价,不然很难收回投资。

投资为何仍需不息

那么,这种对成本开垦的淘气投资会放缓吗?谜底是狡赖的。

微软剩余践约义务约为3680亿好意思元,标明商场需求仍然卓越供应。谷歌也明确示意,筹画进一步扩大成本开销,以称心东谈主工智能和云狡计的需求。环节在于,这两家公司都不是因为预期随机收回投资才进行投资的。相背,它们是被动不息投资的,因为罢手投资就意味着在竞争中逾期。

面前的东谈主工智能投资也曾从追求利润最大化休养为戮力幸免失败。咱们应该将东谈主工智能投资视为也曾参加“破费战”阶段,而非“增长”阶段。

只好这种结构捏续下去,东谈主工智能激越就会不息延长,但其里面会蕴蓄一种无法支持的风险阵势的“污蔑”。这种污蔑会在某个节点短暂表走漏来。这便是下一章将要进展的“崩溃线”。

探索崩溃线

必一体育中国官网入口

如上所述,判断东谈主工智能投资的可捏续性不仅需要接头GPU的数目,还需要接头HBM、电力以及悉数电力基础步调。本文将以一个领有10000个GPU的集群为例,定量地展示投资回收在何种规模下将变得不能能——即所谓的“崩溃线”。

从GPU数目倒推,HBM和功耗按如下神志增多:

发轫,咱们假定一个由10,000 个 GPU 构成的集群。图8自满了每个集群所需的年功耗以及所需的等效核电站数目。

图8:故障线所需功耗的物理规模

假定每个GPU配备8个HBM堆栈,则所需的HBM总量将达到80,000个堆栈。每个堆栈24GB,共计约为1.92PB。此外,就功耗而言,假定每个GPU的功耗为1kW,而悉数步调(包括冷却、变电站和网罗负载)的功耗约为其两倍,则一个领有10,000个GPU的集群的步调负载约为20MW。

年耗电量约为175.2吉瓦时(GWh),除以一座1吉瓦级核电站以90%负荷运行的年发电量,额外于约0.022座反馈堆的发电量。反过来说,这意味着一座核电站只可称心约45个场所的用电需求,要是东谈主工智能集群大规模延长,不新建核电站将无法称心需求。

停业线的界说

如上所述,假定一个领有10,000个GPU的集群,入手投资7亿好意思元,分5年摊销,年运营成本3500万好意思元,年电力成本约为3500万好意思元,则年度总成本约为2.1亿好意思元。在这种情况下,盈亏均衡条件不错用第三章中描画的以下公式示意。

所需计费成本= 年度总成本 ÷ (GPU 数目 × 24 小时 × 365 天 × 平淡运行时候)

假定愚弄率为70%,则每 GPU 小时的计费成本约为 3.43 好意思元。本文将此称为“临界点”。换句话说,一朝 AI 就业价钱低于此水平,或者愚弄率低于此假定值,投资就无法收回成本。

需要留意的是,出于管帐标的而经受的5年摊销期联系于NVIDIA GPU的技巧周期(频繁每两年阁下更新换代一次)而言是一个较为乐不雅的假定。在后文所述的崩溃状况③中,咱们将分析这种缩小的摊销期对收入结构的影响。

崩溃短暂发生

在典型的基础设践诺业中,利润率会逐渐下降。然而,在固定成本极高的AI数据中心,一朝利润率低于某个水平,盈利本事就会赶快恶化,原因有以下三点。

第一,GPU 和 HBM 的入手投资巨大且固定。

第二,电力和冷却负荷很高,况兼破碎易责问。

第三,另一方面,由于竞争,所需的计费单元价钱(商场价钱)将会下降。

因此,东谈主工智能投资的恶化经由并非线性而非线性。换句话说,并非“情况逐渐恶化,然后变得愈加阻塞”,而是“一朝越过某个临界点,损失就会短暂变得巨大”。这便是停业线的施行。

目下,让咱们定量狡计东谈主工智能数据中心发生故障的三种场景。每种场景的共同条件如图9所示。

图9:狡计 AI 数据中心故障线的常见条件

三种崩溃状况

图10自满了三种故障场景的仿真收尾。

图10:东谈主工智能数据中心发生故障的三种场景模拟

第一,软件崩溃。

最有可能出现的情况是东谈主工智能公司之间张开强烈的价钱竞争。要是计费价钱降至每GPU小时2.90好意思元,愚弄率降至65%,则所需计费价钱将上升至3.69好意思元,导致每年损负约4490万好意思元。然而,如图10所示,天然现阶段并未出现澈底崩溃,但利润已都备解除,投资复苏也悄然走向失败。即使名义需求得以保管,里面成本成果也在急剧下降。

第二,硬件崩溃。

下一个风险是电力、制冷和装置等施行成本的上升。要是3好意思元的计费率和55%的愚弄率,再加上电价上升和步调负荷增多,所需的计费率将跃升至4.7好意思元,导致每年约8170万好意思元的损失。图10 自满,在此阶段,赤字急剧扩大。这是一个典型的例子,评释基础步调成本而非需求何如蹂躏盈利本事。

第三,金融崩溃。

最严重的后果是财务上的崩溃。即使计费率为每间3.20好意思元,入住率为60%,由于折旧期缩小(从5年缩小到4年)以及8%的成本成本,施行计费率也需达到每间5.73好意思元,导致每年亏蚀约1.33亿好意思元。因此,如图 10 底行所示,此阶段的损失已达到无法承受的水平(每年 1.33 亿好意思元)。这种情况的施行在于,成本商场在开垦发生物理故障之前就认定该项投资“无法收回”。

失效以“非线性”神志发生

图11自满了AI 数据中心愚弄率与所需计费成本之间的关系。需要留意的是,这种关系并非线性关系。

图11:AI 数据中心将出现故障的边界

入住率为70% 时,所需单元成本约为 3.43 好意思元;但当入住率降至 60% 时,所需单元成本将上升至近 4 好意思元;要是入住率进一步降至 50%,所需单元成本将跃升至近 5 好意思元。

图11 所示的“崩溃区域”直不雅地展示了这种非线性关系。商场价钱区间(2.5 至 3.0 好意思元:基于 AWS、Azure、Lambda Labs 等平台的 H100/H200 小时费率范围)也曾跌入该区域深处,目下的 AI 就业价钱很可能已从结构上低于盈亏均衡点。

功耗限制:东谈主工智能是一个国度基础步调问题

更伏击的是,东谈主工智能投资的规模化成功依赖于电力基础步调。如图12所示,10,000 个 GPU 大致需要 20 兆瓦 (MW) 的电力,100,000 个 GPU 需要 200 兆瓦 (MW) 的电力,而 1,000,000 个 GPU 则需要 2,000 兆瓦 (MW)(= 2 吉瓦 (GW))。这意味着不仅需要扩建数据中心,还需要扩建电力供应基础步调本身。

图12:功耗从 10,000 个 GPU 到 100,000 个 GPU 再到 1,000,000 个 GPU 急剧增多

要是咱们把这些电力革新为核能:

10,000 个 GPU 的集群:0.02 个单元

100,000 GPU 集群:0.2 个单元

百万GPU集群:2.2个单元

东谈主工智能投资的延长较着等同于电力基础步调的延长。东谈主工智能数据中心不再只是是IT行业的问题,而是也曾演变为触及电力、地皮和开垦本事的“国度供给本事问题”。

东谈主工智能投资面对的“崩溃”

目下对东谈主工智能数据中心的投资不仅无利可图,况兼在物理上也难以捏续。商场价钱下降、愚弄率下降、电力成本上升或成本商场收紧——哪怕其中任何一个身分都可能立即导致数据中心崩溃到临界点。况兼,这种崩溃不会逐渐发生,而是在跨越某个临界点后短暂爆发。这不再只是是半导体行业的问题,而是关乎国度电力供应本事的问题。

2026年4月3日,日本首相高市早苗会见了好意思国大型超大规模数据中心运营商微软总裁布拉德·史小姐,并对该公司在日本数据中心投资约100亿好意思元示意包涵。然而,正如本文所示,此类投资不仅无利可图,况兼耗电量巨大,其结构还会给国度基础步调带来包袱。在东谈主工智能激越的背后,有必要随便地评估日本将要付出的代价规模。

*声明:本文系原作家创作。著述内容系其个东谈主不雅点,本人转载仅为共享与究诘,不代表本人赞赏或认可,如有异议,请干系后台。

思要取得半导体产业的前沿洞见、技巧速递、趋势领会kaiyun(中国)2026世界杯官方网站,暖热咱们!

相关标签: AI 投资 数据中心 崩溃