继 TD Cowen 后,巴克莱似乎也开始唱空 AI 算力。
3 月 26 日,巴克莱发布最新研究称,2025 年全球 AI 算力可支持 15-220 亿个 AI Agent,似乎足以满足美国和欧盟的绝大部分需求。而同日 TD Cowen 分析师称支撑人工智能运算的计算机集群供过于求。
巴克莱研报指出,AI 行业需要从 “无意义基准测试” 转向真正有用的 Agent 产品部署。同时巴克莱分析师表示:
- AI Agent 市场的增长潜力巨大: 行业算力能够支持大规模 Agent 部署,预示着巨大的市场机会。
- 推理成本是关键: 低推理成本对于 Agent 产品的盈利至关重要,这将驱动对更高效的 AI 模型和算力的需求。
- 开源模型的重要性: 开源模型将在降低成本方面发挥关键作用,投资者应关注相关领域的动态。
算力供需:过剩还是不足?
关于 AI 算力的供需平衡,巴克莱展示了几个核心发现:
- 行业推理容量基础:2025 年全球约有 1,570 万个 AI 加速器(GPU/TPU/ASIC 等)在线,其中 40%(约 630 万个)将用于推理,而这些推理算力中约一半(310 万个)将专门用于 Agent/聊天机器人服务;
- 算力分配正在演变:企业客户已开始转向成本更低的开源模型,如 Salesforce 的 Agentforce 采用 Mistral 开源模型(7B-141B 参数),而非最昂贵的专有前沿模型;
- 开源模型下载激增:Hugging Face 数据显示 DeepSeek、Llama 和 Mistral 等开源模型的下载量正在迅速增长,这一趋势将随着从聊天机器人向 Agent 的转变而加速。
算力供应虽然表面上充足,但面临结构性挑战。巴克莱明确表示:
如果 Agent 产品真正起飞并对消费者和企业用户非常有用,我们可能需要
1)更便宜、更小但性能同样高的基础模型(DeepSeek 风格);
2)更多推理芯片安装;以及
3)可能需要将已安装的训练 GPU 重新用于推理。
这表明,虽然目前总体算力看似充足,但针对高效、低成本 Agent 产品的专用算力仍有较大缺口。巴克莱指出这意味着,在 AI Agent 赛道上,具有高效推理成本结构和专注开发小型高效模型的公司可能拥有更大竞争优势,而仅依赖大模型而不考虑单位经济学的公司可能面临更大挑战。
推理成本:AI Agent 的经济学挑战
巴克莱指出AI Agent 的推理成本正成为行业发展的核心考量因素:
- AI Agent 生成的 Token 数量巨大:相比传统聊天机器人,Agent 产品每次查询生成约 10,000 个 Token,是聊天机器人 (约 400 个) 的 25 倍,这极大增加了推理成本;
- 不同模型的经济效益差异巨大:以年度订阅成本计算,基于 OpenAI o1 模型的 Agent 产品成本高达 2,400/年,而基于 88/年,后者提供了 15 倍于前者的用户容量;
- 超级 Agent 需求正在兴起:OpenAI 计划推出的”超级 Agent”产品,这类高端产品将消耗更多 Token,每月高达 3,560 万个,每日查询次数可达 44 次,远超普通 Agent 的 2.6 次。
从单位经济学角度看,以 Token 计价的模式将决定不同模型的市场竞争力。正如巴克莱研究指出:
这证明了低推理成本的重要性。由于其自主性质,Agent AI 产品的 Token 消耗趋势远高于聊天机器人。
此外,巴克莱分析师表示,虽然 “超级 Agent” 有潜力,但其高昂的推理成本可能限制其大规模应用。投资者在评估此类产品时,应谨慎考虑其经济可行性。
文章来自长桥证券
原创文章,作者:meigu,如若转载,请注明出处:https://www.tiezong.com/595.html