瑞银:企业AI采用成本攀升源于使用量激增,市场对Token通胀风险存在高估

2026/06/15 17:23:31

6 月 15 日,瑞银(UBS)在最新研报中表示,企业 AI 采用正面临 Token 和算力成本快速上升带来的新摩擦,但这一问题更多源于使用量激增而非单价通胀,整体风险或被市场高估。报告指出,随着 AI 编码代理等高强度工具的部署,企业 Token 消耗远超预期,这一现象已在投资者讨论中频繁出现,并引发对 AI 技术在企业端扩散速度可能放缓的担忧。


瑞银通过对约 13 家企业 IT 高管的访谈发现,约 60% 的受访组织已将 AI Token 和算力成本视为实质性问题,尤其在从简单聊天机器人转向自主运行的代理应用后,成本从固定 SaaS 支出转变为可变消费支出,预算可预测性大幅下降。


多数企业已或计划引入护栏措施,包括 Token 池化、模型降级使用、浪费提醒以及对重度用户的限制,以消除明显浪费而非全面遏制采用。部分高管明确表示不愿大幅限制员工使用 AI,强调「我们的目标就是让员工开始用 AI」,因此选择通过削减外部 IT 服务、整合云支出等方式优化其他预算来平衡上升的 AI 成本。报告强调,几乎所有受访企业都提到 AI 采用率正在加速,尤其在开发者团队,这表明成本上升主要由使用量增长驱动,而非单位成本通胀。


瑞银认为,这种情况属于企业正常的成本管控行为,并非 AI 采用受阻的信号,即使如 Uber 这类已将全年 AI 预算在一个季度内用完的公司,依然保持高 Token 限额并全力推进 AI 应用,同时通过提升工程师效率来对冲成本。


瑞银进一步分析称,AI 模型提供商和超大规模云服务商正加速推动 Token 效率提升,这可能限制近期价格上涨,并对云服务商份额分布产生影响,Google Cloud 和 AWS 凭借自研芯片与模型或在成本控制上获得优势。


同时,企业对使用量定价模式的抵触可能加大,或导致非 AI 软件支出环境进一步承压。结合此前进行的 140 家企业 AI 调查,报告指出「不明确的投资回报」仍是采用最大障碍,而「缺乏预算」尚未进入前五,但随着 Token 成本问题凸显,这一动态正成为企业更务实地优化 AI 部署的关键因素。

相关推荐

摩根大通:AI服务器需求升温,亚洲MLCC行业或迎新一轮景气周期

6 月 15 日,摩根大通在一份最新研报中表示,随着 AI 服务器、通用服务器和汽车电子需求持续增长,MLCC 市场供需关系有望在未来几年明显收紧,甚至在 2027 年至 2028 年进入短缺状态。


MLCC 是电子设备中广泛使用的基础元件,过去更多与智能手机、PC 和消费电子周期绑定。但这一次,推动需求的主角正在发生变化。摩根大通认为,服务器,尤其是 AI 服务器,正在成为行业最重要的增量来源。相比普通消费电子产品,AI 服务器对电源稳定性和元件规格要求更高,需要更多高容量、高性能的 MLCC。


报告预计,全球 MLCC 行业收入将在 2025 年至 2028 年保持较快增长,主要来自产品价格上涨和需求结构改善。摩根大通预计,行业供需将从 2025 年的约 10% 供过于求,转为 2027 年的约 5% 短缺,并在 2028 年进一步扩大至约 6% 短缺。


供应端的约束是这轮判断的关键。虽然厂商仍在扩产,但高规格 MLCC 并不能简单用传统产能来衡量。用于 AI 服务器和汽车的产品尺寸更大、技术要求更高,生产良率也更低。摩根大通指出,部分 AI 服务器用 MLCC 的组装良率可能只有普通产品的几分之一,这意味着名义产能增长未必能快速转化为有效供应。


汽车电子也是另一个稳定支撑。随着电动车、混动车和智能化配置提升,单车 MLCC 用量持续增加。报告预计,到 2030 年,汽车、服务器和人形机器人等高增长应用合计将占 MLCC 总需求的三分之一以上。


投资层面,摩根大通对亚洲主要 MLCC 厂商整体维持看好态度,但更偏好日本和台湾厂商,而不是韩国厂商。其理由是,日本的村田、太阳诱电、TDK 以及台湾的国巨,在估值和潜在盈利弹性上更具吸引力。相比之下,三星电机虽然同样受益于行业景气,但股价已经大幅上涨,估值优势相对较弱。


不过,报告也提醒,市场已经提前反映了部分乐观预期。MLCC 相关股票今年以来涨幅显著,后续行情能否延续,将取决于 AI 服务器需求是否继续超预期、厂商扩产是否受限,以及高端产品价格能否持续上涨。对于投资者而言,行业价格、库存变化和厂商对产能良率的表态,将成为判断这轮周期强弱的关键指标。

27分钟前

Tether旗下AI平台QVAC发布SDK 0.13.0,新增脑机接口插件

动察 Beating 监测,Tether 旗下本地 AI 开发平台 QVAC 发布 SDK 0.13.0 版本。本次更新主要包括:


新增 @qvac/ai-sdk-provider,可作为 opencode 等编程智能体的本地推理提供商;

支持一键将 QVAC 项目打包为 Mac、Windows 或 Linux 桌面应用(基于 Electron);

新增 pi0.5 视觉语言模型支持,可在单张消费级显卡上全精度运行;

新增本地图生视频能力,基于 Wan2.1 模型;

新增脑机接口(BCI)插件,可在设备端将神经信号解码为文字。


此外本次更新还带来 Android 端 Whisper GPU 转录优化、移动端 Parakeet 语音识别改进,以及 Supertonic TTS 全 GPU 加速支持。


---------------------------------

点击下方原文链接,加入动察 Beating · 飞书 AI 新闻渠道,7×24 小时不间断监测全球 AI 热点与新闻。

42分钟前

美股聪明钱以2.8万美元本金录118倍盈利,最新布局延伸至AI光通信

6 月 15 日,据 Hyperinsight 监测显示,MU(美光科技)盘前续涨 3%,较上个交易日收盘累计上涨 8.1%。Hyperliquid 上 MU 整体回报率最高的交易员,「美股交易王」受益于本轮上涨,其核心美光仓位浮盈进一步扩大至 208 万美元。


目前,该交易员持有 10 倍杠杆 MU、INTC(英特尔)及 LITE(Lumentum)三笔多单,在不足3个月内,其合计已将 2.79 万美元本金滚至约 320 万美元,累计回报率达 11800%。


其中,MU 为其当前盈利最大的核心仓位,INTC 多单目前浮盈约 146 万美元;而 LITE 则为其 4 日前最新建仓,建仓均价约 840 美元。在半导体板块持续获利后,其最新布局已进一步延伸至 AI 光通信产业链。


地址:0xcf67e4da9e9cd38c0afd26338d0fbddb3036eb24

2小时前

摩根士丹利:电力短缺正成为AI基础设施核心瓶颈,算力扩张进入「电力约束时代」

6 月 15 日,摩根士丹利在其最新研究中指出,电力短缺已从配套问题上升为 AI 基础设施建设的核心限制因素。电力变压器交货周期已从疫情前的 12–16 周大幅延长至 128–144 周,美国新能源并网积压规模已超过现有已装机容量的 2 倍,同时 30 万电工缺口与 43% 数据中心处于高水资源压力区,正在共同压制算力供给扩张速度。


电力系统扩张速度远低于数据中心建设节奏,输电网络与关键设备供应链周期显著更长。当前电力变压器平均交付周期已达 128 周,发电机升压变压器约 144 周,而疫情前仅为 12–16 周。这意味着 AI 数据中心即便完成融资、选址与设备采购,也可能因电力接入延迟而无法按期投产。


在并网环节,美国新能源项目排队积压规模已超过全国已装机电力容量的两倍,导致「发电完成≠可用电力」的结构性问题。电力必须完成并网后才能转化为数据中心可用供给,使得选址逻辑正从「适合建设机房」转向「电力可快速稳定接入区域」。


与此同时,AI 基础设施与能源体系的融资边界正在模糊,部分项目开始采用离网或半离网方案,包括燃气轮机、储能与燃料电池等直接供电路径。AI 公司也逐步从依赖公用事业扩张,转向直接参与电力资产投资与锁定供电能力,推动资本市场对 AI 与能源资产进行一体化定价。


除电力外,劳动力与资源同样构成约束。美国未来十年预计缺口约 30 万名电工,其中超过 20% 从业者年龄已在 55 岁以上;同时约 43% 的数据中心位于高水资源压力地区,冷却用水与替代方案正成为新增建设的重要限制因素。此外,多州已开始讨论或推动数据中心建设限制与审批收紧,进一步增加项目不确定性。


综合来看,电力、并网、设备、人力、水资源与政策审批正形成多重叠加约束,使算力扩张速度可能低于需求增长。报告认为,这种供需错配将强化「算力稀缺性」,使具备稳定可交付算力能力的参与者获得更强定价权,市场正从「算力扩张竞争」逐步转向「可用算力控制权竞争」。

5小时前

06

15

快讯
瑞银:企业AI采用成本攀升源于使用量激增,市场对Token通胀风险存在高估

6 月 15 日,瑞银(UBS)在最新研报中表示,企业 AI 采用正面临 Token 和算力成本快速上升带来的新摩擦,但这一问题更多源于使用量激增而非单价通胀,整体风险或被市场高估。报告指出,随着 AI 编码代理等高强度工具的部署,企业 Token 消耗远超预期,这一现象已在投资者讨论中频繁出现,并引发对 AI 技术在企业端扩散速度可能放缓的担忧。


瑞银通过对约 13 家企业 IT 高管的访谈发现,约 60% 的受访组织已将 AI Token 和算力成本视为实质性问题,尤其在从简单聊天机器人转向自主运行的代理应用后,成本从固定 SaaS 支出转变为可变消费支出,预算可预测性大幅下降。


多数企业已或计划引入护栏措施,包括 Token 池化、模型降级使用、浪费提醒以及对重度用户的限制,以消除明显浪费而非全面遏制采用。部分高管明确表示不愿大幅限制员工使用 AI,强调「我们的目标就是让员工开始用 AI」,因此选择通过削减外部 IT 服务、整合云支出等方式优化其他预算来平衡上升的 AI 成本。报告强调,几乎所有受访企业都提到 AI 采用率正在加速,尤其在开发者团队,这表明成本上升主要由使用量增长驱动,而非单位成本通胀。


瑞银认为,这种情况属于企业正常的成本管控行为,并非 AI 采用受阻的信号,即使如 Uber 这类已将全年 AI 预算在一个季度内用完的公司,依然保持高 Token 限额并全力推进 AI 应用,同时通过提升工程师效率来对冲成本。


瑞银进一步分析称,AI 模型提供商和超大规模云服务商正加速推动 Token 效率提升,这可能限制近期价格上涨,并对云服务商份额分布产生影响,Google Cloud 和 AWS 凭借自研芯片与模型或在成本控制上获得优势。


同时,企业对使用量定价模式的抵触可能加大,或导致非 AI 软件支出环境进一步承压。结合此前进行的 140 家企业 AI 调查,报告指出「不明确的投资回报」仍是采用最大障碍,而「缺乏预算」尚未进入前五,但随着 Token 成本问题凸显,这一动态正成为企业更务实地优化 AI 部署的关键因素。