

进入 2026 年,全球半导体市场最先感受到的寒意来自存储领域。根据多家市场研究机构的报告,存储芯片价格的上涨已近乎"失控"。
根据 Counterpoint Research 与 TrendForce 的数据,继 2025 年第四季度价格暴涨 50% 之后,DRAM 与 NAND Flash 芯片的价格预计在 2026 年第一季度将继续上扬 40% 至 50%。
这一极端的价格压力迅速从上游传导至终端。以消费市场为例,部分主流 DDR5 内存条的价格自 2025 年下半年以来涨幅已超过三倍 。
对这个现象深度溯源,其实是 AI 基础设施,特别是大模型训练与推理对高带宽内存(HBM)和高性能存储的"虹吸效应"所致。
晶圆厂将产能优先分配给利润更高的 AI 相关存储产品,挤压了传统 DRAM 和 NAND 的供给,一场覆盖全行业的"算力税"已经拉开序幕。
但存储上扬只是序章,涨价轮盘上新近转来的,是 CPU。一、算力税第二波,CPU 涨价
长期以来被视为成熟市场的 CPU,在 2025 年下半年开始出现异动,并在 2026 年初彻底爆发。
资本市场的反应最为敏锐。截至 2026 年 1 月 21 日,芯片巨头英特尔(Intel)股价触及 54.25 美元,创下自 2022 年 1 月以来的新高,年初至今累计涨幅高达 44.74% 。它的竞争对手 AMD 股价同样录得七连涨。

在中国市场,国产 CPU 的代表龙芯中科和海光信息股价分别在 1 月 21 日创下 20% 涨停和上涨超 13% 的惊人记录。
这一系列现象的背后,供给侧的产能瓶颈是显而易见的。

根据 TrendForce 2026 年 1 月的供应链监测报告,台积电(TSMC)的 N2 与 N3 到 2027 年的产能,也已被苹果、英伟达(NVIDIA)及博通(Broadcom)等巨头瓜分。
由于高端 GPU 与定制 ASIC 在单晶圆产出价值(Revenue per Wafer)上相较传统 CPU 享有溢价,代工厂在产能分配优先级上存在明显的盈利倾向。
这种资源向高毛利产品的倾斜,直接削减了消费级与企业级处理器的晶圆配额。与此同时,先进封装技术(如 CoWoS-L/S)的瓶颈成为次生阻碍,IDC 分析指出,由于 CoWoS 产能利用率在 2025 年第四季度便已突破 100%,导致即便前端晶圆完成刻蚀,后端封装的积压也使 CPU 出货周期从正常的 8-10 周大幅延长至 24 周以上。
这种产能压力在英特尔的内部生态中体现得更为极致。随着其 18A 工艺进入量产高峰期,英特尔不仅需要保障自身酷睿(Core)与至强(Xeon)系列的供应,还需履行向微软、亚马逊等外部 Foundry 客户的代工承诺,导致英特尔核心节点的产能利用率已攀升至 120%-130% 的超负荷状态。
摩根大通最新的研报指出,这种"极限超载"已迫使英特尔将部分非核心组件转移至联电(UMC)等二线代工厂,但依然无法完全抵消先进制程供应的缺口。
然而,供给受限仅仅是故事的一半,真正重塑市场格局的,乐鱼体育官方网站是来自需求侧的结构性剧变。
而推高需求侧的关键词,就是智能体。
二、需求侧,智能体创造"域外 CPU "新需求
智能体能够自主规划任务、调用工具、记忆历史步骤,并在执行过程中实时调整策略来解决问题,人们通过这种方式来弥补单纯大模型在上下文感知、幻觉问题以及实时信息获取方面的不足。
在它的架构中,在大模型的推理工作之外,还增加了决策编排器,还会使用网页搜索、抓取、Python 解释器、上下文数据库等外部工具。
也就是说,整个智能体的工作负载中,AI 计算任务只是一部分,还有很大部分是通用计算。

在智能体运行任务中,CPU 的核心优势体现在对工具处理的适配能力、资源利用的灵活性以及对多种应用场景的兼容性。CPU 能够高效运行许多无法部署在 GPU/TPU/NPU 上的计算任务和外部程序工具,例如网页搜索、Python 执行、精确向量 / 数据搜索等。

这类任务处理在智能体任务总量中总耗时(Latency)占比很大。要知道,CPU 还支持多线程和多进程并行,天然可以根据负载特征进行动态调整。
为了进一步深度分析,我们需要引入两个概念:域内 CPU 和域外 CPU。

所谓域内 CPU,指的是 GPU 服务器中所配的 CPU,金沙电玩传统上来讲,装在 GPU 模组的服务器主机被称为机头,域内 CPU 指的就是机头里的 CPU。它的主要任务是解决内存相关问题和数据调度,确保 GPU 任务均衡、合理、高效。
所谓域外 CPU,指的是整个任务系统中,GPU 服务器以外的集群中的其他 CPU。
从系统视角来看,如果把整个智能体应用(Agentic AI)看成一个系统,根据上面的分析我们就知道,仅仅就 CPU 而言,起到性能决定性因素的,实际上是来自于域外 CPU。
{jz:field.toptypename/}首先是极高的 Latency 占比。在典型的 Agent 工作负载中,运行在 CPU 上的任务处理(如数据库检索、代码执行和搜索摘要)占据了任务总 Latency 的 80~90%。也就是说,系统运行时的大部分耗时都是域外 CPU 在处理任务,而不是消耗在 AI 芯片的推理上。

其次是复杂的计算模式。域外 CPU 需要处理大量非 AI 原生任务,比如说搜索、爬虫、抓网页,比如说运行 Python 脚本,还有排序和摘要算法。
还有并发和能效比。在大规模批处理场景下,由于核心负载和同步开销,动态能耗会上升。域外 CPU 的多核性能和调度能力和智能体服务的经济效率强相关。

三、传统的 CPU,新的增量市场
IDC 预计,活跃 Agent 的数量将从 2025 年的约 2860 万,快速攀升至 2030 年的 22.16 亿,年复合增长率达到 139%。年执行任务总数将从 2025 年的 440 亿次暴涨至 2030 年的 415 万亿次,年复合增长率高达 524%。年度 Token 消耗量预计从 2025 年的 0.0005 PetaTokens 暴增至 2030 年的 152,667 PetaTokens,年复合增长率高达 3418%。
这些数据揭示了一个关键趋势:单个 Agent 承担的任务复杂度、决策链路长度以及对实时性的要求都在指数级增长。
这将直接转化为对"域外 CPU "算力的海量需求。
Meta 近期斥资数十亿美元收购通用 AI Agent 初创公司 Manus,这是 Meta 成立以来第三大收购,仅次于 WhatsApp 和 Scale AI。这一举动充分说明了产业界对 Agent 应用前景的看好。
根据 Gartner 发布的《2025 年十大战略技术趋势》报告,智能体 AI(Agentic AI)被列为年度首要趋势,预测到 2028 年,全球约 33% 的企业级软件应用将集成智能体功能,而这一比例在 2024 年尚不足 1%。
企业端的采纳率数据进一步验证了这一增长的确定性。Capgemini 研究报告显示,2025 年企业对智能体及多智能体系统(MAS)的利用率已达 21%,较 2024 年的 10% 实现了翻倍增长。
同时,PwC 对 300 余位高管的调研显示,88% 的受访企业表示正因智能体带来的生产力红利而增加 AI 预算,平均 ROI 已达到 1.7 倍。Cloudera 的最新数据则显示,96% 的 IT 决策者计划在 2026 年前进一步扩大智能体的部署规模。
这种近乎一致的扩张意愿,提升了智能体的使用需求。
这是新的增长逻辑,也就会在资本市场带来新的增长故事。

基于当前 AI 技术和应用的发展趋势,智能体这一波推起来的通用 CPU 需求,不仅增长速度快,而且还是有持续性的。

这一趋势还处于早期阶段,但增长势头已经不可阻挡。按照任务总延迟来计算,域外 CPU 的需求增加不比 GPU/AI 芯片少。
如前文所说,Intel 的产能利用率据说已经达到 120~130%,而 AMD 主要靠 TSMC,前面已经提到,TSMC 的先进工艺产能尽量给了更 fancy 的 GPU,稍次一点的产能现在也已经满载,提升空间也不大。已经有消息表明,2026 全年 intel 和 AMD 的 CPU 配额已经被预定完毕。
同属于 X86 阵营的海光,是否可以为行业提供充足的供应,就考验着中国半导体供应链的韧性了。

在这样的情况下,CPU 价格在未来一段时间内怎么能轻易降下来?

备案号: