AI大模型2026年投资前景(大模型 ai) 99xcs.com

01 AI大模型可能率先产业化与变现的领域在B端

国家“十五五”规划明确:新一轮科技革命和产业变革加速突破,科技自立自强水平要大幅提高。重点领域关键核心技术要快速突破,并跑领跑领域明显增多。要加强原始创新和关键核心技术攻关。完善新型举国体制,采取超常规措施,全链条推动集成电路、工业母机、高端仪器、基础软件、先进材料、生物制造等重点领域关键核心技术攻关取得决定性突破。要加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等高效供给。全面实施“人工智能+”行动,以人工智能引领科研范式变革,加强人工智能同产业发展、文化建设、民生保障、社会治理相结合,抢占人工智能产业应用制高点,全方位赋能千行百业。

目前,人工智能产业仍在加速发展,带来的产业革命持续推进,带动算力行业需求爆发。北美以OpenAI为代表的公司,对未来的算力需求与投资给予了非常乐观的展望。如:2025年9 月,OpenAI与甲骨文签署了一份为期五年的算力采购协议,总价值约3000亿美元,2027年开始执行;2025年9月,OpenAI计划未来部署至少10GW英伟达系统,英伟达计划向OpenAI投资高达1000亿美元(随每GW部署逐步到位);2025年10月,OpenAI宣布将在未来数年内部署总计6GW的AMD GPU算力,首GW计划2026 年下半年开始部署;2025年10月,OpenAI宣布与博通达成长期战略合作,2026-2029年共同开发部署10GW的定制AI加速器及网络系统;2025年10月,OpenAI承诺向微软追加采购价值2500亿美元的Azure云计算服务;2025年11月,OpenAI又与亚马逊云科技(AWS)达成380亿美元的算力采购协议。中国以阿里为代表的公司,也对AI非常乐观:AGI(通用人工智能)已是确定性事件,但只是起点,AI 的终极目标是实现能自我迭代、全面超越人类的超级人工智能ASI。阿里正积极推进3800亿元的AI基础设施建设,并计划追加更大的投入,对比2022年GenAI元年,到2032年阿里云全球数据中心的能耗规模将提升10倍,这意味着阿里云算力投入将指数级提升。

我们认为,目前世界正处于AI产业革命中,类比工业革命,影响深远,不能简单对比近几年的云计算、新能源等,需要以更长期的视角、更高的视野去观察。因此,我们对AI带动的算力需求以及应用也非常乐观。其中,AI算力板块涉及先进制程、GPU/ASIC、光模块、PCB、服务器、交换机、光器件、铜连接、IDC及其配套(液冷、电源、电力、综合布线等)等,是板块性大行情,产业链个股普遍有机会,市值仍有空间。AI大模型及应用也应高度关注。我们认为,AI大模型可能率先产业化与变现的领域在B端,如编程等,AI算力大投入的背后一定需要大模型实现商业变现和闭环,建议要关注核心大模型公司。

久久小常识(www.99xcs.com)™

风险提示:

国际环境变化对供应链的安全和稳定产生影响,对相关公司向海外拓展的进度产生影响;关税影响超预期;人工智能需求过快增长,供给紧张导致出货及业绩兑现不及预期;人工智能行业发展不及预期,资本开支不及预期,影响云计算及算力产业链相关公司的需求;市场竞争加剧,导致毛利率快速下滑;汇率波动影响外向型企业的汇兑收益与毛利率,包括ICT设备、光模块/光器件板块的企业;数字经济和数字中国建设发展不及预期;电信运营商的云计算业务发展不及预期;运营商资本开支不及预期;持仓较高带来的交易型市场波动等。

02 国内外CSP持续加大资本开支,云业务与大模型应用表现亮眼

北美四家CSP厂商已经公布三季报,资本开支加速增长,同时各家对未来基础设施投资均继续保持积极态度。北美四大云厂商今年资本开支逐季提升:2025Q1资本开支总计773亿美元,同比增长62%;2025Q2资本开支总计958亿美元,同比增长64%;2025Q3资本开支总计1133亿美元,同比增长75%,环比增长18%。

在资本开支加速增长的背景下,近期北美CSP与Open AI等大模型厂商持续加大算力基础设施投入。亚马逊耗资110亿美元的“雷尼尔”项目数据中心正式启用,为Anthropic部署50万块自研Trainium2芯片,最终将容纳100万块Trainium2芯片;微软与Nebius、Nscale、IREN签署百亿美元级别的算力服务协议,进一步扩展GPU算力部署;谷歌宣布将在2027年前向南卡罗来纳州投资90亿美元,用于扩展谷歌在伯克利县的现有数据中心园区;Meta计划投资超过15亿美元在得州埃尔帕索建设一座GW级别的数据中心,同时与Blue Owl达成270亿美元合资协议,开发路易斯安那州Hyperion数据中心;Open AI与英伟达、AMD、博通分别达成10GW、6GW、10GW的算力合作,与微软、AWS分别签署2500亿美元Azure服务、380亿美元采购算力服务。

大模型应用数据与相关业务收入规模激增。2025年5月,谷歌表示系统每月处理的Tokens数量激增,从去年的9.7万亿增加到480万亿,增长将近50倍。2025年7月,谷歌每月处理超980万亿Tokens,较两月前翻倍增长。2025年10月,谷歌每月处理的Tokens超过1300万亿,一年内增长超过20倍。据The Information报道,OpenAI在2025年前七个月实现收入翻番,年化收入ARR达到120亿美元,远超2024年约40亿美元的水平,目标是2029年年收入达到1250亿美元,近期OpenAI CEO奥尔特曼表示公司年收入超过130亿美元,并有望提前实现千亿美元营收目标。2025年7月,Anthropic年化收入达40亿美元,较2024年增长近四倍,其中70%-75%由代码生成场景贡献。The Information数据:Anthropic将2025年营收预期上调26%至47亿美元,2026年预期上调28%至152亿美元,2027年预期上调13%至389亿美元,到2028年营收将突破700亿美元。

国内CSP厂商季度资本开支略有波动,整体仍保持较高投资强度。2025年第二季度,阿里巴巴的资本开支达到386亿元,同比增长220%,环比增长57.1%,创下单季历史新高。2025Q2阿里云业务营收333.98亿元,同比增长26%,AI相关收入继续保持三位数增长,外部商业化收入中AI贡献已超过20%,AI需求快速扩大,同时带动计算、存储及其它公有云服务需求上升。在财报电话会上,阿里巴巴CEO吴泳铭披露,过去四个季度,阿里已经在AI基础设施及AI产品研发上累计投入超1000亿元。公司已为全球AI芯片供应及政策变化准备“后备方案”,通过与不同合作伙伴合作,建立多元化的供应链储备,从而确保投资计划能够如期推进。阿里2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭表示,目前阿里正积极推进3800亿元的AI基础设施建设,并计划追加更大的投入,为了迎接超级人工智能(ASI)时代的到来,对比2022年GenAI的元年,到2032年阿里云全球数据中心的能耗规模将提升10倍,这意味着阿里云算力投入将指数级提升。2025年第二季度,腾讯的资本开支为191亿元,同比增长119%,公司表示在AI方面一直在大量投入,同时未来还会继续加大投入力度,但需要以合适的节奏进行。公司正在部分游戏、微信、广告等多方面加大人工智能的应用,同时不断升级混元基础模型的功能,推动AI原生应用元宝的使用。

03 海外大模型开始加速实现商业化落地

进入 2025 年,大模型的应用落地进程呈现显著加速态势。我们总结了目前海外典型大模型ARR(年化收入,亿美元)情况,OpenAI已实现超过120亿美金ARR,月度CAGR仍然保持10%的环比增速,Claude4凭借代码优势,10个月的时间从10亿美金奔向70亿美金,并有望在年底达到90亿美金,月度CAGR超过20%的环比增速,海外大模型开始加速实现商业化落地。

1)目前整体呈现强“头部平台 + 长尾应用”结构。按 ARR 切分可见三个明显层级:超大体量(>40亿美金)由通用平台把持(OpenAI、Anthropic、Databricks、Canva),其后是 5–15亿美金的企业应用与横向工具(Deel、Fullscript、Rippling、Ramp、Samsara、Notion 等),最后是1–5亿美金的专业垂类与新兴 AI-native(Cursor、Cohere、HeyGen、ElevenLabs、Perplexity、Aiven 等)。这说明通用模型与数据平台依靠强大的平台效应或广泛的客户群迅速商业化。

2)榜单前二十中出现了大量B端AI应用,包括上游(模型/数据/平台)和企业工作流(ERP/人力/安全/合规)。如“AI 编程/工作流自动化”成为新增长锚点,Cursor、Cognition(Devin+Windsurf)、Replit、Usercentrics、Customer.io 等显示出 AI+开发的强劲变现能力:一是高频、刚需、可快速替代人工(如程序员);二是从开发者自下而上渗透到B端批量采购。传统软件厂商(如 Databricks、Canva、Notion、Deel、Rippling)依靠既有客户基座与数据资产快速把AI能力嵌入,形成“功能增购/套件化”收入,强客户粘性是显著优势。

3)C端(图像/视频/配音/伴侣类)多数处于1–3亿美金区间,增速快且空间大。且多模态内容生产正由“工具”走向“渠道与平台化”。HeyGen、ElevenLabs、Otter.ai、Perplexity等的 ARR 进入 1-2亿美金档,核心不止是模型效果,而是模板化工作流、资产管理与分发渠道:例如一键生成/配音/字幕/多语版本到企业素材库,或将搜索问答转化为“可引用、可复用”的知识单元。

风险提示:

北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;疫情影响公司正常生产和交付,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工业智能化进展不及预期;半导体扩产不及预期等。

04 推理时代已全面开启,大模型行业正走入智能体阶段

GPT4系列基础模型表明,预训练受到Scaling Law限制愈发明显,仅提升参数规模、扩大数据集对模型性能的提升边际递减。而后训练、测试时扩展方兴未艾,DeepSeek-R1等实践证明推理时代已全面开启;GPT-5、Gemini 2.5 pro强大的代码能力则说明大模型行业正走入智能体阶段。

回到国内,2023年至今,国内外大模型能力持续发展,目前依旧呈现百花齐放的态势。国内模型经历了一年多的迭代周期后,与OpenAI的差距从2023年5月的30.12%,缩小至2024年8月的1.29%。DeepSeek R1、Qwen系列、豆包、MiniMax等模型相继发布,模型能力滚动提升。2025年“人工智能+”被写入政府工作报告,

未来中国大模型行业或将呈现以下趋势:一是技术创新加速,聚焦多模态、具身智能等前沿领域;二是应用场景深化,垂直行业渗透(如医疗、制造)与消费级终端(AI手机、智能汽车)齐头并进,API调用量爆发式增长;三是生态构建起步,通过开源开放降低门槛。

机器人模型领域目前主要沿着两条路线进行,分别是大脑增强路线(结合大模型)以及小脑运动控制路线(强化学习)。2022-2023年,谷歌机器人模型发展主要集中在大规模的模型训练和跨领域应用方面,例如RT系列(包括RT-1和RT-2)的推进,以及将这些模型应用于物理环境中的实际操作和任务规划。2024年以后,谷歌进一步推进了如AutoRT、RT-Trajectory等新技术,并在2025年目标推出更加智能化的Gemini机器人系统,同时结合深度学习和强化学习技术实现更复杂的任务自动化。

风险提示:

北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;疫情影响公司正常生产和交付,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;汽车与工业智能化进展不及预期;半导体扩产不及预期等。

05 OpenAI持续引领大模型演进,驱动AI迈向多模态与智能体融合新阶段

GPT-5引领AI大模型迈向统一智能阶段。2025年8月,OpenAI正式发布GPT-5,这是一项继GPT-4o之后最具战略意义的升级。与以往单一模型体系不同,GPT-5被定义为一个统一智能系统,不再区分推理、多模态与Agent模型,而是通过内置的实时路由器在理解用户Prompt后,动态调用最合适的模型与工具,实现跨模态、跨任务的协同处理。GPT-5在编程、文本创作及医疗健康问答等场景中的表现显著提升,具备更低的幻觉率与更强的代码能力。虽然整体性能提升较GPT-3至GPT-4的跨代跃迁更为平稳,但GPT-5在推理效率与成本控制上取得重大突破。其API调用价格较 GPT-4o显著下降——输入端由2.5美元/百万tokens降至1.25美元/百万tokens,而输出端保持10美元/百万tokens。该降本优化将进一步推动大模型的普及与商业化落地。

Sora2推动AI视频生成物理一致性大幅提升。2025年9月,OpenAI推出了新一代文生视频模型Sora 2,标志着多模态生成技术从静态图像迈向高保真、可交互的视频阶段。相比首代 Sora,Sora 2在时空一致性、角色连续性和物理模拟等方面实现大幅提升,能够在单个视频中保持场景、光影和人物动作的逻辑连贯,并同步生成对应的语音和环境音效。模型引入了“世界建模(World Model)”思路,使其在生成内容时能推演物体运动与因果关系,而非仅进行像素层预测。Sora2大幅降低了普通用户创作视频的门槛,也为AI大模型找到了重要的商业化落地场景,被称为“视频领域的GPT-3.5时刻”。OpenAI同期上线的iOS应用Sora2 APP,仅用5天时间达成百万下载,显示出强劲的用户接受度与市场潜力。

OpenAI打造“从入口层即具备AI能力”的产品形态,引领人机交互迈入智能协作的新阶段。OpenAI又在10月发布了ChatGPT Atlas——一款以ChatGPT为核心构建的桌面智能浏览器。Atlas将GPT系统直接整合进浏览器/工具环境,使其能理解用户所处的网页情景、记忆历史对话、主动选择调用模型或工具,并在用户界面内完成复杂任务。这款产品不仅是对ChatGPT功能的扩展,更是一次对互联网访问方式的重塑。ChatGPT从问答式助手正式升级为覆盖搜索、浏览与执行任务的全方位“超级入口”。OpenAI期望通过Atlas让ChatGPT成为用户与互联网世界的主通道,直接承担网站访问、社交媒体互动与在线服务操作等任务,预示着未来Web使用形态将逐步转向AI代理式浏览——让用户专注于决策与创造,并将信息获取与操作直接交由智能体完成。对于产业来说,这既是对“模型→API”阶段的延伸,也是“模型→智能体/应用平台”阶段的开端。

风险提示:

1、未来中美贸易摩擦可能进一步加剧,存在美国政府将继续加征关税、设置进口限制条件或其他贸易壁垒风险;

2、AI上游基础设施投入了大量资金做研发和建设,端侧尚未有杀手级应用和刚性需求出现,存在AI应用不及预期风险;

3、宏观环境的不利因素将可能使得全球经济增速放缓,居民收入、购买力及消费意愿将受到影响,存在下游需求不及预期风险;

4、大宗商品价格仍未企稳,不排除继续上涨的可能,存在原材料成本提高的风险;

5、全球政治局势复杂,主要经济体争端激化,国际贸易环境不确定性增大,可能使得全球经济增速放缓,从而影响市场需求结构,存在国际政治经济形势风险。

06 AI技术商业化进程加速,大模型进入应用变现与基础设施竞速时代

AI大模型厂商的用户与收入规模仍处于快速扩张期。截至2025年10月初,ChatGPT的全球周活跃用户数量已突破8亿人,较2024年底的约3亿实现翻倍以上增长。用户规模的快速扩张,也带动了OpenAI整体商业化能力的跃升。根据The Information的报道,OpenAI在2024年底的年经常性收入(ARR)约为55亿美元,而到2025年前七个月,其ARR已达到约120亿美元,实现收入翻番。与此同时,Anthropic的增长势头更为迅猛,其ARR在2025年初仅约10亿美元,但至年中已攀升至50亿美元,半年增长近五倍。两家公司在规模与生态扩张上的竞速,标志着AI大模型正进入“应用变现”阶段——从以模型参数和性能为主导的竞争,转向以用户留存率、商业渗透率为核心的可持续增长。

伴随AI应用落地加速,CSP也在加快资本开支,押注AI基础设施建设。全球几大头部CSP明显感受到AI技术对收入和运营效率带来的提升,并纷纷进行史上最大规模的基础设施投资。以Google为例,其云业务营收在25Q3达到152亿美元,同比增长34%,其中AI相关收入已达到“每季度数十亿美元”的规模。同时,AI正在重塑谷歌核心搜索业务体验,自推出以来实现了强劲的周环比增长,本季度搜索查询量翻了一番,目前拥有超过7500万日活跃用户。Google每月处理的Token数量从7月的980万亿增长至超过1300万亿,一年内增长超过20倍。受此推动,谷歌将2025年资本开支预期从850亿美元上调至910-930亿美元,并明确表示2026年的资本开支将显著增加。

风险提示:

1、未来中美贸易摩擦可能进一步加剧,存在美国政府将继续加征关税、设置进口限制条件或其他贸易壁垒风险;

2、AI上游基础设施投入了大量资金做研发和建设,端侧尚未有杀手级应用和刚性需求出现,存在AI应用不及预期风险;

3、宏观环境的不利因素将可能使得全球经济增速放缓,居民收入、购买力及消费意愿将受到影响,存在下游需求不及预期风险;

4、大宗商品价格仍未企稳,不排除继续上涨的可能,存在原材料成本提高的风险;

5、全球政治局势复杂,主要经济体争端激化,国际贸易环境不确定性增大,可能使得全球经济增速放缓,从而影响市场需求结构,存在国际政治经济形势风险。

07 国内外大模型加速迭代,差距进一步缩窄

2024年以来,国内外模型均加速迭代。其中海外各家大厂模型能力侧重有所不同,OpenAI通过GPT-5统一了O系列和数字系列模型,并聚焦幻觉率下降以适配用户落地需求;Anthropic的Claude围绕编程能力不断优化,Sonnet 4已支持百万token上下文;xAI基于20万GPU集群开发的Grok 4引入了多个智能体共同思考的模式,其RL投入的算力已超过Pre-Training算力;Google Gemini和Veo模型则分别对应Chrome和YouTube产品生态。国内由阿里主导开源生态,围绕“全尺寸”“全模态”“多场景”推出各种模型;初创厂商中DeepSeek及MiniMax亦入局争夺开源第一宝座,DeepSeek-R1、MiniMax-M2模型均以较低成本实现较高性能。

随着国内外模型进一步迭代,预计国内开源阵营头部模型能力与海外大厂闭源模型差距将进一步缩窄,并通过成本优化为AI应用打开空间。

2024年以来海外头部厂商模型迭代加速。随着人工智能技术的持续发展,2024年以来海外头部厂商的模型更新频率明显加速。以OpenAI为例,其2024年推出了包括拥有多模态处理能力的数字系列模型GPT-4o、GPT-4o mini、GPT-4 Turbo,具备推理能力的O系列模型o1-preview、o1-mini、o1、o3、o3-mini,并正式发布年初爆火出圈的视频生成模型Sora;2025年则延续2024年的密集更新节奏,对应模型能力亦加速迭代。

国内前沿模型与海外差距缩短,多方角逐开源阵营领先地位。横向对比各厂商大模型能力,尽管以OpenAI为代表的海外厂商持续引领技术优势,但国内前沿模型能力同样始终位列全球第一梯队,且较海外头部厂商的差距已由最初的6个月以上缩短到目前的约3个月。就厂商而言,阿里作为国内唯一践行全面开源战略的互联网大厂,持续引领国内开源模型风向;但也不乏DeepSeek、MiniMax等初创厂商在开源领域崭露头角。

风险提示:

(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:目前国际形势动荡,对于海外收入占比较高公司可能形成影响,此外美国不断对中国科技施压,导致供应链安全风险。

08 大模型Token调用量快速增长,下游AI应用渗透率处于快速提升趋势

今年以来大模型Token调用量的快速增长,也同样反映下游AI应用渗透率处于快速提升趋势、AI与传统工作流的融合程度迅速深化。

1)从头部大模型的Token调用量看:谷歌Gemini目前月度Token消耗量整体达1300万亿,较7月增长33%,同比24年同期增长超10倍。同时谷歌在三季报业绩会中披露,目前Gemini模型的API调用量为每分钟70亿token,折合单月约300万亿Token,在整体调用量中占比23%。10月初OpenAI则官宣目前API每分钟Token调用量60亿(不含C端调用),是两年前的20倍,折合每月259万亿。国内的大模型Token调用量同样呈现快速增长态势,截至2025年9月底豆包大模型日均Tokens调用量已突破30万亿,相比今年5月底增长超80%。折算后目前月度Token调用量达900万亿,接近谷歌Gemini的规模。

2)从OpenRouter的Token调用量增长趋势看:OpenRouter是全球头部的大模型集合平台(大模型API的中间商),上线了Gemini、Qwen、Claude等主流模型,用户主要为海外中小体量的AI应用。OpenRouter会周度披露该平台上各个模型的调用情况,10月周度调用量在5万亿附近,较年初增长9倍左右。今年以来出现两轮快速增长期1)今年一季度:周度Token调用量从年初的0.5万亿增长至3月底的2.0万亿,增幅300%,主要是以DeepSeek R1为代表的推理模型渗透率提升;2)今年三季度:9月底为5万亿,较7月初增长110%,显著高于二季度增幅2%。

一季度大模型token调用量增长的导火索主要是DeepSeek R1的全球出圈。一方面,R1的领先性能提高了用户对推理模型的认知,推理模型凭借准确度高、逻辑能力强的优势快速被大范围采用,且单次推理消耗的Token数约为LLM的10倍,从而驱动整体Token量快速增加。据Poe根据自身平台上的模型使用情况统计,推理模型接收到的文本消息占比从25年初的不足2%快速增加至10%左右。另一方面,R1降低应用开发门槛,更多开发者参与AI应用研发。DS的V3和R1在Github接收到的累计点赞数,在短时间内即超过发布半年以上的Llama3、Qwen2.5等模型,反映开发者对R1和V3的性能认可。

三季度全球大模型进入新一轮迭代周期,更好的模型效果提升下游应用渗透率,驱动整体Token调用量提速增长。5月起新模型发布密集,驱动下游应用效果和使用量提升,用户付费意愿也相继增加。下图展示了各厂商旗舰模型的综合性能与发布时间,5月开始以GPT5、Gemini2.5 Pro、Claude4、R1(0528)为代表的新模型发布,模型性能天花板快速提升,下游应用的使用效果也相应提升。其中AI编程场景落地较快,目前贡献OpenRouter超过40%的Token调用量。

风险提示:

版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。

久久小常识(www.99xcs.com)™