国产大模型集体转身

日期：2026-04-20 14:04:10 / 人气：18

过去六十天，国内大模型头部公司在集体做同一件事——从卖算力、做项目，转向卖Token、做订阅。你可能会好奇，为啥动作这么一致？我拆了一下，觉得有三件事同时发生了，把大家推到了同一条路上。
一、集体转身的三大推手

第一件，C端这口井，挖不动了。这事MiniMax替所有人验证过：2025年它全年收入7903万美元，海外收入占73%，整体毛利率25.4%。这已经是国内C端AI产品跑得最好的一家了，而其他C端AI助手，到今天没一家把商业化真正跑通。
Kimi K2.5更能说明问题。今年1月底发布，不到二十天，累计收入就超过了2025全年。数字看着迅猛，但拆开来看，核心增长全在海外。Kimi在内部信中透露，2025年11月以来，海外API收入增长4倍，海内外付费用户月环比增速超过170%——很明显，国内C端市场，真的挣不动了。值得一提的是，Kimi K2.5采用原生多模态架构，多项基准测试达开源SOTA水平，部分甚至超越GPT-5.2，其全球付费用户数翻两番，在Openrouter热度排名第三，成为国产大模型国际商业化的重要突破。
第二件，钱不好找了。这事最能说明问题的是DeepSeek。梁文锋过去三年一直说，幻方赚的钱够DeepSeek烧，但这话到2026年，再也说不下去了。过去一年，DeepSeek被精准挖走了五个核心成员：V2的关键开发者罗福莉去了小米，雷军开出千万年薪；R1核心研究员郭达雅去了字节Seed，传闻总包近亿；OCR核心魏浩然、多模态核心阮翀也先后离职。这五个人，覆盖了基座模型、推理、OCR、多模态四条核心技术线。
别人都在融资、扩团队，给顶尖研究员开天价，而DeepSeek“自己赚的钱烧自己”这套模式，彻底扛不住了。2023年那一轮融资，只要能讲AI故事就能拿到钱；但到了2026年，资本的要求变了——你得证明自己能造血。这个信号，传给了所有还在牌桌上的玩家。
第三件，海外那两个样本，太扎眼了。Anthropic的Claude Code，2025年5月正式公开发布，11月就做到10亿美元年化，2026年2月更是冲到25亿美元，三个月翻了一倍多。这个速度，当年Salesforce、Workday、ServiceNow那些后来成长为千亿美金的SaaS公司，谁都没跑出来过。
更猛的是Cursor。据TechCrunch 4月17号报道，Cursor正在以500亿美元估值融资，比去年秋天的293亿几乎翻了倍。今年2月它的年化收入达20亿，公司内部预计到年底能干到60亿。两个样本摆在那儿，信号很明确：一个靠卖Token赚溢价，一个靠做订阅赚续费，两条路都跑通了。于是，国内这几家头部公司集体转身，各自盯上了其中一条路。
二、两条可借鉴的海外路径：Token溢价与订阅续费
在深入分析国内公司的布局前，得先把这两条海外路径拆开看清楚。一条是Anthropic走的：做底座、卖Token、赚溢价；另一条是Cursor走的：做工具、做订阅、收续费。两条路的终点都是赚钱，但脚下的土壤，完全不一样。
先从Cursor说起——它是国内几家公司讨论最多、对标最密集的样本。了解过的人都知道，这家公司走得挺曲折：AI编程刚火那阵，Cursor是顶流明星，一个IDE插件就做到几十万日活；后来Claude、ChatGPT把编程功能嵌进自己产品里，还免费给用户用，Cursor的数据一下就被打下来了。那时，业内很多人都觉得它要凉了——巨头亲自下场，谁还会用一个套壳工具？
结果它不光没凉，反而涨回来了，还涨得比以前更猛。它靠什么？关键在于它脚下的海外土壤，这片土地上有三样东西，是中国目前没有的。
第一样，愿意掏钱的开发者基本盘。这事在国内看可能有点反直觉，但在美国真的太常见了：从几十年前JetBrains那会儿开始，写代码的人每年自己掏几百美元买IDE，就跟设计师买Photoshop、会计师用Excel一样，天经地义。工具是他们的吃饭家伙，花钱买好用的，没人觉得奇怪，这个习惯一直延续到现在。你看GitHub Copilot每月10美元，JetBrains AI助手每月20美元，大家都觉得合理。
Cursor定价20到200美元一个月，放在这个环境里就很正常。一个全职开发者一年工资十几万美元，花一两千美元买工具，连1%都不到。用着顺手就续费，不顺手就换，但绝不会为了省钱去用盗版——这就是Cursor的基本盘，几百万愿意每月为工具付费的开发者。
第二样，走通了二十年的企业采购流程。海外企业早就把“按席位订阅软件”这套玩法跑通了，这模式是Salesforce在1999年开创的。自那以后，企业软件就从“一次性买断加每年服务费”，变成了“按人头按月付费”。后来ServiceNow、Zoom、Slack、Notion、GitHub，一家接一家都走这条路。二十年下来，企业的IT采购流程、财务审批、预算科目、续费机制，全按这套模式搭好了。
举个例子你就懂了：公司招个新工程师，HR给他开账号的时候，顺手就把Cursor的席位加上，钱从IT预算里走，CFO根本不用专门审批；到年底续费，财务看一眼使用率和留存率，直接就续了。这套流程最值钱的地方，就是把企业付费从“一件要专门决策的事”，变成了“一个默认动作”。Cursor卖给企业时，相当于接了一条已经在正常流转的管道，省了太多麻烦。现在它60%的收入都来自企业客户，就是从这条管道流过来的。
第三样，分工明确的三层生态。海外AI编程有一套完整的分层生态，各司其职、互不越界：上游是Anthropic、OpenAI这些底座模型公司，专门负责把模型训练好、把API做好；中游是Cursor、Windsurf这些编程工具公司，负责把模型包装成开发者用着顺手的产品；下游是几千万开发者和几十万家企业，是最终掏钱的人。
这三层谁也不抢谁的饭碗：Anthropic赚Token结算的钱，Cursor赚订阅费，下游拿到好用的工具，三方都能获利。这个生态能跑起来，核心是Anthropic这种底座公司主动选择了“只做底座”——它把API开放出来，让Cursor、Windsurf，甚至做文档、做测试、做客服的公司，都能接它的模型去赚自己的钱。它不抢下游的生意，下游才敢放心把产品建在它的基础上。
最后就形成了一个正向循环：Anthropic越开放，下游生态越繁荣；下游生态越繁荣，调用它API的需求越大，Anthropic的Token生意就越好。这三样东西叠在一起，才长出了Cursor——所以说，Cursor不止是一个产品，更是一套环境里长出的果实。
三、国内六家大厂的押注：五种赌法，一条独路
那国内这片地上，能长出和Cursor一样的东西吗？六家头部公司，给出了不同的答案，各自押下了不同的赌注。
智谱赌“付费习惯能被教育出来”。这半年，智谱的路子很明确：砍掉了其他业务线，把全部资源压在GLM Coding Plan这一条腿上。2025年底推出时，套餐月费最低才3美元，海外媒体还特意给它起了个外号，叫“3美元版Claude Code”。结果不到半年，它连涨了三次价：2月12号GLM-5发布，整体涨幅30%起；3月16号GLM-5 Turbo出来，又涨20%；4月8号GLM-5.1发布，再涨10%。最高档直接从80美元涨到160美元，几乎翻倍。
智谱CEO张鹏在财报电话会上说，一季度接口调用价格涨了83%，但调用量还是增长了400%。敢这么连涨还能保住用户，意思很明显：智谱想用这组动作证明，国内开发者，也愿意为好用的Coding工具持续买单。
MiniMax赌“三条腿走路”。它过去的底子是C端，靠两亿用户堆出了一套流量打法。今年，它做了个关键动作：挖来了华为云原中国区副总裁、现新加坡总经理胡维琦。这个位置要的不是懂C端流量的人——华为云那套打法你可能有所耳闻：派专门的服务团队住进客户现场，跟着客户的实际业务做深度定制，把每一个央国企客户都当成十年的生意来经营。
这步棋很关键，相当于MiniMax跟自己说：C端的底盘不能丢，但得再练一套B端的功夫，这个过程，最快也得一两年起步。与此同时，AI编程这条线它也没放弃；智谱的GLM Coding Plan跑出订阅模式之后，MiniMax在模型和Agent上明显加大了压注力度，瞄的就是开发者这个赛道。C端、B端、开发者，三条腿同时伸出去，哪条先跑通就压哪条。
阿里赌的最大，它赌“规模能碾压所有对手”。3月16号，吴泳铭亲自下场，成立了ATH事业群，把通义实验室、MaaS业务线、千问事业部、悟空事业部、AI创新事业部全合到一起。CEO亲自挂帅，核心动作很直接：把AI业务的目标从“卖算力”改成了“卖Token”。
但阿里这一轮真正值得琢磨的，不止底座这一边；阿里云同时在变阵，上层应用这条线也在加码，悟空、秒悟这些AI产品一个接一个推出来。这些产品表面看是应用，往里拆其实都是一个个Agent，主要服务开发者和效率工作者这波人。阿里的算盘很清楚：上层应用用得越多，底座Token消耗就越大；底座Token卖得越便宜，上层应用就越能铺开；两头互相带动。这个打法的逻辑特别朴素：我家底厚，人多，资源调度快，只要方向没错，就用规模碾压对手。
字节走得最早，它赌“MaaS生态能自己滚起来”。Seed在2023年底就独立建制了，到现在跑了两年多，搭出了一套三层结构：Seed管模型，Flow管产品，火山引擎管商业化。数据摆在这儿：IDC的数据显示，2025年上半年中国公有云大模型调用量，火山引擎占了49.2%，超过第二、第三位的阿里云和百度智能云加起来还多。
字节押注的生态逻辑很简单：我模型够便宜，平台够好用，调用量就会自己涨；调用量涨了，上下游玩家就会围过来；玩家多了，生态就能自己养活自己。这个飞轮一旦转起来，速度会特别快。
DeepSeek有点不一样，它看着最没动作，动作可能最重。目前能拿到的消息是，它在死磕国产芯片适配：V4版本优先给华为昇腾和寒武纪做预发布，要从英伟达CUDA生态，硬生生切到华为CANN框架。这条路代价太大，节奏会明显变慢；V4从2月一直推到4月，还在隐身测试，市场对它的预期一直在往下调。它看起来像那个“掉队”的人。
但换个角度想，这条路也保住了一样别人都在放弃的东西：当其他家都绑死在英伟达和Token订阅的路子上时，DeepSeek还有别的选择。它赌的是，跑得快的未必能赢，留得住选择权的人，才能笑到最后。
还有一家，走了一条完全不同的路——百度。2025年百度AI业务收入400亿，其中AI云基础设施198亿，同比增长34%。但百度似乎根本不在意Token订阅这门生意，它走的是全栈路线：底层自己做芯片（昆仑芯），中间做模型、训练平台，往上做智能体、应用，从下到上一整条链，全是自己攒的。
百度的客户主要是金融机构、央国企、政府、大型制造业，一套打包方案卖给你。这种玩法，跟其他五家完全是两个物种——它干脆说，“我躺平做TOB生意就够了”。
四、转型困局：三条跨不过的坎
六家大厂，看着同一件事，动作天差地别：智谱、MiniMax、阿里、字节、DeepSeek，五种不同的赌法，百度则干脆另辟蹊径。那问题来了，这么多种押法，到底哪种能押中？或者换个问法：卖Token、做订阅这条路，到底学不学得会？
答案很明确：短期内，学不来。国内这片地上，长不出和海外一模一样的东西。这话听着有点绝对，但拆开来分析，就很清楚了——有三道坎，挡在所有国内玩家面前。
第一道坎，国内开发者不愿意掏钱。过去二十年，中国互联网的默认玩法是“免费”：从早年下载盗版软件，到后来找开源替代品，再到现在用破解版、白嫖免费版，写代码的人早就习惯了“工具不花钱”这回事。你让他每月掏20美元买工具，他第一反应不是“这工具值不值”，而是“为啥要花这个钱？有没有免费的？”
这种本能，是二十年攒下来的肌肉记忆，改变需要时间。Cursor的定价逻辑，放在美国没毛病；但搬到中国，一个标准档位的费用，差不多能吃掉初级工程师小半天的饭钱。与其花这个钱，他宁可花半小时去GitHub上找个免费替代品。这是第一头拦路虎。
更扎心的是第二道坎：海外位置早就被占死了。肯定有人会想，国内做不通，做出好模型卖到海外不就行了？海外开发者有钱、愿意付费，去赚他们的钱不好吗？答案是：不行，位置轮不到你。
3月底，Cursor发布了新一代编程模型Composer 2，宣传语吹得挺唬人，叫“前沿级编程智能”，但博客里压根没提它的底座是谁。三天后就被开发者扒出来了：Composer 2的底座是Kimi K2.5，藏都没藏干净；月之暗面预训练负责人杜宇伦在X上确认了，双方通过Fireworks AI平台有授权合作。
这事本身没啥瓜可吃——开源模型被二次训练、重新包装，在行业里本来就是常态。值得琢磨的是背后的账本：据《财富》报道，Cursor在ARR（年化收入）5亿美元时，每年付给Anthropic的推理费大约6.5亿美元。也就是说，每一块钱订阅费，背后的成本超过一块钱，它一直在赔本赚吆喝；直到把Kimi这种便宜的中国模型接进来，压下推理成本，才在企业客户那端实现了微薄的正毛利。
你品品这个账：品牌挂Cursor，订阅费全归Cursor，500亿美元估值也归Cursor；而Kimi在里面扮演的角色，就是个按Token结算的底座供应方，而且是“更便宜的那一个”。一个估值500亿美元的编程工具，靠压低上游中国供应商的价格，才救活了自己的毛利——这就是海外下游生态对国产模型的定价方式：海外的赢家吃肉，中国的供货商喝汤。
第三道坎，Token已经卖不出价钱了。说到这，肯定有人要反驳：OpenRouter上国产模型不是霸榜了吗？前五里占四席，这还不算赢？算赢，但只赢在调用量，没赢在收入。
OpenRouter是聚合平台，开发者拿一个API Key，就能在所有模型之间自由切换，哪个便宜用哪个。调用量大，只能说明海外开发者在频繁试用你；这跟背后有没有稳定的付费用户，完全是两码事。Cursor拿国产模型当底座能赚大钱，因为它有几千万订阅用户；而国产模型在OpenRouter上调用量再大，最终把订阅费变成真金白银的那一步，还是被海外生态收走了。我们看似参与了，其实只赚了点零头。
那有人会说，做底座生意也挺好，卖Token照样赚钱。这恰恰是最要命的地方——Claude Code能跑通订阅制，前提很简单：Anthropic的Token能卖溢价。Claude Opus的输出价是25美元每百万Token，靠这个单价，它能覆盖推理成本、训练成本，还能剩下毛利，订阅制的账才算得通。
再看国内：从2025年下半年开始，Token价格就被字节和阿里卷到地板价了。字节豆包进入“厘计价”时代，阿里千问主力模型降价97%。具体到编程模型，差距更吓人：MiniMax M2.5输出价1.2美元每百万Token，智谱GLM-5也就3.2美元。同样一百万Token，Claude能卖15到25美元，国产模型只能卖1到3美元——这个差距意味着什么？
Claude Code的订阅制商业模型，直接搬到中国来复刻，地基就少了五分之四。订阅制的账很朴素：用户每月给你付X块钱，你拿这笔钱覆盖推理成本，剩下的就是毛利。Anthropic能做到，因为它Token单价够高，订阅费减掉推理成本还有剩余；而国内Token单价只有它的1/5到1/12，同样一份订阅费，光推理成本就快不够覆盖了。
上游已经卷成红海，下游付费端还没长起来，中间这段，根本挤不出利润空间。
五、结语：Token经济的真实天花板
三道坎挡在前面，我们终于明白：产品能学得来，土壤学不来。国内大模型的集体转身，最终大概率会是这样一幅画面：六家公司都把Cursor、Claude Code的中间层各做一遍，在国内市场里互相内卷；底座那头，Token价格被卷到地板，规模做大，毛利做薄，每一分钱都得从石头里榨出来。
这，就是当前国产大模型Token经济的真实天花板。至于谁能在这场内卷中突围，谁能真正走出一条适合中国市场的商业化道路，还需要时间给出答案。

作者：恒达娱乐

国产大模型集体转身

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →