用户嫌贵但还在用！OpenAI和Anthropic可能找到了AI的付费场景

产品中心

发布日期：2026-05-30 10:50 点击次数：113

用户嫌贵但还在用！OpenAI和Anthropic可能找到了AI的付费场景

出品 | 网易智能

作家 | 小爪

裁剪 | 王凤枝

许多东谈主都把“小龙虾”忘了。

3月那阵子，它让许多东谈主第一次深切感到：AI不单会聊天，开动会首先了。各式智能体满天飞，总共东谈主都在聊“下一个操作系统级进口”。到了5月，除了少数发热友，没什么东谈主再掀开它了。

于是一个很当然的判断冒出来：智能体也凉了。

但着名工夫博主、开源诱惑者、AI用具挑剔者西蒙·威利森（Simon Willison）近日撰文《OpenAI和Anthropic可能照旧找到了PMF》，给了一个相悖的谜底。

西蒙认为，OpenAI和Anthropic可能照旧找到了PMF（product-market fit），让居品的确长在了用户的责任流里。不是因为聊天机器东谈主更会聊天，不是因为演示更能打动东谈主，而是因为Claude Code、OpenAI Codex这类编程智能体，照旧让一批用户从“碰侥幸”走到了“天天用、重度用、贵了也要用”。

用的东谈主多了，用量上去了，的确有效的AI以致开动变贵。小龙虾退烧，只可说聪慧能体叙事从干扰插足筛选；西蒙这篇著述要讲的，是另一件更硬的事：AI没凉，的确有PMF的智能体，开动插足用户账单、预算和责任流。

西蒙的中枢判断

这篇著述的要点，不是“编程智能体很强”，而是OpenAI和Anthropic可能终于找到了的确能变成收入的PMF。西蒙给出的判断圭臬也不复杂：用户会不会反复回首，居品会不会被塞进责任流，价钱变真实以后，用户是回身就走，如故开动想象如何无间用。

第一组字据，是使用深度变了。早期AI用具更多是低频试用：问一个问题、生成一段案牍、试一段演示，以为极新，但巧合第二天还掀开。Claude Code、Codex这类用具不不异，它们开动被放进每天的责任流里：读容貌、改文献、跑测试、解释报错、无间下一轮修改。用户不是来围不雅智商，而是在把一部单干作交给它鼓动。

第二组字据，是账单。西蒙用我方的使用量算了一笔账：他每月付100好意思元给Anthropic、100好意思元给OpenAI，一共200好意思元；但已往30天，若是按API token价钱折算，Claude Code不祥花掉1199.79好意思元，OpenAI Codex不祥花掉980.37好意思元，加起来是2180.16好意思元。也等于说，一个中重度用户在个东谈主订阅里“包住”的真实调用量，照旧接近订阅费的11倍。

这个反差很遑急。个东谈主订阅用户会以为我方赚到了，模子公司却会看到另一件事：编程智能体的真实使用量实足大，照旧不成再当成赠品了。当智能体确凿开动干活，它就不再是一次问答，而是一连串不雅察、推理、调用用具、修改、报错、再修改的高强度筹谋。

西蒙还提到，到2026年4月，OpenAI Codex和Anthropic的Claude Code / Cowork，企业使用都更获胜地对皆API价钱。OpenAI的Codex计价在4月从按音问转向更接近token用量；Anthropic的企业决策也从“企业订阅包含典型责任日用量”的念念象，转向“订阅费除外，使用量另按API价钱计费”。这意味着企业客户不再仅仅订阅一个AI软件，而是在为真实推理耗尽付钱。

这等于西蒙说OpenAI和Anthropic可能找到PMF的中枢字据：编程智能体不仅仅让东谈主以为酷，而是开动让用户舒心为真实使用付真钱。的确有PMF的居品，往往不是总共东谈主都坐窝沸腾，而是客户在预算会议上想象如何管控，而不是获胜取消。

为什么偏巧是编程智能体

这听起来像门径员小圈子的故事，其实不是。编程智能体先跑出来，不是因为门径员最爱尝鲜，也不是因为门径员最会写prompt，而是因为代码责任自然给了AI一套验收系统。

代码能不成跑，不错考据；测试过不外，不错考据；diff改了什么，不错查验；git能不成回滚，不错限度；日记、报错、类型查验、CI，都在给智能体提供密集响应。AI最危机的场合不是不会话语，而是它很会说，但你不知谈它到底作念对莫得。代码天下复杂、详细、容易出错，却也更容易把造作暴表示来。

这等于编程智能体和许多其他智能体的分水岭。一个会议智能体总结得好不好，经常需要东谈主再行读一遍；一个说合智能体给的贵寓靠不靠谱，5x社区精品视频在线播放18往走动要回源查对；一个销售智能体自动发邮件，出错等于品牌风险；一个金融智能体真能动账户，误操作就可能获胜变成失掉。越辘集真实业务，越需要权限、审批、审计、回滚和牵累界限。

编程智能体虽然也会犯错，但它们所在的经由更容易把风险关在一个可查验的鸿沟里。一个智能体改代码，你不错看diff、跑测试、让它重试，再决定要不要同一。换句话说，代码不是AI最浮浅的运用场景，却可能是最早酿成可靠响应闭环的复杂场景。

不外这也带来一个反向门槛：编程智能体用得越重，对东谈主的代码质料、架构分解和review智商条目越高。AI帮你写出代码，不等于你就能恒久热心它；它把构建门槛降下来了，也把验收和热心的牵累更清亮地推到东谈主眼前。

的确的门槛不是会不会写prompt，而是能不成给AI建验收圭臬。西蒙那篇著述里的PMF判断，背后其实等于这个逻辑。

智能体开动被筛选

已往一年，智能体这个词被用得太满了。什么都不错叫智能体：销售智能体、客服智能体、会议智能体、招聘智能体、财务智能体、个东谈主助默默能体。许多居品第一次演示时如实有冲击力，模子会我方分要领，会调用用具，会从一个网页跳到另一个网页，像是确凿开动替东谈主作念事。

但演示不是PMF。让AI自动跑十步，和让它每天相识完成一项真实责任，中拆开着高下文、权限、老本、安全、审计和失败兜底。用户第一次看到它能首先，会欣忭；第三次发现它会乱点、乱填、乱花token，就会开动问：它到底能接什么系统？谁批准它活动？它错了谁负责？我能不成回滚？

这不是说泛智能体都没长进。西蒙的写法其实更克制：咫尺最清亮看到PMF的，是编程智能体。其他智能体标的虽然也可能设立，仅仅它们还需要阐发我方能从“能演示”走到“能往常使用”。

会聊天的智能体不稀缺。会点按钮的智能体也不一定稀缺。的确稀缺的是能相识完成高频任务、能被考据、能被纳入真实经由、出错后能减弱事故半径、变贵后用户还舒心无间用的智能体。

西蒙文中提到的Microsoft和Uber案例，也不错放在这个角度看。企业预算被Claude Code之类用具提前耗尽完，名义上看像坏音问；但从居品角度看，它也阐发使用需求比原先预算假定强得多。预算疼，不等于居品莫得价值，许多时辰阐发居品照旧从“无关宏旨的新玩物”变成了“财务部门必须再行核算的分娩力用具”。

这亦然PMF的另一种样式。不是媒体无间欣忭，不是用户无间晒图，而是采购、财务和工夫团队开动谨慎想象：如何放胆用量，如何分派预算，如何把它放进正经经由。

这和野蛮东谈主有什么关连

对野蛮东谈主来说，氛围编程（vibe coding）的价值在于，许多念念法第一次不错低老本落地。一个网页、一个里面用具、一个自动化表格、一个报名系统，以前可能需要找诱惑、写需求、排期、外包，当今不错先作念出一个粗版块，拿给真实用户或共事看。

不外的确遑急的不是“东谈主东谈主都能写代码”，而是“东谈主东谈主都要学会验收AI作念出来的东西”。AI不错裁汰构建门槛，但不成替你承担热心牵累。一个原型能跑，和一个居品能恒久被使用，是两回事。

这也恰恰回到西蒙的判断：编程智能体先接近PMF，不是因为它们会写代码，而是因为代码天下有一套更清亮的验收机制。野蛮东谈主能从这件事里学到的，也不是写prompt的技能，而是若何把一个任务变成可推论、可查验、可修正的经由。

筛选开动了

智能体没凉，因为账单开动话语了。西蒙著述最故原理的场合在于，它莫得无间追问“模子又强了若干”，而是把问题换成了：谁照旧找到了用户舒心恒久使用、而且捏续付费的场景。Claude Code、Claude Cowork、Codex这些编程智能体，是咫尺最清亮的样本。

他顺遂算了另一笔账：这些公司不仅在收钱，推理调用越时时，算力老本越高。智能体从回话一句话变成辘集推论任务，终末会同期变成供应商的收入、客户的账单和云算力的压力。

小龙虾昂扬的降温，也不是赖事。它让想象从“什么都能智能体化”回到更朴素的居品问题：有莫得真实痛点，有莫得往常使用，有莫得验收闭环，有莫得价钱承受力。

若是谜底是yes的，会从玩物变成用具，从用具变成责任流，从责任流变成预算项；若是谜底暂时还不清亮的，就需要无间恭候真实使用来考据。

是以，不要问AI是不是凉了。

要问：哪些AI照旧开动让东谈主舒心付真实账单，哪些智能体还仅仅让东谈主看了一眼干扰。

前者才是PMF。

后者还在禁受筛选。

上一篇：崇拜动工！广州外洋金融城东区“七路组团”，片区能级跃升
下一篇：首款纯电Luce被喷不像法拉利？CEO急了：别拿中国电动车和咱们比