AI 创业入场自检
套壳可以赚钱,但套壳不是终点。真正的问题是:当模型升级、竞争涌入、融资窗口关闭,你手里到底有没有能留下来的东西?
阅读地图
五个问题,决定一个 AI 项目是在做工具,还是在建壁垒。
01-工作流
你解决的是 API 调用问题,还是完整工作流问题?
02-差异化
你的价值会被平台升级削弱,还是被平台升级放大?
03-数据飞轮
每新增一个用户,产品有没有变得更聪明?
04-MVP 心态
套壳是验证需求的手段,还是你打算长期依赖的商业模式?
05-技术自主
团队里有没有人能做出独立技术决策?
先说实话:套壳能赚钱。过去一年,我见过太多人用一个漂亮的界面包住OpenAI的API,收月费,月入几万美金。有些甚至赚到了百万。
但我也见过更多人,在同一个赛道上,产品上线三个月就死了。死因不在技术。他们以为套壳就是终点。
这篇文章写给准备入场的人。来审判谁的是非没意义,我只是给你一面镜子。你拿去照照自己正在走的路。
00.一个残酷的事实
2024到2025年,AI创业圈死了两间做同一件事的公司,AI合同审查。它们死在完全不同的原因上。
一间叫Robin AI。2019年在伦敦创立,创始人是前高伟绅律师事务所的律师配一个机器学习研究员。背景无可挑剔。产品方向也很聪明:没做一个独立App跟客户说”来用我们的AI审合同”。它把AI合同审查直接嵌进了Microsoft Word。律师本来就在Word里改合同,现在AI自己把条款偏差标出来,不需要切换任何工具。
客户名单很好看。瑞银、PwC、百事可乐,13家财富500强,峰值ARR约1000万美元。融了两轮,2024年初刚拿到2600万。
2025年底,Robin AI倒闭了。

它死于一个更基本的问题:赚回来的钱不够花出去的。 50人的团队,企业客户的长销售周期,AI推理成本在涨,客户获客成本也在涨。一笔5000万的新融资没能关上,公司进入破产接管。服务部门卖给了Scissero,工程团队被微软吸收进了Word的AI团队。
另一间叫Builder.ai。这家更离谱:融资超过4.5亿美元,微软、软银、卡塔尔投资局都投了。它声称AI助手”Natasha”能自动化80%的移动应用开发。后来 whistleblowers 曝出真相:大部分代码是印度人类工程师手写的,“AI”只是一层皮。2025年5月,Builder.ai申请破产,收入从宣称的1.8亿美元修正到4500万,欠亚马逊8500万、微软3000万。
两间公司,死因天差地别。Robin AI用真AI做了真产品,有真客户。Builder.ai连AI都没有。
但它们共享一个致命的共同点:都没能在产品之外,建立可持续的商业壁垒。
Robin AI做对了很多事:嵌入工作流、理解垂直场景、不卖”AI”卖”效率”。但它忽略了一件更底层的事:在”套壳”模式下(底层调用OpenAI的模型),如果单位经济模型不成立,产品做得再好也是给投资人打工。它的客户会续费,但每续一个客户,公司不一定在赚钱。
这引出一个比”套壳是对是错”更尖锐的问题。我们对Robin AI的失败应该问的是:为什么一个做对了几乎所有事的公司,还是会死?答案在下面的五道题里。
01.第一题:你解决的是一个API调用问题,还是一个完整工作流的问题?
这是最容易被忽略、也最关键的一道题。
很多人做AI产品的起点是这样的:看到别人用ChatGPT写邮件、做翻译、生成图片,觉得”这个体验可以更好”,于是做了个更漂亮的界面,调用了同样的API,然后收费。
这种产品解决的是”调用API”的问题。用户本可以直接去OpenAI官网用,你的价值只是”界面更好看一点”或者”操作少两步”。这种价值很薄,薄到OpenAI自己加个功能就能把你碾平。
但还有一种套壳,它解决的是”完整工作流”的问题。Robin AI在这一点上,其实是做对了的。

律师审合同不是”把合同丢给AI问意见”这么简单。他们的真实工作流是:收到合同→快速浏览找出关键条款→标记风险点→对比公司内部模板→给业务部门写审查意见→跟进修改→最终归档。Robin AI看懂了这一点,所以它没做一个”更聪明的ChatGPT”。它把AI直接嵌进了Microsoft Word。律师本来就在Word里改合同,它就在Word里自动标出条款偏差、高亮风险点。不需要切换工具,不需要上传下载,不需要改变任何习惯。
对Robin AI的早期客户来说,这个价值是真实的。客户不说”AI好厉害”。他们说:“我审一份合同的时间从4小时变成了40分钟。” 他们卖的不是API的便利,是工作流的效率。
这就引出了一个让人不太舒服的问题:如果Robin AI做对了这道题,为什么还是死了?
原因是:工作流效率这一层护城河,虽然在”API提供商抢不走”这个意义上是成立的,但它在”能帮你赚钱”这个意义上,可能比你以为的要浅。嵌入Word确实是壁垒。UBS和PwC不可能因为OpenAI降价就把整套流程切走。但这个壁垒只够让你活下来,不够让你脱离套壳带来的结构性劣势:你的利润率被上游API定价锁死。
所以第一题的正确答案,不只是”我解决了工作流问题还是API调用问题”。那道题的完整版本应该是:你解决了工作流问题之后,还能不能解决单位经济模型的问题?
02.第二题:你的差异化存在于现在,还是存在于平台升级之后?
OpenAI、Google、Anthropic这些公司,每几个月就升级一次模型。每次升级,能力变强,价格变低,功能变多。
如果你的差异化建立在”我调用了当时最强的模型”上,那你的护城河就是别人的产品路线图。模型越升级,你的差异化越薄。
我见过一个做AI写作助手的团队,2024年初上线时主打”基于GPT-4的高质量长文生成”。当时GPT-4确实是市面上最强的长文本模型,他们的产品体验也确实比直接用ChatGPT好一些。产品上线前三个月,增长很快,用户反馈也不错。
然后GPT-4 Turbo出来了,上下文窗口从8K扩展到128K。Claude 3紧随其后,长文本能力更强。GPT-4o也来了,速度更快、更便宜。
每一次模型升级,都有一部分用户回流到直接使用官方产品。因为官方产品的长文本能力在变强,而这个团队的核心卖点,“我能生成高质量长文”,正在被上游免费赠送。
到2024年底,这个产品的月活掉了60%。团队试图增加”写作模板”“风格定制”等功能,但这些也只是延缓死亡,不是逆转。
真正安全的差异化,建立在”模型升级后,我的价值反而更大了”这个基础上。跟”我现在用了什么模型”无关。
怎么做到?
第一种:垂直深度。
你深耕一个极细分的领域,积累了大量专有数据和领域知识。模型再升级,它也不知道”这个行业的合规红线在哪里”“这个客户的风格偏好是什么”“这个场景下的常见陷阱有哪些”。这些知识是你一点点攒出来的,模型提供商不会为这么小的细分领域专门训练。
比如做医疗影像AI的公司,底层可能也是调用现成的视觉模型,但他们花了三年时间,和50家医院合作,标注了几十万张特定病种的影像,建立了独有的标注标准和质量控制流程。模型升级了,他们可以换更好的模型,但那三年的数据积累换不走。
第二种:网络效应或数据飞轮。
每多一个用户,你的产品就变得更好了。这种飞轮,模型升级反而能加速。

举个例子:一个做客服自动化的AI工具。它的核心价值不在”能自动回复常见问题”。每处理一个工单,系统就学到一点这个客户行业的特定知识。处理了一万个工单后,它知道这个行业的用户最爱问什么、最头疼什么、最容易在哪里卡住。这些知识沉淀在系统里,形成了壁垒。
模型升级了,这些知识可以直接迁移到新模型上,让新模型的表现更好。模型越升级,你的飞轮转得越快。这才是健康的差异化。
自检:
问自己:如果明天OpenAI发布了一个能力翻倍、价格减半的新模型,你的产品是更值钱了,还是更不值钱了?
- 如果更不值钱了。你的差异化在现在。
- 如果更值钱了。你的差异化在未来。
只有后者才值得长期投入。
03.第三题:每新增一个用户,你的产品有没有变得更聪明?
这个看似抽象的问题,其实是一个极硬的商业指标。
大多数套壳产品,第1个用户和第10000个用户得到的体验,几乎完全一样。因为产品本身没有学习能力。它只是在重复调用同一个API,用同一套prompt,处理不同的输入。
这种产品叫”线性产品”。用户增长,收入线性增长,成本也线性增长。没有规模效应,没有网络效应,没有飞轮。每新增一个用户,你的毛利率不会改善,用户体验不会提升,产品不会变得更聪明。
真正有价值的AI产品,应该是”超线性”的。每新增一个用户,整个产品都变好一点点。
这个”变好”可以是很多形式:
- 数据积累:用户产生的数据被用来微调模型,让后续用户的体验更好
- 知识沉淀:用户的使用模式被分析,系统学会了”这个行业的人通常先关心A再关心B”
- 社区效应:用户之间可以共享模板、工作流、最佳实践,形成生态
- 反馈闭环:用户的反馈(点赞、修改、投诉)被自动收集,用来改进系统
举两个例子对比。
Notion AI(线性产品的代表)。你在Notion里调用AI写一段话,这段对话的数据不会被用来改进Notion AI的整体能力。你的使用体验,和全世界其他几百万用户的使用体验,是完全独立的。Notion AI的价值,几乎完全取决于底层模型的能力和Notion团队的prompt工程水平。这是一层很贵的皮。
Grammarly(超线性产品的代表)。它早期也是基于规则的语法检查工具,后来逐步引入了ML模型。但它的核心壁垒不在模型。是二十年来积累的海量用户写作数据。真实的语法错误、真实的修改偏好、真实的写作场景。每多一个用户,Grammarly就多了一个数据点,模型就多学了一点。这种飞轮一旦转起来,后来者很难追上。
注意:Grammarly早期的技术一点也不”先进”。它就是一套规则引擎加简单的统计模型。但它很早就建立了数据飞轮的意识,把用户交互数据作为核心资产来积累。这才是关键。
自检:
你的产品有没有一个自动化的机制,把用户的使用数据转化为产品改进?
- 如果没有。你在做线性产品,规模越大越辛苦。
- 如果有,你在建飞轮,前期慢,后期会加速。
这个机制不需要很复杂。它可以简单到”每次用户修改了AI的输出,系统就记录这次修改,每周自动分析高频修改模式,更新prompt模板”。关键是有意识的建立,而不是完全依赖人工运营。
04.第四题:套壳是你的MVP策略,还是你的商业模式?
这是心态问题,也是战略问题。
很多成功的AI产品,起点都是套壳。这不可耻,甚至很明智。它让你用最低的成本、最快的速度验证需求。
但MVP(最小可行产品)和商业模式之间,有本质的区别。
MVP套壳的心态是: “我先做个最简单的版本,快速上线,看看有没有人愿意付费。如果有,我再投入资源做深度:自建模型、积累数据、嵌入工作流。套壳只是验证假设的手段。”
商业模式套壳的心态是: “我就做这个了。用户愿意付费,说明模式成立。我把精力放在获客和运营上,技术交给API提供商。”
这两种心态的差别,在顺境时看不出来。市场好、竞争少、用户新鲜的时候,商业模式套壳也能赚钱。但一旦市场降温、竞争者涌入、用户对”又一个AI工具”产生疲劳,差别就显现了。
2024年的AI工具市场就是这样。上半年,几乎任何套了层皮的产品都能拿到用户。到了下半年,同一个品类出现了十几个竞争对手,获客成本翻了三倍,用户流失率飙升。那些把套壳当商业模式的团队,突然发现自己在打一场打不赢的价格战。因为大家的底层能力完全一样,差异化只剩UI和营销。
Robin AI卡在了一个更尴尬的位置。它不属于典型的商业模式套壳,它真的做了工作流集成,也有一流客户。但它从来没有认真回答过一个硬问题:我们的单位经济模型,在不烧钱的情况下能跑通吗? 它的ARR在涨,但成本涨得更快。当你靠融资活着的时候,这个问题很容易被忽略,投资人会说”先做增长,利润之后再说”。但当融资窗口关上,这个问题的答案就是生死线。
而那些把套壳当MVP的团队,在验证需求的同时,已经在默默做三件事:
- 积累专有数据:用户的输入、反馈、修改记录,全部结构化存储
- 深化工作流集成:从”一个独立工具”变成”嵌入用户现有工作流的一部分”
- 建立技术团队:招募能调模型、建pipeline、处理数据的人,为自建核心能力做准备
当竞争白热化的时候,前者在降价求生,后者在换更好的模型、推更深的集成、靠数据优势拉开差距。
自检:
如果你的产品上线六个月后,收入稳定了,你下一步的计划是什么?
- 如果是”加大投放,扩大获客”,你在把套壳当商业模式。
- 如果是”自建数据飞轮,深度嵌入工作流,逐步替换依赖的外部API”,你在把套壳当MVP。
没有对错之分。但你要知道自己选的是哪条路,以及每条路的终点在哪里。
05.第五题:你的团队里,有没有能做出独立技术决策的人?
这个问题看似和技术无关,其实是所有问题里最致命的。
我看过很多AI创业团队的About页面。里面列着”营销总监”“增长负责人”“品牌策略师”“社区运营”……翻到底,找不到一个”AI工程师”“数据科学家”“ML工程师”的头衔。
这种团队不是在造AI产品,他们是在运营一个API分销生意。
分销生意本身没问题。但如果你以为自己在造产品,实际上只是在分销,那问题就大了。因为你所有的技术决策,用什么模型、怎么调prompt、怎么处理数据、怎么优化成本,全都依赖外部API提供商。他们没有义务告诉你最优方案,也不会为你的业务场景专门优化。你只是一个客户,还是一个没有技术谈判能力的客户。
更严重的是,当API提供商升级、涨价、改变服务条款、甚至直接推出竞争产品时,你没有任何应对能力。你只能被动接受,或者祈祷。
Builder.ai的崩塌,很大程度上就是这个原因。他们的”AI”本质上是一层包装,真正的开发工作外包给海外工程师。团队没有核心技术能力,所以当投资者要求看技术细节、当竞争加剧需要技术突破、当”AI开发”这个叙事开始被质疑时,他们没有任何牌可打。
YC合伙人Jared Friedman在2024年的一篇文章里说过一句话,我印象很深:“如果你的团队里没有至少一个人能从头训练一个模型,你做的不是AI公司。” 这句话有点极端,但方向是对的。你的团队里,必须有人能做出不依赖外部API的技术决策。
这种人不一定要”从头训练模型”。但TA需要能:
- 评估不同模型的优劣,为你的具体场景选择最优方案
- 设计数据pipeline,把用户数据转化为模型改进
- 理解prompt工程的边界,知道什么时候该用RAG、什么时候该微调
- 监控和优化推理成本,确保单位经济模型可持续
- 在API提供商变更时,有迁移能力,不被锁定
自检:
如果你的API提供商明天宣布涨价300%,或者停止服务,你的团队能做什么?
- 如果答案是”没办法,只能接受”,你的团队没有独立技术决策能力。
- 如果答案是”我们可以切换到另一个模型,调整pipeline,两周内恢复”,你在建真正的技术壁垒。
这个能力的建立,不需要你一开始就雇佣一个PhD。但至少要有一个人,愿意花时间去理解底层技术,而不是把整个技术栈外包给”OpenAI的API文档”。
路线如果五道题中,你有两道以上答不上来
先别慌。套壳能赚钱,这是事实。很多现在看起来很成功的AI公司,早期也是套壳起步的。
但你需要一张逃生路线图。

第一阶段:承认现状(0-3个月)
诚实地回答上面五道题。不用给任何人看,给自己看。知道自己在什么位置,才能决定往哪走。
如果你五道题全答不上来,说明你的项目还在非常早期的验证阶段。这没问题,但你需要设一个deadline。再给三个月,如果还不能在两道题上给出肯定答案,就认真考虑要不要 pivot。
第二阶段:选择一条护城河(3-6个月)
五道题对应五条可能的护城河路径。你不需要同时建五条,选一条最深的,集中资源打透。
第三阶段:逐步切换引擎(6-12个月)
这个阶段的目标,是把你的”套壳”从主要依赖外部API,逐步切换为“外部API+自有数据+自有工作流+自有技术决策”的混合模式。
具体来说:
- 模型层面:开始尝试开源模型(Llama、Mistral、Qwen等),在特定场景下替代商业API。不是为了省钱,是为了建立”不被锁定”的能力。
- 数据层面:把积累的用户数据用于微调开源模型或训练领域专用的小模型。即使效果比商业API差10%,但这是”你的”模型,没人能抢走。
- 工作流层面:从”一个独立工具”变成”嵌入用户核心工作流的基础设施”。让用户离开你的成本,远高于继续使用你的成本。
- 团队层面:确保技术团队能独立评估、选择、部署、优化模型。不再把技术决策外包给API提供商的客户支持。
第四阶段:建立真正的壁垒(12个月以后)
到这个阶段,你就不再是一个”套壳”了。
你的壁垒可能来自:
- 一个别人复制不了的数据资产
- 一个深度嵌入客户工作流的产品形态
- 一个持续自我改进的技术体系
- 一个能独立做技术决策的团队
这些壁垒中的任何一个,都足以让你在模型升级、竞争加剧、市场降温时,仍然保持定价权和用户粘性。
结尾最后,给一个数字
过去一年,我统计了大约50个我知道的AI套壳项目(不包括大厂产品,只算小团队做的)。
其中:
- 大约30%,上线三个月内就死了。死因各异,但本质都是”没有解决真问题”。
- 大约40%,活着,但增长停滞,在价格战中艰难维持。
- 大约20%,活得不错,月入几万到几十万美金,但创始人自己心里清楚,随时可能被平台碾平。
- 大约10%,真正建立了某种护城河,开始从”套壳”向”平台”转型。
那10%的共同特征是什么?
是另一件事:他们最早意识到套壳只是起点,并在还有时间的时候,开始建真正的壁垒。
如果你正在做一个AI项目,或者正准备做一个,花半小时回答上面五道题。不用写出来,在心里回答就行。
如果答案让你不安,那说明这篇文章没有白写。
文中Robin AI案例数据来源:Artificial Lawyer(2026年1月)、PitchBook及多家科技媒体报道。Builder.ai案例数据来源:The Register(2025年5月)、SEC公开文件。
