从套壳到护城河：AI创业入场前的5道必答题

AI 创业入场自检

套壳可以赚钱，但套壳不是终点。真正的问题是：当模型升级、竞争涌入、融资窗口关闭，你手里到底有没有能留下来的东西？

阅读地图

五个问题，决定一个 AI 项目是在做工具，还是在建壁垒。

01-工作流

你解决的是 API 调用问题，还是完整工作流问题？

02-差异化

你的价值会被平台升级削弱，还是被平台升级放大？

03-数据飞轮

每新增一个用户，产品有没有变得更聪明？

04-MVP 心态

套壳是验证需求的手段，还是你打算长期依赖的商业模式？

05-技术自主

团队里有没有人能做出独立技术决策？

先说实话：套壳能赚钱。过去一年，我见过太多人用一个漂亮的界面包住OpenAI的API，收月费，月入几万美金。有些甚至赚到了百万。

但我也见过更多人，在同一个赛道上，产品上线三个月就死了。死因不在技术。他们以为套壳就是终点。

这篇文章写给准备入场的人。来审判谁的是非没意义，我只是给你一面镜子。你拿去照照自己正在走的路。

00.一个残酷的事实

2024到2025年，AI创业圈死了两间做同一件事的公司，AI合同审查。它们死在完全不同的原因上。

一间叫Robin AI。2019年在伦敦创立，创始人是前高伟绅律师事务所的律师配一个机器学习研究员。背景无可挑剔。产品方向也很聪明：没做一个独立App跟客户说”来用我们的AI审合同”。它把AI合同审查直接嵌进了Microsoft Word。律师本来就在Word里改合同，现在AI自己把条款偏差标出来，不需要切换任何工具。

客户名单很好看。瑞银、PwC、百事可乐，13家财富500强，峰值ARR约1000万美元。融了两轮，2024年初刚拿到2600万。

2025年底，Robin AI倒闭了。

它死于一个更基本的问题：赚回来的钱不够花出去的。 50人的团队，企业客户的长销售周期，AI推理成本在涨，客户获客成本也在涨。一笔5000万的新融资没能关上，公司进入破产接管。服务部门卖给了Scissero，工程团队被微软吸收进了Word的AI团队。

另一间叫Builder.ai。这家更离谱：融资超过4.5亿美元，微软、软银、卡塔尔投资局都投了。它声称AI助手”Natasha”能自动化80%的移动应用开发。后来 whistleblowers 曝出真相：大部分代码是印度人类工程师手写的，“AI”只是一层皮。2025年5月，Builder.ai申请破产，收入从宣称的1.8亿美元修正到4500万，欠亚马逊8500万、微软3000万。

两间公司，死因天差地别。Robin AI用真AI做了真产品，有真客户。Builder.ai连AI都没有。

但它们共享一个致命的共同点：都没能在产品之外，建立可持续的商业壁垒。

Robin AI做对了很多事：嵌入工作流、理解垂直场景、不卖”AI”卖”效率”。但它忽略了一件更底层的事：在”套壳”模式下（底层调用OpenAI的模型），如果单位经济模型不成立，产品做得再好也是给投资人打工。它的客户会续费，但每续一个客户，公司不一定在赚钱。

这引出一个比”套壳是对是错”更尖锐的问题。我们对Robin AI的失败应该问的是：为什么一个做对了几乎所有事的公司，还是会死？答案在下面的五道题里。

01.第一题：你解决的是一个API调用问题，还是一个完整工作流的问题？

这是最容易被忽略、也最关键的一道题。

很多人做AI产品的起点是这样的：看到别人用ChatGPT写邮件、做翻译、生成图片，觉得”这个体验可以更好”，于是做了个更漂亮的界面，调用了同样的API，然后收费。

这种产品解决的是”调用API”的问题。用户本可以直接去OpenAI官网用，你的价值只是”界面更好看一点”或者”操作少两步”。这种价值很薄，薄到OpenAI自己加个功能就能把你碾平。

但还有一种套壳，它解决的是”完整工作流”的问题。Robin AI在这一点上，其实是做对了的。

律师审合同不是”把合同丢给AI问意见”这么简单。他们的真实工作流是：收到合同→快速浏览找出关键条款→标记风险点→对比公司内部模板→给业务部门写审查意见→跟进修改→最终归档。Robin AI看懂了这一点，所以它没做一个”更聪明的ChatGPT”。它把AI直接嵌进了Microsoft Word。律师本来就在Word里改合同，它就在Word里自动标出条款偏差、高亮风险点。不需要切换工具，不需要上传下载，不需要改变任何习惯。

对Robin AI的早期客户来说，这个价值是真实的。客户不说”AI好厉害”。他们说：“我审一份合同的时间从4小时变成了40分钟。” 他们卖的不是API的便利，是工作流的效率。

这就引出了一个让人不太舒服的问题：如果Robin AI做对了这道题，为什么还是死了？

原因是：工作流效率这一层护城河，虽然在”API提供商抢不走”这个意义上是成立的，但它在”能帮你赚钱”这个意义上，可能比你以为的要浅。嵌入Word确实是壁垒。UBS和PwC不可能因为OpenAI降价就把整套流程切走。但这个壁垒只够让你活下来，不够让你脱离套壳带来的结构性劣势：你的利润率被上游API定价锁死。

所以第一题的正确答案，不只是”我解决了工作流问题还是API调用问题”。那道题的完整版本应该是：你解决了工作流问题之后，还能不能解决单位经济模型的问题？

02.第二题：你的差异化存在于现在，还是存在于平台升级之后？

OpenAI、Google、Anthropic这些公司，每几个月就升级一次模型。每次升级，能力变强，价格变低，功能变多。

如果你的差异化建立在”我调用了当时最强的模型”上，那你的护城河就是别人的产品路线图。模型越升级，你的差异化越薄。

我见过一个做AI写作助手的团队，2024年初上线时主打”基于GPT-4的高质量长文生成”。当时GPT-4确实是市面上最强的长文本模型，他们的产品体验也确实比直接用ChatGPT好一些。产品上线前三个月，增长很快，用户反馈也不错。

然后GPT-4 Turbo出来了，上下文窗口从8K扩展到128K。Claude 3紧随其后，长文本能力更强。GPT-4o也来了，速度更快、更便宜。

每一次模型升级，都有一部分用户回流到直接使用官方产品。因为官方产品的长文本能力在变强，而这个团队的核心卖点，“我能生成高质量长文”，正在被上游免费赠送。

到2024年底，这个产品的月活掉了60%。团队试图增加”写作模板”“风格定制”等功能，但这些也只是延缓死亡，不是逆转。

真正安全的差异化，建立在”模型升级后，我的价值反而更大了”这个基础上。跟”我现在用了什么模型”无关。

怎么做到？

第一种：垂直深度。

你深耕一个极细分的领域，积累了大量专有数据和领域知识。模型再升级，它也不知道”这个行业的合规红线在哪里”“这个客户的风格偏好是什么”“这个场景下的常见陷阱有哪些”。这些知识是你一点点攒出来的，模型提供商不会为这么小的细分领域专门训练。

比如做医疗影像AI的公司，底层可能也是调用现成的视觉模型，但他们花了三年时间，和50家医院合作，标注了几十万张特定病种的影像，建立了独有的标注标准和质量控制流程。模型升级了，他们可以换更好的模型，但那三年的数据积累换不走。

第二种：网络效应或数据飞轮。

每多一个用户，你的产品就变得更好了。这种飞轮，模型升级反而能加速。

举个例子：一个做客服自动化的AI工具。它的核心价值不在”能自动回复常见问题”。每处理一个工单，系统就学到一点这个客户行业的特定知识。处理了一万个工单后，它知道这个行业的用户最爱问什么、最头疼什么、最容易在哪里卡住。这些知识沉淀在系统里，形成了壁垒。

模型升级了，这些知识可以直接迁移到新模型上，让新模型的表现更好。模型越升级，你的飞轮转得越快。这才是健康的差异化。

自检：

问自己：如果明天OpenAI发布了一个能力翻倍、价格减半的新模型，你的产品是更值钱了，还是更不值钱了？

如果更不值钱了。你的差异化在现在。
如果更值钱了。你的差异化在未来。

只有后者才值得长期投入。

03.第三题：每新增一个用户，你的产品有没有变得更聪明？

这个看似抽象的问题，其实是一个极硬的商业指标。

大多数套壳产品，第1个用户和第10000个用户得到的体验，几乎完全一样。因为产品本身没有学习能力。它只是在重复调用同一个API，用同一套prompt，处理不同的输入。

这种产品叫”线性产品”。用户增长，收入线性增长，成本也线性增长。没有规模效应，没有网络效应，没有飞轮。每新增一个用户，你的毛利率不会改善，用户体验不会提升，产品不会变得更聪明。

真正有价值的AI产品，应该是”超线性”的。每新增一个用户，整个产品都变好一点点。

这个”变好”可以是很多形式：

数据积累：用户产生的数据被用来微调模型，让后续用户的体验更好
知识沉淀：用户的使用模式被分析，系统学会了”这个行业的人通常先关心A再关心B”
社区效应：用户之间可以共享模板、工作流、最佳实践，形成生态
反馈闭环：用户的反馈（点赞、修改、投诉）被自动收集，用来改进系统

举两个例子对比。

Notion AI（线性产品的代表）。你在Notion里调用AI写一段话，这段对话的数据不会被用来改进Notion AI的整体能力。你的使用体验，和全世界其他几百万用户的使用体验，是完全独立的。Notion AI的价值，几乎完全取决于底层模型的能力和Notion团队的prompt工程水平。这是一层很贵的皮。

Grammarly（超线性产品的代表）。它早期也是基于规则的语法检查工具，后来逐步引入了ML模型。但它的核心壁垒不在模型。是二十年来积累的海量用户写作数据。真实的语法错误、真实的修改偏好、真实的写作场景。每多一个用户，Grammarly就多了一个数据点，模型就多学了一点。这种飞轮一旦转起来，后来者很难追上。

注意：Grammarly早期的技术一点也不”先进”。它就是一套规则引擎加简单的统计模型。但它很早就建立了数据飞轮的意识，把用户交互数据作为核心资产来积累。这才是关键。

自检：

你的产品有没有一个自动化的机制，把用户的使用数据转化为产品改进？

如果没有。你在做线性产品，规模越大越辛苦。
如果有，你在建飞轮，前期慢，后期会加速。

这个机制不需要很复杂。它可以简单到”每次用户修改了AI的输出，系统就记录这次修改，每周自动分析高频修改模式，更新prompt模板”。关键是有意识的建立，而不是完全依赖人工运营。

04.第四题：套壳是你的MVP策略，还是你的商业模式？

这是心态问题，也是战略问题。

很多成功的AI产品，起点都是套壳。这不可耻，甚至很明智。它让你用最低的成本、最快的速度验证需求。

但MVP（最小可行产品）和商业模式之间，有本质的区别。

MVP套壳的心态是： “我先做个最简单的版本，快速上线，看看有没有人愿意付费。如果有，我再投入资源做深度：自建模型、积累数据、嵌入工作流。套壳只是验证假设的手段。”

商业模式套壳的心态是： “我就做这个了。用户愿意付费，说明模式成立。我把精力放在获客和运营上，技术交给API提供商。”

这两种心态的差别，在顺境时看不出来。市场好、竞争少、用户新鲜的时候，商业模式套壳也能赚钱。但一旦市场降温、竞争者涌入、用户对”又一个AI工具”产生疲劳，差别就显现了。

2024年的AI工具市场就是这样。上半年，几乎任何套了层皮的产品都能拿到用户。到了下半年，同一个品类出现了十几个竞争对手，获客成本翻了三倍，用户流失率飙升。那些把套壳当商业模式的团队，突然发现自己在打一场打不赢的价格战。因为大家的底层能力完全一样，差异化只剩UI和营销。

Robin AI卡在了一个更尴尬的位置。它不属于典型的商业模式套壳，它真的做了工作流集成，也有一流客户。但它从来没有认真回答过一个硬问题：我们的单位经济模型，在不烧钱的情况下能跑通吗？ 它的ARR在涨，但成本涨得更快。当你靠融资活着的时候，这个问题很容易被忽略，投资人会说”先做增长，利润之后再说”。但当融资窗口关上，这个问题的答案就是生死线。

而那些把套壳当MVP的团队，在验证需求的同时，已经在默默做三件事：

积累专有数据：用户的输入、反馈、修改记录，全部结构化存储
深化工作流集成：从”一个独立工具”变成”嵌入用户现有工作流的一部分”
建立技术团队：招募能调模型、建pipeline、处理数据的人，为自建核心能力做准备

当竞争白热化的时候，前者在降价求生，后者在换更好的模型、推更深的集成、靠数据优势拉开差距。

自检：

如果你的产品上线六个月后，收入稳定了，你下一步的计划是什么？

如果是”加大投放，扩大获客”，你在把套壳当商业模式。
如果是”自建数据飞轮，深度嵌入工作流，逐步替换依赖的外部API”，你在把套壳当MVP。

没有对错之分。但你要知道自己选的是哪条路，以及每条路的终点在哪里。

05.第五题：你的团队里，有没有能做出独立技术决策的人？

这个问题看似和技术无关，其实是所有问题里最致命的。

我看过很多AI创业团队的About页面。里面列着”营销总监”“增长负责人”“品牌策略师”“社区运营”……翻到底，找不到一个”AI工程师”“数据科学家”“ML工程师”的头衔。

这种团队不是在造AI产品，他们是在运营一个API分销生意。

分销生意本身没问题。但如果你以为自己在造产品，实际上只是在分销，那问题就大了。因为你所有的技术决策，用什么模型、怎么调prompt、怎么处理数据、怎么优化成本，全都依赖外部API提供商。他们没有义务告诉你最优方案，也不会为你的业务场景专门优化。你只是一个客户，还是一个没有技术谈判能力的客户。

更严重的是，当API提供商升级、涨价、改变服务条款、甚至直接推出竞争产品时，你没有任何应对能力。你只能被动接受，或者祈祷。

Builder.ai的崩塌，很大程度上就是这个原因。他们的”AI”本质上是一层包装，真正的开发工作外包给海外工程师。团队没有核心技术能力，所以当投资者要求看技术细节、当竞争加剧需要技术突破、当”AI开发”这个叙事开始被质疑时，他们没有任何牌可打。

YC合伙人Jared Friedman在2024年的一篇文章里说过一句话，我印象很深：“如果你的团队里没有至少一个人能从头训练一个模型，你做的不是AI公司。” 这句话有点极端，但方向是对的。你的团队里，必须有人能做出不依赖外部API的技术决策。

这种人不一定要”从头训练模型”。但TA需要能：

评估不同模型的优劣，为你的具体场景选择最优方案
设计数据pipeline，把用户数据转化为模型改进
理解prompt工程的边界，知道什么时候该用RAG、什么时候该微调
监控和优化推理成本，确保单位经济模型可持续
在API提供商变更时，有迁移能力，不被锁定

自检：

如果你的API提供商明天宣布涨价300%，或者停止服务，你的团队能做什么？

如果答案是”没办法，只能接受”，你的团队没有独立技术决策能力。
如果答案是”我们可以切换到另一个模型，调整pipeline，两周内恢复”，你在建真正的技术壁垒。

这个能力的建立，不需要你一开始就雇佣一个PhD。但至少要有一个人，愿意花时间去理解底层技术，而不是把整个技术栈外包给”OpenAI的API文档”。

路线如果五道题中，你有两道以上答不上来

先别慌。套壳能赚钱，这是事实。很多现在看起来很成功的AI公司，早期也是套壳起步的。

但你需要一张逃生路线图。

第一阶段：承认现状（0-3个月）

诚实地回答上面五道题。不用给任何人看，给自己看。知道自己在什么位置，才能决定往哪走。

如果你五道题全答不上来，说明你的项目还在非常早期的验证阶段。这没问题，但你需要设一个deadline。再给三个月，如果还不能在两道题上给出肯定答案，就认真考虑要不要 pivot。

第二阶段：选择一条护城河（3-6个月）

五道题对应五条可能的护城河路径。你不需要同时建五条，选一条最深的，集中资源打透。

题目	对应的护城河	具体行动
第一题（工作流）	工作流深度	选一个最痛的工作流环节，做端到端的自动化，而不是通用工具
第二题（差异化）	垂直数据	在一个细分领域积累别人拿不到的数据，建立标注标准和质量流程
第三题（飞轮）	数据飞轮	建立用户反馈的自动收集和分析机制，让产品随用户增长而变聪明
第四题（MVP心态）	战略耐心	把收入的20%以上投入技术深度建设，而不是全部用于获客
第五题（技术团队）	技术自主	招募或培养至少一个能做独立技术决策的人，建立内部技术能力

第三阶段：逐步切换引擎（6-12个月）

这个阶段的目标，是把你的”套壳”从主要依赖外部API，逐步切换为“外部API+自有数据+自有工作流+自有技术决策”的混合模式。

具体来说：

模型层面：开始尝试开源模型（Llama、Mistral、Qwen等），在特定场景下替代商业API。不是为了省钱，是为了建立”不被锁定”的能力。
数据层面：把积累的用户数据用于微调开源模型或训练领域专用的小模型。即使效果比商业API差10%，但这是”你的”模型，没人能抢走。
工作流层面：从”一个独立工具”变成”嵌入用户核心工作流的基础设施”。让用户离开你的成本，远高于继续使用你的成本。
团队层面：确保技术团队能独立评估、选择、部署、优化模型。不再把技术决策外包给API提供商的客户支持。

第四阶段：建立真正的壁垒（12个月以后）

到这个阶段，你就不再是一个”套壳”了。

你的壁垒可能来自：

一个别人复制不了的数据资产
一个深度嵌入客户工作流的产品形态
一个持续自我改进的技术体系
一个能独立做技术决策的团队

这些壁垒中的任何一个，都足以让你在模型升级、竞争加剧、市场降温时，仍然保持定价权和用户粘性。

结尾最后，给一个数字

过去一年，我统计了大约50个我知道的AI套壳项目（不包括大厂产品，只算小团队做的）。

其中：

大约30%，上线三个月内就死了。死因各异，但本质都是”没有解决真问题”。
大约40%，活着，但增长停滞，在价格战中艰难维持。
大约20%，活得不错，月入几万到几十万美金，但创始人自己心里清楚，随时可能被平台碾平。
大约10%，真正建立了某种护城河，开始从”套壳”向”平台”转型。

那10%的共同特征是什么？

是另一件事：他们最早意识到套壳只是起点，并在还有时间的时候，开始建真正的壁垒。

如果你正在做一个AI项目，或者正准备做一个，花半小时回答上面五道题。不用写出来，在心里回答就行。

如果答案让你不安，那说明这篇文章没有白写。

文中Robin AI案例数据来源：Artificial Lawyer（2026年1月）、PitchBook及多家科技媒体报道。Builder.ai案例数据来源：The Register（2025年5月）、SEC公开文件。