新闻中心
NEWS
从SaaS到RaaS:打造可盈利AI Agent的全景方法论
发布时间:
2025-05-26 16:00
来源:
当下,AI Agent正迎来全球性发展大爆发,AI产业的下一个大阶段已拉开序幕。然而,在大模型能力突飞猛进、AI产业链被重塑的同时,寻求杀手级应用也成为业界共同面临的核心命题。
为此,5月15日盛景举办以“面向技术经理的AI Agent开发”为主题的投后赋能培训,线上线下联动吸引近300名参与者,其中数十家科技赛道的盛景被投企业创始人携骨干团队现场出席。
盛景网联高级合伙人、AIC人工智能创业孵化器创始合伙人颜艳春,从技术落地和产品经理的角度,深度拆解了“如何打造AI Agent爆款应用”这一破局命题,助力被投企业跨越“从技术到价值”的鸿沟,在智能体革命中抢占战略高地。
盛景网联董事长、盛景嘉成创投创始合伙人彭志强,也在活动中做了深入点评,犀利指出“只从技术谈技术是死路一条,一定要从结果反推”。AI应用技术开发要回归“第一性原理”——商业意识与结果导向。
这一务实主张,既为活动奠定基调,亦彰显盛景投后赋能的长期使命——以深度认知与实战赋能,助力被投企业在智能时代逆势突围。
小编将两位大咖的发言分享精编如下,以飨读者,enjoy~
盛景网联董事长
盛景嘉成创投创始合伙人彭志强
硅谷流传着一句广为认同的用人法则:“用最少、但最好的人,做最重要的事。”
什么才是最重要的事情?什么才是最好的人?这其实就是“关键任务,关键人才”,两者之间要匹配,要match。
对技术经理而言,真正的挑战不仅是判断什么是“最好的人”,更在于如何识别“最重要的事”。这个答案必须回到AI应用开发的第一性原理:商业意识与结果导向。
随着大模型底座能力的跃升,AI应用开发的模式也正在发生根本变化。未来技术的核心价值,不再是技术本身,而是其能否创造“结果”。这一趋势催生了“RaaS(Result-as-a-Service,结果即服务)”的商业模式:企业必须敢于以结果定价、以结果收费、以结果盈利。如果一项技术不能带来清晰的商业闭环,那它的存在就缺乏持续意义。
当今SaaS和传统软件的服务逻辑正遭遇彻底重构。大模型具备广谱能力,堪称“1万米宽、10米深”的技术平台,几乎可以胜任所有轻量任务。因此,如果你的产品只是实现表层数字化,极易被通用大模型直接替代。唯有将AI的能力聚焦于“1米宽、1000米深”的垂直场景中,真正服务于特定结果,才有可能建立竞争壁垒。所以,只从技术谈技术必然是死路一条,一定要从结果反推!
对于“最重要的事”,过去大多数人普遍认为竞争对手重要,但盛景一直强调:要用99%的时间研究客户,1%的时间研究竞争对手。从内部的工作角度来讲,要用90%的时间研究客户需求,10%的时间开发产品。
原因在于,绝大多数的开发都是在浪费时间、浪费人工、浪费金钱,体现在产品或服务上,就是无法达到预期的销售额。所以,真正需要花时间精力的地方,是在研究客户的需求上,而不是盲目开发一个没人用没人买的产品。
基于此,今天的AI应用一定要坚决控制研发投入,这里的控制投入不是给员工降薪,而是要聚焦客户的刚需,且最终必须能赚到钱。这也是技术经理要时刻提醒自己的重点。
那么如何才能做到“少投入大产出”?一定要坚持核心大单品逻辑。先把一个最主要的应用做深做透,应用要同时符合前述两个条件:客户刚需能被满足、企业能够赚到钱。否则研发费就不值得花。然后,这一主要应用要从MVP(Minimum Viable Product)做起。
什么是MVP?推荐一部纪录片形式的电影《大创业家》,影片讲述了麦当劳的创业过程。你会看到麦当劳高速餐厅的雏形,居然是用粉笔在网球场上画出来的,所有员工在画出的场地里模拟工作时的操作,不断实践不断修改,最后根据图纸定制化打造出高效厨房,让出餐时间从30分钟缩短到30秒。这就是MVP。
当前,AI时代已经来临,希望大家能运用这些新的认知,走在AI的正确道路上,少投入大产出,把握住这一波AI RaaS的时代机会。
面向技术经理的AI Agent开发
——盛景网联高级合伙人、AIC人工智能创业孵化器创始合伙人颜艳春
2024年,AI创业在全球范围内持续升温,硅谷尤为显著。Y Combinator(YC)最新一批项目几乎100%都与AI相关,OpenAI黑帮前员工所创的十五家初创企业累计估值已达2500亿美元,这不仅预示着AI的资本浪潮,更反映出一个关键趋势的确立:AI将全面重塑产业格局,开启以“结果交付”为核心的智能体经济。
AI正在以前所未有的速度重塑企业的权利版图,AI Agent 的崛起标志着人类正式进入“结果经济”时代。尤其对创业公司而言,产品定义不再是对功能的简单组合,而是从结果出发的系统性再构。很多企业延续着旧有的软件思维方式,试图在传统框架中塞进大模型组件,最终难以走出困境。真正突破的关键,是彻底抛弃“旧马车装新引擎”的思维。
因此,下一个伟大十年,是一个“结果经济”的十年,强调结果交付的RaaS(Result as a Service)型智能体产品的开发是其中的核心之一。
尤其对于创业公司而言,如何走出属于自己的成长曲线?最难的其实是对产品的定义。
守旧会限制我们的行动力。如果我们仍然沿袭过去传统软件的开发逻辑,是不可能开发出一个伟大的智能体产品。
打个比方,大模型就像是蒸汽机,蒸汽机是一个伟大的发明,对于蒸汽机来说火车是一个伟大的应用,但火车并没有渗透到每一个家庭里。
反而是德国人本茨先生把蒸汽机小型化,发明了单缸发动机,这又是一大创举,但是它在最初定义产品的过程中,却不能算作一个伟大的产品经理。为什么?这是去年我在奔驰博物馆看到的人类第一辆汽车:在三轮马车这样一个老的硬件上加装了单缸发动机。
同样的还有诺基亚,它在自己传统的键盘手机上加了一个触摸屏,便认为可以与乔布斯的苹果手机抗衡,结果可想而知。
它们都没有真正的改变世界。
反观是亨利·福特,领导了世界的汽车工业革命,用自动组装线生产出了廉价的T型车,让汽车这个最初的“昂贵玩具”真正走进大众生活,令普通工薪阶层也能买得起,美国由此成为“跑在轮子上的国家”。福特汽车改变汽车工业的同时,也让自己崛起为世界上最大的车企之一,至今仍在汽车行业占有重要一席。
所以一个伟大的产品经理作用是非常重大的,但要冲破惯有的旧思维,重新归零,实际上也是最难的一件事。
回到现在,DeepSeek的崛起充满了大模型“下凡”的意味。它不仅是中国创新的觉醒,更是撕开了AGI工业化的铁幕,就像福特T型车碾碎马车时代。
未来十年,将会发生三个重大改变:
第一,AI大模型将从奢侈品变为水电煤基础设施,AIOS(Artificial Intelligence Operating System,人工智能操作系统)的“Android时刻”其实已经到来;
第二,未来将诞生上千亿AI智能体和机器人大军,软件工业将第一次成为AI劳动力;
第三,AI+产业,将迎来真正的生产力核聚变时刻。
从AI智能进化的趋势来看,大模型从感知AI、生成式AI,现在已经进入到智能体AI,未来3-5年有可能会看到物理智能大突破的时刻。
那么当下的智能体革命意味着什么呢?宣告了AGI通用人工智能,进入福特T型车流水线工业化量产时代。
而DeepSeek带给各行各业的巨大改变,体现在每一个智能体都可以真正运行在若干个小模型之上,这种小模型可能运行在我们的手机、耳机、AI眼镜、AI桌玩、机器人里。
那么智能体未来的机会是什么?护城河到底在哪里?其中非常关键的,就是互联网的公开的数据集。很多人认为把私有数据集准备好就可以了,其实是还远远不够。
在私有数据集之外,清楚记录人类实时的、动态的互联网的公开数据集也是价值巨大的,我们需要从大量的2C用户、2B用户数据找到真正的我们需要的信息,这将是一个考验。在这个过程中,数据飞轮也将变得更为重要。
不可否认,私有数据集的作为护城河依然有很大价值,而真正形成你能力的,还是你的思维链 (Chain-of-Thought, CoT) 或思维树 (Tree-of-Thought, ToT) 数据,这些记录了模型推理过程的数据。严格来讲,DeepSeek本身就是一个智能体,它之所以能够很好地回答问题,得益于其背后80万条规模的COT数据,这构成了它最核心的竞争力壁垒。
所以,眼下企业无论是做消费品市场2C的用户,还是做工业品市场、产业互联网平台抑或是出海,要建立自己的智能体,就要想尽办法通过各种渠道先收集数据,因为未来数据会越来越贵。
未来在研、产、供、销、服、人、财税、物、IT、合规、每一个节点做智能体的开发,都离不开小参数高性能的小模型的支持,这正是小模型时代智能体的边际成本很快变成零。
同时我们认为,小模型有一个超长尾的分布效应,首先各个行业这种中大型的模型,领域的中小模型、产品的模型或者企业的模型、个人模型,将来都要形成自己的小模型的能力。而且从整个开发的UI来说,智能体不仅可以运行在手机、iPad上,还可以运行在AI眼镜、机器人上,赋能各行各业,机会非常多。
具体来讲,智能体一般有三个容器:AI分身、机器人、AI智器。它们会成为我们人类硅基性的同事,我们不仅仅是开发软件,而是迎来了一个新的互联网时代:
-
2007年,iphone开启移动互联网时代,60亿消费者已经实时连接;
-
2022年,ChatGPT、DeepSeek开启开启AI时代;
-
未来30年,所有人类和他们上千亿的AI智能体(包括AI分身、机器人、智器)实时连接,进入智能体互联网时代。智能互联网 3.0 遵循梅特卡夫定律,其价值可能会超过现有互联网价值的 100 倍。
那么智能体的第一性(本质)到底是什么?是AI劳动力。如果忽视这一点,就不可能开发出任何一款伟大的智能体产品。而可以预见的是,未来也没有公司可以仅靠一款智能体打天下,一定是若干种智能体组队形成一个“能力池”。
那么智能体产品规划应该怎么做?无论是2B还是2C,都可以用这四个象限来呈现,时间(效率型、杀时间型)是横坐标,情商/智商是纵坐标。
举例来说,AI购物、AI教练、AI营养师、AI医生智商越高,就越能获得用户的信任。而AI销售、AI主播、AI旅行、AI冥想教练,显然不能只懂产品,还需要有共情的能力,所以单培养高情商这一方向,就有可能会诞生出非常好的智能体公司,并且这四个象限种中的每一个关键词,也都存在诞生千亿甚至万亿美金级别经济体的可能性。
真正有潜力的Agent,不一定最聪明,但一定是最能形成“情感连接 + 结果价值”的复合体。要构建这样的Agent,不能只依赖模型本身的能力,更需要在人设、语气、角色记忆、场景适配等维度进行精细设计。AI Agent开发从此不再是工程导向的过程,而是兼具交互设计、心理学、语言建模与商业思维的跨学科融合。
DeepSeek的成功正是这种新范式的缩影。它不仅是一种模型架构的革新,更是智能体范式落地的标志。在其背后,支撑它核心竞争力的并非参数量本身,而是规模庞大、持续优化的思维链(Chain of Thought, CoT)数据。这些数据记录了问题被理解、被拆解、被解决的全过程,为智能体的推理能力提供了“演化基因”。
第二劳动力的崛起
自亚里士多德定义“第一性原理”以来,我们总在追问:某个现象背后最基本、不可再分的本质是什么?若将这一哲学镜头投射到当下AI智能体的浪潮中,或许我们会得出一个惊人的结论:智能体的第一性,并非代码、模型、或数据,而是劳动力。它不是一段等待调用的函数,而是一位等待派遣的“数字员工”。
当AI智能体变成基本劳动力单元,组织将迎来深度重构。公司不再是各部门之间的接口,而是一个基于“任务流”的系统。每一个任务,从生成需求到资源调配到结果交付,都由AI智能体网络自动完成。Clay AI、Deel、Harvey、Sierra、Cursor、Synthflow 等先锋公司,正是在这样的架构下进行自我演化。
而如果AI智能体的本质是一种劳动力形态,那么软件世界的价值锚点也必须重构。从“卖功能”走向“卖结果”,从“软件工具”演化为“劳动力即服务(Result-as-a-Service,RaaS)”。这不仅仅是商业模式的更新换代,更是一次生产力与生产关系的根本性迁移。企业不再为工具买单,而是为智能体带来的真实商业结果买单,这背后是一场软件业“卖代码”到“卖劳动力”的深刻物种进化。
这一变化的底层驱动力在于,AI 正在成为“第二种劳动力”。传统的软件卖的是“授权”——授权你使用这套系统、这个功能。而 RaaS 卖的是“结果”——卖我帮你完成了什么。
员工的角色,也将重塑。不再是“岗位职能”的执行者,而是智能体编排的“导演”和“编舞者”。管理者将像一位编曲师,利用一支支由AI构成的“数字交响乐队”来完成目标的落地。
而这一切的极致状态,就是“一人独角兽公司”的出现。通过构建1000个专用智能体协同的系统化方法论,一个人就能完成产品、市场、销售、客服、财务、合规甚至战略的全部运作。这样的创业者,不再依赖“扩招”或“融资”,而是靠“智能协作密度”赢得未来。
传统SaaS软件的时代,以“卖代码”和“卖功能”为核心,用户为界面、模块、调用次数买单,这种模式的价值锚点清晰但也渐趋疲软。进入智能体时代,AI不仅仅是工具,而是一支可以24小时不眠的“数字劳动力军团”,真正替代甚至超越人类完成重复性、高强度且需要情绪理解的任务。
SaaS时代有它的黄金年轮——云端部署、多端协同、按月计费,曾被誉为“永不凋零的订阅之花”。企业为模块、接口、并发数买单,软件公司为功能堆砌、用户习惯而卷生卷死。彼时的竞争逻辑,是谁跑得快,谁定义了“供给效率”的边界。
AI Agent 正在不动声色地改写规则。你不再为“系统”买单,而是为“结果”付费——销售额提升了多少,退货率下降了多少,客户满意度上升了多少。这不是理想主义者的幻梦,而是实打实在企业财报里兑现的现实。
由OpenAI前高管Bret Taylor与Google前重臣Clay Bavor创立的Sierra,是这场革命的先锋。其诞生源自一个朴素但深刻的观察:传统客服SaaS平台虽多,但企业依然需要雇佣大量坐席人员,系统虽在,却“成果未至”。它的诞生源于对传统SaaS模式的深刻洞察:企业采购客服软件后,仍需投入大量人力操作,初始成本高企却效果难测。Sierra摒弃按席位收费的旧逻辑,开创“结果即服务”(RaaS)模式,让企业为实际解决的客户问题付费,而非工具的使用权。
2023年在硅谷成立的 Sierra AI,也许是这一潮流的先行者。他们提供的不是 又一个CRM 软件,也不是另一个“聊天客服平台”,而是一位全栈“AI 销售代表”——可以7×24小时接待客户、讲解产品、推荐方案、推动转化和成交完成支付,乃至在后续几天持续追踪复购和满意度跟踪。并且不断通过真实对话优化自身话术与策略,甚至根据你的品牌语气调整表达风格。
更重要的是,它不再按使用时长或并发数计费,Sierra 不按月收费,而是根据实际成交的销售额分成。这不是在卖软件,而是在雇佣一位“永不抱怨、永不疲惫”的数字销售员。你可以把它想象成一个超级销售员,它不需要 KPI 压力。而在实际案例中,Sierra 已在多个 DTC 品牌中帮助完成百万级美金的闭环交易,交付结果,变现。在一家北美DTC品牌中,Sierra接管了夜间客服与销售任务,仅三个月便交付了超过180万美元GMV,转化率提升68%,退单率下降42%。它不仅是“解决方案”,而是真正成为公司KPI的一部分——交付结果,参与分成,承担风险。
另一家快速崛起的 RaaS 公司是 Clay AI。他们不是给你销售工具,而是直接给你一条智能销售流水线。自动找客户、自动生成 cold email、自动追踪反馈,再自动调整策略。你要的不是一个更好用的 CRM,你要的是更高的转化率。这是一家用 AI 自动发现客户、生成邮件、进行互动跟进的销售链平台。它不是“教你怎么做销售”,也不是“提高 SDR 的效率”,而是替你直接完成这部分销售动作。用 Clay 的公司无需招募大批 Cold Email 写手与数据爬虫,它们只需设定目标客户类型,然后等待 AI agent 自动找人、撰写邮件、追踪打开率并根据反馈不断微调策略。
Clay AI则以其独特的FETE框架(Finding-Enriching-Transforming-Exporting)撬动了AI劳动力的经济价值。Claygent智能体融合75个数据源,整合LinkedIn、Salesforce等商业数据平台,通过深度学习为客户挖掘高价值销售线索。OpenAI客户拓展项目中,Clay单月帮助企业发现了1200万美元的潜在订单,客户为此支付了20%GMV分成,实质是雇佣了一支永不疲倦、不断学习优化的“数字销售军团”。在这场变革中,软件商不再是简单工具提供者,而是业务价值的直接贡献者,AI劳动力的“皇冠上的夜明珠”开始闪耀。
11X AI的案例则将RaaS的“结果驱动”模式推向极致。作为AI销售助理的创新者,11X采用“零底薪+3-5%GMV分成”模式,为客户打造了一个可复制的AI销售团队。其智能体Alice和Jordan不仅支持30种语言,还通过模拟人类语音特征(如停顿、咳嗽)提升客户沟通的真实感和亲和力,客户销售线索因此暴增120%。11X的客户续费率高达95%,显示出基于结果的商业模式极大地提升了客户满意度和粘性。公司最近7600万美元融资背后,是资本对RaaS商业逻辑的认可:AI销售代表正成为企业可复制、可扩展的印钞机。
作为企业财务自动化的明星公司,Ramp正是RaaS模式在B2B SaaS领域演进的典型案例。它不再只是提供报销管理工具,而是构建了一整套“AI财务助理”,帮助企业主动发现节省空间、优化支出结构并预测现金流波动。Ramp以“节省的钱”作为计费基础,客户支付的是一个明确的ROI。例如,某科技公司通过Ramp自动发现并砍掉了14个冗余订阅,年节省支出超过27万美元。这类用结果换付费的机制,正让传统的“订阅制”看起来过时而低效。这个看似简单的机制,背后却是强大的自动识别、谈判建议与系统接入能力的支撑——AI 在扮演着财务顾问的角色,并用“节省额”而非“功能量”来计价。它通过 AI 来识别企业中所有不合理的支出,帮助你谈判供应商,优化预算。
在全球范围,RaaS 的浪潮也不再局限于销售和财务。例如 Adept,这家由前 OpenAI 成员创立的公司,打造的智能操作系统 Agent 可以自主完成如“查找房源并预约看房”、“搜集公司资料并生成竞品对比”这样的复杂任务。Adept 的目标从来不是成为另一个工具集,而是构建“懂事、能做”的数智员工。Fixie AI 则更进一步,它专注为企业部署定制化 Agent,不再出售代码,而是出售“问题的解决方案本身”。
“劳动力”就从人类的劳动力变成了AI劳动力,而当智能体大规模进入人类市场以后,所产生的改变是巨大的。
未来,每个人、每个组织、每个国家乃至每个军队都能低成本训练并部署,一支由高智商或高情商的智能体和机器人组成的AI劳动力团队。
01
如何系统性构建AI Agent:
从0到1的实践路径
打造一个真正可用、可成长、可商业化的AI Agent,并非简单地调用大模型接口或拼装几个插件,而是一个结构化、系统化的设计过程。近年来,我通过与全球范围内的各个开发团队进行交流,总结出从0到1构建智能体产品,你需要知道的七件事。
第一,要选择明确的任务场景。你的智能体从一开始就要越垂直越好,越小越好,越能够产生效果越好。比如“自动报价”、“客服引导”、“文件分析”就是很明确的任务场景。
第二,设计角色人格。过去我们开发智能体,可能只考虑智商,数据不要有幻觉等,但如今我们要创造既有高情商又有高智商的复合智能体时,在做产品设计时,人设该如何设置,它的语气、能力边界、个性该如何调整时需要考虑的。
第三,设定调用权限与数据源。哪些API可调?有哪些文件?什么工具?从一开始做产品设计时就要想起楚。比如设计一个物流的智能体系统,智能体(机器人)之间要协同完成包裹的分拣,其实就是相互调用的权限,数据源开放程度的综合呈现。
第四,构建初版意图识别与执行流。仅把数据简单喂给AI,效果并不会好,手动标注高质量的小样本的数据是非常重要的。这一阶段真的需要某一领域的专家来识别用户意图,做相应的标注,并与执行形成闭环,循环往复。
第五,加上记忆与反馈机制。好的智能体系统一定要有记忆的反馈,执行的反馈。最开始别太复杂,可以先只记录“是否完成任务”“完成的好不好”。因为没有反馈就没法训练,且智能体的后训练阶段,很多人并不重视,这样出来的智能体基本没法用,浪费时间。
第六,用10个真实用户内测。观察他们如何误用、用偏、用错,这些数据非常宝贵。这些“异常路径”往往揭示出产品设计的盲区。
第七,建立你专属的数据飞轮。随着用户使用增加,逐步收集“高质量成功案例”、“反复失败样本”、“偏好偏移趋势”等关键数据点,不断优化Agent的行为策略,从而构建出专属的核心壁垒。
02
构建有效 Agent 的三个核心思想
Anthropic 公司的工程师 Barry Zhang 在 AI Engineer 工作坊上做了一场名为“如何构建有效的 Agent”的分享。其中的三个核心思想,我认为同样适用于国内的智能体开发,结合案例来做一下深入分析。
具体来看,构建有效 Agent 的三大要点分别为:
1、不要为所有事情都构建智能体。构建智能体的成本相对较高,且可能存在潜在的错误累积风险。许多任务使用简单的工作流程或直接调用大型语言模型就能很好地完成,无需构建复杂的智能体系统。
比如,AI 销售公司 Clay,它预定义了工作流与智能体分层。在客户数据整合中,70%的流程使用联邦学习框架的预定义工作流(如FETE框架的Finding、Enriching步骤),仅在高价值线索筛选、动态定价等需要实时决策的场景,才启用Claygent智能体。
2、保持简单。简单的系统更易于理解、调试和维护。核心逻辑是从最小可行智能体(MVA)起步,通过模块化降低复杂度。
Sierra 作为一个AI客服平台,它的做法是,先部署“工单分类”单一功能智能体,验证效果后再扩展至“赔偿计算”“话术推荐”等模块。
3、像智能体一样思考。其核心逻辑是,通过“开发者-智能体认知对齐”提升任务完成率,避免工具与环境的“信息差”。
比如在给智能客服对话 Agent设计对话流程时,要充分考虑用户可能的提问方式和意图,因为通常情况下,用户提问不会长篇大论,可能只有两三个关键词,所以针对这类模糊的用户提问,设置智能体要先进行简单的意图确认,再提供相应的答案。同时,对智能体的回答进行严格的测试和评估,确保其准确性和友好性。
03
技术与商业挑战:
智能体落地的三重障碍与应对策略
尽管AI智能体在功能演示与理论模型层面已取得突破,但真正落地为可用、可靠的产品系统,仍面临严峻挑战,具体可分为技术层面、商业层面与伦理风险三大类。
在技术方面,“幻觉”问题依然是智能体最致命的隐患。即使是先进的大模型,在缺乏足够上下文或任务约束时,仍可能产生看似合理但实则错误的信息。这在业务场景中尤其危险,可能造成决策误导、客户投诉,甚至合规风险。同时,多轮推理所带来的延迟问题也显著影响用户体验,当响应时间超过3秒,用户中断率将大幅上升。此外,安全性控制不到位也可能导致API误调用、数据泄露或违规操作,这些都要求在系统层引入“最小权限+沙盒机制”进行约束。
在商业层面,智能体所面临的第一个门槛是用户信任的建立周期。即使Agent准确率很高,用户也可能在早期因一次错误而失去信心,尤其在医疗、法律、财务等高风险领域,用户更倾向于依赖人工判断。同时,Agent的ROI(投资回报)难以在短期内量化,给内部预算审批带来阻力。第三则是护城河问题——简单依赖API集成的大模型应用极易被竞品复制,必须通过数据飞轮、业务链路或垂直模型微调建立差异化能力。
在伦理层面,智能体还面临算法偏见、透明性不足以及数据隐私合规等挑战。训练数据中潜藏的结构性偏见,可能在Agent行为中被放大,甚至引发争议性结果;与此同时,许多用户可能无法判断自己正在与Agent而非真人互动,这带来了交互公平性问题;GDPR、PIPL等合规法规对数据采集与处理也提出了更高要求。
04
为什么
智能体优先落地在“销售”场景?
如前文所述,当智能体大规模进入人类市场以后,将会引发巨大的改变,不仅是“劳动力”的形式,也包括商业模式。而商业付费方式的巨大变革也随之而来,即从传统的功能订阅(SaaS)转变为按结果付费(RaaS)的价值分成模式。
众所周知,每一个公司都有一张损益表,我们把全世界所有的智能体,大致分成了8大类(如下图)。比如,供应链智能体解决的是BOM(物料清单)成本的问题,工业机器人智能体解决的是工人成本的问题。
你会发现,在损益表的每一个节点、每一行都可以看到智能体的身影,AI 智能体覆盖蓝领工人以及大量白领的工作场景是完全可能的,包括前端的AI销售,中后台的 AI面试、AI 会计等。那么面对这8大类智能体,你的重点要放在哪里?这是需要认真思考的。
从生意的底层逻辑来看,我们认为,AI销售是最可能实现 RaaS 模式(按结果来付费)的场景。销售是企业中最明确“以结果衡量价值”的场景之一。不同于客服、招聘、财务等职能,销售的每一次转化都可被清晰量化,直接反映在营收曲线上。这使得销售智能体天然适配RaaS(Result-as-a-Service)模式,即企业愿意“按结果付费”,而不是按使用时间、调用次数或账号数量定价。
以往 SaaS 的本质是卖工具,收的是工具(功能)的订阅费。
从客户视角看,软件或者 SaaS 公司仍是个 IT 公司,在客户的心理账户中只有千分之一到千分之三的预算;如果我们把 AI 看成一个劳动力,比如一个销售的智能体,就完全改变了这个逻辑,可以按效果实现 3% 甚至 10% 的收费。
比如 CLay、Sierra、11X 等公司从传统软件订阅模式,发展到按任务收费或基于任务与结果的混合定价模式。Sierra 可以帮助像 OpenAI 或者谷歌等公司搜索或者打电话,按照销售金额分佣 3% ~ 8%。
此外,大多数企业主对销售的态度是“只要能卖出,就愿意分成”,这在实践中为AI销售智能体的商业模型提供了快速闭环的基础。无论是按签约金额分成,还是按转化线索计费,销售Agent都可以在短周期内创造可感知的回报,进而推动更大规模的部署与复制。
这也意味着,未来那些能够创造销售收入的智能体将在 AI 劳动力市场中占据重要地位,就如同夺得皇冠上的夜明珠一样。
05
技术与数据维度:
SaaS vs RaaS(AI销售+AI中后台)
上述问题清晰之后,我们从技术和数据维度,来对比一下传统SaaS和AI销售智能体,以及AI中后台智能体之间的不同:AI智能体不仅是用户体验的升级,更代表着软件产品底层逻辑的彻底变化。RaaS(Result-as-a-Service)与传统SaaS(Software-as-a-Service)之间的差异,不仅体现在计费方式和业务逻辑,更体现在技术框架、数据路径与模型策略上。
传统SaaS以“模块化功能 + 规则系统”为核心,通过用户界面触发预设流程,实现标准化任务的自动化。其价值依赖于用户覆盖面与流程效率的提升,但数据增量的边际价值往往有限。例如,CRM系统中的用户行为数据并不直接增强系统能力,更多用于运营统计。
相比之下,RaaS中的AI智能体基于大模型与强化学习技术构建,强调任务结果与能力迭代之间的闭环反馈。尤其是在销售智能体场景中,系统通过实时收集对话内容、客户响应、成交结果等数据,不断微调推理路径、话术策略和行动优先级,形成“结果驱动能力 → 能力提升带来更多结果”的数据飞轮。
但AI销售智能体则要更加开放,是一个多渠道的数据整合,包括公开数据、合作伙伴数据、客户授权数据等,甚至需要抓取竞争对手的一些数据。
在数据来源结构上,SaaS主要依赖企业私有数据;而销售智能体需要整合多元化的信息源:包括公开网络数据、用户授权数据、合作伙伴数据,甚至实时抓取竞争对手市场动态。这种“数据开放性”带来了更强的感知能力,但也要求更高的权限控制与隐私合规能力。
另一方面,传统SaaS并不涉及模型推理路径的训练;而RaaS智能体的核心资产之一是思维链(Chain of Thought, CoT)数据——即模型是如何逐步拆解用户意图、判断任务路径、执行行为并收到反馈的。这些推理链数据,是推动模型持续进化、构建竞争壁垒的核心。
不过,值得注意的是,销售智能体问世以后,就基本可以看做是“透明的”,别人也会来“偷学”你的CoT,接入到自己的数据中。所以,依然还是要具备动态的、实时的对全网数据的搜集抓取能力。
同时,新的付费模式也完全有可能产生。比如,AI中后台智能体按底薪付费,每个月收固定底薪,完完全全数字员工的逻辑。再比如,AI销售智能体可以按商品交易总额(GMV)提成付费。甚至未来还有可能出现AI员工劳动力平台,共享逻辑按次付费,比如你可以在平台上聘请AI律师、AI员工等。
06
AI Agent将赋能
每一个人、每一个企业、每一个产业
当智能体构建出来之后,如何为产业服务?
去年 11 月底正式发布了 MCP 协议,所有的智能体、模型以及数据源都可以通过该协议进行连接。它会带来一种新的商业模式,我称之为 “A2A 模式”,即 Agent to Agent(智能体到智能体)的新商业模式。
而世界级的品牌和企业家完全有可能借助消费者到制造商(C2M)、企业到工厂(b2f,产业路由器)以及智能体到智能体(A2A,智能体路由器)的模式,重新改变每个行业的命运,改变每个市场的竞争格局。
简单举例,你可以运用专注不同垂直领域的智能体找线索、联系客户,归集需求之后合并同类项,通过智能体和产业互联网,对接供给端的产业集群,由此创造出千亿规模经济体的可能性是存在的。
当这一天到来的时候,在智业文明的伟大召唤下,我们希望每个行业都能够被重新构建一遍。
07
智能体的核心结构与记忆机制
要理解智能体的构建,首先可以参考一个业界公认的精简表达,即:AI Agent=大模型+记忆+规划+工具使用。
而对于AI Agent 系统而言,用户在与其交互过程中产生的信息和数据都可以认为是Agent的记忆,而记忆支持AI Agent的决策和行为。
那么从数据架构角度,如何让智能体拥有“前世今生”的记忆呢?设计原则只有一个:让智能体的每一次的行为都应“可解释、可学习、可复现”。
长期记忆包括:用户身份、历史偏好、情感画像等,除了要经常总结以外,还要把它写到相应的数据库里。
短期记忆也很重要,它决定了每次你与智能体的对话质量。另外还有工具调用日志,Agent调动工具、API的行为轨迹,要记到我们的日志系统里,要把它结构化。
用户的反馈也非常重要,点击率、满意度打分、重试次数等,都需要记录写进JSON日志,便于开发团队进行优化。
下图是一个极简的RaaS智能体结构,用户通过WEB浏览器进入,在通过前端与智能体的主机建立连接,远程开始通过A2A的协议去调用LangGraph智能体,或者谷歌智能体和Crew Al智能体,当然现在智能体的开发平台有很多。
我们设计了一个RaaS智能体服务平台应用架构,当然并非短期能开发完,但想强调的是,在整个过程中,最重要的要先把AI销售智能体做出来,当转化率达到一定程度后,再考虑投资流量,最后才是履约智能体的建立。以电商平台为例,它们大部分都有履约能力,将来开发时稍微对接之后相对是容易的。
智能体产品迭代是一个持续优化的过程,比传统软件产品更复杂。基于我们对Clay等成功案例的研究,推荐以下结构化的智能体迭代策略:
1. 基于数据的智能体迭代模型
迭代周期 = 收集数据 → 分析失败模式 → 优化策略 → 验证效果 → 再次收集数据
2. 迭代四阶段详解
-
第一阶段:快速原型期(1-4周)- 目标:验证核心功能可行性- 方法:- 使用现有LLM能力实现MVP- 只关注1-2个核心场景- 手动标注50-100组高质量训练数据- 关键指标:基本功能完成率
-
第二阶段:内部测试期(2-6周)- 目标:消除明显的体验断点- 方法:- 10-20名内部用户使用- 重点收集"卡壳时刻"数据- 实施A/B测试优化提示工程- 关键指标:关键任务成功率、响应时间
-
第三阶段:小规模用户期(1-3月)- 目标:构建数据飞轮机制- 方法:- 100-500真实用户使用- 建立用户反馈收集机制- 根据反馈训练专用微调模型- 实施标签化的错误追踪- 关键指标:任务完成率、用户满意度
-
第四阶段:规模化阶段(持续)- 目标:持续学习优化- 方法:- 实施自动化数据收集与分析- 建立"成功案例库"- 开发用户偏好个性化引擎- 智能体行为主动调优- 关键指标:重复使用率、推荐率、商业ROI
08
智能体的用户旅程五步曲
无论是移动互联网还是AI时代,有一个大的共同点就是:要有用户思维,你永远要站在用户的角度去思考。AI Agent 的真正价值,不仅在于“能不能完成任务”,而在于“用户是否愿意持续使用”。因此,从产品设计的视角,智能体的成长路径本质上是一段“用户与数字人格逐步建立信任”的演化过程。
Agent 用户旅程(User Journey)是一个从“陌生工具”到“信任拍档”的演化过程,它与传统SaaS产品的旅程非常不同,更像是在运营一个“准人格体”的数智员工。整个过程一共有五个阶段:
第一阶段:唤醒,从陌生到初识。在用户第一次接触时,通过快速成功、认知共鸣,令其“一见钟情”的能力。比如在使用智能体时第一句欢迎词,或者能够通过简短的对话就能快速清楚使用者的意图等。
第二阶段:建立信任,从工具到习惯。就是用户在使用几次之后,仍能理解用户的想法,并准确执行,让用户觉得“靠谱”。注意这一阶段信任的建立,不仅是靠成功率本身,更多是靠出错可控及反馈的呈现,很多时候把Agent决策过程的思维链展示出来,能加速信任的建立,比如DeepSeek为什么用户体验那么好,这这有很大关系。
第三阶段:人格绑定,从助手到拍档。随着用户与智能体交流得越来越久,通过长期行为一致性塑造出的特定喜好。可以通过语调的训练,命名换肤等操作让用户更有参与感,或者提供“Agent成长记录”:“过去30天你教会了我4件事”。让用户有当老师、调教智能体的成就感。
第四阶段:任务飞轮,从使用到依赖。这一阶段用户开始用Agent处理多个高频任务,由于有了基础数据,经过路径优化之后,系统也更懂他们的流程偏好,用户开始出现“我更喜欢Agent来做这件事”的心理转变,就会产生依赖。
在这一阶段,在功能设计上一定要有任务自动化链条,这是任务飞轮的关键。举个例子,Clay此时加入Lead Management Flow,不是只写邮件,而是整合成“筛选-写信-追踪-归因”一体化。智能体开始推荐任务,比如根据客户的行为,智能体建议下周主动触达他们,使用者根据智能体的任务建议,安排见面或会议。
第五阶段:社交裂变,从个人信任到公开推荐。这个时候个人信任建立起来以后,用户就会公开推荐,晒出自己与Agent协作的成果,主动传播。
11X与Notion AI的玩法很像:完成一个任务后生成可视化“战报卡片”,促使用户分享到X平台或朋友圈。
这一过程中,激励机制的建立很重要。比如任务完成后的可视化“战报卡片”,内容可以是:“我用Agent完成30封邮件发送,回复率35%”。又或者可以是Agent生成的“周报”:“你与Agent上周共处理X任务,回复率Y%,节省Z小时”等等。
有两点需要注意:第一,Agent旅程 ≠ 功能使用,这与过去做SaaS软件传统的开发不一样。第二,用户与智能体逐步共建信任,是一个过程,相当于用户与智能体一起在进化。
09
智能体开发落地9个关键事项
推动Agent真正落地,还需要一系列架构、工具与管理机制支撑。以下是九项关键落地事项:
1、Agent运行核心依赖
以下图中的“资深购物顾问”为例,我们要跟智能体的各种数据源要打穿,从客户端到大模型工具的调用,到开发的平台,再到外部的WEB端的数据以及公共资源的实时的获取,另外还有沙盒,生成文件、文件暂存、代码执行,包括整个建立虚拟的环境,这些都是我们开发Agent的核心。
2、多智能体协作关系
如前文所述,单个智能体肯定不能成事儿,很难形成闭环。数据飞轮、增长飞轮、业务飞轮和产品飞轮要转动起来,背后都是智能体集群,或者说智能体的协作关系非常重要。
比如,未来活动推广、商品推荐、智能销售代表、资深购物顾问再到订单交付等智能体,要共同协作才能完成一张订单的所有流程。所以此时需要调度智能体(Coordinator Agent),类似于一个“智能体编排器”。让每个独立的功能体,通过message passing和状态共享协作完成任务。技术选型可参考LangGraph(用于agent workflow graph)或CrewAI(类协作框架)。
多智能体协作目前大概有5种组织方式(如下图)
3、人格训练手法
智能体的人格是它的“沉默提示”(silent prompt),由以下三部分构成:语言风格训练(Tone Finetuning)、行为策略训练(Action Policy)、人格标签嵌入(Persona Embedding)
4、界面设计与平台适配:Agent UI设计,支持Mobile和DeskTop
需要注意到是,对于用户的需求最初Agent并不知道,所以最初始的意图设计,需要相关领域的资深专业人士来做,因此未来意图工程师会变得很重要。在做原型的时候,就要把相关数据喂进去并开始标注。
5、渠道集成和商家集成
国内目前企业微信相对友好,飞书、钉钉也很支持,抖音、小红书现在也在跟进,它们现在都开始支持MCP,因此智能体的接入相对容易。将来对于企业自己的不同客户,由于产品不同,偏好不同,怎么去调API企业内部的知识库,你不可能用一套智能体去服务所有客户,此时MCP就为我们提供了非常好的工具。
6、项目管理工具选择,用于Agent执行项目任务管理和自身开发项目管理
Agent不仅是业务执行者,也可成为项目协调者。支持任务分解、进度跟踪、资源管理等功能。
7、选择关键技术选择参考
8、产品迭代策略
引入用户反馈 → 策略优化 → 行为更新 → 效果验证的学习闭环,保障Agent持续成长。
Clay 智能体进化闭环很重要,如何确保智能体全天候24小时自主学习、自主进化和自主行动。
9、数据飞轮:AI智能体的永动机
“智能体不是一次性交付,而是持续学习的循环。”无论什么是哪种智能体,最终肯定需要时间验证,不能指望一开始就效果很好,通常需要三个月的数据飞轮,把 COT(包括公有数据、私有数据)转动起来,形成数据飞轮效应,才能慢慢找到感觉,切入目标赛道,找到可以放大的机会。数据飞轮一旦高速自主、自动转动,智能体将越用越聪明。
010
数据飞轮:AI智能体的“永动机”
在 AI 智能体系统中,真正决定智能边界的,从来不是参数量的多少,而是有没有构建起一种可以自我进化的生态机制。这,就是数据飞轮的本质:一种通过用户使用—模型反馈—性能优化—再次使用的正向回路,让智能体越用越聪明,越走越快,最终走向“自增长”。
你可以把它想象成 AI 的“代谢系统”——没有代谢,再强的模型也终将衰老;一旦代谢通畅,哪怕一个小模型,也能焕发出远超初始边界的生命力。
数据飞轮不是神话,而是一种结构性优势。它无法被轻易复制,因为它要求产品设计、数据架构、反馈机制与组织运作的协同共振。只有当一个 AI 系统进入了真正的飞轮状态,它才不再依赖烧钱获客、运营留存,而是依靠内在学习实现自我增长。在未来的智能体互联网中,每一个系统都将是飞轮的艺术品,每一个推动飞轮转动的用户,都是这个生态体的隐形共创者。
人类与 AI 的默契,也许从未如此深刻。不是谁在控制谁,而是在共同进入一个越来越聪明的循环。
飞轮不是结构,而是循环
数据飞轮并不是一个静态结构,而是一组彼此嵌套、层层加速的循环机制。最基础的,是“数据—模型—反馈”的自学习回路:用户使用产品,系统收集行为数据,经标注与清洗反馈进训练体系,生成更优模型,再推向用户使用。
这个回路听起来简单,真正的威力在于:反馈不是“平均值”,而是“结构性改进信号”。
比如 Perplexity 的搜索系统,不会因为某条结果没被点击就粗暴判定其错误。它会结合关键词置信度、语境相似度、用户偏好历史等维度,推测“可能失败原因”,并将这些精细误差反哺模型生成策略。这种“类认知修正”,让飞轮不是盲转,而是精准校准,越转越准。
飞轮的加速器:信任—任务—迁移
进入中阶层级后,飞轮变成一个“任务成功率—用户信任度—数据质量”的复合回路。
模型答得越准,用户越信;信任越强,就会把更多复杂任务交给系统,生成的反馈也越高质量。Clay 正是依赖这种机制,在联系人事务管理中推动智能体从“辅助”到“代理”。一次联系人提醒设置,不仅完成了任务,更留下了一个包含动机、语境、后果的行为链——这种“有意图的行为数据”,远比传统CRM里的标签记录更适合 fine-tune 模型。
共创飞轮:用户即训练者
再进一步,就是“人机共创飞轮”。
以 HeyGen 为例,用户在生成视频后常会进行微调,比如二次配音、调整语速、更改人设。这些操作不仅体现用户品味,更为系统提供了极有价值的学习信号——人是怎么“改写 AI 输出”的。
HeyGen 开发了一种基于编辑日志反向生成提示词的新机制,让模型理解人类的修改逻辑。这种“从共创中学习”的能力,是模型真正“理解用户”的关键。
一旦飞轮真正运转起来之后,所形成的不是线性增长,而是乘数效应,这正是飞轮的真正奇妙之处。每一个用户行为都会带来两个回报:一是完成当下的任务,二是推动系统向未来变得更好,使系统变得比一秒前更聪明。
用户不是数据的产出者,而是系统的共同训练者。他的每一次犹豫、微调、赞同、沉默,都会成为模型成长的养料。AI 不再是被动的应答者,而是一位有意识的观察者、学习者与协作者。
这就是数据飞轮的“增强回路”(reinforcing loop)之所在——它的增长不是靠市场拉动,而是靠内在学习。你用它一次,它记住你;你用它一百次,它理解你;你不再使用它,它反思你为何离开,并优化下一位用户的体验。
这背后的哲学近乎优雅:AI 不再只是一个被动响应的工具,而是一个主动进化的生态体。你的行为、情绪、偏好、反馈,甚至沉默,都会成为它成长的燃料。
飞轮是一种系统性竞争力
飞轮从不是神话,它是一种结构性优势。
它依赖的不是某个功能点,而是设计、维护、监管、反馈系统的全链条协同。真正成熟的飞轮,不依赖烧钱拉新,也无需运营死磕留存。它靠的是——系统内部的学习能力。
在未来的智能体互联网中,每一个 AI 系统,都将是一部飞轮艺术品:既能从千万人那里习得智慧,也能为每一个人定制回应。而每一个推动飞轮转动的用户,本质上也都是这个系统的隐形共创者与训练者。
这也许是 AI 与人类最深层的默契:不是谁控制谁,而是我们正在共同进入一场“越来越聪明的循环”。
数据飞轮的构建与运转
如果说大模型是智能体的“认知大脑”,那么数据飞轮就是它的“代谢系统”。没有飞轮,模型再强也会在时间中枯萎;有了飞轮,哪怕起点很低的系统,也可能在不断的自我进化中焕发出惊人的能力。
数据飞轮的本质是一种正反馈循环,让每一次交互都反哺系统本身。你可以把它想象成一个自学习机器的“新陈代谢”:用户交互产生数据,数据优化模型,模型提供更好服务,从而带来更多更高质量的用户交互,飞轮由此滚动起来。
实际上,飞轮并不是一个,而是多个协同存在的系统层级网络,常见的有行为数据飞轮、标注反馈飞轮、人机协同飞轮与业务闭环飞轮。每一种都像是一个感官与肌肉系统,连接着用户、模型与场景之间的信息循环。
行为数据飞轮是最基础的一环,比如在 Perplexity 上,用户的点击、跳出、持续阅读时间,都会反馈进模型的排序逻辑中,进而影响后续用户看到的结果组合。而 Clay 在其联系人推荐引擎中,通过用户是否收藏、忽略、设置提醒等动作来“投票”优化个性化优先级。
标注反馈飞轮更进一步,涉及对结果质量的显性评价。像 HeyGen 这样的产品中,用户对生成视频进行微调、二次配音、调整语速,其实每一个动作都蕴含着模型“哪里做错了”的线索。这类“弱标注信号”经过结构化提取,能让模型获得极强的迭代能力。
人机协同飞轮则是飞轮系统中的“共同演练场”。在一些高价值场景中,如 Sierra 的客户支持智能体,模型往往并不直接给出终极答案,而是先列出几个可能路径,由人工运营团队选择最佳方案。这一过程中,人的判断力提升了模型的质量,而模型也在不断吸收人的决策习惯。就像是在训练一位学徒,逐步掌握师傅的手艺,甚至最终青出于蓝而胜于蓝。
在这个过程中,人机之间的边界变得模糊:不是谁指挥谁,而是像合奏那样,彼此的节奏彼此成就。Sierra 正是依靠这种“共同演练”的机制,让其智能客服在 B2B 企业中迅速形成差异化优势。据称,他们的智能体已能自动处理 70% 以上的请求,而剩下的 30% 也在持续学习中,不断缩小人机差距。
最后是业务闭环飞轮,这是一种更具战略意义的飞轮系统,它将数据、服务、商业目标串成一个封闭循环,推动系统在真实商业环境中自我成长。例如 Scale AI,不仅为客户提供数据标注服务,更通过部署端到端闭环的智能体系统,把“数据 → 模型 → 场景 → 反馈 → 数据”变成可计量、可监控的高速通道。这种闭环不仅加速了模型训练,也创造了数据的复利价值。
总结来看,数据飞轮不只是让模型更聪明,更是让智能体像生命体那样具备“成长性”。它不是外挂的优化手段,而是系统本身的一种存在方式——像细胞代谢那样持续演化,像生态系统那样多层协同。
未来,谁能构建出多层协同、自我进化的数据飞轮系统,谁就掌握了 AI 智能体时代真正的“永动机”。
飞轮启动:预热式训练
当然,飞轮不可能凭空启动,也没有哪一个飞轮从一开始就自然运转。在最初的“冷启动期”,往往需要设计一套“伪数据—真优化”的流程。早期系统往往要依赖人工冷启动,甚至模拟用户行为来生成初始反馈。冷启动阶段最需要的,不是用户增长,而是伪数据的真实感。
Sierra 在早期开发客户支持智能体时,专门招募运营人员模拟用户投诉流程,让模型在“假装真实”的对话中逐步形成应对逻辑。通过假装真实的交互来锤炼模型输出。这种“预热式训练”提供了飞轮起步所需的初始扭矩,一旦性能达到临界点,用户的自然使用行为便会接替人工,加速整个系统进入指数级自我增强。
这个“伪数据—真优化”的阶段极为关键,这个阶段没有大规模用户数据,但通过“人扮用户”+结构化反馈,打出了模型最初的磨合弧线。直到系统回答能力达到某个临界点,飞轮才真正进入正向加速。这个阶段,就像点燃一枚火箭所需的“初始推力”,并非靠市场拉动,而是靠结构设计。一旦系统表现达到临界点,用户自然会留下更真实、更复杂的反馈,飞轮才真正进入正向加速期。
数据飞轮就是一个代谢系统
在理解人工智能系统的自我进化机制时,数据飞轮是一组极具穿透力的隐喻。如果说大模型是智能体的“认知大脑”,那么数据飞轮便是它的“代谢系统”。正如生命体无法依靠一次性智慧维持长期活力,AI 系统也无法仅靠预训练参数维持性能领先。真正决定智能边界的,不是算力,也不是参数量,而是系统是否构建起了持续反馈、自我演化的生态循环。飞轮不转,模型终将衰竭;飞轮一旦启动,哪怕起点平平,也能滚出燎原之势。
这个飞轮并非单一结构,而是一组嵌套交错、彼此强化的回路:行为数据、用户反馈、模型优化、场景拓展,在一次次交互中织成一张巨大的学习网络。在 Perplexity 的搜索引擎中,用户的每一次点击、跳出与停留时长都会被记录下来,不是作为统计参考,而是参与模型生成策略的“结构性修正”。如果一个结果没有被点击,系统并不会草率地得出“这答案不好”这一结论,而是分析上下文语义、关键词置信度、用户过往偏好等线索,从而生成失败的可能原因。这些推理反哺进模型训练,使每一次失误成为下一次成功的基础。飞轮在这里不仅转动,更是在有意识地“校准”。
而在 Clay 的联系人智能体中,数据飞轮则更像一场带有情感色彩的交互舞蹈。每当用户对推荐联系人采取收藏、忽略、设提醒等操作,系统都会捕捉这些动作背后的动机和判断,从而调整后续推荐的优先级。这不仅仅是“行为投票”,更是系统对“人类关系逻辑”的逐步学习。久而久之,AI 不只是记住你在找谁,更理解你为什么在这个时刻、以这个方式去联络这个人。
Netflix 的数据飞轮是另一个极致案例,它将数据反馈延伸到内容创作本身。从观众的观影偏好中提炼出类型、节奏、演员偏好,再反过来指导原创剧集的制作方向。你看到的《纸牌屋》不是编剧拍脑袋想出来的,而是 Netflix 从千万人次数据中“反演”出的叙事策略。连剧集封面都在实时 A/B 测试中进化,不同观众看到不同视觉封面,系统据此学习视觉诱因背后的心理机制。这种“观看—调整—共创”的机制,使得用户不再只是消费者,而成为了内容共创的无形合作者。
飞轮不是神话,它是一种结构性优势。它需要设计、维护、监管和反馈系统的全链路联动。也只有当一个 AI 系统进入了飞轮状态,它才真正具备“自增长”的能力,而不是靠烧钱堆用户、靠运营拉留存。
在未来的智能体互联网中,每一个系统都将是飞轮的艺术品:它既能从千万人那里习得智慧,也能为每一个人量身定制回应。而每一个推动飞轮转动的用户,本质上都是这个系统的共同训练者与隐形共创者。这也许是 AI 与人类协作最深层的默契——不是谁控制谁,而是共同进入一种越来越聪明的循环。
案例:CLay AI的飞轮故事
Clay AI 的故事,是一个关于数据飞轮如何与人性深度融合的范本。作为一款定位于「关系智能体」的产品,Clay 并不满足于做一个静态的联系人管理工具,而是试图捕捉人与人之间复杂而微妙的关系脉络。它的飞轮机制建立在一种“行为即偏好”的理解之上——每一个用户的动作,不只是操作,而是关于他们人际认知的线索。当你收藏某个联系人,系统记录的不是“你喜欢这个人”,而是“在这个上下文中,你认定了此人值得未来联系”;当你忽略或删除一条建议,系统便更新自己的“社交地图生成器”,尝试理解你不感兴趣的并不仅是这条记录本身,而是你当前人生阶段的关注重心。
这种对数据的深加工能力,使得 Clay 不仅能识别联系人之间的关系强度,还能逐渐预测用户在何种情境下愿意重启旧联系,或者推迟某个提醒。更重要的是,Clay 将这些微观行为转化为用于微调其大语言模型的动态信号,从而让推荐结果越来越贴近用户的社交习惯。这种个性化不是靠粗暴的标签打分实现的,而是一种长期浸润式的交互反哺,就像一个贴身助理在观察你如何判断重要与否、亲疏远近。
Clay 的飞轮已经在很多用户中实现了自我驱动:用得越多,推荐越准;推荐越准,使用频率越高,产生的数据也越丰富。这种正向反馈,不是靠补贴和提醒推动的,而是源于一种细水长流的信任感——AI 懂你,不是因为它看了你的数据,而是因为它“理解”了你的行为逻辑。而理解,本身就是关系的最高形式。
在 AI 进入深水区的今天,Clay 提供了一个重要启示:最好的智能,不是惊艳的回答,而是无声的陪伴;不是快速的反应,而是对你的长期理解。飞轮不是炫技的手段,而是连接人与系统之间真实默契的桥梁。
案例:亚马逊的飞轮
在谈论亚马逊的数据飞轮时,人们常常聚焦于那张经典的“成长飞轮图”——客户体验驱动流量、吸引更多卖家、带来更大规模经济,从而进一步压低价格、提升体验。那张图像是电商的心脏泵动节律,但它真正的奇迹发生在转向数据智能之后。当这个飞轮被AI系统接入、由数据实时驱动时,它从一个物理系统蜕变成一个智能生态。此时的亚马逊,已不是一个“卖书的公司”,而是一个用数据写剧本、用AI配速的全球物流与消费计算机。
从用户的第一个点击开始,亚马逊便启动了一套精密的行为记录系统。这一系统不仅记录“买了什么”,还记录用户在页面上停留了多长时间,是否浏览了评论,是否点进了类似商品页,甚至是否在最后一刻放弃购买。每一次犹豫都是信号,每一次选择都是标签。而这些微小的信号积累起来,构成了用户画像的“细节纹理”,为推荐算法训练提供养料。它不仅知道你买过什么,更能判断你将要买什么——甚至你还没意识到你会买它。
推荐引擎是这套飞轮中的主角之一。它像是一名无形的私人导购,熟知你的兴趣与需求变化,并通过协同过滤与深度学习模型生成高度个性化的商品列表。这种推荐不是简单地“人买了你也买”,而是“理解你是谁后,为你准备好了下一步的惊喜”。当用户点击推荐商品时,这种个性化反馈又进一步丰富了模型的输入,形成了正反馈闭环。而每一轮优化都不只是提升销售额,更是提升了“系统认知用户的能力”。
但这只是飞轮的一侧。另一边,是亚马逊在语音交互上的探索——Alexa。这个家居助手听起来像一个小工具,实则是一个语音数据的富矿。在数亿次的对话请求中,Alexa不仅理解人类的语言,更开始理解人类的“意图结构”:什么时候我们在寻找商品,什么时候只是在问天气,什么时候其实是在寻找一种情绪陪伴。每一次语音互动,都是语义识别系统的一次试炼,每一条语音命令都成为训练模型的真实语料。Alexa 的成长,不依赖于工程师的调参,而依赖于全球用户的实时使用,让模型逐步掌握自然语言的模糊性与上下文之间的流动。
而这还只是“前台”的用户端。在亚马逊的“后台”,另一个更庞大也更隐秘的飞轮在高速运转:仓储与物流的智能化。从用户下单的那一刻起,系统便开始自动匹配最优的发货路径,动态调度拣货员与机器人协同作业。在某些物流中心,这已经不再是人类在货架中穿梭,而是机器人在无声地滑动,甚至会“预判”订单趋势,在你下单前就把商品提前移动到最近的出货口。这种前置调度的背后,是对数百万订单行为的长期建模,是对节假日波动、地区喜好、天气因素等变量的系统整合。在这个飞轮中,订单越多,模型越精准,效率越高,客户体验越好,订单又继续增长——一个看不见的强化学习系统在幕后演奏物流交响乐。
更妙的是,亚马逊把这一飞轮机制“外包”给了世界——这就是 AWS(Amazon Web Services)的魔法所在。AWS 并不仅仅是一个云服务提供商,它是另一个“飞轮中的飞轮”。每一个企业将其系统托管在 AWS 上,每一次 API 的调用、每一次延迟反馈、每一次容量爆表,都会被记录、分析、反馈。AWS 基于这些行为数据持续优化其底层架构和产品体验,从 Lambda 到 S3,从 Bedrock 到 SageMaker,每一个服务的进化,都是由数百万开发者与企业用户“共创”的结果。这个飞轮的妙处在于,它不仅获取数据,还通过服务让用户自发贡献更多数据,从而实现“边用边优化、边优化边吸引更多用户”的动态系统。
换句话说,亚马逊真正的竞争力并不在于某一项技术多领先,而在于它构建了一个可以不断自我学习、自我增强的多层飞轮系统。它不靠一个大脑来运转,而靠一张由数据回路织就的“神经网络”——每个节点都能反馈、每个环节都能学习。推荐系统是认知神经元、Alexa 是感知神经元、仓储是运动神经元,而 AWS 则像是一个不断拓展的外部大脑。
这个飞轮之所以难以复制,不仅因为亚马逊拥有海量数据,更因为它对反馈机制的理解与设计近乎偏执。它深知,单纯的数据本身不会转动飞轮,唯有将数据置于正确的链路中、激活其流动性,才会释放复利。而要做到这一点,需要的不只是技术实力,更是一种“系统性创造”的文化能力——跨团队协作、统一目标感、对延迟回报的长期信仰。
亚马逊的飞轮也早已超越传统推荐引擎的逻辑,成为了涵盖推荐系统、物流系统、语音交互、企业云服务在内的复杂自进化网络。用户购买行为不仅优化推荐算法,还会推动仓储物流 AI 优化拣货路径,影响 Alexa 的语义理解能力,甚至提升 AWS 在全球开发者社区的微服务设计。这个飞轮的本质是:每一个用户行为,都会在不同系统间激发“多重反馈”,最终归一为体验的整体提升。这不是某一模型的精进,而是整个生态的联动。
案例:Netflix的飞轮
在所有数据飞轮案例中,Netflix 的原创内容优化飞轮是最具“导演性”的一环,它将观众的喜好数据直接反馈至剧集的策划与制作环节,从而构建起一种数据驱动的“反演创作”机制。这个飞轮的魅力在于,它不仅提升了点击率和续订率,更重要的是改变了影视内容创作的范式,从“导演拍什么你看什么”变成了“你想看什么我来拍什么”。
这套机制的起点,其实是极其细腻的行为数据:不仅仅是“看没看完”这样粗粒度指标,更包括快进的时间点、暂停的位置、退出的时机、重看的片段、甚至在多设备间切换播放的方式。每一个行为都成为一条“情绪线索”,在系统中被打上标签:紧张、高能、无聊、心动、冲突升级……然后这些标签被汇聚成了用户的“观看情绪画像”。
以此为基础,Netflix 便能够将过往几十万小时的影视内容切分成若干“情绪段落”,并基于这些数据去训练模型判断:哪种结构组合、哪种节奏变化,更容易让用户持续观看甚至“一口气追完”。在这一过程中,推荐系统、A/B 测试、片头封面选择,以及后期剪辑的方式,全部被纳入了数据反馈链路中,形成一个从“情绪识别”到“结构重建”的完整闭环。
然而,飞轮真正加速的转折点出现在 Netflix 决定拍《纸牌屋》时。这个项目在传统内容公司中或许需要依靠资深制片人的经验、导演的风格偏好和演员号召力来拍板,但 Netflix 却反其道而行之:他们先观察到政治题材、美剧+英剧混搭结构、凯文·史派西与大卫·芬奇的受欢迎程度,这几个要素在各类剧集中都表现出色,于是“数据共振”的结果便是:用大数据去“预测”这部剧应该火,然后再拍。这个逻辑在当时遭到不少传统影视从业者的嘲笑,甚至被视为“反创意”,但结果证明,数据理解的观众心理,反而可能比创作者自己更清晰。
从此之后,Netflix 不再只是一个播放平台,它开始像算法工程师一样“编写剧情”,像数据科学家一样“选角”,甚至像运营产品一样“调节情绪节奏”。在《怪奇物语》《猎魔人》《爱死机》等原创作品中,观众能感受到的是一种近乎精准的“审美合谋”,仿佛每一幕、每一节奏变化,都踩中了某种群体共识的节拍。这种精准来自模型对“人群潜意识”的理解,而非单一用户的喜好。
进一步说,这个飞轮之所以强大,不是因为它有“最多的数据”,而是因为它掌握了“正确的反馈链路”:从内容感知到行为采集,从行为采集到模型训练,从模型训练到创作反馈,每一步都经过了精密的工程设计与组织协作。这种链路的难度在于跨职能融合——让内容制片人、AI 工程师、产品经理、运营团队一起参与飞轮设计,而不是割裂地工作。飞轮之所以难以复制,本质上是因为这种“文化共振”的组织形式稀缺,而不是技术壁垒本身高不可攀。
如今,这套飞轮已被进一步延伸至全球化语境。Netflix 会基于不同国家地区的观影数据,捕捉出本地观众的内容偏好,然后反哺投资策略。例如,在韩国用户中,悬疑、复仇、青春剧表现亮眼,于是他们先后推出《王国》《黑暗荣耀》《京城怪物》,结果不仅本地大火,还逆流冲上全球榜单,带来了新的用户增长和数据源扩展。于是一个“内容本地化 → 全球热播 → 用户数据丰富 → 更好内容投资”的复合飞轮便开始加速。
可以说,Netflix 并不是靠“猜用户喜欢什么”成功的,而是通过构建系统,让自己变成那个“不断猜得更准”的组织。数据飞轮不是一次性的胜利,而是一种持续进化的能力。这种能力的关键,不在于一开始就能预测未来,而在于每一次预测都在被行为数据实时修正,从而让“系统性智慧”不断自我增强。就像是一个会写剧本的镜子,镜中投射的是我们自身的欲望、情绪与好奇,而 Netflix 做的,仅仅是比任何人都更敏锐地捕捉到了这一点。
如果说 Netflix 是用数据创作剧情的导演,那么亚马逊则是用数据运行国家的宰相。它规划、调度、预判、分发,每一环都在向智能化演进,但又不失对人类基本需求的把握——想要更快、更便宜、更准确地得到所需。它让一家公司变成了一台没有终点的优化机器,一旦转动,便难以停下。正如贝索斯所言:“我们唯一不变的,是对变化的偏执。”而这种偏执,正是数据飞轮真正转动的燃料。
011
COT:让 AI 像人一样思考
在人类认知中,“会答”与“会想”是两码事。前者是对问题的回应,后者是对世界的理解。在构建 AI 智能体的过程中,越来越多工程师意识到一个残酷事实:大模型的答案虽多,却缺乏链条,它们可以回答问题,却常常无法“思考问题”。
Chain of Thought(思维链)推理,正是对这一缺口的回应。它并不是一个特定算法,而是一种促使模型逐步构建逻辑过程的范式转变。当你让模型“先想后答”,它所展现的能力会产生质变。原本无法处理的多步计算、条件推理、道德判断,开始变得清晰、有条理、甚至令人信服。
我们可以把 COT 想象成一条通向“可信”的小径。没有它,模型的每一次输出都像是在黑箱中掷骰子;有了它,AI 的思维过程被“拉出来”,成为可以阅读、可以优化、甚至可以共情的轨迹。在教育、医疗、金融、法律这些对逻辑严谨性有极高要求的场景中,COT 推理为 AI 提供了一种“可解释的透明”,让人类第一次真正看见了机器是如何“得出这个答案”的。
Perplexity 在回答学术类搜索时引入了思维链技术,让用户不仅能看到结论,还能一步步回溯推理路径;Sierra 在处理客户投诉时,通过让智能体在内部“思考三种解决方案再汇总”来生成更为稳妥的建议;Clay 在判断一个联系人优先级时,不是简单地根据标签排序,而是引入了“交互频率—任务相关性—用户历史行为”三重推理路径,从而得出更自然的建议。
思维链的真正价值,不是让 AI 更聪明,而是让 AI 更“像人”。它给了模型一种“暂停”的能力——先别急着回答,先把问题想清楚。而这正是人类智慧最迷人的特征。
012
常见误区与深刻教训
智能体开发从来不是复制模型的参数,更不是搬运 GPT 的 API。许多创业者在踏入这个新领域时,往往带着开发传统软件的旧思维,结果一次次撞在看不见的墙上。
最典型的误区之一,是将“拥有一个大模型”视为胜利的终点。事实上,大模型只是一个尚未成形的引擎,它缺乏对真实场景的感知能力。你可以用它生成优美的文案,但无法确保它在十万用户互动时依旧稳定。聪明的团队会让模型从一开始就浸入具体任务,贴近用户的行动轨迹与反馈行为,让训练从实验室走进街头。
另一个反复出现的陷阱,是误以为“数据量越大,智能越高”。智能体不是靠吞噬信息成为神,而是靠结构化反馈形成认知。这就像一个读遍图书馆的人未必比一个经历真实生活的人更有判断力。真正推动模型演化的,是精准标注、高质量互动、失败样本的提炼与再利用。
你要开发一款AI销售智能体,如果一开始训练的时候,就把所有销售团队成员的全量数据喂给它的时候,哪效果一定很差的。我们在观察一个开发项目的过程中,从deepSeek R1的后训练过程哪里得到启发。我们只喂给人类亲自标注的小样本高质量的绩效靠前的20%销售过去与客户互动的数据,反而转化率超过了人类销售的平均水平。
同时那些未被转化的客户对话数据,也是宝贝。这也解释了为何 Sierra 更关注“未成功客服”的对话,而非满意度高的案例;为何 HeyGen 的核心进化机制在于“用户手动微调后的视频数据”,而非一开始就生成的版本。
不少团队也忽略了智能体的“人格稳定性”。一个系统如果今天输出一套语气,明天又完全改变风格,用户很难建立信任。这背后涉及提示工程、后训练一致性以及上下文保持机制的稳定化。Perplexity 为此设计了“多回合上下文继承逻辑”,确保用户在连续提问中能获得风格连贯、立场一致的回答。
智能体产品的失败,往往不是技术问题,而是反馈机制出了问题。系统不知道自己做得好不好,没人告诉它哪里错了,也没有结构化方式修正。这种“无回音开发”状态,是一场看似高效实则盲目的内卷。正是在这一点上,构建数据飞轮变得如此重要。飞轮不仅用于增强模型,更用于构建一个“系统能听懂自己行为”的世界。
还有一个常被低估的风险,是人机边界的模糊性。AI 做得越像人,用户对它的要求就越像对待一个人。一旦模型犯错,用户会从容错切换成批评模式。这在法律、医疗、教育等高敏感行业尤其危险。如果团队没有清晰的可解释机制与责任归属定义,任何一次模型“胡说八道”都可能引发巨大的信任崩塌。
因此,构建一个智能体系统,必须是一种“反脆弱式”的工程过程。不是构建一个完美的模型,而是构建一个即便出错也能自我修复的系统。不是追求一次性上线,而是打造可以迭代的认知基础设施。不是依赖某个“超级天才工程师”,而是搭建一支能不断与模型共舞、与现实互动的运营机制。
AI 的不确定性,是风险,也是财富。在旧软件世界中,错误是BUG;而在智能体世界中,错误是下一次成长的门票。前提是你有系统接得住它。
013
技术经理五点行动建议
基于上述分析和预测,技术经理应采取的五点行动建议:
1. 从高ROI场景切入
聚焦销售、客服、报价等业务闭环明确、结果可量化的场景,以低投入验证高回报路径。
2. 构建跨部门能力矩阵
组建“智能体开发小队”,由提示工程师、模型调优专家、业务专家组成,形成高效协同机制。
3. 打造数据资产护城河
启动私域数据收集、企业知识库构建与用户反馈机制,构建智能体的独占知识基础。
4. 制定分阶段实施路线图
明确12个月内的四个阶段目标:MVP验证 → 内测试用 → 数据飞轮 → 多Agent协同部署。
5. 重构产品与商业模型
从功能驱动转向结果驱动;将Agent作为新产品线规划;设计从用户信任到任务依赖的完整旅程。
结 语:
拥抱智能体革命,
共创结果经济时代
彭志强董事长从商业本质出发,强调了AI应用开发必须以“结果导向”(RaaS)为核心,聚焦客户刚需并实现商业闭环。颜艳春老师则深入剖析了智能体的第一性是劳动力,AI Agent的技术趋势、产品构建方法论和落地关键,指明了打造爆款智能体应用的路径,并同样强调了“AI劳动力”和RaaS模式的重要性。
两位老师的分享共同揭示了AI Agent时代的巨大机遇与挑战。对于技术经理而言,理解并践行“结果导向”的商业思维,掌握从0到1构建智能体的方法,并有效驱动数据飞轮,将是在这场智能革命中抢占先机的关键。未来已来,智能体将深刻重塑各行各业,我们应积极拥抱变化,以创新和实干共同开创“结果经济”的新十年。
阅读原文:https://mp.weixin.qq.com/s/4XAqnzAibRPTZP_Zf_TB_g
推荐新闻