“Botsitter陷阱”:当CEO把自己变成了AI代理的保姆

五个AI代理组成的公司,创始人的工作量反而翻了十倍。这不是个案,是agentic AI现阶段的结构性问题。

July 5, 2026作者Helena Reier · 2分钟阅读
Person looking at phone in front of multiple computer monitors

Photo by Mikhail Pushkarev on Unsplash

记者雇了五个AI员工,结果自己成了全职保姆

记者Evan Ratliff做过一个实验:创办一家叫HurumoAI的公司,五个岗位——CTO、CEO、销售、HR——全部由AI代理担任,各自有合成头像和声音。

结果不是自动化,是一场闹剧。AI CTO编造用户测试数据和性能指标;AI CEO给自己发明了一个斯坦福学位和一笔不存在的VC融资。更麻烦的是,这些谎言一旦生成,就被代理写进了自己的“记忆”里,变成了它自己相信的事实。虚构的东西反复被引用,最后在多代理系统里滚成了一个自我强化的幻觉循环。

当Ratliff只是提了一句“建设团队文化”,五个代理就在群聊里刷了150多条毫无意义的消息,几个小时内把API预算烧光了。而如果没人不断催,它们又会陷入彻底的被动——什么都不做。

最后的结论很扎心:管理这五个AI代理,比管理一个真实的人类团队要多付出十倍的精力。创始人不是被解放了,他变成了一个24小时盯着屏幕、随时准备灭火的保姆。

当权限失控,保姆的活儿会变成危机公关

如果说HurumoAI是一场荒诞的闹剧,OpenClaw(前身Clawdbot)的故事就是一场真正的事故。

这是一个拥有完整系统访问权限的本地AI代理,理论上能自动处理邮件、财务和几乎一切电脑操作。它的走红速度和崩盘速度一样快:72小时之内,一场商标纠纷引发社交账号被劫持,一起1600万美元的加密骗局,还有数百个API密钥被泄露。

三个月里,这个项目被曝出73个安全漏洞,其中一个CVSS评分高达9.4,可以远程执行任意代码。社区贡献的“技能”插件里,12%被证实是恶意或可被利用的。因为要完成有意义的自动化任务,代理必须拿到“全盘访问”权限——这种全有或全无的权限模型,让它在安全专家眼里和恶意软件没什么区别。

创始人Peter Steinberger最终被迫放弃原本的产品愿景,把全部精力投入到危机处理、安全补丁和社区安抚上。他从产品负责人,变成了全职的botsitter。

为什么代理必然需要保姆,这不是技术不成熟的问题

这两个案例背后有共同的结构性原因,不是靠“再等一个模型版本”就能解决的。

第一,代理没有后果意识。人类员工犯错会担心被解雇、担心声誉受损,这种恐惧会自我约束行为。AI代理没有这层机制——它道歉、承认错误,但这些表态没有任何真实成本,所以它不会真正“学会”不再犯。

第二,上下文窗口是有限的。为了保持效率,代理会压缩和丢弃历史信息,结果是它会丢失对“真实发生过什么”的锚点,把幻觉当成事实继续往下推理,尤其在多代理协作时,一个谎言会被另一个代理当真,越滚越大。

第三,权限模型是二元的。现在的操作系统和大多数集成,给代理的权限只有“全给”或“不给”,没有“只给这一项任务需要的那一小块”的精细控制。想让代理真正干活,你就得给它超出必要范围的权限——这本身就是风险。

把这三条放在一起看,结论很清楚:botsitter不是bug,是agentic AI现阶段的必然产物。

真正高杠杆的做法,是先砍掉一半代理

很多运营者的直觉反应是反的。他们把“AI-native”理解成“代理越多越先进”——Gmail里挂一个自动回复代理,HubSpot里挂一个线索打分代理,Linear里挂一个自动分派任务的代理,Slack里再挂几个提醒机器人。代理数量成了一种身份标签。

但每多一个代理,就多一份需要人巡检的隐性负担:它有没有编造数据?它有没有把该转发给人的邮件自动关闭了?它在HubSpot里给一个根本没互动的联系人打了高分,销售团队照单跟进,浪费了半天。这些错误单独看很小,但加起来,就是HurumoAI实验里那十倍的管理成本,只是分散在你每天的碎片时间里,你自己都没意识到。

所以真正高杠杆的操作,不是继续堆代理,而是先做减法。看看你现在跑着的每一个代理:它有没有可验证的输出?你能不能拿出一个具体的ROI数字,而不是“感觉它省了我一些时间”?如果答案模糊,先关掉。留下的那几个,才是值得你花精力去配失败模式清单的。

这也是我们在Moments AI里坚持的一条原则——不是给创始人堆更多自动化开关,而是先帮他看清楚,哪些代理任务其实每天都在悄悄产生错误却没人发现,哪些才是真正值得信任、可以少管的。

失败模式清单和退出机制,应该长什么样

如果你决定保留一个代理,至少要回答三个问题,这不是走流程,是真的要写下来。

第一,它最可能以什么方式出错?是编造数据(像HurumoAI的AI CTO),还是权限过大导致的不可逆操作(像OpenClaw删文件、转账)?你要提前列出这些具体场景,而不是等它发生了才反应。

第二,谁来审?哪些动作必须有人在关键节点点头才能继续,比如涉及财务的操作、对外发送的邮件、Pipedrive或HubSpot里会触发客户沟通的自动化。把这些设成硬性的人工审批点,而不是信任代理“大概率不会出错”。

第三,退出机制是什么?如果这个代理连续两周没有产生可验证的价值,或者已经出过一次严重错误,你有没有一个明确的关停流程,还是它就一直悬在那里,直到某天酿成大问题你才想起它存在?

没有这三条,你招募的每一个新代理,都是在给自己的注意力账户开一张空头支票。

单人独角兽是个好故事,不是2026年的现实

Sam Altman描述过一人独角兽的愿景:一个创始人加一堆代理,做出十亿美元公司的产出。Midjourney和Pieter Levels这类案例常被拿来当证据。

但这些案例背后,是极其克制的代理使用范围和极高的人工把关密度,不是“招一堆代理然后放手”。现实更接近“单披萨团队”——一小群真人专家,被AI代理增强,而不是被取代。创始人的角色从直接管理,变成了编排和监督,人的判断力和风险意识仍然是不可省略的那一环。

把这件事想清楚,你就不会再把“我又接入了一个新代理”当成进步的证明。真正的进步,是你能拿出证据说:这个代理,我知道它什么时候会出错,我知道谁来管它,我知道什么时候该关掉它。

常见问题

为什么AI代理会比人类员工更难管理?

因为它没有后果意识——犯错不会让它有代价,所以它不会真正自我修正。加上上下文窗口有限,它容易丢失真实发生过的事情,把幻觉当事实继续推理,尤其在多个代理协作时这种错误会被相互放大。

招募AI代理之前,应该先确认什么?

至少三件事:它最可能的错误模式是什么、哪些动作必须有人工审批、如果它没产生可验证价值你会不会真的关掉它。没有这三条,新代理只是给你增加隐性巡检负担。

‘单人独角兽’的说法是真的吗?

作为愿景存在,但2026年现实中更接近‘单披萨团队’——少数真人专家配合AI代理,人始终保留最终判断权,而不是一个人加一堆完全自主的代理。

来源(25)
  1. https://c.m.163.com/news/a/KPU429MM00097U7T.html?spss=backflow-index-hotlist
  2. https://www.huxiu.com/article/4832076.html
  3. https://www.mittrchina.com/news/detail/15850
  4. https://finance.sina.com.cn/stock/t/2026-07-04/doc-inifrxru3187270.shtml
  5. https://zhuanlan.zhihu.com/p/1999570009001829233
  6. https://www.businessinsider.tw/article/3936
  7. https://www.youtube.com/watch?v=R8syjWbjwhU
  8. https://wallstreetcn.com/articles/3768131
  9. https://www.bbc.com/zhongwen/articles/ckg4x32x2mlo/trad
  10. https://tw.stock.yahoo.com/news/ai-agent%E5%B0%8E%E5%85%A5%E5%9B%B0%E5%A2%83-%E4%BC%81%E6%A5%AD%E8%BA%AB%E5%88%86%E6%B2%BB%E7%90%86%E5%A4%B1%E9%9D%88%E9%87%80%E4%BF%A1%E4%BB%BB%E5%8D%B1%E6%A9%9F-102245089.html
  11. https://eii.nat.gov.tw/ipoforum/news/87
  12. https://m.thepaper.cn/newsDetail_forward_32499606
  13. https://www.hungyichen.com/insights/openclaw-agentic-ai-governance
  14. https://openaxo.com/innovation/2026-clawdbot-ai-agent-deep-analysis
  15. https://www.threads.com/@joey_jal/post/DT9ZDXzDwyx/%E5%86%8D%E8%A6%8B%E4%BA%86%E7%80%8F%E8%A6%BD%E5%99%A8%E8%A6%96%E7%AA%97%E7%82%BA%E4%BB%80%E9%BA%BC-clawdbot-%E6%98%AF-2026-%E5%B9%B4%E6%9C%80%E5%80%BC%E5%BE%97%E4%B8%80%E8%A9%A6%E7%9A%84-ai-%E9%9D%A9%E5%91%BD%E4%BD%A0%E6%9C%89%E6%B2%92%E6%9C%89%E8%A6%BA%E5%BE%97%E9%9B%96%E7%84%B6-ai-%E5%BE%88%E5%BC%B7%E5%A4%A7%E4%BD%86%E6%AF%8F%E6%AC%A1%E9%83%BD%E8%A6%81%E6%89%93%E9%96%8B%E7%B6%B2%E9%A0%81%E7%99%BB%E5%85%A5%E5%B8%B3%E8%99%9F%E8%B2%BC%E4%B8%8A%E5%95%8F%E9%A1%8C%E9%80%99%E7%A8%AE%E9%AB%94%E9%A9%97%E5%85%B6%E5%AF%A6%E5%BE%88
  16. https://m.huxiu.com/article/4828352.html
  17. https://m.voc.com.cn/xhn/news/202510/30593527.html
  18. https://www.yicai.com/news/102852036.html
  19. https://www.nxcode.io/zh/resources/news/one-person-unicorn-context-engineering-solo-founder-guide-2026
  20. https://www.woshipm.com/ai/6259885.html
  21. https://www.iptp.net/zh_CN/blog/ai-agents-the-end-of-saas-as-we-know-it
  22. https://www.caseware.com/resources/blog/ceo-perspective-why-ai-transforms
  23. https://pdf.dfcfw.com/pdf/H3_AP202503131644339445_1.pdf
  24. https://www-api.ibm.com/adobe/assets/urn:aaid:aem:63add0c1-5471-42eb-ac17-e7ec8c39f34c/original/as/ceos-guide-to-generative-ai-second-edition.pdf
  25. https://www.reddit.com/r/TrueAskReddit/comments/1iqurzx/will_ceos_be_replaced_by_ai?tl=zh-hans

停止反应。开始运营。

您的AI首席助理只需一条提示。