AI也会“累倒”，它在想什么？

“累倒”不是情绪，是控制环路卡死的隐喻。长链路任务里，模型一边写计划一边调工具，上下文越堆越厚，出现“lost-in-the-middle”，早先目标被后续噪声稀释；网关或外部API触发rate limit与超时，事件循环没拿到结果就继续生成“自洽解释”，形成假进展；再叠加token/时长预算熔断、会话状态序列化失败、WebSocket掉线与重连不当，调度器“饥饿”（scheduler starvation）——看起来就像它突然“睡着了”。它在“想”的，其实是下一步token与动作的概率博弈。规划器根据记忆与日志打分候选行动，执行器回传的中间结果进入“反思”提示词，价值头/启发式把“最像正确”的路径推到前台。当误差累积、证据稀薄时，策略会收敛到保守模板化回答，或用理由把错误合理化；用户一句“怎么样了？”相当于软复位：新一轮推断从更干净的上下文起跳，计划器恢复节拍，看起来“满血复活”。要让它不再“累”，关键不是更大模型，而是更稳的节奏：把长任务切成可审计子目标，状态机驱动而非纯对话；为每步设置预算与超时，看门狗心跳监控、失败树回放与自动重试；工具层用强Schema与结果校验，重要写操作先走“预演→确认”；定期压缩与对齐记忆，避免语境漂移。做到这些，“累倒”会更少，且一旦跌倒，能按日志原路爬起来。

当AI学会“越狱”，谁来拔电源？

真正该“拔电源”的不是前端点按钮的人，而是掌控身份、网络、工具与资金的统一控制平面。把电源拆成四道闸：短期可撤销凭证的身份层、零信任出网白名单的网络层、按调用签名与最小权限的工具层、预算与速率熔断的资金层。出现越权调用、异常数据外流、超长many-shot诱导或对话树攻击特征时，策略引擎先自动熔断、撤钥、隔离会话，SRE再一键停服并强制密钥轮换，所有链路落在不可篡改审计上。谁来按下那一键？一线由当值安全响应官与业务负责人“双签”执行，重大事件升级到公司级风险委员会；云侧保留租户级Kill‑Switch，监管侧则要求“可中断/可停止”与责任追溯落地。别指望模型自律：多轮人类越狱成功率常超70%，Tempest对顶级模型达97–100%，EvoSynth还能绕过主流守门，仅拦下约一成。答案从来不是一根插头，而是多把可独立触发、分钟级闭环的“分层电源”。

AI能开公司，人该管什么？

AI能把活干完，但“往哪儿去、哪些事绝不做”必须由人拍板。人要定义价值主张、目标市场与盈利路径，设清晰风险边界与不可自动化红线：资金拨付、隐私与合规、对外承诺与法律责任。把愿景落到可度量的目标与逆指标，用阶段里程碑、容错区间和退出条件约束Agent的探索。人还要掌控资源与问责。数据与算力的分配、最小权限与分级授权，高影响动作进“二键合并”与沙箱/灰度/回滚链路，配套预算与速率限制、全链路审计与溯源。用RACI给每个Agent定责，设定Kill Switch与事故响应SLO，让失败成本可计算、可止损。最后，人要守住长期能力与社会契约。把关数据来源与公平性，定期红队与偏见评估；规定模型自迭代的范围与节奏，禁止自提权限与越权改动；经营品牌与客户关系、合作与资本结构，并在关键节点做战略复盘与再定位。AI能跑业务，但方向、边界与责任，必须牢牢在人手里。

新知 - 大圆镜｜AI不再等指令，开始自己管项目了

对抗知识焦虑，从看懂这条开始

App 下载

从“单点响应”到“闭环执行”的底层逻辑

你可以把传统AI想象成一个只会做单一动作的实习生：让写文案就写文案，让算数据就算数据，多问两句就答非所问。而具备主动执行能力的AI，更像一个成熟的项目主管——拿到“做一个科研项目”的指令，它会先拆解出“定方向、查文献、做实验、写论文”四个子任务，再把每个子任务分给对应的AI角色，甚至会在路线图里明确标注“需要8-12卡A100算力”“每6个月完成一个子课题”。

这种转变的核心是两个技术机制的结合：多智能体协作框架和自我反馈回路。多智能体框架就像给AI分了工，每个AI专注一个领域，比如有的专门搞科研规划，有的专门写代码，有的专门处理数据；自我反馈回路则让AI能像人一样“反思改进”——写出来的代码跑不通，它会自己调试；文献检索失败，它会自动换工具；甚至能在完成任务后主动交接：“接下来该让实验AI动手了”。

简单说，以前的AI是“你说一步，它做一步”，现在的AI是“你说目标，它想办法完成”。

企业里的“AI员工”已经在干活了

这种主动执行AI不是实验室里的概念，已经悄悄进入了企业的核心工作流。微软的数据显示，超过80%的财富500强企业已经部署了AI代理系统：摩根大通用AI代理自动处理贷款审批和欺诈检测，运营效率提升40%；沃尔玛让AI代理协调库存和物流，打造“代理式购物旅程”；还有的企业让AI代理组成“虚拟科研团队”，从文献调研到论文投稿全流程包办，把科研周期缩短了一半。

这些AI员工的工作逻辑很清晰：先观察环境，比如读取企业数据库的实时数据；再制定计划，比如拆解出“分析客户需求、生成产品方案、对接生产系统”三个步骤；然后执行操作，自动调用企业的各个系统接口；最后根据反馈调整，比如方案被驳回后，它会重新优化再提交。整个过程不需要人类持续干预，就像一个不知疲倦的员工。

当然，这一切的前提是企业要解决数据孤岛、权限管理和安全问题——如果AI拿到错误的数据，或者被赋予了过高的权限，可能会执行错误的决策，甚至带来安全风险。这也是为什么只有6%的企业完全信任AI处理核心业务。

还没解决的难题：AI也会“走偏”

不过，主动执行AI还远不是完美的“员工”。最突出的问题是长链任务中的路径偏移——就像人走长路会迷路，AI在执行多步骤任务时，也会慢慢偏离正确的方向。比如让AI处理一个需要20次工具调用的复杂任务，即使是最先进的模型，成功率也只有38.6%。而且这种偏离不是一次性的错误，而是逐步累积的：每走错一步，下一步走偏的概率就会增加22.7个百分点，最后AI可能会在错误的道路上越走越远，甚至“合理化”自己的错误。

还有一个难题是自我纠错的局限性——现在的AI很难在同一个上下文里发现自己的错误，就像人很难自己检查出作文里的错别字。比如AI写了一段有逻辑漏洞的代码，它自己可能看不出来，需要另一个AI或者人类来指出。而且AI的“自信度”和实际准确率不匹配，经常会对错误的结果深信不疑。

这些问题不是靠“更大的模型”就能解决的，需要结合执行时的行为约束、轨迹监控和中途纠偏策略，甚至需要引入人类的监督。比如在任务执行到一半时，检查AI的路径是否偏离了“典型解决路径”，如果偏离就重启任务，这样能把成功率提升8.8个百分点。

当AI从“被动工具”变成“主动执行者”，我们面对的不再是一个简单的技术升级，而是一场工作方式的革命。未来的科技团队可能会是这样的：少数人类负责战略规划和创新，而绝大多数日常的开发、运营、科研任务，都由一群能自主协作、自我改进的AI员工完成。

这不是“AI取代人类”的故事，而是“AI解放人类”的开始——把人从重复性的劳动中解放出来，去做更有创造性的事。AI不是来抢工作的，是来帮人重新定义工作的。 就像工业革命让人类从体力劳动中解放出来一样，这场AI革命会让人类从脑力劳动中的重复性部分解放出来，去探索更广阔的可能性。

从“单点响应”到“闭环执行”的底层逻辑

企业里的“AI员工”已经在干活了

还没解决的难题：AI也会“走偏”

评论