程序员不写代码，改写“AI宪法”？

答案不在于“彻底不写代码”，而是把主要精力转向把规矩写成可执行的“AI宪法”。真正有效的宪法不是长文档，而是policy-as-code：用hooks联动Semgrep/OPA把危险改动与越权调用当场阻断；用定制lint与测试表达规范，错误信息写成“修复指令”交给Agent自愈；把每次事故复盘自动沉淀回CLAUDE.md与规则库。记住三件事：规则要可测试、可回滚、可观测。上线姿势也得换：先跑影子模式，盯PR通过率、回滚率、测试覆盖增量、护栏拦截次数，再逐级放权；给宪法做版本化与A/B，避免过度收紧导致产出塌缩；遇规则打架，用“最小可行约束”与规则lint消振。最后给一份落地清单：密钥扫描与出站代理、临时容器沙箱、工具白名单、前缀缓存+批量推理控成本。程序员的新工作，不是变少，而是从“码农”进化为“规则与可靠性”的总设计师。

给AI“上规矩”，会限制它的创造力吗？

不会，前提是你把规矩当“轨道”而不是“镣铐”。实证更有说服力：在不更换模型的前提下，仅通过调整工程挽具，某大规模基准从52.8提升到66.5；另一边，自动化系统在强规则下依旧能周更千级PR。这说明规矩并未削弱新意，反而减少了无效试错，把模型的“创意火力”集中到有价值的空间里。更直白点：98.4%的确定性基础设施，是为那1.6%的AI决策创造可落地的舞台。真正会扼杀创造力的，是把规矩写成逐行手册。高效的做法是“发散与收敛分层”：让子代理在沙盒里高温探索，主代理低温整合；把规矩表述为目标与红线，而非具体步骤；用hooks兜底风险、用skills固化重复，把自由度留给“如何解”。一旦发现产出多样性下降、重复错误增多，就是规矩过度干预的信号，收紧红线、放松路径，让AI在边界清晰的场内尽情发挥。

AI同事上岗，人类实习生该去哪？

别和AI拼敲代码，去占据“人机中枢”。实习生最该做的，是把团队经验翻译成可执行约束：维护CLAUDE.md让规则落地；把重复任务沉淀成skills；用hooks做权限网关、沙盒与回滚；把lint信息改写成“机器可修”的指令；建立可度量的评估集与基线（成功率、回归率、PR合并时长），并持续红队对抗与越权检测。去哪儿更有成长？两条路最吃香：在技术团队做Agent Ops/Rules Engineer，把开发流水线的“方向盘和刹车”搭牢；或深入行业侧当AI落地实习，把业务制度编译成规则与测试。你的作品集别晒行数，展示一次端到端改造：接管一个repo，交付CLAUDE.md v1、关键skills与hooks，并给出前后效率与事故率对比。能力模型也变了：能把需求写成机器可执行规范；能让代理安全运行（最小权限、沙盒、审计）；能用指标驱动迭代。这三件事，比会不会写某门语言更决定去向。抓住“设计AI工作环境”的空位，你就不再是被替代的那一个。

新知 - 大圆镜｜别再调提示词了，AI编程要靠工程化

对抗知识焦虑，从看懂这条开始

App 下载

从对话到协作，AI成了项目的固定成员

你可以把这套工程化架构想象成一家微型公司：CLAUDE.md是入职手册，写着项目的架构规则、命名规范和踩过的坑；skills/是工作SOP，把代码审查、生成提交说明这些重复活儿封装成可一键调用的模块；hooks/是合规部，用确定性代码在AI犯错前就挡住危险操作；docs/是公司章程，记录着每个决策的来龙去脉。

OpenAI Frontier团队的实验把这套逻辑推到了极致：5个月里，AI代理生成了100万行代码、1500个PR，团队从3人扩到7人，却几乎没人直接写代码。他们的核心不是用了更强大的模型，而是给AI搭了个“脚手架”——用分层架构约束AI的代码逻辑，让linter的错误提示直接变成AI能读懂的修复指令，把所有文档都存在代码库让AI随时查阅。

最关键的是，这套系统会越用越聪明。每次AI犯错，你就往CLAUDE.md里加一条规则；每次重复劳动，就封装成一个skill；每次出bug，就加一道hook护栏。项目经验就这样沉淀成了AI的长期记忆，不用每次启动都重新培训。

Harness工程：给AI装方向盘和刹车

如果说大模型是一匹跑得快的马，那Harness就是套在马身上的挽具——缰绳控制方向，马鞍固定位置，笼头约束边界。Martin Fowler把这个逻辑凝练成了公式：Agent=模型+Harness。模型负责智能推理，Harness负责给AI搭好“工作环境”。

Harness的核心是三层机制：上下文管理让AI随时能调用项目记忆；约束与权限给AI划好安全边界，比如禁止删除核心文件；反馈与验证则像个质检员，AI写完代码自动跑测试，错了就自己修复。Stripe的Minions系统就是个典型，每周自动生成1300多个PR，全程不用人写代码，只需要最后人工审核——因为Harness已经把代码质量的底线卡死了。

有意思的是，对Harness的优化往往比换模型更有效。有人做过测试，模型权重不变，只优化Harness的上下文管理和验证机制，系统性能排名能提升20名以上。这也解释了为什么Claude Code的51万行代码里，只有1.6%是AI决策逻辑，剩下98.4%全是Harness的工程代码——真正让AI靠谱的，从来不是模型有多聪明，而是给它搭的架子有多结实。

普通开发者的第一步：从建一个文件开始

你不用一开始就搭出OpenAI那样复杂的系统，从最简单的小事就能切入。

第一件事，在项目根目录建一个CLAUDE.md。不用写太长，10分钟就能搞定：把团队的命名规范、禁止踩的坑、测试要求写进去。下次AI犯错了，别着急手动改，先想想是不是CLAUDE.md里漏了规则。

第二件事，把每天重复做的事封装成skill。比如你每天都要写提交说明，就把这个流程写成一个标准化的指令模块，以后让AI直接调用，不用每次都敲提示词。Anthropic的创始人Boris Cherny说过：“每天做某事超过一次，就把它做成skill。”

第三件事，在容易出问题的地方加hook。比如AI经常写错配置文件，就加一个自动校验的脚本，AI一修改就自动检查格式，错了就打回去重写。这部分是最能体现“工程化”的地方——用确定性的规则，代替对AI“自觉性”的期待。

当然，这套系统也不是完美的。AI生成的代码缺陷率比人工高1.7倍，安全漏洞更是个大问题。但这些不是不能解决的——只要在Harness里加更严格的验证环节，比如让AI写完代码自动跑安全扫描，就能把风险降到最低。

当AI从“对话工具”变成“项目成员”，开发者的角色也在悄悄改变：以前是自己写代码，现在是给AI搭环境、定规则、做监督。就像导演不用自己演每一个角色，只需要写好剧本、把控节奏，就能拍出完整的电影。

未来的软件工程，拼的不再是谁写代码更快，而是谁能设计出更高效的AI协作系统。代码会被AI写，但系统要靠人搭。这不是开发者的失业危机，而是一次能力升级的机会——从“码农”变成“AI系统设计师”，用更高效的方式创造价值。

从对话到协作，AI成了项目的固定成员

Harness工程：给AI装方向盘和刹车

普通开发者的第一步：从建一个文件开始

评论