最受审查的代码，为何藏着致命缺陷？

因为多年审查盯的是“对不对、能否等价运行”的安全性，而不是“是否必然继续前进”的活性。阅读和逐指令仿真能证明不崩溃、不越界，却很难穷尽“获得资源后在所有错误路径上都释放”的进展性约束。LGYRO 恰是活性漏洞：只在“扭转中被笼罩”的罕见分支触发，又被重启清零的自愈逻辑遮蔽，测试与飞行流程把它当作会自行消失的幽灵。更隐蔽的是社会技术缝隙：通用收尾例程与陀螺专用锁分属不同责任边界，汇编缺乏作用域析构与异常保障，释放靠人工记忆逐路径补丁；再叠加遥测盲点与 DSKY 无告警，现场只呈现“接受输入却不前进”，不给诊断锚点。权威与“已飞行成功”的幸存者偏差，进一步降低了质疑的动机。能抓住这类错的，不是更多“读”和“跑”，而是把资源写成状态机的可执行规范，明确“获得后最终释放”的活性公理，用模型检查、符号执行或类型化资源生命周期逐路径对账。读代码与仿真只能说明此刻不崩，规范才能逼问：有没有一条路，会永远不回来？

AI能揪出57年前的bug，然后呢？

能揪出来只是序章，真正的价值在把“隐含的契约”变成“可验证的承诺”。把像LGYRO这样的资源状态抽成显式状态机，用AI从代码中自动蒸馏行为规范，再把这些规范接进流水线：每次提交都做全路径义务检查（谁加锁、何时必解），给出可复现实例路径，而不是模糊告警。对安全关键软件，还能把这套规范转成合规证据，配合形式化方法标准接受（如可与现有认证流程并行提供可追溯证明链）。落到工程上，接下来该做三件事：先用同类规范挖掘把全库的“必须释放”类资源列一张清单，生成专用规则（等价于为CWE-772量身定制守门员），纳入CI；再把高危点自动化修复为结构化清理（RAII/try‑finally/defer，或在汇编里内联解锁宏），并为嵌入式加上轻量运行时哨兵，遇到异常路径先解锁再进入安全重启；最后把这次缺陷的路径证据沉淀成回归用例和规范基线，后续任何改动触发“规范差异”预警，而不是等到系统挂起才追溯。当然，AI的结论必须有“可核查的轨迹”。没有路径见证、模型检查和硬件在环复现实验的支撑，它只是一个漂亮的猜想。真正的“然后”，是把读代码与跑仿真，升级为“陈述并证明”：让行为规范成为一等公民，把“规格债”像技术债一样持续清偿，旧代码得以再保险，新代码不再重蹈覆辙。

完美代码和皮实系统，哪个更重要？

如果只能二选一，选皮实系统。所谓“完美代码”是逼近而非抵达的极限；AGC 被无数双眼睛审过、字节级比对过，锁泄漏仍潜伏了半个世纪。真正托底的是系统层的“抗打击能力”：优先级调度、故障隔离、可重启与有状态清零，把不可避免的缺陷变成可承受的事件，用有界影响和可预期恢复赢过了“零缺陷”的幻觉。但“皮实”不是烂代码的免死金牌，而是让失效可见、可控、可逆。把行为规范前置成不变式（如资源生命周期、必须释放的承诺），再用超时、幂等、看门狗、冷启动确定性与可观测性兜底。规范减少“无声失败”，韧性确保“带病生存”。预算有限时，先买系统韧性；余力用于把关键不变式写下来并持续校验。

新知 - 大圆镜｜57年未被发现的阿波罗代码bug，藏在最严谨的盲区

对抗知识焦虑，从看懂这条开始

App 下载

被重启机制掩盖的锁死陷阱

要理解这个bug，得先搞懂阿波罗制导计算机（AGC）的「资源锁」——你可以把它想象成厕所隔间的门栓：陀螺仪是唯一的隔间，每次调整姿态前必须先插上栓（获取锁LGYRO），用完再拔下来（释放锁），防止两个程序同时抢硬件。

AGC的代码里，正常校准完成后会通过STRTGYR2程序拔下门栓，但如果校准中途IMU被「笼式开关」触发（比如宇航员误碰），程序会跳转到BADEND紧急退出——这里偏偏少了拔门栓的两步指令：把零值加载到累加器，再写入锁寄存器。就像有人急着离开，忘了把厕所门栓拉开。

更致命的是，AGC有个「防御性重启」机制：一旦系统崩溃，重启会自动清空所有锁状态。过去的测试里，只要触发重启，这个bug就会被悄悄抹掉。但如果没有重启——比如柯林斯只是误碰开关又马上复位——锁就会永远卡在「占用」状态，所有后续校准都会卡在等待里，连手动调整都没用。

从13万行汇编里揪出4字节漏洞

为什么全球上万开发者翻了19年都没发现？因为他们都在「读代码」，而发现bug的团队用了另一种思路：「看行为」。

他们用Allium——一种专门给AI读的行为规范语言——把AGC里IMU模块的13万行汇编代码，提炼成了1.25万行「资源生命周期规则」。简单说，就是给每个资源（比如LGYRO锁）写一本使用手册：什么时候必须拿，什么时候必须还，所有可能的路径都得覆盖到。

这个过程相当于让AI当「合规检查员」：先定义规则「只要拿了锁，任何路径都必须还」，再让AI顺着代码的所有分支一条条查。正常路径没问题，但当它追到BADEND分支时，规则被打破了——这里只清算了其他资源，唯独漏了LGYRO。

传统的代码审查和仿真测试，只会盯着「应该正常运行的情况」，而行为规范建模是从「资源必须被正确管理」的本质出发，逼着检查所有「没人想过会发生的异常路径」。这就像查消防隐患，不是看灭火器有没有，而是看每个房间的每个出口都能不能顺畅逃生。

不止是阿波罗：我们代码里的隐形炸弹

这个bug不是孤例。MITRE把这种「资源拿了不还」的问题归类为CWE-772，评级为「高风险」——直到今天，它依然是软件里最常见的隐形陷阱。小到手机APP闪退，大到云计算中心宕机，很多都是因为某个文件句柄、数据库连接或者分布式锁被「遗忘」了。

阿波罗的bug能藏57年，还有个重要原因：它的代码是「焊死」在硬件里的——程序被手工编成铜线绕在磁芯上，改代码等于重新造硬件。而现在的软件迭代快，很多团队为了赶进度，把「资源释放」这种脏活累活丢给程序员手动处理，甚至依赖自动垃圾回收机制，但总有漏网之鱼。

有意思的是，当年AGC的开发者们其实已经想到了「防御性编程」，但他们没想到，这种「出问题就重启」的保护机制，反而把bug给藏得更深了。就像给漏了的水管套上保温层，暂时不漏水了，却没人发现管子已经裂了。

柯林斯最终平安返回了地球，那个可能发生的灾难永远停留在了假设里。但这个57年的bug，像一面镜子照出了软件工程里最容易被忽略的真相：我们总在盯着「怎么让程序跑起来」，却常常忘了问「程序在所有情况下都能正确停下来吗」。

行为规范化建模的价值，不止是挖出来一个老代码里的bug，它提醒我们：软件的可靠性，从来不是靠「测试正常情况」堆出来的，而是要盯着那些「没人想过会发生的异常」。

代码的盲区，才是最致命的风险。

被重启机制掩盖的锁死陷阱

从13万行汇编里揪出4字节漏洞

不止是阿波罗：我们代码里的隐形炸弹

评论