抛弃数据库事务，世界会变得更好吗？

想象一下，银行把“扣款”和“入账”当作两笔互不相关的独立操作；电商大促里，库存扣减与订单确认彼此不再捆绑；写入一半断电，系统重启后大家各看各的版本。没有事务，世界会更快吗？也许一瞬间更快，但很快你会发现，速度换来的是不确定性、纠纷和深夜的应急回滚。事务存在的意义，是在混乱中维持秩序。原子性让一组动作同生共死；一致性守住业务不变式；隔离性让并发互不干扰；持久性在断电和故障后依然还原真相。这不是教条，而是被电源抖动、磁盘坏块与并发写入反复锤炼出来的工程常识。正因如此，数据库投入了惊人的机械：PostgreSQL用多版本行和xmin/xmax让每个事务看到自己的“时间切片”，再靠VACUUM清理失效版本；MySQL不保留多份行，而是用undo log和读视图在需要时“回放”过往。两条路，同一目标：可重复读的一致快照，不阻塞的并发读。有人会说：事务拖慢了系统。确实，隔离越强，代价越高。Serializable在MySQL里依赖锁，冲突时可能死锁，只能牺牲一个事务放行另一个；PostgreSQL用谓词锁与乐观冲突检测，避免等待，却会在提交时以“序列化失败”终结其中一方。无论哪条路径，应用都必须写好重试、幂等与去重。把隔离级别调低到读已提交或可重复读，缩短事务、减少热点、用好索引与分区，往往比“不要事务”更有效率。真正让人动念“抛弃事务”的，是分布式。跨库、跨服务的全局ACID几乎寸步难行：两阶段提交耗时、占锁、还可能在故障边界留下不一致。这里的答案不是否定事务，而是重构边界：在服务内坚持本地事务，在服务间采用柔性一致性。TCC把操作拆成Try/Confirm/Cancel，以业务补偿代替全局锁；Saga通过事件或编排让长事务分段提交、可回滚；Outbox+消息队列把“先落库、后发件”整成一笔可恢复的本地原子单元。你仍然依赖事务——只是把强一致限定在最小闭包内，再用幂等、去重键、重试与回查把“最终一致”拉回正轨。 NoSQL世界选择了BASE，换来了弹性与吞吐，但也不得不引入版本号、乐观锁、回放日志等“类事务”的部件去收敛不确定性。这恰恰说明：你可以不叫它事务，却逃不开它要解决的问题。面对钱、库存、用户身份等强约束数据，放弃强一致就是邀请“丢失更新、脏读、幻读”上门；面对日志、推荐、指标等宽容场景，读写解耦、最终一致与近实时足矣。所以，抛弃数据库事务，世界不会更好，只会把复杂度从数据库转嫁到应用，再以更高的维护成本和更隐蔽的事故概率索取代价。更好的世界，是把事务用在该用的地方：关键不变量内坚守ACID，分析与内容场景敢于放宽到读已提交或快照读；单库内写小而快的事务，分布式上用Saga/TCC/Outbox编织“可补偿”的流程；系统层提供重试、幂等与观测，承认冲突必然发生，并优雅应对。工程的成熟，不是迷信强一致，也不是盲逐高性能，而是知道在哪里需要“现在就对”，在哪里允许“稍后而对”。当你把真相交给事务，把不确定交给补偿，系统便在速度与正确之间找到呼吸的节奏。技术的尽头，是选择的智慧。

数据库的“处事哲学”有何不同？

如果把数据库当作江湖高手，它们的“处事哲学”大相径庭：有人善用分身术，保证见招拆招；有人专练硬功夫，先动手后补偿。你愿意要一个“永远给你一张稳定快照”的队友，还是一个“当场覆盖、事后回滚”的拍档？这份差异，正是并发世界里性能与一致性的取舍之道。在 ACID 的铁律下，事务像契约：要么全部兑现，要么一笔勾销。但“如何在拥挤的战场上互不误伤”，MySQL 与 PostgreSQL 选择了不同策略。PostgreSQL走多版本并发控制的“纯版本派”：每次更新都新写一条版本，用 xmin/xmax 标记可见性，读者各取其“时空快照”；副作用是版本会堆积，需要 VACUUM 清扫、必要时 VACUUM FULL 紧缩，换来读写互不阻塞、Repeatable Read 下也不出幻读。MySQL（InnoDB）走“写入覆盖+后悔药”的实用派：行数据直接改新值，历史版本进 undo log，配合 Read View 现场还原快照；快照读靠 MVCC，不加锁高并发；遇到当前读和防幻读，再动用 next-key 锁守住边界，减少日常维护，却要管理好 undo 的回收与清理。在隔离级别上，两者同名不同命。标准说 Repeatable Read 可能有幻读，但 PostgreSQL 通过版本可见性把它消弭；MySQL 的 RR 对快照读没有幻读，对当前读用间隙锁兜底。PostgreSQL干脆不允许脏读，所谓 Read Uncommitted 实际也等价 Read Committed。结果是：PG的读一致性更“刻板”，MySQL的并发控制更“机敏”。当两笔交易都要改同一行，哲学分野更明显。MySQL信奉“先锁为敬”：读多用共享锁，写必取排他锁，必要时让其中一方死锁出局、应用重试；PostgreSQL偏爱“乐观推进”：通过谓词锁和可序列化快照隔离跟踪冲突，不先堵，事后发现违规就中止事务，减少长期阻塞。这决定了你的应用要不要更积极地做幂等与重试。至于持久性，路径也不同。PostgreSQL以 WAL 统筹崩溃恢复；MySQL则以 redo log 保证落盘一致性、binlog承载复制归档，再用“两阶段提交”调和双日志一致。一个强调标准化的严整，一个强调工程化的实用。运营侧的性格也能看见：PostgreSQL要与 autovacuum 共舞，换来稳定的可见性；MySQL要与索引和锁打交道，避免无索引条件导致表锁放大。工作负载上，复杂查询、写入密集、强一致风格常偏爱 PostgreSQL；读多写少、延迟敏感、简单事务高并发场景常拥抱 MySQL——当然，这从不是铁律，而是概率。说到底，数据库的“处事哲学”，是你对世界的假设：你更信“每个人都在看自己的快照”，还是“大家都看当前现实，但随时能悔棋”？工程的美在于选择可解释的代价。当你为一次转账写下重试逻辑、为一条统计报表挑选隔离级别，你其实在回答一个更大的问题：在不完美的世界里，我们愿意用怎样的秩序，换取怎样的自由。

数据眼中的“真实”，到底有几种？

你以为数据库里只有一个“真相”？不，数据的世界更像万花筒：同一条记录，在不同的观察者、不同的时刻、不同的规则下，会呈现出截然不同的面孔。这不是魔术，而是事务隔离、快照与一致性共同谱写的“多重现实”。理解这些“现实”，就等于拿到了并发世界的通行证。在单库事务里，真相至少有四种形态。读未提交像是偷看画家未干的颜料，快且刺激，却可能把污渍当作风景；读已提交更克制，每条语句启动时都看到“刚刚定型”的画面，因此会出现前后两次读到不一样的结果与“凭空多出一行”的幻觉。可重复读更像给自己拍了一张定格快照，在事务期内始终对照这张照片作出判断。标准允许它出现“幻读”，但现实世界里，MySQL通过Next-Key Lock、PostgreSQL通过更强的实现，使得幻影也常被驱散。若你要的是“宇宙唯一时间线”的绝对真相，串行化隔离会把所有事务排成一列：MySQL以更重的锁来实现，可能触发死锁并牺牲一个事务；PostgreSQL靠谓词锁与可序列化快照隔离（SSI）乐观推进，冲突时果断中止，让整体秩序保持“看似串行”。这些“真相”并不是空泛的哲学，它们有坚实的工程脉络。PostgreSQL选择“多版本留存”的路子：更新一行不覆写，而是生成新版本，并用xmin/xmax记录“谁生、谁终”，配合快照决定你能看到哪个版本；旧版本由VACUUM清理，避免表膨胀。MySQL则“覆写即刻生效”，把历史装进Undo Log，通过隐藏的事务ID（xid）与回滚指针（ptr）串起一条可回溯的版本链；事务读取时用Read View筛选“在我这张快照里谁可见”：在读已提交下，每次语句生成新视图，在可重复读下则复用一次，保证“照片”不变。两者殊途同归，都让“我的读，不阻塞你的写；你的写，也不打断我的读”。当写与写正面相撞，真相如何保全？在串行化边界内，MySQL以共享/排他锁维护秩序，遇到环形等待就清场重来；PostgreSQL不急于上锁，而是记录“谓词范围”的使用，事后检测是否破坏可串行性，一旦发现矛盾就中止其中一个事务。共同点是：应用必须准备好重试机制，把“偶发失败”当作设计常态。把镜头拉远，分布式世界里还有更多层次的真相。最终一致告诉你“终将达成共识”，适合信息流、点赞数这类对时效宽容的场景；会话一致（因果一致）强调“我读到我自己写过的”，让用户体验连贯；全局一致把强一致读推到任意副本，读到的就是“最新公认的宇宙状态”。不同业务对“现在”的定义不一样：社交时间线要顺滑，电商库存要守拐点，金融账本则寸步不让。工程上，选择哪一种真相，等于选择一套权衡。报表与检索偏爱读已提交，吞吐更高；订单扣减、名额发放需要可重复读配合锁定的“当前读”（如SELECT FOR UPDATE），堵住超卖；资金转账更稳妥的是串行化或等价的显式锁方案；需要“读我所写”的交互，开会话一致或在应用侧做单调读兜底。无论站在哪个真相里，缩短事务、精简范围、为死锁与序列化冲突预设重试，都是通用的生存之道；在PostgreSQL里关注VACUUM健康，在MySQL里留意Undo清理与长事务，才能让多版本世界常青。回到那个问题：数据眼中的“真实”，到底有几种？答案是：由你定义的所有可被工程化并兑现承诺的“观察视角”。在并发宇宙里，真相不是唯一常量，它是你给系统的契约、时间与边界的函数。重要的不是执念于“一种绝对”，而是学会在正确的场景，点亮恰当的那一面。当我们承认“真相取决于观察者”，反而更接近真实的秩序——这份秩序，来自对时间线的敬畏、对一致性的拿捏，以及对复杂世界的温柔掌控。

数据库“垃圾回收”一旦罢工会怎样？

想象一下，整座城市的垃圾车突然停运：街道很快被淤塞，空气开始变味，清理成本呈指数上升。数据库的“垃圾回收”（MVCC 产生的历史版本、撤销日志、死元组的清理）一旦罢工，呈现的景象异曲同工，且后果往往更隐蔽、更昂贵。在 PostgreSQL 里，更新和删除不会就地覆盖，而是制造“旧版本”行，等 VACUUM 或 autovacuum 来打扫。这些“死元组”清不掉，表和索引会像被吹胀的气球一样膨胀：3GB 的表，可能一路涨到 80GB，还让缓存命中率直线滑坡，I/O 放大，查询每读一页都要先“踩雷”筛掉无效元组，拖慢响应。更棘手的是事务 ID 回卷风险：超过冻结阈值（典型配置约 2 亿 XID）不处理，数据库会被迫进入“自我保护”，限制甚至拒绝新事务，直至你完成 VACUUM FREEZE。等你不得不收拾残局时，常常只能用会长时间加 ACCESS EXCLUSIVE 锁的 VACUUM FULL 或借助 pg_repack 重建，这才真正“把空间还给操作系统”，代价是停顿与高 I/O。在 MySQL/InnoDB 中，历史版本不保存在行里，而是挂在 undo log 上，由 purge 线程异步清理。垃圾回收一旦落后，history list 越拉越长，快照读需要顺着“版本链”回溯；一致性读每次都像翻旧账本，延迟飙升。undo 表空间与 redo/WAL 同步增长，备份窗口拉长，复制延迟扩大，甚至触发“空间不足”的红线。业务看似还能跑，但每次更新都在给将来的清理加码，技术债利滚利。为什么会“罢工”？最常见是长事务或 idle in transaction 会话把旧版本“钉死”，VACUUM/Purge 不敢动；也可能是失效复制槽、统计收集异常（回环接口问题）、超大表导致的清理低效。症状也很典型：表体量持续增大而行数不变，查询计划退化，WAL/redo 暴涨，复制延迟上扬；在 PG 还能看到 n_dead_tup 居高不下、冻结年龄逼近阈值；在 MySQL 则是 undo 历史链激增。更糟的是，清不掉不代表“省事”。当你被迫集中清理时，短时间高强度的 I/O 冲击会把在线负载按在地上摩擦。实测中，清理百万级死元组即可带来 7%–10% 的性能下滑；而 VACUUM TRUNCATE、VACUUM FULL 为回收尾页或重写表时需要强锁，读写与 DDL 都要让路。PolarDB 等实现会用并发 I/O、异步预读、可维护窗口来减轻痛感，但本质规律没变：越晚处理，代价越高。怎么办？让垃圾回收“持续、温和、可预期”。养成短事务、及时提交的习惯，设置 idle_in_transaction_session_timeout 清理僵尸会话；在 PG 调整 autovacuum 的 scale factor 与阈值，热点表适当降低 fillfactor 留出更新空间，业务低谷定期 vacuum/analyze，必要时用分区减少清理工作集；在 MySQL 监控并确保 purge 能跟上节拍，避免历史链失控。别把数据库维护当作“临时抱佛脚”的运维事件，它更像城市保洁：按时巡回、随脏随净，才不会演变为大规模停摆。技术的秩序感，常常体现在这些“不起眼”的保洁机制里。数据世界与现实城市一样：清洁不是一次性的胜利，而是日复一日的自律。当你学会与时间做朋友，把小问题消灭在日常，数据库也会回报你以稳定、从容与可持续的速度。

为何有人甘冒奇险去使用“脏数据”？

在数据的世界里，速度像风，准确像锚。创业冲刺、流量大战、实时风控与秒级推荐，都在用力拉扯这根绳：是在毫秒内做出“差不多对”的判断，还是在几秒后给出“绝对准”的答案？这就是人们甘冒奇险使用“脏数据”的真实处境与诱因。 “脏数据”有两层含义。工程语境里，它可能是数据库隔离级别过低造成的脏读——读取到尚未提交、可能回滚的写入结果；数据治理语境里，它指不完整、重复、带偏差、或因解析失败而不合规的记录。看似人人避之不及，但在不少系统中，它却被有意识地“驯化”和“圈养”。背后的第一根驱动力是经济学。清洗数据、提高隔离级别、等待一致状态，都有机会成本。市场窗口只有几天，A/B 实验只需方向性信号，广告竞价要在百毫秒内出价，推荐流要靠最新的行为温度来“趁热打铁”。很多场景不需要“100 分的真相”，而是“70 分且马上”的决策优势。在这条曲线上，越早看到数据，转化越高，收益越快；即使掺杂噪声，也可能整体收益显著胜过“慢而准”。第二根驱动力是工程现实。高隔离意味着更多锁与等待，出现死锁、长尾延迟、吞吐骤降的概率上升。为了让服务“永不阻塞”，工程师会对读路径放松要求：用读已提交代替可重复读，用乐观并发减少互斥锁，甚至让部分只读分析在“读未提交”下跑，以避免热点争用。流式管道中，无法解析的记录被送入侧输出流的“脏数据收集器”，主干流水照常推进并确保检查点成功，不让少数异常拖垮整条链路。这些做法不是草率，而是对可用性优先级的清醒权衡。第三根驱动力是统计与业务容错。汇总指标、趋势判断、异常检测，常对少量噪声不敏感；海量样本下，误差会被稀释。IoT 传感器天然多噪，行为日志难免缺失，增长实验追求的是方向和弹性迭代，而非逐条完美。只要建立了稳健估计、采样与回填策略，带“毛边”的数据仍能支持有效决策。隐形的第四根驱动力来自组织激励。KPI 偏向上线速度和短期转化，数据契约与治理滞后，跨团队接口频繁变更，工程师更愿意让系统“先活着”，再逐步清理。久而久之，“先跑通再抛光”成了默认工程文化。当然，冒险并非鲁莽。许多团队会给“脏数据”上笼头、绑护栏：限定其只用于低风险读场景，不直接驱动资金转移与权限变更；采用幂等写入、补偿交易与回滚策略，把错误影响圈定在可追溯范围；对强一致域维持更高隔离，弱一致域设置“陈旧度预算”；通过数据血缘、告警与灰度发布，在发现偏差时快速熔断与纠偏。数据库层面，哪怕读路径放宽，写路径仍依赖 WAL/redo 等机制守住持久性与原子性，确保“乱看可以，乱写不行”。但有些赛道没有这类“容错垫”。金融清算、医疗诊断、风控黑名单、合规报送，这些地方对错误零容忍，脏读与脏数据可能引发传染式错误、法律风险与信任崩塌。真正成熟的体系，会把域划清：在探索、推荐、增长和监控等“快半拍”领域拥抱不完美，在交易、账务、权限等“要命处”坚持强一致。归根结底，使用“脏数据”是人类在不确定中进行的一场理性押注：在时间、成本、准确之间，选择最有期望收益的点。关键不在于“要不要用”，而在于“在哪儿用、敢用多脏、如何兜底”。当我们承认世界本就噪声横生，真正的专业就体现在明确置信度、圈定影响半径、给出纠偏通道。速度会让你抓住风口，真相让你站稳脚跟；聪明的系统，会让二者在同一艘船上各守其位、彼此成全。

被“回滚”的数据，去了数字冥界吗？

当你在数据库里按下“撤销”的那一刻，数据并不会立刻坠入某个虚无的“数字冥界”。相反，它会被安置进一座有秩序的中转站：日志、版本、标记与后台清理线程共同守护的“数据临时居所”。只有当系统确认“再也没有人需要它”时，它才会被真正抹去，好似一段从未对外显影的平行时空。在事务世界里，回滚意味着“这件事从未发生”。之所以能做到不留痕，是因为数据库从来不把改变鲁莽地“写死”。它们先记账，再动刀。这个记账本叫 WAL（预写日志）：任何变更，先写日志、再落盘，从而保证故障恢复的路径清晰。如果事务中途反悔或被系统中止（比如死锁、序列化冲突、客户端取消），数据库会按日志与版本信息将影响逐步撤回，恢复到干净的起点。在 PostgreSQL，变更并不是“覆盖”，而是“叠加”。每次更新都会生成一条新的行版本，老版本仍在，元数据里的 xmin/xmax（创建/淘汰该版本的事务号）决定了谁能看到哪一版。回滚时，这些新生的版本被标记为无效，其他会话从未见过它们；等到没有事务会再需要这些影子，VACUUM 会把它们物理清除并回收空间。对外，它们像幽灵一样“没来过”；对内，它们短暂地躺在版本堆中，直到被打扫干净。在 MySQL 的 InnoDB，引擎选择“就地更新”，但把“旧我”的魂存进了 Undo Log。每条记录都带着 DATA_TRX_ID 和 DATA_ROLL_PTR，后者像一条回溯指针，串起被修改前的历史版本。回滚时，InnoDB按 undo 日志做反向操作：insert 变 delete，delete 变 insert，update 反改回去。只要还有事务可能需要读到过去的样子（可重复读的“快照”），这些旧版本就会被保留；等安全了，Purge 线程把它们从“历史队列”里逐批清理，InnoDB 8.x 甚至能截断独立的 undo 表空间以归还磁盘。对应用来说，被回滚的数据并没“下落不明”，它们有据可循、有序退场。为什么别人看不见你的“未遂修改”？这要归功于一致性读与隔离级别。大多数生产系统采用可重复读或读已提交：每个事务都拿到一个自洽的快照。即使旁边有人在“改名换姓”，你的视野也不会被外界搅动，直到对方提交。脏读只会出现在最低的读未提交级别，现实中极少启用。回滚的故事不止出现在手工撤销。死锁被检测时，数据库会“牺牲”其中一个事务并回滚它，以解套其他人；在 PostgreSQL 的可串行化级别，系统用谓词锁和多版本监测到违背串行语义的冲突时，也会果断中止其中之一。所有这些“被迫反悔”，最终都依靠相同的回滚与版本机制把现场复原。那已经提交的误操作怎么办？这时“ROLLBACK”帮不上忙，但时间机器仍有几条路。行格式的二进制日志可以做时间点恢复或生成“补偿事务”，把数据“正向修复”回目标状态；具备闪回能力的系统会延长 undo 保留窗，让你用 “AS OF 某时刻”去查询或重建历史快照。代价是更多的空间与更慢的清理，因此要权衡保留时长、磁盘预算与恢复目标。真正让“数字冥界”久驻不散的，是长事务。它们会拖住 PostgreSQL 的 VACUUM，阻止清理“死版本”，让表膨胀；也会阻滞 InnoDB 的 Purge，让 undo 堆积。监控活跃事务、控制事务粒度与时长、合理配置 undo 保留与清理线程，是让灵魂早登极乐的关键工程。所以，被回滚的数据去哪儿了？它们没有消失在黑暗里，而是被细致地保存在可控的维度：要么作为“未被采纳的候选版本”被标记、被清扫，要么栖身于撤销日志链，等待无人再访的那一刻被安然送走。数据库工程师用日志与多版本，给了世界一个能“后悔”、也能“重来”的秩序。也许这正是一点温柔的启示：好的系统，不是从不犯错，而是把犯错的代价降到可承受；好的设计，不是苛求永不回头，而是让每一次回头都有路可循。技术让我们学会对过去负责，也给了未来一次次重新选择的机会。

如果大脑有“死锁”，世界会是什么样？

想象一座城市突然被“暂停键”按下：红绿灯都在等彼此先变色，电梯等门、门等人、人在等电梯；人们张口要说话，却像被无形的手摁住——句子的主语握着“名词锁”，谓语握着“动词锁”，彼此等待，谁也不先松手。若大脑像数据库那样发生“死锁”，世界的质感就会变成这种诡异的静止与卡顿。在数据库里，死锁是并发事务各自拿着对方需要的锁，互相等待，系统只好“牺牲一笔交易”来解套：MySQL会检测死锁并中止其中一个事务；Postgres在最严格的 SERIALIZABLE 隔离下更像“乐观派”——用谓词锁与多版本并发控制跟踪冲突，直到发现违反了可串行化的保证，才果断杀掉违规者并要求重试。没有这样的“止损”，成千上万事务会一起陷入无尽等待。把这幅图搬进神经世界：我们的思考、决策与行动本质上也是一连串“事务”——从感知到计划再到执行。前额叶像事务管理器，基底节是“上锁与放行”的闸门，扣带回则是冲突监视器。一旦多个行动方案同时争夺“资源”（注意力、工作记忆、运动通路），却谁也不肯释放，行为就会“卡死”。现实中你能窥见它的影子：强迫症的反复校验像无休止的重试；帕金森“冻结步态”像动作选择上的写锁僵持；紧张时的决定瘫痪，好比隔离级别开到“可重复读”，任何新证据都进不来，只剩原地打转；而“锁定综合征”更像极端的系统级阻塞——意识在线，输出被彻底占用，只能以眨眼传递“心跳包”。有趣的是，大脑天生自带“死锁处理器”。去甲肾上腺素的瞬时爆发像超时机制，打断僵局强制重排优先级；多巴胺是动作的“提交信号”，把犹疑的草案按下去；睡眠与做梦则像一次“VACUUM FULL”，清理过期痕迹，压实记忆表；海马的重放如同写前日志（WAL），先把轨迹写到“日志”里再在第二天白天“提交”。当判断出路线错误，前扣带回触发“错误相关负波”，相当于一次“ROLLBACK”，撤销刚才那步操作，改线再来。如果“脑内死锁”成为常态，社会也会像巨型分布式系统随处卡顿：会议永远投不出一票，城市调度像线程互斥导致的全网拥塞，公共决策不是慢而稳，而是慢而停。更微妙的后果是认知层面的“脏读”与“幻读”泛滥——过早采信未经“提交”的信息（流言、直觉）导致群体误判，或在同一问题上反复扫描，却每次被新插入的碎片化事实扰乱结论，策略迟迟无法落地。幸运的是，我们可以把数据库的智慧引入日常心智与制度设计。为重要决策设定“重试逻辑”和明确的提交条件，用限时讨论与小步试点降低“锁竞争”；在信息过载时，主动将心智隔离级别从“读未提交”调到“读提交”，先验证再行动；通过冥想、运动与规律睡眠，为大脑定期做一次“真空整理”；临床上，认知行为疗法与深部脑刺激，正是在帮系统识别死锁、释放关键通路、让行动重新可串行化。也许，生命的本质就是与并发打交道：无数念头、情绪与欲望同时上场，等待一次恰到好处的“COMMIT”。当你下次陷入卡顿，不妨问问自己：是该等待更多版本的证据，还是先小步提交、允许回滚？世界会因我们的“提交策略”而改变。愿我们都学会在复杂中优雅退让、勇敢前进，用一次次可重试的选择，编排出流畅而可靠的人生事务。

新知 - 大圆镜｜数据库并发之争：锁与版本，两种秩序的哲学对决

对抗知识焦虑，从看懂这条开始

App 下载

一场没有硝烟的战争

想象一下，年度最大的购物节零点钟声敲响，数百万用户涌入一个电商平台，争抢一件限量版商品。在你看不到的服务器后台，一场无声的战争正在上演。当两个用户在同一毫秒点击“购买”最后一件库存时，系统如何决定谁是赢家？它如何确保库存不会被减成负数，订单不会重复创建，支付不会混乱？

这场战争每时每刻都在发生。从银行转账到社交媒体点赞，全球每天有数以万亿计的数据库“事务”在执行。它们是数字世界的基石，悄无声息地维护着我们习以为常的秩序。一个“事务”，就是一系列必须作为一个整体、不可分割地完成的操作。它要么全部成功，要么全部失败，绝不允许停在中间状态。这种承诺，就是数据库世界著名的ACID原则——原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability）。

然而，当成千上万的事务试图同时操作同一份数据时，混乱的幽灵便开始游荡。如果缺乏有效的管理，数据库就会出现“脏读”（读到别人未提交的脏数据）、“不可重复读”（同一事务内两次读取结果不一）和“幻读”（两次范围查询，结果集无端多出或减少）等诡异现象。为了驱散这些幽灵，数据库工程师们设计了精密的并发控制机制。而在这场旷日持久的战争中，两大最受欢迎的开源关系型数据库——MySQL和PostgreSQL，走上了两条截然不同的哲学道路。

两种哲学：历史学家与会计师

为了让多个事务在互不干扰的情况下同时工作，即实现“隔离性”，MySQL和PostgreSQL都采用了名为**MVCC（多版本并发控制）**的先进思想。其核心理念是：读操作不应该被写操作阻塞。与其让读者排队等待作者完稿，不如给读者一份作者动笔前的“快照”。然而，如何保存和管理这些“快照”，两位大师给出了不同的答案。

PostgreSQL：严谨的历史学家

PostgreSQL选择了一种近乎偏执的方式来记录历史。当一行数据被更新时，它从不直接覆盖旧数据。相反，它会创建一个全新的数据行版本，并将旧版本保留下来。每一行数据都像一份历史档案，带有两个关键的时间戳：xmin（创建该版本的事务ID）和xmax（废弃该版本的事务ID）。

当一个事务开始时，它会得到一个“快照”，明确告诉它哪些事务ID在它看来是“过去”（已提交），哪些是“现在”（正在进行），哪些是“未来”（尚未开始）。
当它读取数据时，它会沿着数据的版本链，找到那个xmin属于“过去”且xmax不属于“过去”的版本。这样，每个事务都活在自己专属的、凝固的时间切片里，看不到其他并发事务所做的未提交修改。

这种方法的优点是读取历史版本非常快，因为它就是物理存在的。但代价也显而易见：数据库会像博物馆一样，堆积大量不再需要的旧版本（被称为“死元组”）。为此，PostgreSQL必须雇佣一位勤勉的“清洁工”——VACUUM进程，定期巡视并清理这些历史尘埃，回收空间。

MySQL：精明的会计师

相比之下，MySQL（特指其默认的InnoDB引擎）则像一位注重效率的会计师。当数据更新时，它会直接在原地覆盖旧数据，保持数据文件的整洁。那么，历史版本去哪了？

答案藏在一个名为**Undo Log（撤销日志）**的账本里。每次修改数据前，MySQL会先把旧数据的模样记录到Undo Log中。这些日志被一个名为roll_pointer的指针串联起来，形成一条版本链。

当一个事务需要读取某个历史版本时，MySQL会从最新的数据行开始，沿着roll_pointer指针回溯Undo Log，一步步地“撤销”后续的修改，直到构建出该事务所需要的那个“快照”版本。

这种方式让主数据文件保持紧凑，无需频繁的大规模清理。但代价是，读取旧版本数据可能需要一个动态的、相对耗时的重构过程。它牺牲了历史读取的便利性，换取了存储空间的效率和更简单的维护模型。

冲突的十字路口：悲观与乐观的抉择

当两个事务不只是读取，而是要同时修改同一行数据时，真正的哲学分歧出现了。这就像两辆车要同时驶入一个单行道，必须有一套交通规则。

MySQL的悲观主义：先上锁，再通行

MySQL天性谨慎，它采用的是悲观锁策略。它认为冲突是大概率事件，所以最好提前预防。当一个事务要修改某行数据时，它会先申请一个排它锁（Exclusive Lock）。这个锁就像一个“请勿打扰”的牌子，一旦挂上，其他任何想修改这行数据的事务都必须在门外排队等待，直到前一个事务完成并释放锁。

这种方式简单直接，规则清晰。但缺点是，如果一个持有锁的事务执行缓慢，后面的所有事务都会被阻塞，导致性能瓶颈。更糟糕的是，如果两个事务互相等待对方持有的锁，就会陷入**死锁（Deadlock）**的尴尬境地，就像两条首尾相接的贪吃蛇，谁也动弹不得。好在MySQL有自动的死锁检测机制，会选择“牺牲”一个事务来打破僵局。

PostgreSQL的乐观主义：先通行，后裁决

PostgreSQL则更加乐观。它采用乐观并发控制，认为事务间的直接冲突是小概率事件。它允许事务自由地执行，不会因为写操作而轻易阻塞其他事务。它不使用传统的行锁来阻止写入，而是通过一种更高级的机制——**谓词锁（Predicate Locks）**来“监视”事务读取和写入的数据范围。

直到事务准备提交时，PostgreSQL才会进行冲突检测。如果它发现某个事务的执行破坏了“可串行化”的隔离保证（即执行结果无法等价于某种串行顺序），它就会果断出手，回滚其中一个事务，并抛出序列化失败的错误，告诉应用程序：“抱歉，你们的操作有冲突，其中一个需要重试。”

这种方法避免了锁等待和死锁，极大地提升了并发性能。但它将冲突解决的责任部分转移给了应用层——应用程序必须准备好捕获序列化失败的异常，并进行事务重试。

结语：没有最优解，只有最合适的权衡

从MVCC的实现到冲突的处理，MySQL和PostgreSQL的差异背后，是两种截然不同的系统设计哲学。

MySQL的哲学，更偏向于一种命令与控制的模式。通过悲观锁，它为数据世界建立了严格的、可预测的秩序。这种确定性降低了应用层开发的复杂性，但在高并发写入场景下可能牺牲性能。
PostgreSQL的哲学，则是一种信任但验证的模式。它乐观地相信并发操作可以和谐共存，通过多版本和事后裁决来化解冲突。这赋予了系统极高的并发潜力，但要求应用开发者理解并处理好事务重试的逻辑。

这场技术路线的“战争”没有终极的胜利者。它们各自的取舍，塑造了它们在不同应用场景下的优势。选择哪一个，不仅仅是选择一个数据库，更是选择一种与数据世界打交道的方式。这趟深入数据库事务核心的旅程揭示了一个深刻的工程真理：最优秀的设计，往往不是最完美的设计，而是最懂得权衡与妥协的艺术。

一场没有硝烟的战争

两种哲学：历史学家与会计师

冲突的十字路口：悲观与乐观的抉择

结语：没有最优解，只有最合适的权衡

评论