你的脸，会被数据“囚禁”75年吗？

短答案：在某些场景下，真的可能。若你的面部数据进入美国国土安全体系（如IDENT/HART）并被Mobile Fortify等工具检索，记录通常按“自最后一次接触起最长可达75年”留存，并在多机构、承包商间共享与备份；即便误匹配被纠正，底层日志与特征模板往往仍被保留。这也是海量图库下“长期可追溯性”的制度性后果。但这并非宿命，取决于“谁采集、在哪儿、基于什么法律”。中国新近规则强调最小必要、设备端存储、不作唯一验证、达目的即删并要求10万人以上备案；欧盟在GDPR下对生物特征极为克制；美国地方层面亦有对警方FRT的城市禁令。现实做法是尽量选择端侧处理的解锁方式、拒绝强制“刷脸”、行使撤回与删除权（能行使的辖区），并警惕将静态照上传至会与执法数据打通的平台。最终，是否被“囚禁75年”，关键在于是否被纳入政府级生物特征库——一旦进入，时钟会走得很久。

AI脸盲症，谁来为算法纠偏？

要给“AI脸盲”纠偏，得把责任拧成一股绳。监管先兜底：把人脸识别按高风险管理，强制数据治理、分群准确率披露与独立合规审计，辅以严厉罚则；同时把“低质图像禁用、1:N不得单独入罪、全流程可追溯”写进执法操作规程，并配套证据排除与问责机制。基准测试要看得见差异：分年龄/性别/肤色公开误报曲线，而非一行“总体准确率”。真正的刹车在采购和法庭。政府与企业采购合同应硬性要求：提交最新分组成绩单与误报上限，图库规模与阈值可追溯，1:N只作线索、1:1在高质量条件下复核，质量门槛不过不许出结果，完整日志便于事后审计；执行“两把钥匙”：FRT命中须由独立1:1比对加非生物证据共同成立，否则不得批捕。法院与保险用可诉权、赔付与费率，把错误的代价直接压到使用方与厂商身上。厂商则要把“黑箱”翻开：发布数据表与模型卡，持续做漂移监测与红队测试，用质量加权和不确定性校准，而非按种族调阈值；用多源、更均衡和合成数据补齐长尾，加入活体检测、图像质量评分与多模态复核。最后，独立第三方做外部合规审计，结果至少限度公开。技术改进、强审计和法律责任三件套同时到位，AI的“脸盲”才会被系统性纠偏。

当AI说你不是你，你该如何自证？

先把机器“降噪”，再把你“跑满证据”。当场要求二次采样：换光线与角度、摘口罩/眼镜、开启活体检测，并改用1:1核验（护照芯片读写、指纹或虹膜）而非在海量库里1:N搜人；同时索取相似度分数与阈值、候选名单，并要求人工复核与主管在场签名记录。若系统仍拒绝，出示强绑定凭证（含芯片的身份证件、银行/运营商实名记录、FIDO设备凭据），把身份从“像谁”转成“只能是你”。事后把它变成一场可审计的错误。保全全过程：时间点、设备编号、截图与回执；调取门禁/刷卡、行程定位、交易流水、同乘或同事证言，形成时序证据链，直指“机器不可靠”而非“你不可信”。提交书面申诉，要求调高阈值、跨算法复核或第三方重测，并申请查阅与更正人脸模板及检索日志；若为商家黑名单，行使访问、更正、删除与申诉权，直至拿到“撤销误识”的书面结论与模板销毁确认。

新知 - 大圆镜｜人脸识别的误差陷阱，比你想的更致命

大圆镜

内容由AI生成，思考得你完成

App Store 下载 Android 下载

2020年1月的一个清晨，底特律居民罗伯特·威廉姆斯刚送完女儿去 daycare，就被突然冲来的警察按倒在地。他被指控盗窃了一家手表店的商品，证据是警方人脸识别系统的匹配结果——监控里的模糊人影，和他驾照上的照片“对上了”。

但威廉姆斯有完美的不在场证明：案发时他正在上班，同事和公司监控都能作证。30小时的拘留后，警方才承认系统认错了人。这场无妄之灾，让他的女儿留下了心理阴影，自己也患上了PTSD。

你可能觉得这是极端个案，但实际上，人脸识别的误差正潜伏在我们生活的各个角落。为什么技术明明越来越准，却还会把无辜者送进警局？

算法的两难：假阳性与假阴性的天平

要理解威廉姆斯的遭遇，得先搞懂人脸识别最核心的两个误差：假阳性和假阴性。你可以把算法比作一个守门的保安：

假阳性就是保安把没带通行证的人放进来了——系统把两个不同的人错认成同一个，就像把威廉姆斯和小偷搞混；
假阴性则是保安把有通行证的人拦在了门外——系统没认出本该匹配的人，比如让真正的嫌疑人从监控下溜走。

这两种误差就像天平的两端，没法同时降到最低。调高标准减少假阳性，就会增加假阴性；放宽标准减少假阴性，假阳性又会飙升。在边境检查这种理想场景下，假阳性率低于百万分之一，假阴性率也只有千分之二——就算被拦下来，人工复核就能解决。

但到了真实世界的安防场景，一切都变了。监控画面可能是低光照、侧脸、模糊的，数据库里的照片可能是几年前的旧照。美国国家标准与技术研究院（NIST）2019年的测试显示，当用监控图比对旧 mug shot 时，部分算法对黑人女性的假阳性率，比对白人男性高了100倍。

偏见的根源：数据里的“权力阴影”

算法的偏见，本质上是训练数据的偏见。目前主流的人脸识别数据集，比如Labeled Faces in the Wild，83.5%都是白人面孔，男性占比更是远超女性。就像让一个只见过白人的保安去认黑人，出错是必然的。

这种数据偏差不是无心之失，而是社会权力结构的投射——训练数据多来自公众人物和警方数据库，而这些领域长期由白人男性主导。加拿大法学助理教授吉迪恩·克里斯蒂安指出，白人男性的识别准确率能超过99%，但黑人女性的错误率可能高达35%。

更隐蔽的是，硬件也在放大偏见。普通摄像头的传感器是针对浅色皮肤优化的，深色皮肤在低光照下的特征会被“吃掉”，算法自然没法准确识别。当警方过度依赖这种有偏见的系统，就会形成恶性循环：数据库里黑人的记录越多，算法越容易把黑人错认成嫌疑人，进而导致更多黑人被错误逮捕，数据库里的偏见又被进一步强化。

2023年，美国连锁药店Rite Aid就因为使用有种族偏见的人脸识别系统，被法院禁止使用该技术五年——系统多次把黑人顾客错认成小偷，导致无辜者被当众拦下搜身。

破局的尝试：从数据到规则的补漏

要解决人脸识别的公平性问题，首先得从数据入手。麻省理工学院的研究团队提出了一种精准去偏技术：用TRAK算法找出训练数据里那些最容易导致偏见的样本，只删除这些“坏数据点”，而不是像传统方法那样大规模删减少数群体的样本。在实验中，这种方法只用了传统方法1/10的样本删除量，就把少数群体的识别准确率提升了15%。

合成数据也成为补充多样性的新途径。IBM发布的“Diversity in Faces”数据集，包含100万张标注了年龄、性别、颅面特征的合成人脸，覆盖了不同种族和年龄段。不过斯坦福大学的研究也提醒，合成数据不能替代真实数据——如果合成的少数群体样本不符合真实特征，反而会加剧偏见。

规则层面的约束同样重要。底特律在威廉姆斯案后出台了全美最严格的人脸识别政策：仅凭算法结果不能申请逮捕令，必须辅以其他独立证据；警方还要对2017年以来所有用人脸识别的案件进行审计。欧盟的AI法案则直接把人脸识别归为“高风险AI”，要求必须经过严格的公平性测试才能使用。

当我们为人脸识别的便利欢呼时，往往忽略了它背后的代价——那些被错认的无辜者，那些被算法放大的社会偏见，都是技术发展必须承担的“隐形成本”。

技术本身没有善恶，但使用技术的人，必须为它的后果负责。算法的公平，从来不是技术问题，而是社会问题。只有当我们把每一个群体的权益都放进训练数据里，把每一次误判的代价都算进技术的成本里，人脸识别才不会成为新的歧视工具，而是真正服务于所有人的技术。

毕竟，威廉姆斯的遭遇，不应该是任何一个普通人的“万一”。

算法的两难：假阳性与假阴性的天平

偏见的根源：数据里的“权力阴影”

破局的尝试：从数据到规则的补漏

评论