用假人能骗过AI空调吗？

能。若空调只靠摄像头+检测/跟踪判“有人”，做工逼真的人形模特、等身立牌，甚至循环播放真人上半身的大屏，都可能长期触发占用。因为当检测器置信度高时，论文里的“仅对可疑帧请LLM复核”并不会触发，且静态假人不会制造时序突变，反而更“稳定”，结果就是白耗能。但一旦系统上了多模态与时序约束，难度立刻陡升。热成像/PIR需要热辐射和微动，CO2需要代谢源；要骗过它们，你得给假人加热片、微风扰动和CO2罐，成本与运维瞬间失衡。再叠加门禁/门计的进出守恒、静止超时降权、屏幕与镜面区域语义屏蔽、对抗补丁与“假影”检测，假人基本失效。实操建议：用“视觉∧(热/CO2/WiFi CSI任一)”做占用判定；对“连续静止>N分钟”的目标降权并强制二次验证；把进/出事件守恒写入MPC；对高置信却长期不动的轨迹定期触发微动作检测或低频人工抽检。结论是：能骗，但前提是系统只看视频且规则宽松；一旦做对工程化融合，骗的代价往往高过电费。

AI为你调温，是关怀还是监视？

两者一念之差。若AI只知道“这间房此刻大约有几个人”，却不知道“你是谁在做什么”，它更像关怀。做法上，用热成像/深度相机顶装取代可识别的RGB脸部画面，在边缘设备完成推理，只保留人数与时间戳，原始帧本地加密缓冲不超过30–60秒即擦除；控制侧按5分钟粒度取数，并提供“隐私模式”一键退出。这类“最小化采集+本地化处理+可选择参与”的设计，既能带来约10–20%的节能红利，又把个体风险压到低位。当系统开始留存高清视频、跨目的复用到考勤/安防、生成可回溯的人脸或轨迹ID，或将占用数据与门禁、工位数据打通，它就滑向监视。不仅触碰合规红线，也会把算法误报转化为对人的“惩罚”（误判空置而降温、断风）。想把边界拉回，需要做隐私影响评估、用途隔离与最小必要保存，默认不留存原始画面，留审计日志，定期做第三方安全与偏差评估；模型更新先在历史回放沙盒校验误报/漏报阈值，再上线。一句话总结：把算法从“看人”变成“看热”，从“上云”搬到“本地”，从“永久记录”变成“短暂计数”，从“静默运行”变成“可见可控”，AI为你调温才更像关怀，而不是监视。

省下的电费，够付AI的工资吗？

算一笔快账：一栋约2万㎡的写字楼，年用电约2GWh，电价按0.8元/kWh，HVAC占60%。用这套“数人头+MPC”省18%，一年能省约17万—22万元；5万㎡体量就是40万元以上。行业落地案例的区间也在这个量级（15万—27万元/年），量大从优。再看AI这边的账：YOLO在边缘跑，LLM只审“可疑帧”。按1 fps取样、10%帧送审、每次约200 tokens，单路摄像头全年LLM费用不足500元；50路摄像头也就约2万元。加上边缘算力与运维用电，全年<1万元。即便采购厂商SaaS/项目制服务，年费5—15万元，大多仍被节能结余覆盖；一次性改造（边缘盒子、集成、调参）约10—50万元，回本周期常见在6—18个月。例外是小体量场景：若只管几间会议室，年省电可能只有几千到一两万元，就难“养活”团队工时。做法是把应用做成全楼/园区级，或改用纯文本LLM/本地小模型，把云端推理费再压到几乎可以忽略的水平。结论：在中大型楼宇里，省下的电费，通常足够“付AI的工资”，还会有盈余。

新知 - 大圆镜｜AI数准人头，让写字楼空调省18%电费

对抗知识焦虑，从看懂这条开始

App 下载

你有没有过这样的经历：周末加班的写字楼里，整层楼只有你一个人，中央空调却在呼呼吹着满负荷的冷风；或是挤满人的会议室里，空调温度却高得让人冒汗？这不是空调的问题，是它根本不知道房间里到底有多少人。传统的红外、CO₂传感器要么反应慢半拍，要么误判连连，连排班表都赶不上现代人灵活的办公节奏。直到清华和MIT的团队用大模型给空调装上了“聪明的眼睛”——它不仅能数清人头，还能靠推理修正错误，最终让写字楼的空调能耗直接降了18%。

传统“数人头”：在误判里打转的困境

写字楼的空调从来都不是“瞎”，是“看不准”。

先看最常用的CO₂传感器：它靠空气中的二氧化碳浓度估算人数，但响应延迟能达到5分钟，人都走光了，它还以为房间里满员；要是房间通风好，哪怕挤满了人，浓度也升不上来，空调只会慢悠悠地调温。更别说红外传感器，只要人坐着不动，它就直接判定“房间空置”，分分钟把加班的人冻得搓手。

后来人们用上了视觉检测，比如YOLO系列模型，能实时框出画面里的人。但现实办公室里，人会被办公桌挡、会转身、会扎堆，前一帧数出3个人，后一帧可能就变成2个，再下一帧又跳回3个——这种“帧间抖动”对空调控制系统来说是灾难：它会跟着频繁启停，反而徒增能耗，还加速设备老化。

再升级到多目标跟踪技术，比如DeepSORT，给每个人分配唯一ID，试图把不同帧里的同一个人关联起来。但它的命根子是底层检测的准确性，只要YOLO漏判了一个人，跟踪链就直接断裂，该漏的还是漏，该误判的还是误判。

大模型当质检员：用推理修正错误

清华和MIT的团队没想着替换掉现有的视觉检测模型，而是给它加了个“智能质检员”——大语言模型。

这个逻辑很简单：先让YOLOv8跑一遍监控画面，得到每帧的初步人数和检测置信度，然后筛选出“可疑帧”：比如置信度极低却检测出好几个人，或者前后帧人数突然从5跳到1，又或者检测结果是0或1这种关键判断。只有这些拿不准的帧，才会被送到大模型那里“会诊”。

他们试过两种会诊方式：一种是用视觉语言模型直接看图，结合提示词“忽略海报、屏幕里的人像，只数真实在场的人”；另一种是用纯文本大模型，给它输入“前一帧5人，这一帧突然1人”的结构化信息，让它靠常识推理。更聪明的是，他们加了个“置信度融合机制”：只有当大模型的修正置信度比原始检测高0.15以上，才采纳修正结果，避免大模型“胡言乱语”。

实验结果直接刷新了精度：在清华FIT楼的真实场景里，这种方法的计数准确率达到88%，也就是超过88%的帧，数出来的人数和人眼标注完全一致；判断房间“空/有人”的F1-score更是高达0.93，假阴性和假阳性都降到了最低。

从数人头到省电费：闭环验证的18%奇迹

数准人头只是第一步，真正的价值在于让空调“聪明地干活”。

团队把这套精准计数系统和模型预测控制（MPC）结合了起来。简单说，MPC就像个会“预判”的空调管家：它会根据当前的室内温度、室外天气，再加上实时的人员计数，预测未来一小时的温度变化，然后在保证舒适度的前提下，算出最省电的温度设定曲线。比如提前半小时给即将有人的会议室预冷，在确定没人的时段直接放宽温控范围。

他们用EnergyPlus模拟了北京一栋办公楼全年的运行情况，结果超出预期：采用精准人员计数的MPC控制，HVAC能耗直接降低了17.94%，接近18%；更重要的是，人员舒适度指标（PPD）几乎没有变化，甚至略有提升——省下的电全是无效供能的部分，完全没牺牲人的体验。

当然，这项技术也不是没有局限：大模型推理需要计算资源，实时性和成本的平衡还得优化；隐私问题也绕不开，毕竟用了监控摄像头，得靠边缘计算、数据匿名化来合规。但不可否认的是，它第一次把“数人头”这个看似琐碎的技术，和写字楼的节能效益直接画了等号。

当我们谈论智能建筑时，总喜欢说“未来感”“黑科技”，但真正的智能，从来都是解决那些最实际的小问题——比如让空调知道房间里有多少人。

清华和MIT的研究证明，AI的价值不一定是创造全新的技术，而是给传统技术装上“会思考的大脑”。从误判连连的传感器，到能推理修正的大模型，再到能预判的空调控制，这串链条里的每个环节，都在指向一个更高效的未来：建筑不再是被动的空间，而是能感知、会思考、懂节约的“生命体”。

精准感知，才是节能的第一步。

传统“数人头”：在误判里打转的困境

大模型当质检员：用推理修正错误

从数人头到省电费：闭环验证的18%奇迹

评论