让AI“发明”一件你想要的新商品？

把“发明”变成可优化问题：在语义ID的离散空间里，把“转化率/复购/价格弹性”作为目标，把“成本≤X、重量≤Y、材料与安全标准”作为硬约束，用可微分索引（如DIGER）端到端联合训练，搜索还不存在的token组合；再由多模态解码器把这些组合还原为规格、结构与外观草图，并回填可生产件库校验可行性。我想要的新品是：通勤×露营的掌上手冲一体壶。磁吸折叠壶身+可拆滤杯，USB‑C PD直驱，45–96°C曲线控温，容量500 ml、整机≤380 g，钛合金内胆，内置TDS传感与微泵，杯盖翻转即成±0.1 g称重底座；收纳后相当于一本书的体积，随身背包不鼓包。落地也可交给AI：用检索增强生成把设计映射到BOM与供应商件号，热仿真与食品接触合规模型先验过滤，再用合成受众与小样预售验证需求（控制库存风险），不确定性高的部件改为模块化选件。整链路用同一套语义ID闭环迭代，防止“幻觉式设计”越界到不可生产或侵权方案。

推荐越准，世界会变得越无聊吗？

会，也不一定会。若把“准”狭义地等同于短期点击最大化，算法会不断强化已知偏好，列表同质化、信息茧房随之而来——多家平台的实测都表明：适度增加多样性与新颖性，哪怕短期CTR略降，长期留存与满意度却上升。但新一代生成式推荐在“准”与“多样”间并非零和。像DIGER把语义ID与推荐目标端到端联训，用Gumbel探索与不确定性衰减避免码本塌缩，令code使用更均衡、语义空间更“铺开”，长尾与潜在兴趣更容易被生成出来。再配合频控、重排打散、多兴趣建模与多目标优化（准确率×新颖性×覆盖×公平），系统既能命中当下所爱，也能递送“意外之喜”。当“准”被这样定义与约束，世界只会更有趣，而不是更无聊。

AI为你“造词”，它在想什么？

它在琢磨的不是“叫法好听不”，而是“哪个离散符号最能逼真地勾住你的下一次点击”。它把商品的文本/图片等内容压成向量，再“刻”成分层短码；同时看你的历史行为，把“像不像这个商品”与“会不会被点”揉进同一个打分里。为不被少数热码带偏，它故意加点Gumbel噪声做试探，盯着码本的熵和使用频率：谁用得过多就加压分流，冷门位则放大被探索的机会。当探索足够了，它再把噪声慢慢降温，让“造出的词”从百花齐放收敛到既懂语义又会卖货的那一套。能让冷启动更稳、长尾更可见、检索更快的前缀会被保留下来，次优的则被替换。最终的“想法”很朴素：用尽可能均衡、信息量充足的码本，换取更高的点击命中与更顺滑的全库生成；你看到的是更懂你的推荐，它背后是在持续权衡“表达得真”与“预测得准”。

新知 - 大圆镜｜推荐系统的隐藏瓶颈：语义ID终于能跟着推荐学了

对抗知识焦虑，从看懂这条开始

App 下载

从「固定身份证」到「动态学习卡」的死结

你可以把传统生成式推荐的流程想象成「先做身份证，再办业务」：第一步用RQ-VAE这类模型给每个商品生成语义ID——就像把面霜的「保湿、敏感肌适用、玻璃包装」这些信息压缩成一串短码；第二步把这些固定好的短码丢给推荐模型，让它学「用户会点哪个短码」。

问题恰恰出在这两步的割裂上。生成语义ID的目标是「精准还原商品内容」，就像身份证要拍清楚你的脸；但推荐模型的目标是「猜中用户喜好」，相当于银行要判断你能不能贷款。这两个目标根本不是一回事——一款面霜的语义ID还原得再精准，也未必能帮模型判断「刚买过面霜的用户现在需要的是面膜」。

更关键的是，推荐模型就算发现了这个问题，也没办法改身份证——因为语义ID是提前冻结的，推荐效果的好坏传不到生成ID的环节里。就像银行明明知道你有稳定收入，却没法改你身份证上的「无业」标注。

给语义ID装个「可调节开关」

DIGER的核心，就是给这张「固定身份证」装了个可调节的开关，让推荐效果能反过来调整语义ID的生成。

首先，它用Gumbel噪声替代了传统的「硬选择」——就像给身份证照片加了点模糊效果，让模型在训练初期不会死盯着某几个短码，而是多试试不同的组合，避免出现「几百个短码只用得上几个」的「码本塌缩」问题。

然后，它设计了两种「不确定性衰减」策略：一种是随着训练推进慢慢降低噪声，让模型从「广撒网试错」过渡到「精准锁定最优解」；另一种是盯着那些被用得太频繁的短码，主动给它们加噪声，逼着模型去发掘那些被冷落的短码。

这套机制的效果很直接：在亚马逊Beauty数据集上，DIGER把Top10推荐召回率从6.1%拉到了最高6.96%；在Yelp数据集上，也稳定把召回率提升了0.25到0.32个百分点。更重要的是，它解决了传统方法的「码本塌缩」——原本只有少数短码被激活，现在几乎所有短码都能被用到，语义空间的利用率翻了好几倍。

不止是推荐，更是离散表示的破局

DIGER的意义，其实不止于推荐系统。它本质上解决了一个机器学习领域的共性问题：当系统依赖离散的中间表示（比如语义ID、离散token）时，要不要让这个表示跟着最终任务一起优化？

过去的默认答案是「先学好固定表示，再做任务」，就像先学好单词再写作文。但DIGER证明了，只要设计好训练机制，让离散表示跟着任务走，能拿到更好的结果——就像一边写作文一边调整单词的用法，最终的文章会更贴合主题。

当然，它也不是完美的。比如目前它只优化了商品侧的语义ID，还没涉及用户侧的表示；而且在超大规模数据集上，训练效率还有提升空间。但不管怎样，它给生成式推荐指了一条新的路：与其让推荐模型去适配固定的语义表示，不如让语义表示主动适配推荐目标。

你刷到的每一条推荐背后，都是无数个模型在「猜你喜欢」。但过去的推荐模型，就像拿着固定字典猜谜语的人——字典里的字是死的，猜对全靠运气。

DIGER第一次让这本字典活了起来：推荐错了，字典里的字就会悄悄调整，下次猜中的概率就更高。这背后藏着一个更重要的信号：AI系统的进化，正在从「优化任务模型」转向「优化任务与表示的协同」。

好的表示，从来不是固定的，而是为任务而生的。 或许用不了多久，你刷到的推荐就不再是「算法觉得你需要」，而是「算法懂你需要」。

从「固定身份证」到「动态学习卡」的死结

给语义ID装个「可调节开关」

不止是推荐，更是离散表示的破局

评论