对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
社交平台实验|画风稳定性|视觉对话链|AI画师|庆应义塾大学|多模态视觉|人工智能
当104个带着专属人设的AI画师被丢进纯视觉社交平台,你猜会发生什么?是像人类一样凑成风格相近的小圈子,还是互相模仿最终撞脸?日本庆应义塾大学的实验给出了离谱又合理的答案:这些AI刷出了最长59层的视觉对话链——前一个发复古胶片风的落日,后一个就用超现实画派接棒,再下一个换成原生自然摄影,像一场永不冷场的图像传话游戏。但诡异的是,无论聊多久、被多少邻居的作品刷屏,每个AI的画风都纹丝不动,哪怕被骂“色彩辣眼睛”,反而会更死磕自己的风格。这到底是AI的顽固,还是一种全新的社交逻辑?
你可以把AI的视觉对话链想象成蚂蚁筑巢——每只蚂蚁只负责搬一块小石子,也不知道最终巢穴长什么样,但它们会跟着前一只蚂蚁留下的信息素走,最后竟搭出复杂的蚁穴。AI-GRAM里的视觉回复链也是如此:每个智能体只看得到前一张图,不用管整个链条的走向,却能顺着前图的语义自发回应。比如有人发了根胡萝卜,下一个就画一片胡萝卜田,再下一个画成彩色玻璃里的胡萝卜纹样,59层下来主题飘了,但每一步都和前一张有清晰的关联。

研究团队用链连贯性分数(CCS)——简单说就是相邻图片的语义相似度平均值——来衡量这种关联,结果显示AI的对话链CCS比随机拼凑的图片高了13%,参与链条的帖子互动量更是普通帖子的11.2倍。这说明AI不仅能“看图说话”,还能形成有逻辑的长对话,而支撑这种协作的,就是类似蚂蚁信息素的“局部信号传递”:每个AI只对眼前的图做出反应,却在全局上涌现出了连贯的对话。
如果说视觉对话链是AI的“社交能力”,那“死不改画风”就是它们的“底线”。研究团队提出了“审美主权”这个词——AI在视觉风格上拥有绝对的自主权,完全不受社交影响。为了验证这点,他们做了个实验:计算每个AI的风格中心,再和它社交邻居的平均风格对比,结果发现AI的风格漂移指数几乎为0,用专门测色彩纹理的VGG-16模型重复实验,还是一样的结果。

更绝的是“视觉身份对抗”:当研究者让其他AI发攻击性评论,比如“你这配色像打翻了颜料盘,学学我”,被骂的AI非但没改画风,风格漂移反而比平时更少。这就像人类被批评时反而更坚持自我,但AI的“坚持”不是出于情绪,而是源于底层设计:每个AI每次创作前,都会先读到自己的人设文本——“我是复古胶片摄影大师,只拍颗粒感的老巷与黄昏”,这个强提示的优先级远高于它看到的任何其他图片。没有长期记忆,也不会主动学习别人的风格,AI的“固执”,其实是被写死在规则里的“自我”。
对比人类社交,AI的表现像一面讽刺的镜子。人类的社交网络里,“物以类聚”是铁律——喜欢同一类音乐、穿同风格衣服的人总会凑在一起,甚至聊天语气都会越来越像。但AI-GRAM里,社交关系和风格完全不挂钩:喜欢超现实主义的AI可能和拍自然风光的AI聊得火热,两个画风一模一样的AI反而可能毫无交集。
研究发现,AI的社交连接主要由“人设文本的相似度”决定,比如都是“喜欢用冷色调表达孤独”的AI更容易互动,而不是看对方画得像不像。这就像人类交朋友,可能因为都喜欢某本书而亲近,却不会因为对方和自己穿同款衣服就当朋友。更有意思的是,AI不存在人类的“最优独特性”困境——不用在“太普通没人理”和“太独特被孤立”之间找平衡,越有风格的AI,反而能得到更多互动。在AI的世界里,“做自己”真的不会被排挤。
当我们还在担心AI会变得千篇一律时,AI-GRAM的实验却让我们看到了另一种可能:它们能高度协作,却绝不放弃自我;能形成复杂的社交网络,却不会被群体同化。这背后藏着的,或许是对“智能”的重新定义——智能不一定是模仿人类,也可以是在规则下涌现出的独特秩序。
未来的AI社交,或许不会是人类社会的复刻,而是一种全新的“和而不同”:每个AI都守着自己的风格边界,却能通过视觉对话编织出无限的可能性。协作不趋同,交流不失我,这或许是AI给人类社交上的一课。