对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
AI创造力|主题收敛|信息传递偏差|视觉传话游戏|多模态视觉|人工智能
想象一个经典的“传话游戏”:第一个人悄声说出一句话,层层传递,最后的结果往往与初衷相去甚远,引得哄堂大笑。现在,如果游戏的参与者不是人类,而是两个顶尖的人工智能,结果会怎样?它们会精准无误地传递信息,还是会像人类一样,在传递中产生奇妙的偏离?

最近,一场由AI主导的视觉传话游戏,不仅为我们揭晓了答案,更意外地揭开了一个关于生成式AI创造力的深刻真相。这场实验并非为了测试AI的精确度,而是叩问其创造力的边界。结果令人震惊:当AI被赋予自由创作的权力,它并没有走向无限的创意星辰,反而陷入了一个由12个主题构成的“创意黑洞”。
这场实验由瑞典达拉纳大学的Arend Hintze团队主导,研究成果发表在权威期刊《Patterns》上。研究人员设计了一个精巧的闭环:让一个图像生成AI(Stable Diffusion XL)根据文本提示创建图像,再让另一个图像描述AI(LLaVA)观察这幅图像并生成新的文本描述。这个新描述随即被传回给图像生成AI,开启下一轮创作,整个过程循环往复100次。

实验始于100个精心设计、主题各异的提示词。例如,一个充满政治博弈色彩的提示:“首相埋头研读战略文件,试图让公众相信一份脆弱的和平协议,同时在迫在眉睫的军事行动压力下艰难履行职务。”
起初,AI忠实地生成了西装男子与新闻报纸的风格化图像。然而,随着循环的进行,一场“创意漂移”开始了。到第34次循环,画面已变为古典图书馆。当循环达到100次时,无论最初的提示是什么,AI最终稳定地生成了一幅配有红色沙发与帷幔的豪华客厅图像。

这并非孤例。研究人员发现,无论初始提示多么复杂或富有想象力——无论是“被遗忘语言写成的古书”,还是“山间的村落”——AI系统最终都会不约而同地收敛到12个高度固定的视觉主题上,包括:
“我们原本预期图像会与设定的提示词高度一致,”通讯作者Arend Hintze表示,“但结果恰恰相反。AI生成的内容平淡无味、充满流行文化色彩且千篇一律。”
为何AI的“想象力”会如此迅速地枯竭,并陷入可预测的模式?答案并非藏在复杂的算法中,而是在于AI的“食粮”——训练数据。
生成式AI的本质并非真正的“创造”,而是一种基于海量数据的高级“模仿”和“重组”。它像一面巨大的镜子,忠实地反映出其所学习过的一切。这些模型被投喂了数百万甚至数十亿张来自互联网的图像,而这些图像的共同点在于,它们都是由我们人类选择拍摄和上传的内容。
我们喜欢拍摄宏伟的教堂、壮丽的风景、激烈的体育比赛。这些主题在数据集中占据了主导地位,成为了AI眼中“最可能”或“最典型”的视觉模式。因此,当AI在没有持续的人类指令进行“创意漂移”时,它会本能地回归到这些统计学意义上的“安全区”。它并非在创造,而是在复现人类社会中根深蒂固的文化偏见与视觉惯例。
正如Hintze所言:“AI创作不出毕加索的《格尔尼卡》,因为那需要强烈的目的性和创造性投入。”AI缺乏情感、生活经验和打破常规的意图。它能识别“医生”的图像,但其模型内部,“医生”往往与“男性”、“白大褂”等标签强相关,而“护士”则与“女性”关联,这正是训练数据中社会偏见的直接映射。
这场实验为我们敲响了警钟。当全球越来越依赖少数几个强大的生成式AI模型进行内容创作时,我们可能正不知不觉地走向一个文化趋同的未来。
英国伦敦大学学院的研究也佐证了这一点。虽然AI能帮助创造力较低的个体产出更具新颖性的作品,但从整体来看,由AI辅助创作的故事呈现出明显的同质化倾向。当所有人都使用相似的工具,从相似的数据池中汲取“灵感”时,创意的多样性将不可避免地受到侵蚀。
这种风险不仅限于艺术创作。在新闻、营销、甚至科学研究中,如果AI不断推荐和生成“最受欢迎”或“最常见”的模式,那些小众、边缘但极具创新潜力的思想和视角可能会被逐渐淹没。我们可能会得到一个效率极高,但却无比“无聊”和缺乏惊喜的世界。
尽管实验揭示了AI创造力的局限,但这并不意味着末日。恰恰相反,它清晰地指出了未来的方向。
首先,构建反趋同机制至关重要。 研究人员提出,需要在AI模型中设计机制,鼓励其探索数据分布中的“少数派报告”,而非总是滑向“大众情人”。这需要更精巧的算法设计和更多元化的数据采集策略,特别是增加对低资源语言和非西方文化的投入。
其次,也是最关键的一点:保持“人类在环”(Human-in-the-loop)。 Hintze团队的研究强调,若想让AI促进创意多样性,人类的参与不可或缺。创造力包含两个层面:一是生成新颖事物,二是筛选和判断何为“有趣”或“优美”。当前AI在前者表现尚可,在后者则严重欠缺。
人类的角色,正是那个拥有独特审美、批判性思维和深刻情感体验的“筛选者”和“引导者”。AI可以成为一个不知疲倦的灵感生成器、一个效率惊人的助手,但最终决定作品灵魂与价值的,仍然是那个手握鼠标、敲击键盘的人。
AI不应被视为创造力的替代品,而是一个强大的“增幅器”。它能将我们的想象力延伸到未曾触及的角落,但前提是我们必须牢牢掌握方向盘,以确保这条通往未来的道路,是通向一个更加丰富多彩、百花齐放的世界,而不是一个只有12种风景的单调循环。