对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
连笔生成|古籍识别|书法风格复刻|香港科技大学(广州)|UniCalli模型|AIGC|人工智能
当你输入“将进酒”三个字,十秒后,文征明的清雅小楷、米芾的恣意行书、怀素的狂放草书会同时出现在屏幕上——不是孤立的三个字,是整列错落有致的书法作品:字与字间大小随章法缩放,草书的游丝连笔像书法家腕下自然带出的余韵,甚至连字间距的留白都透着古人的行气。
这不是某位书法家的即兴创作,是香港科技大学(广州)团队推出的UniCalli模型。它不仅能精准复刻数十位古代名家的书法风格,更破天荒地把“书法生成”和“古籍识别”拧进了同一个模型里。更重要的是,它解决了AI书法界悬而未决的老问题:终于不再是单字的拼凑,而是有灵魂的整幅作品。
在UniCalli出现之前,AI书法生成一直卡在两个死胡同里:要么是“单字专家”,每个字的笔法都能以假乱真,但凑成一列就像把不同书法家的字硬贴在纸上,大小、间距、笔势全不搭,活脱脱的“书法僵尸”;要么是“整页赌徒”,直接生成整幅画面,结果常常是错字连篇,连基本的字形都保不住。

UniCalli的解法是“全局谋篇”——它用多模态扩散Transformer(MMDiT)做底座,这是一种能同时处理文字、图像、空间布局的神经网络,就像书法家动笔前先在脑子里排布好整列的章法。传统AI是逐字“线性生成”,写完第一个字才想第二个,自然顾不上连贯;而MMDiT的双向注意力机制,能在生成每一笔时都“看见”整列的所有字,就像你写文章时会回头调整语序,让前后气韵贯通。
最关键的是,它把“生成”和“识别”做成了一对互相监督的搭档:识别任务像个严格的书法老师,盯着AI别把“之”写成“乏”,保证字形骨架不歪;生成任务则负责注入风格,让字里行间带着米芾的癫狂或文征明的克制。这种“双向约束”,终于让AI写出的字既有形,又有神。
要让AI懂书法,光有全局观还不够,得把那些只可意会的“行规”变成它能理解的算法。
比如非对称加噪——这是UniCalli切换“生成”和“识别”任务的开关。当模型要生成书法时,它会给一张空白图像加噪声,同时让输入的文字保持“干净”,引导AI从噪声里还原出对应风格的字;反过来,要识别古籍时,就给模糊的古籍文字加噪声,让AI从混乱里提炼出清晰的标准文本。两套独立的噪声时间步,就像给模型装了个换挡杆,切换任务时丝毫不卡顿。

再比如边界框图(BoxMap),这是给AI的“排版脚手架”。你可以把它想象成每个字的“占位框”,模型生成时必须先预测每个框的大小和位置,相当于先在纸上画好格子,但这个格子是活的——王羲之的草书里,“天”可能比“地”大一圈,米芾的字会故意歪着放,这些书法家的“小心思”,都被模型通过学习海量古籍数据内化进了框的变化里。
还有重复旋转位置编码(DuplicateRoPE),它解决了不同模态的“语言不通”问题。AI要同时处理文字、图像、布局框,就像要让中文、英文、日文的人对话,得先统一翻译器。RoPE先给书法图像做2D空间编码,再把这个编码“复制”给文字和布局框,让三者在同一个空间坐标系里对齐——字的位置、大小、笔画走向,终于能精准对应上了。
当然,也有防止AI“学偏”的保险:条件随机失活。训练时,模型会随机把部分风格信息“屏蔽”,比如故意不让它看怀素的草书样本,逼着它去学所有草书共有的连笔逻辑,而不是死记怀素的某一个字,这样遇到没见过的书法家风格,它也能写出像样的作品。
UniCalli的野心不止于生成好看的书法,它更想解决古籍数字化的痛点。
现存的古籍大多是手写本,字迹模糊、排版混乱,传统OCR识别常常“张冠李戴”,把“曰”认成“日”,更别说那些连笔的草书古籍了。而UniCalli因为同时懂“生成”和“识别”,它能先根据古籍的残字“脑补”出完整的字形,再反过来验证识别的准确性——就像你猜一个模糊的字时,会先想想这个词的上下文,再判断是什么字。
目前它已经能处理甲骨文、古埃及象形文字这类极难识别的古文字,甚至能把现代文逆向生成甲骨文风格的书法。团队开源了包含8000多件古籍的数据集,还上线了在线Demo,你输入任何一句话,都能立刻拿到宋徽宗瘦金体或颜真卿楷书版的整列作品。
但它也有局限:面对超长文本时,整列的连贯性会打折扣;一些极其小众的书法家风格,因为训练数据少,生成的质量还不稳定。不过,这已经是AI在书法和古籍领域迈出的一大步——从“模仿单字”到“理解章法”,从“各自为战”到“生成识别统一”,它终于开始懂书法了。
当AI能写出带着米芾笔意的《将进酒》,当它能读懂千年前模糊的古籍残页,我们突然发现:科技和传统的相遇,从来不是谁取代谁,而是让那些快要被遗忘的美,以新的方式活过来。
技术懂了章法,传统才有新生。
或许未来的某一天,我们能通过AI让失传的书法家“复活”,让散佚的古籍重新完整,而这一切的起点,不过是一群工程师想让AI学会——写一幅有灵魂的书法。