对抗知识焦虑,从看懂这条开始
App 下载对抗知识焦虑,从看懂这条开始
App 下载
社交网络图|清代词人|古籍数字化|纳兰词|文化艺术|AIGC|社会人文|人工智能
当你点开手机里的古籍平台,想读《纳兰词》,却对着“人生若只如初见”背后的典故意兴阑珊——这曾是无数古籍爱好者的常态。三年前,古籍数字化还困在“付费贵、资源锁、难检索”的死胡同,藏馆把珍本当“镇馆之宝”秘不示人,普通人想翻一页宋元刻本,得跨大半个中国。而现在,AI不仅能把《纳兰词》里的人名地名一键标红,还能拉出一张清代词人社交网络图,告诉你纳兰容若和顾贞观的交游脉络。这一切变化,只用了三年。为什么古籍数字化突然就“活”了?
古籍数字化的第一步,是把纸页变成像素——这曾是最基础也最艰难的一步。十年前,藏馆怕“珍本贬值”,连书影都不肯放;后来妥协的数字化,也是“阉割版”:裁掉天头地脚的题跋,抹去藏书印章,只留光秃秃的文字。那时的数字古籍,更像“电子图片库”,搜“纳兰容若”,出来的是几百页扫图,得自己逐页翻找。

真正的转折来自AI的介入。首先是OCR技术的升级——传统OCR连宋体印刷体都能认错,现在基于深度学习的模型,能把古籍里的异体字、破损字、手写批注的识别准确率拉到97%以上。比如识典古籍平台,用AI先完成粗校,再发动3.7万志愿者做精校,三年就完成了15亿字的古籍整理,是过去人工效率的20倍。

但这还不够。AI要做的不是“扫字”,而是“读字”。就像你读《纳兰词》,看到“骊山语罢清宵半”,AI能直接跳出:骊山,在今陕西临潼,是唐明皇与杨贵妃定情处;这句化用《长恨歌》“七月七日长生殿”。这就是**逐字逐词标引**——把古籍里的人名、地名、典故、专有名词全部“钉”进一张知识网里。
你可以把古籍的知识标引想象成给人体做CT扫描:不仅要看到每一个“细胞”(文字),还要看清“血管”(逻辑关联)和“器官”(知识体系)。
传统的标引靠人工,一本《纳兰词》的人名地名标引,得几个学者花几个月;现在AI能在一天内完成,还能关联更庞大的知识库。比如标引“顾贞观”,AI会自动链接到《弹指词》、他和吴兆骞的“金缕曲之交”,甚至清代词坛的“阳羡派”“浙西派”脉络——这就是**数字知识网络**:把散在几十万本古籍里的知识点,像神经元一样连起来。

这个网络的核心是**命名实体识别技术**(NER),简单说就是让AI学会“认人认地认东西”。过去的NER只能识别常见的皇帝、地名,现在用大语言模型训练后,能认出《纳兰词》里的“渌水亭”(纳兰的别墅)、“通志堂”(他的藏书楼),甚至能区分不同时代的同名人物——比如同样叫“苏轼”,不会把宋代词人和清代学者搞混。
但AI也有短板。比如《纳兰词》里的“当时只道是寻常”,AI能标引“寻常”是“平常”的意思,却很难读懂背后那种失去妻子后的怅惘——这种文化语境的理解,还得靠人。所以现在的模式是“AI打底,专家补漏”:AI完成80%的标准化标引,学者专注剩下20%的深度解读,效率比纯人工高了10倍都不止。
有人担心,AI会不会抢了古籍整理学者的饭碗?其实恰恰相反,AI解放了学者的双手,让他们能做更有价值的事。
古籍整理专家周旭,过去花三年时间校勘《中华大藏经》,大部分时间都在做“形近字校对”这种重复劳动;现在AI能先把99%的错误找出来,他只需要处理剩下1%的疑难问题——比如“壼”(古代的一种酒器)和“壺”(茶壶)的混淆,AI可能认错,但学者一眼就能看出来。
更重要的是,AI让古籍从“学者的书房”走进了“普通人的手机”。过去读《纳兰词》,得买中华书局的繁体竖排本,还得配一本《清代词史》;现在打开手机,就能看到AI标引的注释、词人的社交网络,甚至能听AI用古音朗读。截至2026年,识典古籍的月活用户超过240万,其中80%是普通读者,不是专业学者。
当然,挑战也不少:比如古籍的版权问题,有些藏馆还是不肯开放资源;AI的标引偶尔会“张冠李戴”,把明代的地名安到清代;还有最核心的——AI能读懂文字,却读不懂文字背后的“人心”。但这些都不是阻碍,而是AI和人协作的方向。
当AI帮你标引出《纳兰词》里的每一个典故,当你能一键看清清代词坛的人脉网络,你会发现:古籍不再是积满灰尘的“天书”,而是一群活生生的人,在纸页上和你对话。
科技不是为了取代传统,而是为了让传统活过来。未来的古籍数字化,不是把纸书变成电子书,而是把散落在历史里的知识点,织成一张能触摸、能互动、能生长的知识网。而我们每个人,都能成为这张网的编织者——就像那些在识典古籍上校对《纳兰词》的志愿者,他们用指尖的点击,把三百年前的纳兰容若,拉到了我们面前。