
24 天前
想象一下:你花了十年时间练出能分辨1.4万种鸟鸣的耳朵,某天突然被扔进大西洋底,居然能精准听出座头鲸的哼鸣和虎鲸的哨声——这不是科幻,是Google DeepMind的AI模型Perch 2.0干的事。
这个原本以鸟类、陆生昆虫和两栖动物的百万条录音为食的AI,在几乎没听过海洋声音的前提下,仅凭几十条鲸鱼音频样本,就学会了分辨8种鲸类的不同叫声,甚至在虎鲸亚种识别上,比专门训练的鲸鱼模型表现还出色。
没人预见到这个结果。为什么一个训鸟的AI,能听懂深海里的歌声?
要搞懂这件事,得先拆解Perch 2.0背后的迁移学习(Transfer Learning)——简单说就是让AI把在A任务上学到的本事,用到B任务上,相当于“举一反三”。你可以把它想象成:一个练会了中餐颠锅的厨师,转去做西餐煎牛排,不用重新学拿刀握锅,只需要调整火候和调味就行。
但真实的机制比这个类比更精确:Perch 2.0先在1.5万种陆地动物的声音数据上完成“预训练”,把杂乱的音频转换成能捕捉核心特征的**嵌入向量**——就像把每段声音都提炼成一张独特的“特征名片”,上面标注着频率变化、节奏快慢、音色特质这些关键信息。当要识别鲸鱼时,研究团队不用从头训练模型,只需要拿几十条鲸鱼音频的“名片”,训练一个轻量的分类器,让它学会把鲸鱼的“名片”和对应物种配对。
这个过程省了至少90%的计算资源。Google Research的Lauren Harrell说:“相当于把之前几百万小时的训练成果都‘回收利用’了,不用再从零开始烧钱训练鲸鱼模型。”
具体的操作逻辑很清晰:
一开始连研究者都不敢信这个结果,直到他们从生物学和AI规律里找到了三重答案。
第一重是进化的巧合。鸟类和鲸类虽然一个在天上一个在海里,却都是“声音学习者”——它们能通过模仿学会复杂叫声,而不是天生就会。研究发现,这两类动物的发声器官虽然结构不同,却遵循着相似的“肌弹性-气动”发声原理,甚至负责声音学习的脑区基因表达都有趋同性。反映在声谱图上,虎鲸的哨声频率和很多鸣禽重叠,座头鲸的哼鸣节奏,和某些鸟类的鸣啭有着相似的频率调制模式。
第二重是AI的规模定律。Perch 2.0用150万条跨物种音频训练,参数超过1亿——按照神经网络的规模定律,模型越大、训练数据越多样,学到的特征就越接近“声音的本质”,而不是某一类动物的专属特征。它就像一个听遍了全世界声音的超级耳朵,能捕捉到频率变化、节奏波动这些通用的声学规律,不管是鸟叫还是鲸鸣,在它眼里都是这些规律的组合。
第三重是练最难的题,做简单的卷。鸟类声音识别的难度远超鲸鱼:光是鸣禽就有1.4万种,很多亲缘物种的叫声差异细微到人类耳朵根本分辨不出。Perch 2.0在训练时被逼着学会捕捉最细微的声学特征——比如千分之几秒的频率偏移、几赫兹的音色差异,这些本事用到鲸鱼识别上,就像让做奥数题的学生去做初中数学,自然游刃有余。
我认为,这件事最被忽略的价值,不是AI的跨界能力,而是它给我们指了一条明路:当我们缺乏某类数据时,与其死磕稀缺数据,不如先在更丰富、更难的相关数据上训练出通用能力——这可能是解决生态保护中数据稀缺问题的最优解。
对于鲸类保护来说,这个发现是个实打实的效率革命。过去要监测鲸类,要么靠成本高昂的航空调查,要么靠水下麦克风录下海量音频后人工标注——一个研究员一天最多能听10小时音频,而Perch 2.0一天能处理几万小时。

现在,研究团队只需要把水下麦克风放在深海,录下的音频传到云端后,Perch 2.0能自动识别出鲸类的物种、叫声类型,甚至能追踪它们的迁徙路线。比如北大西洋右鲸,这种濒危鲸类的“upcall”叫声,Perch 2.0识别准确率能达到86%,比人工识别还稳定。

更重要的是,它能快速应对新情况。海洋里每天都有新的声音出现——可能是新的鲸类叫声类型,可能是未知的海洋生物,Perch 2.0只需要几条样本,就能快速学会识别,不用等几个月训练新模型。
当然,它也有局限:在极端嘈杂的海域,比如靠近货轮航线的地方,识别准确率会下降;对于那些和鸟类声谱特征差异极大的深海生物,比如某些低频发声的须鲸,它的表现也会打折扣。但这些问题,都可以通过补充少量针对性数据来解决。
当Perch 2.0第一次准确识别出太平洋深处的虎鲸哨声时,研究团队意识到,他们打开的不只是一个跨物种识别的技术窗口,更是一个重新理解动物声音的新视角。
我们过去总觉得,不同物种的声音是隔绝的语言,鸟有鸟的歌,鲸有鲸的吟,彼此无法相通。但AI告诉我们,在声学的本质层面,这些声音共享着进化和物理的底层规律——就像不同的语言,却用着相同的字母表。
听懂跨物种的声音,先懂共享的规律。
未来,或许我们不用再为每种动物单独训练模型,只需要一个能捕捉声音本质的通用AI,就能听懂从雨林到深海的所有生命之声。而这,可能是AI给生态保护最珍贵的礼物:用技术打破物种间的声音壁垒,让我们能更平等地倾听这个星球的心跳。
点击充电,成为大圆镜下一个视频选题!