每周,海洋生物学家丽莎·施泰纳(Lisa Steiner)都会从她位于北大西洋亚速尔群岛(Azores)偏远岛屿Faial的家中拨打视频电话,与一个由数据科学家和开发人员组成的小团队交谈。用她的话说,他们想看看她是否能打破他们为她建立的一切。

这个“什么”是一个数字工具,由全球咨询公司凯捷(Capgemini)的团队设计,使用亚马逊网络服务(AWS)机器学习技术,帮助斯坦纳更快、更准确地识别单个抹香鲸。抹香鲸的寿命最长可达70年,斯坦纳通过拍摄它们的尾鳍,并将图像存储在数据库中,来追踪抹香鲸。就像人类的指纹一样,每个人的吸虫都是独一无二的。通过对吸虫图像进行分类和匹配,斯坦纳可以确定同一种动物何时回到该地区。

抹香鲸的尾巴露出了大西洋的水线。
一张抹香鲸尾巴的照片,由斯坦纳拍摄。

将她的研究描述为热爱的劳动是一种保守的说法。1988年,斯坦纳来到亚速尔群岛开始研究抹香鲸,当时柏林墙还在,乔治·迈克尔(George Michael)的《信仰》(Faith)是美国最畅销的专辑,四年后,第一条短信才被发送到手机上。斯坦纳对鲸鱼迁徙模式的研究从一开始——并一直到现在——基本上都是靠手工完成的,这也许并不令人意外,尤其是对一个自称对科技“很可能是”感兴趣的人来说。

她说:“我们以前从早上9点到晚上10点都在出海。”“我会用黑白胶卷拍摄鲸鱼,但在冲洗之前,我不知道我是否真的拍到了清晰的照片。”

如今,一台数码相机,更不用说一艘更快的双体船,对施泰纳的耐心要求要低得多。然而,耐心似乎是她拥有的一种品质,因为她的研究的日常现实看起来,至少在局外人看来,类似于世界上运行时间最长的“专注”游戏。
斯坦纳跟踪了一些鲸鱼很长时间,现在她可以一眼认出大约100头。然而,即使是她渊博的知识和无尽的热情,也不足以让她在一个拥有8000多张图像的不断增长的数据库中寻找匹配。

海洋生物学家丽莎·斯坦纳花了30年时间研究和识别抹香鲸及其迁徙模式

“我确实有一个电脑程序,”斯坦纳说,她补充说,她最初只是把照片放在地板上。“但它是2002年的,差不多有20年了,而且相当笨重。大约在2010年到2011年,我开始跟不上身份识别的进度。”

斯坦纳现有的程序要求她上传图像,并手动输入数据,描述每头鲸鱼吸虫的左右轮廓。这个程序很慢,而且无法随着时间的推移发现微小的变化。例如,如果鲸鱼尾巴的轮廓因磨损而略有变化,系统无法识别它仍然是同一种动物。

直到全球咨询集团凯捷(Capgemini)的一名员工参加了斯坦纳的一次观鲸之旅,并看到了机器学习帮助她的潜力,Fluketracker的想法才诞生。斯坦纳说:“我向他们提供了我所有的照片,他们已经训练了一个算法来知道抹香鲸尾巴的样子。”“它成功地找到了我无法找到的匹配,特别是那些轮廓非常光滑的尾巴,很难与其他尾巴区分开来。”

Fluketracker使用AWS机器学习技术对图像进行高速排序和匹配,已经帮助斯坦纳对2019年至2020年的所有照片进行了分类,识别出了200多只新鲸鱼。在她每周与团队的通话中,她提供了关于工具如何工作的反馈,这样他们就可以改进应用程序本身和人工智能,以及添加新功能。

海洋生物学家丽莎·斯坦纳花了30年时间研究和识别抹香鲸及其迁徙模式

她说:“现在我只要上传图片,等几分钟,如果目录中有已经在线的鲸鱼,它就会找到匹配的。”“我们的最终目标是让这个平台公开可用,并且是开源的,这样任何人都可以提交照片。”

斯坦纳说:“我的研究只覆盖了亚速尔群岛,所以如果能收集到其他地区的照片就太棒了。”“我们合作得越多,获取的信息就越多,我们就能更好地了解鲸鱼用户的去向和社交方式。我真的希望它能激发人们的想象力。”

当然,前提是她不能先把它弄坏。