即使数据集看起来只是一堵数字墙,它也能描绘出一幅引人注目的画面。以你的五天天气预报为例。这个计算可以归结为大量的细节,其中一些来自美国的雷达网络NEXRAD-让你看到即将到来的天气。但是,当NEXRAD天气数据档案最近在亚马逊网络服务上提供时,康奈尔大学的一组研究人员不仅看到了降雨、阳光和风的模式。

他们看到的完全是另一回事。

通过访问天气雷达的数据宝库,他们得以探索一种发生在美国夜空中、人们知之甚少的现象:鸟类迁徙。他们的研究跟踪了40多亿只鸟类在秋季向南迁徙,了解它们去了哪里,哪些鸟类幸存了下来,这是他们所谓的“有史以来描述动物运动的最大数据集之一”的结果。

亚马逊可持续发展数据计划扩展对旨在推动可持续创新的数据的访问-在AWS上托管NEXRAD等数据存档。该计划使天气预报模型、卫星图像、空气质量测量和其他公共数据集更易于在云中访问,还提供了用于分析的计算工具。

康奈尔实验室的鸟类迁徙视频

这一举措是在团队之间数月的对话中达成的亚马逊的可持续性而且亚马逊网络服务(AWS).随着时间的推移,团队意识到,通过共同努力,改善亚马逊为实现我们的可持续发展目标所需的数据集的访问,也可以使更广泛的非营利组织、企业和学术研究人员能够使用这些数据。该倡议的成立是为了让任何致力于可持续发展问题的人既了解如何使用云,又了解如何访问数据集,可以结合起来提供新的见解并推动新的解决方案。

康奈尔大学关于鸟类迁徙的论文是一项“绝对令人震惊的研究”,美国国家鸟类研究中心的首席数据官埃德·卡恩斯说美国国家海洋和大气管理局该联邦机构负责NEXRAD的运营。“老实说,如果亚马逊平台上没有这些数据集,这是不可能做到的。”

云的力量

亚马逊的可持续发展团队去年开始与AWS合作,开始对大量的数据进行仓储公共数据描述了我们的星球。雷竞技官网欢迎你虽然这些数据集一直是免费提供的,但研究人员可能没有必要的计算能力来通过自己的内部数据中心利用这些资源。

AWS开放数据全球主管杰德•桑德沃尔(Jed Sundwall)表示:“如果你足够幸运,有良好的互联网连接和充足的存储空间,你可以在大约一天半的时间内下载1tb的数据。”例如,NEXRAD档案是300tb (1tb是1024 gb)。从这个角度来看,您可以在1tb中容纳500小时的电影。

当数据保存在云端——在远程、联网的服务器上——任何人都可以看到并分析它,而不必获取自己的副本,也不必担心保持数据的更新。“这真的很强大,”Sundwall说,“因为它可以让研究人员以更低的成本更快地进行实验,从而获得更多的见解。我们经常听到客户说,他们现在能够做几年前还在科幻小说里才有的事情。”

虽然亚马逊可持续数据计划(Amazon Sustainability Data Initiative)最初的想法是在云中聚合资源,但它很快就变成了更多的东西。

亚马逊可持续发展团队高级首席科学家、加州大学伯克利分校(University of California, Berkeley)环境与劳工政策副教授达拉·奥洛克(Dara O'Rourke)说:“我们几乎立刻发现,我们只是触及了我们所能提供的价值的表面。”

在与研究人员的交谈中,很明显,他们不仅需要访问数据本身,还需要技术专长和计算工具,而亚马逊已经能够提供这两者。例如,NASA最近在AWS上使用机器学习技术来估计飓风风速,比他们以前的方法快了6倍。

O'Rourke说:“很少有气候研究人员会接触到最新的尖端机器学习和人工智能工具,但这些工具对他们来说可能非常有价值。”“所以我们试图将这些数据放在一个更容易获取的地方,并为这些研究人员提供一套他们以前从未有过的工具。”

聚焦天空的眼睛

总之,AWS提供的访问和计算工具正在推动由大学研究人员、地方政府、联邦机构和私营初创公司等团体领导的可持续发展项目。例如,非洲五个国家的卫星图像已在联合国汇编非洲区域数据立方体这是一个旨在解决土地利用、水和城市化相关问题的全球伙伴关系。

在加纳,非法矿工在一个月的时间里突袭一小块一小块的土地,清理树木,留下被污染的水坑。“这是一场环境灾难,”通过NASA帮助领导数据立方体工作的布莱恩·基洛(Brian Killough)说。

加纳当局只能用直升机和飞机监控这么多地方。但是基洛说:“每隔两到三天就有一幅卫星图像,再加上一些花哨的算法,你可以在瞬间发现变化。”通过AWS提供的数据立方体(如此命名是因为它在给定位置的时间内堆叠了一层又一层的卫星数据)也有助于为农业和城市规划提供信息。基洛说,他希望将这项努力扩大到非洲和世界其他地区。

AWS还提供了150万美元的云积分地球观测小组这是一个政府间组织,以便发展中国家的政府机构和研究小组能够使用大数据为可持续发展决策提供信息。这笔赠款是11月底刚刚宣布的,将为一系列广泛的项目提供资金,但全球地质组织对外关系负责人史蒂文·拉马奇(Steven Ramage)说,已经收到了与减少灾害风险工具和服务有关的多项申请。

“我们希望帮助人们自助,”拉梅奇说,“通过这样做,我们所有人都能应对人类曾经面临过的一些最大挑战。”

全球影响力,本地影响

虽然其中一些工作显然是大局观的,但它也可以很容易地归结为一个城市街区。在弗吉尼亚州,洪水易发城镇正在使用传感器监测水位,并将其上传到云端,作为监测的一部分StormSense项目。本地居民可问Alexa关于水位的问题在特定的地方或订阅有危险洪水警报的应用程序。

参与该项目的弗吉尼亚海滩市(City of Virginia Beach)的数据官员斯里达尔·卡特拉格达(Sridhar Katragadda)说,这些数据还被用于预测可能发生洪水的地方,最终可能会为道路发生洪水时告诉司机掉头的标志提供电力。

StormSense正在从弗吉尼亚海滩、纽波特纽斯和汉普顿路等沿海城市收集数据。卡特拉加达指出,每个地区可能都有自己的水位捕捉和显示系统,为了项目的发展,这些系统需要协调一致。

他说:“你能很好地扩大规模的唯一方法就是在云端。”“不同的城市可以使用不同的传感器,但我们可以将数据集中在一个地方。”

从20世纪60年代到2100年弗雷斯诺的极端高温(预测)的图表。随着时间的推移,极端高温的频率会增加。
每年极端高温天数的时间。该图表显示了一年中4月至10月每日最高温度高于极端高温阈值华氏100度的每一天的一个点,该图表显示了弗雷斯诺在2040年左右排放达到峰值,然后下降的情景。学习更多的知识。
这张图用预测模型说明了过去10年的平均野火燃烧量。这张地图显示的是加利福尼亚。
由Cal-Adapt提供的图表,使用数据模型说明了加州野火平均燃烧面积的预期变化。该图表以10年为周期变化,可以在Cal-Adapt上查看完整的动画。
查看动画。

在加州,Cal-Adapt这项计划正在使用AWS开放该州研究界的气候数据,包括海平面上升、野火发生率、积雪水平和其他指标的详细信息。

“下一代全球气候模型比以前的模型具有更高的空间和时间分辨率,模型输出包含的变量比以往任何时候都多,”加州适应组织执行董事南希·托马斯(Nancy Thomas)说。

托马斯说,该组织正在使用AWSλ为了提高计算能力,研究人员可以应用于日常气候参数,如极端高温天数,以交互式映射格式,可以突出时空气候异常。

她说:“开放数据获取对于使复杂的气候研究变得可理解、可获取和可操作至关重要。”

有时测量很深奥,它们的直接应用并不明显,但在与我们的专家讨论后,人们会说,‘啊哈!这就是这些数据的用途。”这让我们非常兴奋。
美国国家海洋和大气管理局(NOAA)首席数据官埃德·卡恩斯

构建数据社区

对于NOAA来说,在云中托管NEXRAD数据和其他资源减轻了其服务器的压力。

美国国家海洋和大气管理局的卡恩斯说:“亚马逊所做的事情的真正好处在于,他们提供的这些NOAA数据对人们可以消费多少数据没有明显的限制。”

他补充说,亚马逊和NOAA专家之间正在进行的对话有助于形成该机构提出的内容。亚马逊传达了客户感兴趣的数据集,NOAA则帮助解释数据集以及如何使用数据集。

“有时测量方法很深奥,它们的直接应用并不明显,”他说,“但在与我们的专家讨论后,人们会说,‘啊哈!这就是这些数据集的使用方式。”这对我们来说真的很令人兴奋。”

随着亚马逊可持续发展数据计划的发展,它产生了一个飞轮效应:更多的数据带来更多的用户,反过来又带来更多的数据和更多的用户。这些用户中有许多是公民科学家、企业家或像康奈尔大学那样的研究人员,他们从长期以来难以获得的数据中提出了完全出乎意料和创造性的见解。

“当我们与NOAA合作开放他们的天气雷达数据时,我们从未想过它会被用作描述动物运动的数据集,”森德沃尔谈到这项鸟类研究时说。

“如果你能把数据提供给更多有着不同视角、不同优先级和不同方法的人,你就能从中获得更多。”

了解更多关于亚马逊可持续发展数据计划的信息。