闪洪每年夺走数千条生命。它们来势迅猛,最严重地冲击城市,数十年来几乎没有科学家能提前预见,因为用于训练预测模型的数据根本不存在。 周四,谷歌宣布他们找到了解决方案——通过阅读新闻。 公司推出了Groundsource系统,利用Gemini AI扫描自2000年以来发布的数百万篇新闻文章,提取洪水事件的相关信息,并将每一条事件与具体地点和日期关联起来。最终形成了一个包含260万条历史闪洪事件的数据集,覆盖150多个国家,现已向公众开放下载和使用。
该数据集随后被用来训练一款新型AI模型,能够预测未来24小时内某个城市区域是否可能发生闪洪。预测结果现已在谷歌的Flood Hub平台上线,该平台此前已用于向全球约20亿人发出河流洪水预警。 Groundsource解决的问题其实非常基础。河流有物理测量仪——水中传感器,几十年来一直在记录水位变化。这也是预报员学会预测河流溢出的依据。而城市街道没有类似的设备。当强降雨冲刷路面、淹没排水系统时,洪水发生得太快、太局部,传统仪器难以追踪。 没有历史记录,就无法训练AI模型识别这种模式。谷歌的解决方案是将新闻文章视作缺失的传感器。
“通过将公共信息转化为可操作的数据,我们不仅在分析过去,更在为未来构建更具韧性的系统,朝着‘没有人会对自然灾害感到意外’的目标努力。”谷歌表示。
来源:谷歌
在过滤掉广告、导航菜单和重复内容,并将其他语言的文章翻译成英文后,团队将数百万杂乱的文本描述转化为干净的、具有地理位置的时间序列数据。 基于这些数据训练的模型采用LSTM神经网络——一种专为处理时间序列的AI模型——结合每小时天气预报以及城市化密度、土壤吸收率、地形等本地因素进行预测。它输出一个简单的信号:未来24小时内某个城市区域的洪水风险为中等或高,适用于每平方公里人口密度超过100人的地区。 该系统存在一定局限性。它每次只能覆盖大约20平方公里的区域,不能判断洪水的严重程度,也在新闻报道较少的地区表现不佳。 尽管如此,早期的测试结果已颇具意义。在南部非洲的一个地区灾害管理部门在测试阶段收到了Flood Hub的预警,确认了洪水发生,并派遣人道主义工作者进行应对。谷歌危机韧性主管朱丽叶·罗斯滕伯格表示:“从Flood Hub的预测到实地行动的整个链条,正是Flood Hub设计的初衷。”