对于自然灾害监测预警部门来说,最常见、最棘手的问题之一是如何准确预报自然灾害。对于该领域的从业人员来说,无论是自然灾害防御人员还是抢险人员,几乎所有从业人员希望提前知道答案。然而,自然灾害预报受随机性强、影响因素多、过程隐蔽、监测不足和信息滞后等难以预测。但可以肯定的是,基于大数据算法和机器学习获得的自然灾害预测方法、应用软件和预警信息系统,已成为大数据工程领域极具前景的研究与发展方向。
自然灾害是发生于一个复杂的非线性自然生态系统之中,其对初始条件非常敏感,初始数据稍有误差即可导致预测不准。影响自然灾害发生和发展的“隐性因素”难以实时观测,加之自然灾害形成过程的多变性、触发机制的复杂性、影响因素的多样性和突然爆发的可能性等,即使能实现自然灾害预报也难以对其过程进行精确模拟,往往留给自然灾害预报人员的预警时间非常短。此外,自然灾害在发生时间、发生地点、灾害规模和诱发条件等方面均具有很强的随机性,这种使得依赖过往经验和统计规律进行的自然灾害预报无法保证绝对的精确性和准确性。
自然灾害按是否可预测分为:常规自然灾害和非常规自然灾害。常规自然灾害往往是可预测的,而非常规自然灾害则往往是难以预测的。以短时强降雨为例,短时强降雨是最常见、危害最大的自然灾害之一,无法准确预测的短时强降雨可以诱发山体滑坡、河道洪水和城市道路积水等众多自然灾害。短时强降雨可分为常规强降雨和非常规强降雨。例如,以广东省广州市为例,基于过往的大数据统计,该市每年五六月份的降雨量往往较全年其他时段偏多,也称为“龙舟水”时段。基于该周期性规律,“龙舟水”期间的强降雨属于典型的常规自然灾害,对于这种常规短时强降雨,自然灾害预测预报的从业人员可通过历史经验和统计规律进行防御和减灾。而非常规自然灾害往往随机性很强,无规律可循,以今年8月发生于广州市的强降雨为例,属于典型的非常规强降雨。根据气象部门数据,自今年8月以来,广州市受西南季风和低涡气流影响,降雨量远超历史同期,截至今年8月13日,该市平均雨量为340.8毫米,较该市近三十年历史同期(112.1毫米)偏多2倍,为该市历史同期最多。该次强降雨属于典型的非常规自然灾害,其发生无规律性可循,难以预测。
对于常规自然灾害,可以通过计算机算法、机器学习和大数据统计等数据分析技术进行较为精确的预测和预报。机器学习的本质是通过挖掘自然灾害的过往规律,对未来做出较为可靠的预测和预报。机器学习主要包括三个步骤:数据采集、发现规律和预测未来。数据采集是指采集某种自然灾害的过往历史数据,包括某种自然灾害过往在发生时间、发生地点、灾害规模和诱发条件等方面的历史数据;发现规律是指对自然灾害的过往历史数据进行数据分析或大数据统计,发现过往历史数据的(周期性)规律,并尝试获得影响自然灾害结果的相关变量(因素);预测未来则是指基于历史数据、规律和经验,用以往周期性发生的事件来预测未来,认为过往周期性发生的事件未来也会同样按既定的时间轨迹再次出现。例如,过去广州市每年五六月份均会出现强降雨,那么,可以预测明年、后年或者未来更久的年份广州市同样也会在五六月份出现强降雨。
大数据算法在非常规自然灾害预测领域应用的局限性是显而易见的,无法基于历史数据统计发现非常规自然灾害发生和发展的规律,进而无法依赖大数据算法对非常规自然灾害进行可靠的预测。例如,今年8月,广州市的强降雨超常规,为该市历史同期最多,无规律可循。笔者认为,未来自然灾害预测软件将在数据集成、可视化平台、智能化、实时计算和与决策系统融合等方面进行系统优化和算法升级,使自然灾害预报的预测方法更智能、应用软件更便捷、决策价值更高。