05 生物灾害精细化预报算法试验研究——以潜山县马尾松毛虫为例 下载本文

内容发布更新时间 : 2024/5/21 11:21:29星期一 下面是文章的全部内容请认真阅读。

生物灾害精细化预报算法试验研究——以潜山县马尾松毛虫为例

张国庆

(安徽省潜山县林业局 安徽 246300)

摘要:精细化预报建模,除了“精”、“细”之外,还要注重“简”的精细化预报基本要求,只有这样的算法模型,才能“化繁为简”,才能在生产实践中得到广泛应用。一个好的算法,就是要把复杂的事情交给计算机去做,最大程度地把人从繁重的劳动中解放出来。因此,算法与模型的的选择,应该按照“精”、“细”、“简”要求,应用最新数学、系统学成果和分析仿真工具,采用多种方式进行试验比较,选择合适的算法。就本次算法试验而言,对于潜山县马尾松毛虫精细化预报,采用多层感知器建立马尾松毛虫预报模型较好。 关键词:生物灾害;马尾松毛虫;回归;神经网络;算法

1.数据来源

马尾松毛虫发生量、发生期数据来源于潜山县监测数据,气象数据来源于国家气候中心。 2.数据预处理

为了体现马尾松毛虫发生发展时间上的完整性,在数据处理时,将越冬代数据与上一年第二代数据合并,这样,就在时间上保持了一个马尾松毛虫世代的完整性,以便于建模和预测。

(1)发生量数据处理

对潜山县1983~2014年原始监测数据预处理时,按照“轻”、“中”、“重”3个强度等级,分类按世代逐年汇总。

(2)发生期数据处理

在对潜山县1983~2014年原始发生期监测数据按世代逐年汇总,然后,将日期数据转换成日历天,使之数量化,以便于建模分析。

(3)气象数据处理

根据《松毛虫综合管理》、《中国松毛虫》等学术资料以及近年来有关马尾松毛虫监测预报学术论文,[1,2]初步选择与松毛虫发生量、发生期有一定相关性气象因子,包括卵期极低气温,卵期平均气温,卵期积温(日度),卵期降雨量,第1、2龄极低气温,第1、2龄平均气温,第1、2龄积温(日度),第12龄降雨量,幼虫期极低气温,幼虫期平均气温,幼虫期积温(日度),幼虫期降雨量,世代极低气温,世代平均气温,世代积温(日度),世代降雨量共16个变量。将来自于国家气候中心的气象原始数据,按年度分世代转换成上述16个变量数据系列。

然后按照精细化管理的“精”、“细”、“简”的要求,选择对当前马尾松毛虫防治实践有着较高指导意义的发生面积和幼虫高峰期作为预报因子,采用SSPS进行偏相关性分析,再次排除相关性较低因子变量,并排除世代降雨量、幼虫期降雨量、幼虫期极低气温、幼虫期平均气温、幼虫期积温等过时数据,以减少过多相关性较低变量对建模试验的干扰。

在数据汇总中发现,第一代与第二代之间的气象数据相差较大,为了保证试验的精确性,将第一代与第二代分开建模试验。各世代参加算法试验的变量如表1。

表1 参加算法试验的变量

因变量 第一代发生量 第二代发生量 第一代幼虫高峰期 第二代幼虫高峰期 自变量 第1、2龄极低气温,卵期极低气温,上一代防治效果,上一代防治面积,以及第1、2龄降雨量,卵期降雨量 第1、2龄极低气温,上一代防治面积,卵期极低气温,上一代防治效果,第1、2龄降雨量,卵期降雨量 成虫始见期,第1、2龄平均气温,第1、2龄积温,第1、2龄极低气温,卵期极低气温,卵期平均气温,卵期积温 成虫始见期,卵期平均气温,卵期积温,第1、2龄极低气温,第1、2龄平均气温,第1、2龄积温,卵期极低气温

3.试验工具

IBM SPSS Statistics 22,Microsoft Office Excel 2007。 4.算法试验

(1)回归试验

使用IBM SPSS Statistics 22和Microsoft Office Excel 2007,多次选择不同的变量,采用线性回归、曲线回归、非线性回归、Logistics回归等回归建模试验的比较,再次排除了部分相关性较低的变量,最终选择了拟合度较高的线性回归模型,如表2。

表2 回归算法试验结果 最终参加试验的变量 因变量 第一代发生量 第二代发生量 第一代幼虫高峰期 第二代幼虫高峰期 自变量 第1、2龄极低气温,卵期极低气温,上一代防治效果,上一代防治面积 第1、2龄极低气温,上一代防治面积 成虫始见期,第1、2龄积温,第1、2龄平均气温 成虫始见期,卵期积温,卵期平均气温 算法试验结果 预报模型 第一代发生面积=18563.523-0.17×上一代发生面积+3223.329×上一代防治效果+305.634×卵期极低气温-1197.311×第1、2龄极低气温 第二代发生面积=-33943.89+1.3337872×上一代防治面积+1958.0085×第1、2龄极低气温 第一代幼虫高峰期(日历天)=34.055+0.585×上一代成虫始见期+0.002×第1、2龄幼虫期积温(日度) 第二代幼虫高峰期(日历天)=219.323+0.280×上一代成虫始见期-0.150×卵期平均气温 显著性 0.036 0.053 0.000 0.000 从表2可以看出,显著性概率小于或非常接近0.05,拒绝回归系数都为0的原假设,算法试验基本满足精细化预报试验要求。

(2)神经网络径向基函数试验

使用IBM SPSS Statistics 22,经过多次神经网络径向基函数试验,筛选拟合度高的马尾松毛虫精细化预报模型,试验结果如表3。

因变量 第一代发生量 第二代发生量 第一代幼虫高峰期 第二代幼虫高峰期 表3 神经网络径向基函数算法试验结果 最终参加试验的变量 试验结果 自变量 R2 因子变量:选择第1、2龄极低气温,卵期极低气温; 线性0.810 协变量:幼虫期降雨量,卵期积温 因子变量:第1、2龄极低气温,上一代防治面积; 协变量:卵期极低气温 因子变量:成虫始见期,第1、2龄积温; 使用分区变量分配个案:1、2龄平均气温 因子变量:成虫始见期,卵期积温; 使用分区变量分配个案:卵期平均气温 线性0.883 二次0.842 三次0.889 算法试验发现,采用径向基函数建立的马尾松毛虫预报模型,基本满足马尾松毛虫预报要求。

(3)神经网络多层感知器试验

使用IBM SPSS Statistics 22,经过多次神经网络多层感知器试验,筛选拟合度高的马尾松毛虫精细化预报模型,试验结果如表3。

表4 神经网络多层感知器算法试验结果

最终参加试验的变量 因变量 第一代发生量 自变量 因子变量:上一代防治面积,上一代防治效果,卵期极低气温,第1、2龄极低气温; 协变量:卵期降雨量,第1、2龄降雨量 因子变量:第1、2龄极低气温,上一代防治面积; 协变量:卵期极低气温; 使用分区变量分配个案:上一代防治效果 因子变量:成虫始见期,第1、2龄积温; 协变量:第1、2龄平均气温,第1、2龄极低气温; 使用分区变量分配个案:卵期极低气温 因子变量:成虫始见期,卵期积温; 协变量:卵期平均气温,第1、2龄极低气温; 使用分区变量分配个案:第1、2龄平均气温 试验结果 R2(线性) 0.957 第二代发生量 1.000 第一代幼虫高峰期 0.999 第二代幼虫高峰期 0.999

算法试验发现,采用多层感知器建立马尾松毛虫预报模型,R2均大于0.9,要优于径向

基函数与回归方法建立的模型。

(4)时间序列分析算法试验

在算法试验中,还采用了多种时间序列分析算法,试验结果的拟合度都较低,达不到预报模型要求。 5.算法选择与组合

(1)算法基本要求

精细化预报建模,除了“精”、“细”之外,还要注重“简”的精细化预报基本要求,只有这样的算法模型,才能“化繁为简”,才能在生产实践中得到广泛应用。模型拟合度再高,如果实际应用操作复杂,那也很难应用于实践。因此,这就要求我们创新算法,把复杂的事情交给计算机去做,最大程度地简化人的操作,这样的算法才是好的算法。

(2)自变量数据的获取

对于马尾松毛虫精细化预报而言,对防治具有较高指导意义只有发生面积、发生强度与幼虫高峰期的预报。

就目前技术来说,用于建模的成虫始见期数据,采用性诱或灯诱获取最易于实现,而且成本低,数据可靠性高。发生面积和发生强度,建模中使用的是上一代数据,这个数据可以使用高分卫片由计算机自动获取,必要时采用成本低廉的遥控无人机对重点区域进行遥测,对高分数据进行校正,尽量避免使用劳动强度大、成本高、可靠性低的人工地面监测数据。

气象数据可以从国家气候中心直接获取,包括历史数据和周、旬预报数据。[1~5] (3)算法的选择

不同的区域,不同的有害生物,其算法与模型不可能完全相同。算法与模型的的选择,应该按照“精”、“细”、“简”要求,应用最新数学、系统学成果和分析仿真工具,采用多种方式进行试验比较,选择合适的算法。就本次算法试验而言,对于潜山县马尾松毛虫精细化预报,采用多层感知器建立马尾松毛虫预报模型较好。