摘要:针对各预报模型预报结果精度评价不统一现状,考虑径流具有非线性、突变及非平稳性等特点,本文构建了包含均方根误差(RMSE)、平均绝对百分误差(MAPE)和纳什效率系数(NSE)三项指标的综合评价系统,对自回归滑动平均模型(ARMA)、人工神经网络模型(ANN)和支持向量机模型(SVM)在径流汛期和非汛期内进行了预报精度评价。结果表明:单一评价指标下,RMA模型与VM模型预报结果精度相近,而综合评价系统表明,VM模型预报精度优于RMA模型;三种模型在非汛期预报精度均高于汛期预报精度,VM预报效果均最好。将径流进行分割后预报,预报精度可提高。本研究获得了可靠性和精度较高的月径流预报模型,可为工程水资源高效配置提供理论和技术支撑。
关键词:径流预报;支持向量机模型;综合评价系统;引汉济渭工程;汛期与非汛期
径流具有高度复杂性、非平稳性、动态性和非线性的特点,它的现象和特征模式不容易被预报。近年来许多学者对高精度径流预报进行了研究2]。传统的时间序列预测模型是在考虑一致性条件下进行的,而机器学习能更好的捕捉径流非平稳性和非一致性的特点。随着高精度预报模型及组合预报模型不断被提出[36],评价模型或组合模型的预报结果非常重要。
河流水资源论文范例:探讨河流健康下的黄河泥沙资源利用
目前,大多数研究学者对预报结果的评判往往选用单一评价指标。不同评价指标对模型结果分析存在差异,若仍用单一指标来评价预报精度,很有可能造成模型预报结果与实际相差较大而整体性精度较高。因此,构建综合评价指标系统对预报结果进行评价至关重要。均方根误差(RootMeanSquaredError,MSE)可用来评价预测值与真实值之间的偏差,被广泛用于模型计算结果评价[78]。平均绝对百分误差(MeanAbsolutePercentageError,APE)是一个常用于衡量预测准确性的统计指标,如时间序列的预测[9,10]。纳什效率系数Nash–SutcliffeEfficiencyCoefficient,SE)常用来评价模型质量[1112]。
因此,构建由以上三种评价指标组成的综合评价系统,可全面的评价一个模型预报结果的好坏。自回归滑动平均模型(Autoegressiveovingverageodel,ARMA)、人工神经网络模型(ArtificialNeuralNetworkodel,ANN)、支持向量机(SupportVectorMachineModels,SVM)常用于中长期径流预报[1316]。研究高精度的径流预测模型可以有效指导水资源跨流域调度,提高“引汉济渭”工程的水资源利用率,关中地区的缺水情况可以得到有效的解决,促进可持续发展。预报方法在不断完善,但当前研究主要基于各水文年长序列数据,将长序列拆分为短序列后再进行预报的研究不多;针对径流的特点,径流序列在非汛期比汛期时间长,突变少,两者径流特征相差较大,可将长序列数据系列进行汛期非汛期划分,在划分后的数据基础上,再采用模型进行径流预报。
本文以“引汉济渭”工程调水区黄金峡断面和三河口断面的为研究对象进行月径流预报研究,将径流数据进行汛期和非汛期划分,在此基础上分别构建了基于Huber权重计算的ARMA模型、基于切型函数进行传递计算的ANN模型和基于径向基函数为核函数和遗传算法进行参数优选的SVM模型,并采用构建的综合评价指标系统对预报结果进行评价,综合选出预报效果最好的模型。可为“引汉济渭”工程提供较为精准的预报模型,为水库优化调度和合理配置水资源提供选择。数据与方法.
1数据来源本次研究选取了黄金峡断面和三河口断面的综合流入径流资料。研究分析了两个断面从1955年2009年共55年的月径流资料。按照8:2的比例分为率定期及验证期。
1.2汛期与非汛期划分
对于汛期与非汛期的划分国内外的研究中已存在很多种方法,例如模糊统计法、相对频率法、变点分析法以及片段法等[17]。片段法是将径流序列看作整体算出多年平均值,将突变的数据进行了整体均分,能更准确的确定整体序列的汛期非汛期,作为预报的数据输入。因此本文选用了片段法对月径流量进行分析并进行划分。片段法是通过对已知的一个年年径流量序列的样本进行分解,求出多年平均年径流量以及多年平均月径流量。用历史样本中年序列的对应的多年月平均径流量除以多年年平均径流量,得到的结果为该系列每年12个标准化的月径流不规则因子。
2结果与讨论
2.1汛期月径流预报结果
将黄金峡断面和三河口断面汛期数据滞时为和月的情景和情景的径流数据序列分别带入三种预报模型,得到汛期预报结果。分别计算两断面汛期月径流预报结果与实测数据间的RMSE、MAPE和NSE,表为黄金峡汛期月径流预报结果分析计算结果表,表为三河口汛期月径流预报结果分析计算结果表。
可以看出,黄金峡汛期月径流三种模型的预报结果较实测数据都有所偏差,径流实测值变化较大,无规律可循。ANN模型结果偏差较大,在峰值处预报值低于实测值,大部分预报值都较实测值偏高,特别是在31,趋势发生改变,原因在于在构建NN模型时,选择的切型函数,该函数虽然可捕捉非线性关系,但是不能很好的捕捉径流的整体趋势。而RMA模型的预报结果与NN相反,整体预报结果较实测值偏低,RMA模型是传统预报模型,不能很好捕捉径流间的非线性关系,导致预报效果不优。相对于RMA模型,SVM模型预报结果变化趋势与实测数据更为相似,构建VM模型时,采用的遗传算法进行参数优选,可有效提高模型的预报能力。三种模型在峰值处的预报结果都偏低。可能原因是在捕捉黄金峡率定期的汛期关系时出现偏差。
SVM模型的预报结果最好,研究结果表明参数的选择对于预报的泛化性能影响较大。本文在构建SVM模型时,选用了径向基函数作为SVM的核函数,将数据运用到高级空间,再通过遗传算法进行参数选择。本次构建的VM模型在三种预报效果最好,具有较好的泛化能力,能寻找全局最优解且进行快速准确拟合和预报,且从中可知模型的整体预报趋势与偏差与实测数据都较小。对于非线性和非平稳径流序列,显示出了SVM的优越性。
对于相同断面的汛期和非汛期月径流预报,VM模型、RMA模型、NN模型在非汛期的预报精度高于汛期的预报精度,可能原因是本次径流数据序列在非汛期的变化较为平缓,没有发生突变的情况,模型能更好的捕捉到非汛期径流序列的变化规律,在进行径流预报时,可将径流进行汛期和非汛期划分之后在进行预报。构建的综合评价指标可从洪峰、平稳期以及整体趋势三个方面评价模型预报结果精度,可帮助选定最合适最有效的预报模型,本次构建的综合评价指标系统对VM模型、RMA模型、NN模型预报结果评价,得到预报效果最好的是VM模型。
3结论和展望.
1结论
综合评价指标系统可以更全面的评价一个模型的预报精度和整体预报结果的好坏。以黄金峡汛期预报结果评价为例,在RMSE作为评价指标时,ANN模型为8.9/s,ARMA模型为1467/s,SVM模型为99.01/s。RMSE可评价径流序列中高值的预测效果,但是NN模型与ARMA模型的MSE相差不大。SVM模型的预测效果在高值处最好,RMA模型略好于NN模型。
在MAPE作为评价指标时,ANN模型的MAPE为9.80,ARMA模型的MAPE为48.93,SVM模型的MAPE为47.75。MAPE可评价径流序列中平稳值的预测效果,SVM模型与ARMA模型的APE几乎没有大的差别。ANN模型的预测效果较差一点。在NSE作为评价指标时,ANN模型的NSE为04,ARMA模型的NSE为65.64,SVM模型的NSE为74.38。NSE可评价模型的好坏。因此,综合三个评价指标表明:SVM>ARMA>ANN。
本文提出的三个评价指标结果综合表明黄金峡和三河口两个断面汛期和非汛期内构建的三个模型SVM的预报效果均最好,ARMA次之,ANN较差,基于结构风险最小化诱导原理SVM模型的预报效果较好。且非汛期预报精度高于汛期预报精度,模型在非汛期更好的捕捉径流变化规律。.2展望虽然已经完成了调水区径流预报模型的研究,但是由于数据不够充足,文章还存在值得探讨的地方:本文仅采用径流数据作为输入因子,更多的输入因子能够结合更多的因素,让预报效果提高,因此,未来研究可引入降水和蒸发数据,以进一步提高模型预报精度。
参考文献
[1]GiampaoloC,JorgeL,PunitKB.A2DRealTimeFloodForecastFrameworkBasedonaHybridHistoricalandSyntheticRunoffDatabase[J].Water,2019,12(1)
[2]纪昌明,梁小青,张验科,等.入库径流预报误差随机模型及其应用[J].水力发电学报,2019,38(10):7585.JIChangming,LIANGXiaoqing,ZHANGYanke,etal.Stochasticmodelofreservoirrunoffforecasterrorsanditsapplication[J].JournalofHydroelectricngineering,2019,38(10):7585.
[3]孙凤玲,李继清,张验科径流预报误差的混合tLocationScale分布模型及应用[J].水力发电,2020,46(12):1318.SUNFenglingLIJiqingZHANGYanke.TLocationScaleDistributionModelofRunoffPredictionErrorsandItsApplicatio[J].WaterPower,2020,46(12):1318.
[4]赵泽谦,黄强,明波,等基于多模型随机组合的水文集合预报方法研究[J].水力发电学报,2021,40(1):7687.
作者:李静,黄强,杨元园,,黄生志,刘登峰,孟二浩
相关阅读