1、月度税收收入预测方法之比较月度税收收入预测方法之比较潘雷驰潘雷驰2022-12-11导论常用方法的评价:1、季节模型2、指数平滑3、回归4、ARIMA5、BP神经网络6、支持向量机传统时间序列方法传统时间序列方法统计学方法统计学方法机器学习方法机器学习方法2022-12-11一数据的特征江苏地税江苏地税2022-12-11 1、4、7、10月 3、6、9、12月 2006年9月、10月、11月 2022-12-11“S”形形 2022-12-11宁夏国税宁夏国税2022-12-112022-12-11预测方法及其结果(一)指数平滑方法 指数平滑方法可以通过调整对时间序列中包含的短期趋势的估计,
2、自动追踪数据的变化,实现对短期变动趋势的预测。该方法又包括:一次指数平滑、二次指数平滑、多参数无季节趋势指数平滑和多参数有季节趋势指数平滑。因为月度收入数据的季节性和强烈的时间趋势,这里选用多参数有季节趋势指数平滑法,并使用乘积模型。2022-12-11 我们使用2000年1月-2008年12月数据建立Holter-Winter季节乘积模型,利用2009年1月-4月数据验证模型的效果。计算软件是Eviews6.0。2022-12-11时间时间实际值实际值预测值预测值误差率误差率MAPEMAPE值值2009年1月213082622158293.99%5.662009年2月126007812944
3、722.73%2009年3月1160782130649412.55%2009年4月176383418232503.37%表一表一 指数平滑方法预测结果指数平滑方法预测结果2022-12-11(二)ARIMA方法 在分析之前,首先对税收收入数据取自然对数,以平滑数据的波动。对数据平滑处理后绘制自相关分析图,以判定数据是否具有明显的季节趋势,以及确定自回归阶数p p和移动平均阶数q q。2022-12-112022-12-11 对税收收入自然对数值逐期差分,并以12个月为步长进行季节差分,获得新序列称之为“季节调整后税收收入自然对数值”2022-12-112022-12-11第二次季节差分后自相关
4、图2022-12-11 模型的形态为,ARIMA(p,1,q)(1,1,1)12。最终根据AIC和BIC值,以及参考预测精度确定模型为ARIMA(3,1,3)(1,1,1)12。计算软件是Eviews6.0。2022-12-11表二表二 ARIMAARIMA方法预测结果方法预测结果时间时间实际值实际值预测值预测值误差率误差率MAPEMAPE值值2009年1月213082623029678.08%5.712009年2月126007812681790.64%2009年3月1160782128451810.66%2009年4月176383418250633.47%2022-12-11(三)BP神经网
5、络方法 选择时间趋势项、税收收入前期值作为输入元,实际的月度税收收入为输出元。隐含层层数设定为4,终止误差设定为 。在运算中,我们发现随着隐含层层数的增加和终止误差设定值的降低,会提高预测的精度,但是增加的隐含层过多、终止误差设定过低是没有意义的,预测精度不会改变。61102022-12-11 经过计算,模型的最终形态确定为输入元为时间趋势项和前一期税收收入,输出元为实际税收收入,因为其他形态的模型不能显著提高预测精度。计算软件是R2.9.0。2022-12-11表三表三 神经网络方法预测结果神经网络方法预测结果时间时间实际实际值值预测预测值值误差误差率率MAPEMAPE值值2009年1月21
6、308261315431-38.27%23.592009年2月126007812883222.24%2009年3月1160782142632722.88%2022-12-11(四)支持向量机方法 反复比较模型的预测精度后,支持向量机模型自变量设置为时间趋势项和前一期税收收入,因变量为月度实际税收收入,模型的cost值设置为40000,值设置为0.001,即使将cost值设置再增加100倍,值设置再降低10倍,依然不改变预测精度。计算软件是R2.9.0。2022-12-11表四表四 支持向量机方法预测结果支持向量机方法预测结果时间时间实际值实际值预测值预测值误差率误差率MAPEMAPE值值200
7、9年1月21308261403026-34.16%30.292009年2月1260078687447-45.44%2009年3月1160782134970116.28%2009年4月17638341318197-25.27%2022-12-11三简短的小结在对月度数据进行预测时,多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法效果比较接近而且预测精度较高,BP神经网络方法和支持向量机方法效果比较接近,但是预测精度很低。因此,在使用月度税收收入进行预测时,选择多参数含季节趋势的指数平滑方法、含季节调整的ARIMA方法是比较合适的选择。2022-12-11这里使用多参数含季节趋势的指数平
8、滑方法、含季节调整的ARIMA方法预测江苏地税2009年5月税收收入合计数为分别为126.53亿元,134.51亿元,二者相差8亿元左右。2022-12-11 当然对于这个问题的讨论并没有结束,实际上我们已经看到月度税收数据实际上可以分成三类:1、“1、4、7、10”月收入数据,这些月份收入数据主要受到季缴因素形成的时间序列;2、“3、6、9、12”月份数据构成受到“收入组织方式”因素影响的时间序列;3、“2、5、8、11”月份数据。相对来说,这三类数据内部结构和变动趋势更加接近,在月度预测时候,可以考虑分别三类数据实现预测,而不是将三类波动趋势不一致的数据放在一起。2022-12-11谢谢!2022-12-11