如何对国内GDP进行实时预测

本篇报告借鉴美国亚特兰大联储GDPNOW模型的框架与思路,尝试构建了用于国内GDP预测的中国版GDPNOW模型,以实现对于国内GDP的实时预测。从结果看,模型对于2019年至今的国内GDP同比具有较好的预测效果。

 

摘要

 

魔性原理与构建思路

一方面,当经济环境整体平稳时,GDP具有一定延续性,即当期GDP与过往短期GDP正相关;另一方面,作为反映经济增长的季频指标,GDP与一些反映经济增长的月频指标在变化方向上具有一定同步性。基于此,我们可以得到对GDP进行预测的两个思路:

 

1)使用历史GDP外推下期GDP(季度模型)。在GDP具有延续性的情况下,我们可以根据最近几期GDP的取值来拟合GDP的短期变化趋势,进而外推出下一期GDP的预测值。

 

2)使用月频经济指标预测下期GDP(月度模型)。在两次GDP公布之间,会有一些反映经济增长的月频指标公布。如果能够找到与GDP相关性较高的月频指标,便可根据这些月频指标的最新发布值,预测将要公布的下期GDP取值。

 

上述两模型均可得到对下一期GDP的预测,我们需要将两个预测结果加权,得到最终对于下一期GDP的预测:

 

3)两模型结果加权合成(桥梁模型)。在不同时点,我们需要给予两个模型结果不同的加权权重,在上一个GDP刚公布完时,给予季度模型最高的权重,随着月度数据逐渐发布,月度模型的权重逐渐上升,季度模型的权重逐渐下降。

 

季度模型

 

1)模型准备。①从三大产业的角度入手展开GDP预测。②优先考虑GDP不变价的初步核算数。③GDP当季值比当季同环比更适合用于季度模型。④GDP当季值需进行季调处理。

 

2)模型构建。我们使用BVAR模型来构建季度模型,从结果看:①季度模型对GDP具有较好预测效果;②季度模型对于整体GDP和第二产业GDP的预测效果相对最好,第三产业GDP也有一定效果,相对较差的为第一产业GDP;③分时段看,2020全年的预测效果较差,其他时段相对较好,原因在于受新冠疫情影响,2020年GDP出现较大波动,趋势外推有效性减弱。

 

月度模型

 

1)模型准备。①相比于当季值,GDP当季同比更适合用于月度模型。②使用动态因子模型来解决建模时的混频问题。③对月频指标进行滚动复合来解决各指标信息量不一致的问题。

 

2)模型构建。我们分别构建了用于第一、二、三产业GDP预测的月度模型,并汇总得到整体GDP预测的月度模型。

 

► 第一产业模型:2020年之前预测结果和实际公布值较为接近,2020年1季度第一产业GDP的大幅下跌模型未能捕捉,但之后模型均能把握到第一产业GDP的变化趋势。

 

► 第二产业模型:基本能够贴合第二产业GDP从2019年至今的变化情况。

 

► 第三产业模型:除2020年一季度和2021年一季度因疫情导致的GDP大幅波动外,其余时间基本能够贴合第三产业GDP从2019年至今的变化情况。

 

► 整体GDP模型:绝大多数季度,模型对GDP同比有较为精准的预测,在波动较大的两个季度(2020Q1和2021Q1),模型稍稍低估GDP变化幅度,但对于GDP当时的大幅波动方向具有良好捕捉。

 

桥梁模型复合得到最终预测

 

通过桥梁模型将季度和月度模型的结果进行合成,对2023Q2GDP的最新预测为5.81%。桥梁模型可以在不同时点,给季度模型和月度模型不同的加权权重,从而将两模型预测结果进行线性加权,得到最终对于GDP的预测。

 

风险

预测结果由模型根据数据计算得出,可能与中金宏观团队的预测结果有小幅差异,中金正式对外口径请以宏观团队为准。模型历史回测结果不代表模型未来预测具有相同有效性。

 

正文

GDP作为季频更新的指标,更新频率较低且发布时点较晚。因此在两次GDP公布之间,对将要公布的下一个GDP进行实时预测便显得尤为重要,对于投资者把握宏观经济走势和判断资产未来涨跌均具有实际意义。

 

本篇报告借鉴美国亚特兰大联储GDPNOW模型的框架与思路,尝试构建了用于国内GDP预测的中国版GDPNOW模型,以实现对于国内GDP的实时跟踪与预测。从结果看,模型对于2019年至今的国内GDP同比具有较好的预测效果。

 

模型原理与构建思路

 

GDP反映了国家整体经济发展情况,一方面,当经济环境整体平稳时,GDP具有一定延续性,即当期GDP与过往短期GDP正相关;另一方面,作为反映经济增长的季频指标,GDP与一些反映经济增长的月频指标在变化方向上具有一定同步性。基于此,我们可以得到对GDP进行预测的两个思路:

 

1)使用历史GDP外推下期GDP(季度模型)。在GDP具有延续性的情况下,我们可以根据最近几期GDP的取值来拟合GDP的短期变化趋势,进而外推出下一期GDP的预测值。这种方法只需使用GDP的历史数据,不涉及其他经济指标。由于GDP季频公布,模型的更新频率也为季频,因此我们称该模型为季度模型。

 

2)使用月频经济指标预测下期GDP(月度模型)。GDP每季度公布一次,在两次GDP公布之间,会有一些反映经济增长的月频指标公布。如果能够找到与GDP相关性较高的月频指标,便可根据这些月频指标的最新发布值,预测将要公布的下期GDP取值。由于该模型主要基于月频经济数据构建,我们将该模型称为月度模型。

 

季度模型和月度模型均可得到对下一期GDP的预测,我们需要将两个预测结果加权,得到最终对于下一期GDP的预测:

 

3)两模型结果加权合成(桥梁模型)。季度模型和月度模型的重要区别在于:季度模型在上一个GDP公布后,立刻便能够外推出下一个GDP的取值,且预测值在两次GDP公布之间不发生变化;而月度模型随着月频经济数据的依次发布,其对下期GDP的预测值会动态变化,当GDP公布前的最后一个月频数据发布后,预测值的置信度最高。也就是说,早期季度模型的预测置信度较高,而随着时间推移,月度模型的预测置信度逐渐上升。因此在不同时点,我们需要给予两个模型结果不同的加权权重,在上一个GDP刚公布完时,给予季度模型最高的权重,随着月度数据逐渐发布,月度模型的权重逐渐上升,季度模型的权重逐渐下降。

 

图表1:GDPNOW模型整体结构

 

 

资料来源:中金公司研究部

 

从三大产业的角度入手展开GDP预测。国家统计局在公布整体GDP的同时,也会公布第一、二、三产业的GDP情况,以及11个行业的各自GDP情况。从建模的角度来说,整体GDP过于聚合,只对整体GDP进行预测会忽略其中的结构性变化;分行业GDP过于分散,部分行业的GDP公布历史较短且缺少有效月度数据。因此,我们从分产业的GDP情况入手,分别预测一、二、三产业的GDP同比变化,并将其复合得到我国整体的GDP同比变化。此外,由于GDP不变价相对于现价具有更强的经济参考意义,因此我们预测的GDP对象均为GDP不变价。为尽可能消除数据前修情况,对于有初步核算数的时间点(主要为2015年至今),我们优先使用初步核算数进行建模。

 

我们将在下文中,分别介绍季度模型、月度模型、桥梁模型的构建方法,并展示其对于2019年至今GDP同比的滚动预测效果。

 

 

季度模型

 

我们首先介绍季度模型的构建方法,并展示其预测效果。

 

模型准备

 

GDP当季值比当季同环比更适合用于季度模型。GDP季度模型的核心思想在于趋势外推,因此在构建模型时,我们想要预测的对象需要具有较强的趋势性。GDP公布的数据大概分三类:当季值、当季同比、季调环比,我们分别绘制了三者2010年至今的取值,见图表2。可以看到,GDP当季值的趋势性要强于当季同比和季调环比,因此更适合作为季度模型的预测对象。

 

图表2:GDP当季值更适合趋势外推

 

 

资料来源:Wind,中金公司研究部

 

GDP当季值需进行季调处理。从图表2中可以看出,GDP当季值具有较明显的季节性,在1季度取值显著较低,4季度取值显著较高。因此在构建季度模型前,有必要对GDP当季值进行季调处理。我们以2018年4季度作为样本内与样本外的分界线,样本内使用全数据进行一次季调,样本外每次增加一期数据进行滚动季调,得到GDP当季值的季调后序列。从图表3可以看出,季调后序列的趋势性和平稳性相比季调前有了显著提升。

 

图表3:季调后的GDP趋势性和平稳性得到提升

 

 

资料来源:Wind,中金公司研究部

 

模型构建

 

使用BVAR模型构建季度模型。我们使用与亚特兰大联储GDPNOW相同的方法,使用BVAR模型来构建季度模型。BVAR模型的全称为贝叶斯向量自回归模型,其在GDP趋势外推中的优势主要体现为以下三点:

 

► 1:BVAR模型的本质为向量自回归(VAR)模型,而VAR模型能够刻画经济指标当前值与过去值之间的关系,方便我们对GDP进行趋势外推。

 

► 2:VAR模型能够捕捉多个经济指标之间的交互影响,使得我们能够对一、二、三产业的GDP和整体GDP同时进行趋势外推:。

 

► 3:GDP作为季频数据,样本点相对较少,而BVAR模型通过贝叶斯方法估计模型参数,能够更为有效地利用小样本信息。

 

我们构建的季度模型具体流程如下:

 

► 第1步,选定指标。以整体GDP和一、二、三产业GDP不变价的当季值,共4个指标,作为我们进行趋势外推的对象。

 

► 第2步,滚动季调。以2018年4季度作为样本内与样本外的分界线,样本内使用全数据进行一次季调,样本外每次增加一期数据进行滚动季调,得到上述4个指标的季调后序列。

 

► 第3步:BVAR模型滚动构建。从2018年4季度开始,每季度构建BVAR模型,对下季度的GDP(季调后)进行预测。每次使用的数据为2007年1季度至当时季度的数据。

 

► 第4步:计算预测同比。得到下季度GDP的季调预测值后,使用历史季调因子将GDP还原为非季调预测值,并除以去年同期实际值,得到下季度GDP预测同比。

 

图表4:季度模型建模流程

资料来源:Wind,中金公司研究部

 

季度模型整体具有较好预测效果。下图分别展示了季度模型对2019年之后GDP同比的预测结果。考虑与实际值的接近程度与走势一致性,季度模型对于整体GDP和第二产业GDP的预测效果相对最好,第三产业GDP也有一定效果,相对较差的为第一产业GDP。分时段看,2020全年的预测效果较差,其他时段相对较好,原因在于受新冠疫情影响,2020年GDP出现较大波动,趋势外推有效性减弱。

 

图表5:季度模型结果:整体GDP

 

 

资料来源:Wind,中金公司研究部

 

图表6:季度模型结果:第一产业GDP

 

资料来源:Wind,中金公司研究部

 

图表7:季度模型结果:第二产业GDP

 

资料来源:Wind,中金公司研究部

 

图表8:季度模型结果:第三产业GDP

 

资料来源:Wind,中金公司研究部

 

适当减少第一产业季度模型的置信度。第一产业GDP预测不佳的原因有两方面:一是其历史走势与其它几个GDP的相关性较低;二是其季调后序列在2020Q1~2021Q4的走势与历史走势出现较大偏差,不仅影响了这段时期的预测结果,同时也短暂干扰了2022Q1走势恢复正常后的预测。出于此考虑,我们在后续桥梁模型构建时,适当减弱第一产业季度模型的权重。

 

图表9:第一产业GDP与其它GDP相关性低

 

资料来源:Wind,中金公司研究部

 

图表10:第一产业GDP在2020~2021走势偏离

 

资料来源:Wind,中金公司研究部

 

 

月度模型

 

 

我们接下来介绍月度模型的构建方法以及预测效果。我们会分别构建第一、二、三产业GDP预测的月度模型,并汇总得到整体GDP预测的月度模型。

 

 

 

模型准备

 

相比于当季值,GDP当季同比更适合用于月度模型。月度模型的核心思想在于使用两次GDP公布之间的月频指标去预测下期GDP取值,我们想要预测的GDP对象应与月频指标保持相同的数理学含义(绝对量or变化量)。一方面,部分重要的月频指标并不公布当月绝对量,仅公布当月的同比值,如CPI、PPI、工业增加值等。另一方面,绝对量可以与去年同期值相除变为同比值,而在缺少基期值的情况下,同比值无法直接转化为绝对量。因此,GDP当季同比更适合作为月度模型的预测对象。

 

由于GDP为季度数据,月频指标为月度数据,在构建模型时需要考虑以下两个问题:

 

► 1:混频问题。如何处理GDP和月频指标数据频率不对等的问题,如果降到季频则会损失部分月频指标,如果提升至月频则GDP存在缺失值。

 

► 2:信息量问题。GDP反映近一个季度经济走势,月频指标反映近一个月经济走势,如何解决各数据信息量不一致的问题。

 

使用动态因子模型解决混频问题。对于混频问题,一个合适的解决方案是使用动态因子模型。动态因子模型认为宏观指标同时受到不可被观测的几个共同因子的影响。通过估计共同因子的取值,以及各宏观指标与共同因子之间的关系,即可得到对宏观指标未来取值的预测。动态因子模型的形式可概括如下:

 

其中为可观测的一系列宏观指标,为不可观测的一系列共同因子,为宏观指标无法被共同因子解释的特质部分,A、B、C均为系数矩阵。

 

由模型形式可以看出,动态因子模型认为:①宏观指标取值可以一定程度被共同因子解释,但仍存在无法被解释的特质部分;②共同因子的当前值受其历史m期的取值影响;③特质部分的当前值受其历史n期的取值影响。

 

混频问题本质为中的部分指标存在缺失值,即GDP每年缺少8个月的数据。而动态因子模型能够较好的解决混频问题,原因在于动态因子模型在参数估计时,使用的是卡尔曼滤波+极大似然估计,这两步均可处理存在缺失值时的估计问题[1],从而解决了GDP与月频指标频率不对等的问题。

 

对月频指标进行滚动复合解决信息量问题。GDP可以看做“过去3个月的经济运行情况”,只不过仅公布3、6、9、12月份的值。为使月频指标也包含过去3个月的信息,同时与GDP同比具有相同的数理学含义,我们对月频指标进行滚动3个月的复合,并统一处理为同比数据。具体来说:

 

► 对于包含多个类型的数据,使用优先级为当月值>累计值>环比>当月同比>累计同比。

 

► 当月值数据先求滚动3个月平均,再求同比。如PMI、社融、用电量等。

 

► 累计值数据先差分转化为当月值,然后求滚动3个月平均,最后求同比。如固定资产投资、房地产开发投资完成额、工业企业利润等。

 

► 环比数据先滚动3个月加1累乘,再求同比变化量(减法)。如CPI、PPI、住宅价格指数。

 

► 当月同比数据直接求滚动三个月平均。如工业增加值同比、M2同比、各项贷款余额同比。

 

► 累计同比先差分转化为当月同比,再求滚动三个月平均。

 

我们接下来介绍月度模型的具体构建流程。由于各产业月度模型的构建存在一定差异,我们首先以第一产业月度模型为例,介绍月度模型的整体流程,之后介绍第二、三产业月度模型与第一产业月度模型的差异,最后讨论如何根据三个产业的月度模型,推导出整体GDP的月度模型。

 

 

 

第一产业模型

 

与季度模型相同,我们以2018年12月作为样本内与样本外的分界线,样本内确定模型参数,样本外进行滚动预测,具体步骤如下:

 

第一步:滚动优选月频指标。动态因子模型可以有两种应用方式:①输入经济指标→得到共同因子→将共同因子作为经济状态的表征(如增长、通胀、流动性等);②输入经济指标(含缺失值)→得到共同因子→反解缺失的经济指标。显然,两种应用方式对于输入经济指标的要求有所差异。第一种应用方式可以概括为“宏观降维”,可以输入大量不相关的指标去提取共同因子,第二种应用方式可以概括为“宏观预测”,需要输入预测效果较好的经济指标(月频数据)才能对缺失的经济指标(GDP)产生有效预测,可以理解为线性回归中的“garbage in garbage out”。因此月度模型构建的第一步,我们需要滚动选择与第一产业GDP同比相关度较高的指标。具体来说:

 

► 因变量选择:以第一产业GDP同比作为因变量。

 

► 自变量选择:以第一产业相关月频指标作为自变量,如生猪存栏、CPI、食用农产品价格指数等。各自变量均经过上一节所介绍的滚动3月复合处理。

 

► 指标滞后:在GDP公布的月份,如果月频指标的公布时间不早于GDP,则将其滞后一个月应用,如生猪存栏、第一产业固定资产投资完成额等。

 

► 滚动回归:以2018年12月作为起始时间,每个月末,应用该月及之前的因变量和自变量取值,分别进行一元线性回归,选取指标方向复合经济学逻辑且回归系数显著的月频指标,作为下个月建模应用的指标。

 

第二步:滚动拟合动态因子模型。通过第一步,我们可以得到每个月用于建模的指标,接下来,我们可以使用这些指标来拟合动态因子模型。回顾动态因子模型的形式,其需要一组输入和三个参数:

 

► 一组输入:为可观测的一系列宏观指标,在本模型中,包括第一产业GDP同比和由第一步得到的每个月用于建模的月频指标。其中第一产业GDP同比仅在3、6、9、12这四个月份有取值,其余月份为空值,月频指标首先经过上一节所介绍的滚动3月复合处理,然后对于在GDP公布月份的公布时间不早于GDP的指标,将其滞后一个月应用。

 

► 三个参数:共同因子个数、共同因子自回归阶数、特质部分自回归阶数。共同因子个数指:等式左边的宏观指标同时受到几个不可观测的共同因子影响。共同因子自回归阶数指:共同因子受到其历史几期的取值影响。特质部分自回归阶数指:特质部分受到其历史几期的取值影响。我们在样本内(2018年12月及之前)遍历参数,选取使样本内拟合效果最好的参数,在样本外(2018年12月之后)进行应用。

 

第三步:得到实时预测。从模型逻辑来说,动态因子模型可以根据已发布的指标,估计出共同因子、特质部分和系数矩阵,因而可以外推出所有未发布指标的预测值,以及各指标未来所有时点的预测值。因此在每个时点,我们都可已得到对于即将公布的下一个GDP的实时预测。

 

图表11:第一产业模型流程

 

资料来源:Wind,中金公司研究部

 

第一产业模型对GDP具有一定预测效果。为展示方便,我们仅绘制GDP公布前的最后一个月频指标产生后,第一产业模型对于GDP的预测结果,见图表12。从结果看,第一产业模型对第一产业GDP同比具有较好预测效果,2020年之前预测结果和实际公布值较为接近,2020年1季度第一产业GDP的大幅下跌模型未能捕捉,但之后第一产业GDP的回升,以及2021年3月份至今第一产业GDP的回落,模型均能把握到对应趋势。

 

图表12:第一产业模型对GDP具有一定预测效果

 

资料来源:Wind,中金公司研究部

 

我们在前文提到,在两次GDP公布之间,随着月频指标的逐渐发布,月度模型的置信度会逐渐上升。图表12已经展示了GDP即将公布前,第一产业模型对于GDP的预测效果。那么在上一个GDP刚刚公布后,第一产业模型对下一个GDP有怎样的预测效果?特别地,月度模型和我们上一节构建的季度模型相比,对第一产业GDP的预测效果有何差异?

 

第一产业月度模型在远期和近期的预测效果均优于季度模型。我们在下图中分别绘制了:①季度模型预测值;②月度模型在GDP即将公布前的预测值(近期预测);③月度模型在上一个GDP刚刚公布后,对下一个GDP的预测值(远期预测);④第一产业GDP实际值。同时,我们也计算了各模型的平均每期估计误差来反映预测准确度。从准确度来看,近期预测>远期预测>季度模型。近期预测准确度最高容易理解,远期预测优于季度模型的原因可能在于相对于GDP自身趋势,共同因子和特质部分更好地捕捉到了第一季度GDP的变化。

 

图表13:第一产业月度模型在远期和近期的预测效果均优于季度模型

 

资料来源:Wind,中金公司研究部

 

 

 

第二产业模型

 

第二产业模型的核心在于预测工业增加值。第二产业模型和第一产业模型在形式上具有一定区别,第二产业模型直接产出的预测为滚动3个月工业增加值同比,之后再将其转化为对于第二产业GDP的预测,原因在于:

 

► (1)高相关性。滚动3个月工业增加值同比与第二产业GDP同比在2011年以来的相关性高达98.54%,两者走势具有高相关性。

 

► (2)低缺失率。工业增加值月频公布(除1月外),历史缺失值更少,构建动态因子模型的置信度更高。

 

► (3)同时发布。工业增加值和GDP同一天发布,其他月频数据对这两个指标在发布时间上的领先滞后性相同。

 

从步骤上来说,第二产业模型的第一步~第三步与第一产业模型相同,只是将预测对象由第一产业GDP同比换为滚动3个月工业增加值同比,同时会增加从工业增加值转化为GDP的第四步:

 

第四步:工业增加值预测转化为GDP预测。以2018年4季度作为起始时间,每个季度末,选取该季度之前的第二产业GDP同比和滚动3个月工业增加值同比,分别作为因变量和自变量进行线性回归,并根据回归结果,将下季度对工业增加值的预测转化为对GDP的预测。

 

图表14:第二产业模型流程

资料来源:Wind,中金公司研究部

 

第二产业模型对GDP具有较好预测效果。我们分别展示:(1)工业增加值公布前的最后一个月频指标产生后,第二产业模型对于滚动3个月工业增加值同比的预测结果;(2)3、6、9、12月的上述工业增加值预测转化为第二产业GDP预测的结果。

 

► 从工业增加值预测结果看,第二产业模型能够有效跟踪滚动3个月工业增加值同比的变化趋势,如2020年3月的底部、2021年3月的顶部和2023年1月的底部,模型均能进行有效捕捉。趋势变化过程中,多数情况下模型能够跟随工业增加值的变化方向。

 

► 从工业增加值预测转化为GDP的预测结果看,第二产业模型对第二产业GDP同比具有较好预测效果,基本能够贴合第二产业GDP从2019年至今的变化情况。

 

图表15:模型能够跟踪工业增加值变化趋势

 

资料来源:Wind,中金公司研究部

 

图表16:模型能有效预测第二产业GDP同比

 

资料来源:Wind,中金公司研究部

 

第二产业月度模型的近期预测效果优于季度模型,远期预测效果劣于季度模型。与第一产业模型类似,我们也想探究第二产业模型在季初与季末,对于下一个GDP的预测准确度差异。我们在下图中分别绘制了第二产业的:①季度模型预测值;②月度模型在GDP即将公布前的预测值(近期预测);③月度模型在本季第一个工业增加值公布前,对下一个GDP的预测值(远期预测);④第二产业GDP实际值。同时,我们也计算了各模型的平均每期估计误差来反映预测准确度。从准确度来看,近期预测>季度模型≥远期预测。近期预测准确度最高容易理解,季度模型稍优于远期预测的原因可能在于第二产业GDP的趋势性较强,因此季度模型在季初的有效性高于远期预测。根据这一现象,我们可以适当在季初增大季度模型权重。

 

图表17:第二产业月度模型的近期预测效果优于季度模型,远期预测效果劣于季度模型

 

资料来源:Wind,中金公司研究部

 

 

 

第三产业模型

 

第三产业模型的核心在于预测服务业生产指数。第三产业模型和第二产业模型在形式上具有相似性,直接产出的预测并非GDP,而是滚动3个月服务业生产指数同比,之后再将其转化为对于第三产业GDP的预测,原因同样在于以下三点:

 

► (1)高相关性。滚动3个月服务业生产指数同比与第三产业GDP同比自发布以来的相关性高达95.90%,两者走势具有高相关性。

 

► (2)低缺失率。服务业生产指数月频公布(除1月外),历史缺失值更少,构建动态因子模型的置信度更高。

 

► (3)同时发布。服务业生产指数和GDP同一天发布,其他月频数据对这两个指标在发布时间上的领先滞后性相同。

 

从步骤上来说,第三产业模型与第二产业模型相同,只是将预测对象由滚动3个月工业增加值同比转换为滚动3个月服务业生产指数同比。

 

图表18:第三产业模型流程

资料来源:Wind,中金公司研究部

 

第三产业模型对GDP具有较好预测效果。我们分别展示:(1)服务业生产指数公布前的最后一个月频指标产生后,第三产业模型对于滚动3个月服务业生产指数同比的预测结果;(2)3、6、9、12月的上述服务业生产指数预测转化为第三产业GDP预测的结果。

 

► 从服务业生产指数预测结果看,第三产业模型能够一定程度跟踪滚动3个月服务业生产指数同比的变化趋势,对2020年3月的底部判断有一个月滞后,其余时间有较好预测效果。

 

► 从服务业生产指数预测转化为GDP的预测结果看,第三产业模型对第三产业GDP同比的预测能力良好,除2020年一季度和2021年一季度因疫情导致的GDP大幅波动外,其余时间基本能够贴合第三产业GDP从2019年至今的变化情况。

 

图表19:模型能够跟踪服务业生产指数变化趋势

资料来源:Wind,中金公司研究部

 

图表20:模型能有效预测第三产业GDP同比

资料来源:Wind,中金公司研究部

 

第三产业月度模型在远期和近期的预测效果均优于季度模型。与前文相同,我们探究了第三产业模型在季初与季末,对于下一个GDP的预测准确度差异。我们在下图中分别绘制了第三产业的:①季度模型预测值;②月度模型在GDP即将公布前的预测值(近期预测);③月度模型在本季第一个服务业生产指数公布前,对下一个GDP的预测值(远期预测);④第三产业GDP实际值。同时,我们也计算了各模型的平均每期估计误差来反映预测准确度。从准确度来看,近期预测>远期预测>季度模型。近期预测准确度最高容易理解,季度模型优于远期预测的原因可能在于第三产业GDP的趋势性相对第二产业较弱,因此季度模型在季初的有效性低于远期预测。

 

图表21:第三产业月度模型在远期和近期的预测效果均优于季度模型

资料来源:Wind,中金公司研究部

 

 

整体GDP模型

得到对于第一、二、三产业GDP同比的预测后,我们可以结合去年同期各产业GDP的实际值,复合得到当前对于整体GDP同比的预测。

 

图表22:整体GDP模型流程

资料来源:Wind,中金公司研究部

 

模型对整体GDP具有较好预测效果。为展示方便,我们仅绘制GDP公布前的最后一个月频指标产生后,整体GDP模型对于GDP的预测结果。可以看出,模型能有效贴合2019年以来GDP同比的变化趋势,绝大多数季度,模型对GDP同比有较为精准的预测。在波动较大的两个季度(2020Q1和2021Q1),模型稍稍低估GDP变化幅度,但对于GDP当时的大幅波动方向具有良好捕捉。

 

图表23:模型对整体GDP具有较好预测效果

资料来源:Wind,中金公司研究部

 

 

桥梁模型

 

 

通过桥梁模型将季度和月度模型的结果进行合成。季度模型和月度模型的重要区别在于:季度模型在上一个GDP公布后,立刻便能够外推出下一个GDP的取值,且预测值在两次GDP公布之间不发生变化;而月度模型随着月频经济数据的依次发布,其对下期GDP的预测值会动态变化,当GDP公布前的最后一个月频数据发布后,预测值的置信度最高。也就是说,早期季度模型的预测置信度较高,而随着时间推移,月度模型的预测置信度逐渐上升。因此在不同时点,我们需要给予两个模型结果不同的加权权重,在上一个GDP刚公布完时,给予季度模型较高的权重,而随着月度数据逐渐发布,月度模型的权重逐渐上升,季度模型的权重逐渐下降。

 

我们使用与亚特兰大联储GDPNOW相同的方法,使用以下公式来构建桥梁模型:

 

即最终预测结果是季度模型结果和月度模型结果的线性加权。其中λ和月度指标的公布数量有关,月度指标公布的越多,λ取值越高。

 

具体的权重分配方面,考虑不同产业的季度模型和月度模型有效性存在差异,我们通过以下方式设定各产业模型的权重:

 

► 第一产业模型:只使用月度模型。根据前文检验,第一产业模型的近期预测>远期预测>季度模型,即在上一个GDP刚公布完时,使用月度模型对下一个GDP的预测效果就已经优于季度模型。因此第一产业模型始终使用月度模型即可获得最高置信度。

 

► 第二产业模型:上一个GDP刚公布完时季度模型权重为1,第一个工业增加值公布完后月度模型权重为1,期间λ随月频指标公布线性增加。根据前文检验,第二产业模型的近期预测>季度模型≥远期预测,且远期预测的时间点是第一个工业增加值公布前,即对于第二产业来说,在上一个GDP刚公布完时,季度模型具有更高的置信度,在第一个工业增加值公布时,月度模型和季度模型置信度接近。因此我们在上一个GDP刚公布完时,将季度模型的权重设为1;在第一个工业增加值公布完后,将月度模型权重设为1;假设上一个GDP公布到第一个工业增加值公布之间,共有n个月度模型中所使用的月频指标公布,则,其中k为月频指标已公布数量。

 

 

►第三产业模型:上一个GDP刚公布完时季度模型权重为1,第一个服务业生产指数公布完后月度模型权重为1,期间λ随月频指标公布线性增加。根据前文检验,第三产业模型的近期预测>远期预测>季度模型,由于远期预测的时间点是第一个服务业生产指数公布前,因此对于第三产业来说,在第一个服务业生产指数公布时,月度模型的置信度便已高于季度模型。出于此考虑,我们在上一个GDP刚公布完时,将季度模型的权重设为1;在第一个服务业生产指数公布完后,将月度模型权重设为1;假设上一个GDP公布到第一个服务业生产指数公布之间,共有n个月度模型中所使用的月频指标公布,则,其中k为月频指标已公布数量。

 

图表24:桥梁模型权重分配方法

资料来源:Wind,中金公司研究部

 

我们以对2019年1季度第三产业GDP的预测为例,来展示桥梁模型的合成结果,见下图。

 

图表25:桥梁模型合成结果示例

 

资料来源:Wind,中金公司研究部

 

得到三个产业GDP桥梁模型的合成结果后,按照与图表22相同的方法,我们可以得到对整体GDP的实时动态预测。

 

[1]含缺失值的卡尔曼滤波见论文《Real-Time Measurement of Business Conditions》;含缺失值的极大似然估计见论文《Maximum likelihood estimation of factor models on data sets with arbitrary pattern of missing data》

 

本文转载自微信公众号:中金点睛