跳转到主要内容

深度 | 如何在A股市场上使用智能预估中的盈利意外因子

汪忆帆
汪忆帆
路孚特中国区量化市场专家

之前的文章中着重介绍了StarMine模型选出的2018财年盈利超市场预期的亚洲公司,并提到了用智能预估(SmartEstimates®)数据预测盈利意外的发生以及其预测的准确性。

本文将从量化的角度着手,抛砖迎玉地提出如何用智能预估(SmartEstimates®)中的盈利预测意外数据进行量化模型构建以及其在A股市场的表现。

首先,介绍一下我们所使用的盈利意外数据。我们使用对于EPS预测意外百分比这个数据字段(I/B/E/S EPS Suprise(Actual VS Estimate))。该数据来源于Refintiv旗下量化解决方案旗舰产品Quantative Analytic Direct数据库,数据源为IBES,隶属于Surprise子数据库。该数据库通过收集卖方分析师的研究报告中的内容并且加以分析,对卖方分析师的行为构建因子。具体数据我们采用当季预测中的EPS每股收益与当季度实际公布的季报的差值。

第一步,我们做单因子检验,我们的数据样本为沪深300指数(CSI300),样本区间为2014年2月28日到2019年2月28日,数据颗粒度为月度,即每月末做一次再平衡,60期样本,分层为10层。我们看看此预测意外因子的情况:

  1. 信息系数IC

由图可见,该因子的预测效应已经非常不错了,平均信息系数高达0.05(0.03以上即被认为是有显著的预测效应),但是依然有较长的时间阶段IC为负,稳定性有待提升。

  1. 分层研究

我们对该因子分了十层,从分层看,效果并不是十分明显。

从上述分析可以看出,虽然该因子有较强的信息系数,然而分层效果并不显著,不适合用于直接使用,但是可以用来进行残差项的处理。

那么如何用以处理残差项呢?

现在就必须引入经典的多因子策略了。我们去尝试复现了典的Fama-French三因子模型

CAPM模型中认为股票的收益率只与整个市场的系统性风险有线性关系,即Rit-Rft=βi(Rmt-Rft)。在1993年,Fama和French在CAPM的基础上进行了升级,认为可以建立一个三因子模型来解释股票的回报率。该模型认为一个投资组合的超额回报率可以由它对三个因子的暴露来解释:这三个因子是市场资产组合(Rm− Rf)、市值因子(SMB)、账面市值比因子(HML),即E(Rit) −Rft= βi[E(Rmt−Rft)] +siE(SMBt) +hiE(HMIt)。那么如果还有解释不了的残差项,则公式为:E(Rit) −Rft= βi[E(Rmt−Rft)] +siE(SMBt) +hiE(HMIt)+ε。

所以我们可以先构建一个三因子模型,然后用该预测意外因子解释残差,观察是否能够对投资组合的效用有所提升。

第二步,复现经典Fama-French三因子模型。

三因子模型中的市场投资组合因子β,我们的计算基准指数采用CSI300(沪深300指数),计算周期用60日,对于市值因子和账面市值比因子,我们均采用序数做标准化处理。三个因子的权重我们采用等权,其他样本区间条件与第一步均相同,则构建出的模型测试结果如下:

  1. 信息系数IC:效果非常显著,平均IC系数为0.082。
  2. 分层研究

top-bottom:

所有分层:

其中F1层的累计收益率约为121%

第三步,引入预测意外因子,用来解释三因子模型残差项,观察是否能够提升投资组合的表现。

这相当于我们构建一个基于Fama-French三因子模型基础上的四因子模型,在采用同样的数据标准化基础上,我们增加了一个earningspershare@ibessurprise的因子,同样用序数法,等权处理,对该因子的检验情况如下:

  1. 信息系数IC:平均当月IC由0.082提升到了0.092,并且1月延期和2月延期IC都有不同程度的提升。
  2. 分层研究

top-bottom:

所有分层:

累计收益率F1层也有所提升,我们可以认为,加入了预测意外这个因子后,模型得到了优化。

最后,欢迎您使用我们的QA Direct™量化解决方案