zoukankan      html  css  js  c++  java
  • 比较横截面与时间序列的因子模型

    发表于2020年Review of Financial Studies上的"Comparing cross-section and time-series factor models"一文,作者是2013年诺贝尔经济学奖得主、芝加哥大学Booth商学院的Eugene F. Fama,和他的老搭档、达特茅斯学院Amos Tuck商学院的Kenneth R. French,这也是二位的最新一次合作。

    该文十分简单,且为纯实证,本文对其关键部分作个剖析。

    在下文中,用CS(Cross-Section)表示“横截面”一词,用TS(Time-Series)表示“时间序列”一词。

    1 实证模型

    在因子模型中,资产的收益率应由资产在因子上的载荷,乘上因子收益率构成。有了因子收益率,就可以回归得到因子载荷,而有了载荷,也可以回归得到因子收益率,到底应该用哪种方式呢?该文共比较了4种模型。

    第一个模型,使用Fama和MacBeth(1973)的CS回归方法,直接用公司特征作为载荷,用CS回归,得到的系数就是因子收益率:

    \[\begin{align*} R_{it}=&R_{zt}+R_{MCt}MC_{it-1}+R_{BMt}BM_{it-1}\\ &+R_{OPt}OP_{it-1}+R_{INVt}INV_{it-1}+e_{it} \tag{1} \end{align*} \]

    这样得出的因子,称为CS因子

    然后,将截距项移到左边,将自变量与系数交换位置,就成了一个资产定价模型:

    \[\begin{align*} R_{it}-R_{zt}=&MC_{it-1}R_{MCt}+BM_{it-1}R_{BMt}\\ &+OP_{it-1}R_{OPt}+INV_{it-1}R_{INVt}+e_{it} \tag{2} \end{align*} \]

    第二个模型,就是先通过Fama和French(2015)中构造的TS因子的方法,即用多空组合的方式,构造出因子的收益率序列,然后,再以TS因子收益率为自变量,进行TS回归,得到的系数就是载荷:

    \[\begin{align*} R_{it}-R_{ft}=&a_i+b_i(R_{mt}-R_{ft})+s_i {SMB}_t+ h_i HML_t \\ &+r_i RMW_t + c_i CMA_t+e_{it} \tag{3} \end{align*} \]

    第三个模型,用(1)中得出的CS因子,替换(3)中的TS因子,同样进行TS回归,得到载荷:

    \[\begin{align*} R_t-R_{ft}=&a_i+b_{1i}(R_{mt}-R_{ft})+b_{2i} R_{MCt}+ b_{3i} R_{BMt}\\ &+b_{4i} R_{OPt} + b_{5i} R_{INVt} +e_{it} \tag{4} \end{align*} \]

    (3)与(4)得到的载荷都不是时变的,为了引入时变载荷,可以在系数中加入时变的CS因子,即加入交叉项:

    \[\begin{align*} R_{it}-R_{ft}=&a_i+b_i(R_{mt}-R_{ft})+s_i {SMB}_t+ h_i HML_t \\ &+r_i RMW_t + c_i CMA_t\\ &+s_{i2}MC_{it-1}{SMB}_t+h_{i2}BM_{it-1}HML_t\\ &+r_{i2}OP_{it-1} RMW_t + c_{i2} INV_{it-1} CMA_t+e_{it} \tag{5} \end{align*} \]

    (2)(3)(4)(5)组成了要检验的4个模型。

    2 数据

    2.1 因子构建

    对于FF(2015)的五因子模型即方程(3),在每个6月底生成一次规模SMB、价值HML、盈利RMW、投资CMA的TS因子。

    HML(High Minus Low)因子:用NYSE的6月底的中位数MC(市值)作为断点,将NYSE、AMEX、NASDQA的所有股票分入高/低市值组;再独立地用NYSE股票的BM的\(30^{th}\)\(70^{th}\)分位数作为断点,分成3组。\(T\)年6月的BM,就是\(T-1\)年财年末的账面净值与\(T-1\)年12月底市值(在12月到财年末,若在外发行股票数可能有变化,则需要调整)的比率,再取对数。这样就可以得到\(2\times 3\)个市值加权(VW,value-weight)组合。HML是大市值分组中的高低BM组合收益率之差,与小市值分组中的高低BM组合收益率之差,取平均数。

    RMW(Robust Minus Weak)、CMA(Conservative Minus Aggressive)因子:做法与HML类似,生成RMW时用OP(Operating profitbality),生成CMA时用INV(Investment)。

    SMB(Small Minus Big)因子:前面一共得到3个\(2\times 3\)组合,用其中的9个小市值组合的平均收益率减去剩下的9个大市值组合的平均收益率,即为SMB因子。

    UMD(Up Minus Down)因子:先用从\(t-12\)月到\(t-2\)月的累计收益率除以11,作为MOM,再用MOM作为第二个因子构造\(2\times 3\)组合,得到UMD因子,它是月度更新的。

    MC、BM、OP、INV、MOM等公司特征:就是构造以上因子所用到的公司特征。个股的BM、OP、INV在每年6月更新,MC和MOM在每个月更新。组合的特征就是组合中股票的VW平均值,权重(市值)每个月更新。

    构造CS因子,每个月进行(1)式回归,对每个RHS的公司特征做z-score处理,在不加入MOM时用18个组合做标准化,在加入MOM时用24个组合做标准化。在做标准化之后,CS水平收益率\(R_{zt}\)就是18或24个LHS资产收益率的等权重均值。

    构建因子的LHS资产:为使CS和TS因子可比,月度回归(1)式的左侧资产选择18个生成了SMB、HML、RMW、CMA的VW组合。如果模型中要用到CS动量因子,也加入生成UMD的6个VW组合。

    2.2 描述性统计

    表1为上述因子的描述性统计,Panel A为TS因子,Panel B为CS因子。样本区间为1963.7--2018.8,共662个月度收益率。

    我们知道OLS回归得到的系数为\(\hat{\beta} = (X'X)^{-1}X'y\),也就是\(y\)的线性组合。那么(1)式中系数就是\(R_{zt}\)和CS因子的收益率,也就是说,它们其实是由LHS资产的收益率线性组合出来的。那么,组成它们的,不同的LHS资产的权重是多少呢?表2列出了结果。

    2.3 用于测试的LHS资产

    在实证中,用于检验的LHS资产使用每年6月更新的MC和BM、OP、INV的\(3\)\(5\times 5\)组合,再加上月度更新的MC和MOM的\(5\times 5\)组合。注意,用于生成因子的LHS资产还是以前的\(2\times 3\)组合,但用于检验的是\(5\times 5\)组合。

    为增加一些挑战性,再在LHS中加入FF(2016)的异象组合:

    1. 长期困扰CAPM的单变量市场beta与平均收益率的扁平关系(flat relation);
    2. 股票回购后的高平均收益率,与股票发行后的低平均收益率;
    3. 应计利润大的公司,平均收益率较低;
    4. 日收益率方差大的公司,平均收益率较低。

    同样使用MC和这些异象变量的NYSE的5分位数,构造\(5\times 5\)组合。但这里有几个例外:一是股票净发行(NI,Net share Issue)需要用7分位数,即净回购、无回购无发行,以及净发行的5分位数;二是大市值股票中几乎没有高收益率波动的,因此不适合使用独立双重排序,只能在MC排序后的基础上再进行排序。

    MC-VAR组合是月度更新的,而其他异象组合都在每年6月底更新。

    3 模型比较标准

    该文用了多种模型比较标准。在这里用\(A\)\(V\)表示横截面的均值方差,\(a\)表示模型产生的截距向量,比较标准有:

    • \(A|a|\):截距项绝对值的均值;
    • \(A|t(a)|\):截距项的\(t\)值的绝对值的均值;
    • \(\dfrac{A a^2}{V \bar r}\):和下面一个一样,都是度量截面的分散程度,分子为截距平方的均值,\({V \bar r}\)为LHS资产的平均收益率的截面方差;
    • \(\dfrac{A \lambda^2}{V \bar r}\):修正截距的平方为\(\lambda^2 \equiv a^2-s^2(a)\),这是因为在估计截距时有噪声;
    • \(AR^2\):回归\(R^2\)的均值;
    • \(As(a)\):截距标准误的均值;
    • \(As(e)\):残差标准差的均值;
    • \(Sh^2(a)\):截距的最大平方夏普比率,用\(\Sigma\)表示回归残差的协方差矩阵,则\(Sh^2(a)=a'\Sigma a\)
    • \(GRS\):GRS统计量;
    • \(p(GRS)\):GRS统计量的p值;
    • \(T^2\):Hotelling’s \(T^2\)
    • \(p(T^2)\):Hotelling’s \(T^2\)\(p\)值。

    4 实证结果

    4.1 总体结果

    实证结果在表3中,其中Panel A1和Panel A2检验了模型(3)、(4),Panel A3、Panel A4检验了模型(5)。

    在检验模型(3)、(4)、(5)时,都是用TS回归,然后将各资产回归得到的截距项放在一起,形成向量\(a\)。但由于模型(2)是从CS回归中变化而来,可以不再做TS回归。Panel B1和Panel B2是使用CS因子对测试LHS资产相对\(R_{zt}\)的超额收益率做回归的情况,而Panel B3--B6则不再做TS回归。

    在Panel B5和Panel B6中,模型(2)中的\(R_z\)和CS因子是用(1)式由不同\(2\times 3\)组合生成的,接着,用每个LHS测试资产的公司特征做加权平均,用生成CS因子时的18个或24个组合的均值和标准差对它做标准化,最后的值作为LHS测试资产的因子载荷,再乘上事先得到的CS因子的收益率,去预测LHS测试资产的相对\(R_{zt}\)的超额收益率,从而得到每个LHS资产在每个月的预测误差。在Panel B3和Panel B4中,用特征的时间序列均值作为CS因子的载荷。在这4个Panel中,载荷不是被估计出来的,因此GRS检验不适用,只能用Hotelling’s \(T^2\)检验。

    在每一个评价标准上,Panel B5、B6的结果都比Panel A好。

    4.2 去除异象组合后的结果

    表4就是在表3的LHS测试资产中剔除了异象组合后的结果,它使用的LHS资产是4组\(5\times 5\)组合,即MC-BM、MC-OP、MC-INV、MC-MOM组合。

    在原文的附录中,表A1-A4报告了每个\(5\times 5\)组合的结果。

    4.3 在异象组合中的结果

    表5是只在110个异象组合中的结果。

    在原文的附录中,表A5-A8报告了每种异象组合的结果。

    可以看到,不管用什么作为LHS测试资产,模型(2)结果都是最好的,结论稳健。

    参考文献

    • Fama, E. F., and K. R. French. 2015. A five-factor asset pricing model. Journal of Financial Economics.
    • Fama, E. F., and K. R. French. 2020. Comparing Cross-Section and Time-Series Factor Models. Review of Financial Studies.
    • Fama, E. F., and J. D. MacBeth. 1973. Risk, return, and equilibrium: empirical tests. Journal of Political Economy.
  • 相关阅读:
    spark内存管理这一篇就够了
    spark推测机制及参数设置
    python易错点汇总,不定期更新
    Spark架构与原理这一篇就够了
    MySQL查询这一篇就够了
    pyspark计算最大值、最小值、平均值
    Spark性能调优的方法
    大流量场景下MySQL如何准备
    100台CentOS7要分区怎么办?
    100台CentOS7要升级OpenSSH怎么办?
  • 原文地址:https://www.cnblogs.com/analysis101/p/14642637.html
Copyright © 2011-2022 走看看