量化小讲堂吧 关注:175贴子:520
  • 7回复贴,共1

最新研报解读 | 海通证券-选股因子系列研究(二十七)

只看楼主收藏回复

一楼祭天


1楼2017-11-06 23:11回复
    研报简介
    研报标题:20171018-海通证券-选股因子系列研究(二十七):分位数回归在多因子选股中的应用
    券商:海通证券
    发布时间:2017-10-18
    作者:冯佳睿
    类型:因子研究
    系列:选股因子系列


    2楼2017-11-06 23:12
    回复
      内容概要
      作者首先介绍分位数模型。均值回归虽然一直以来都是量化多因子选股的主要模型,但这个模型会因为遗漏信息而导致不能完全把握因子对整个收益分布的效应,而分位数回归是一类更稳健的估计方法。分位数回归可以通过给予数据不同的权重得到一组预测值。这些预测由变量τ标识和区分,它代表了被赋予高权重的观测数的百分比,也即收益率分布的分位点,可在0到1之间任意取值。具体,设xi表示第i个股票的总市值,yi为对应的收益率。收益率分布的τ分位点和xi的关系:



      3楼2017-11-06 23:12
      回复
        接下来作者以中证500指数成分股为例,选取月度收益率和三个常用因子:前一个月收益、前一个月日均换手率和总市值进行分析。这三个因子对收益率分布的不同位置有不同的效应,单一的均值回归不足以反映这种特征。接下来作者重点介绍如何将分位数回归应用于具体的组合。


        4楼2017-11-06 23:12
        回复
          通过对中证500指数成分股为例的分析,可以看到当τ=0.1时,回归直线最为陡峭,表明收益率的变化最为明显,也最能体现股票未来表现差异的一个方向。因此研报重点讨论当τ=0.1时的三因子分位数回归模型选股。


          5楼2017-11-06 23:12
          回复
            实证样本为2007年1月~2017年9月期间的中证500指数成分股的月度数据,t月的因子值作为解释变量,t+1月的个股收益率作为被解释变量。为了降低极端值的影响,采用MAD(Median Absolute Deviation)来剔除异常值,MAD的计算公式:

            其中,median(X)为因子的中位数,定义上下限——median(X)±3*1.4826*MAD以外的数据点为异常值。


            6楼2017-11-06 23:12
            回复
              本文通过均值回归、τ=0.1、0.5、0.9的分位数回归对应的结果进行比对。τ=0.1时的分位数回归对应的系数估计最为稳定,τ=0.9时分位数回归的系数估计随时间变化最为剧烈。整体来看,无论是等权重加权还是市值加权QR(0.1)、QR(0.5)和OLS的三因子多头组合均能产生明显的收益增强,从2011年起,QR(0.1)对应的多头组合开始展现出绝对优势。从相对基准的超额收益的角度,QR(0.1)更优,两种加权方式下,都大幅超越OLS的结果。但两者的波动和回撤都十分接近,而QR(0.1)的夏普比率具有明显的优势。


              7楼2017-11-06 23:13
              回复
                通过以上分析,可以看出在实际操作中,通常选择斜率绝对值最大,即回归直线最为陡峭,且统计意义上显著的分位点对应的模型来得到股票的排序。因为直线越陡峭,表明收益对因子的敏感性越高,对股票未来表现的区分能力也越强。但需要注意的是,由于构建组合时选择了斜率最为陡峭的方向,相当于放大了因子的beta。因此,一旦因子失效,分位数回归也可能进一步放大风险。


                8楼2017-11-06 23:13
                回复