多因子权重优化方法比较

在多因子量化投资体系中，具有稳定的预期收益，可解释的经济驱动理论，与其他因子的低相关性是选择 alpha 因子的关键指标。本篇文章中，我们以此为因子选取标准，简单地构建了自己的因子库，总共包括八个大类因子，每个大类因子中包含四到五个子类细分因子。为了比较不同的权重优化方法的优劣，本文首先采取不同的方法对各个大类因子下的细分因子进行合成，确定了不同大类因子的各自最优的合成方法；其次，通过不同权重合成方法对合成的大类代理因子进行二次权重合成，并比较了这些不同合成方法下的因子表现差异。基于上述多因子权重优化建模体系，我们初步得出以下结论：

1、同一大类因子下细分因子之间存在相关性，表现为细分因子 IC 值整体变化方向相近。

2、不同大类因子适合不同的合成方式，PCA 方法适用于具有较强相关性的细分因子，在选股绩效指标中，具有较大的累积收益和较低的回撤值，同时夏普比率和胜率表现良好，平均换手率较低，可以降低投资者在手续费佣金上的支出。

3、在细分因子的合成方法中，逐步回归（ stepwise ）方法稳健性不佳，在不同的时期上同一大类因子下不同的细分因子的占比可能存在较大差异。

4、在大类代理因子权重配置上，通过计算大类因子的 IC 进一步配置权重，可以看出合成后的因子受市场风格轮动影响，权重取值波动频繁，通过观察选股绩效指标，使用压缩矩阵最大化复合因子 IR 的权重配置方式可以达到较佳权重优化的效果。使用平均 IC 赋予大类因子权重时，选股结果显示这种方式对市场风格变化的敏感程度较强。

一、驱动逻辑与建模框架在前两篇文章中，我们对估值因子和波动率因子进行了详细的分析，但是前文的分析仅仅局限于某个大类因子中其包含的细分因子的有效性检验。然而在真实的市场环境下，投资者将所有的风险都暴露在某一个因子下，显然是不够理性的。为此，本篇将对因子的合成方法进行探讨，以求能最大化各因子有效性带来的溢价的同时降低单个因子带来的风险暴露，达到二者之间的一个动态平衡。

常见的多因子合成方法包括：

等权加权
IC 均值加权
IR_IC 加权

以往的多因子合成方法的研究，很少考虑到大类因子本身的合成，仅纯粹地对所选定的因子进行合成，用某一个大类因子下的细分因子代替该大类因子，具有一定的随意性。本文尝试首先对大类因子内的细分因子进行选取合成，然后利用相对表现较好的合成方法得到的大类因子的代理变量来进一步合成最终的选股因子。

通过前两篇对估值因子和波动率因子的分析，我们发现大类因子中的细分因子之间存在较高的相关性。具有高相关性的细分因子大多代表了相同的一类信息，为了消除细分因子之间的共线性，最大化地提取该大类因子的信息，本文对大类因子下的细分因子信息进行提取，主要采取了以下三种方法。

方法一：基于等权的思想对大类因子下的细分因子进行加权

方法二：利用 PCA 方法对具有高相关性的因子进行降维，使用降维后的特征变量作为该大类因子的代理变量，其中方差解释率最低要求为 70%

方法三：利用逐步回归法对各大类因子下的细分因子进行回归，选取能够最大程度提升模型解释力度的细分因子进入备选因子集，对所有备选因子进行简单平均得到合成后的大类因子代理变量

图 1 逐步回归（ stepwise ）流程图

注：图片来源于 wikipedia

        在根据以上三种方法合成得到大类因子后，我们选取整体表现最好的合成方法作为大类因子的代理变量生成器，在此基础上，对各大类因子进行再次合成。此时，大类因子之间的合成将采用以下四种方法：

        方法一：大类因子之间进行等权处理，即赋予每个大类因子相同的权重。该种处理方法没有考虑到各大类因子之间的有效性以及稳定性的差异，也忽略了因子之间的相关性。

        方法二：根据大类因子的 IC 均值加权合成。不同的大类因子之间其因子有效性是存在差异的，根据以往的研究结果，一般而言估值因子和规模因子都是表现相对显著的，而杠杆，运营因子都是表现相对较差的因子，如果以等权的方式来对各大类因子进行加权，则忽略了不同因子的解释力度。

        方法三：基于大类因子的 IR_IC 值进行加权。基于 IR_IC 的加权方法综合考虑了因子有效性和稳定性，在保证因子收益的同时也考虑了因子的波动性。其中 IR 的定义为 IC 的均值除以 IC 的标准差。

        方法四：最大化复合因子 IR。根据 Qian 在《 Quantitative Equity Portfolio Management 》中提出的方法，我们可以通过最大化复合因子的 IR 来获得因子最优权重，利用求解得到的最优权重去合成新的因子。假设测试期内 N 个因子的权重向量分别为，因子 IC 值的向量分别为 ，IC 构成的协方差矩阵为，则复合因子的 ，其中，通过对 W 求导，可以直接解得最优权重的解析解为。

二、数据选取表 1 因子定义

本文将所有细分因子划分为八个大类因子，分别为估值因子、波动率因子、营运能力因子、规模因子、技术因子、杠杆因子、财务质量因子以及成长性因子。因子股票池为扣除上市时间不满一年的次新股后的全市场 A 股，测试区间为 2014-01-01~2017-06-30，涵盖一轮牛熊周期。因子调仓周期统一设置为月调仓，每月月底根据合成因子值更新股票池，表现最好的前 20%的股票进入股票池。

三、细分因子分析在前两篇文章中，我们对估值类和波动率类大类因子的细分因子进行了详细测试，本文为节约篇幅，仅计算了其余各大类因子的细分因子的 IC 表现，具体表现可参考附录 1，此处以规模类因子为例：

图 2 规模细分因子的 IC 变化图

可以发现在规模类因子下，其细分因子的 IC 值整体变化方向一致，只是强弱有差异。方向一致说明了细分因子之间存在显著相关性，即各细分因子蕴含着对未来收益率变化的一致信息。而强度不同则表明某些细分因子更加有效，而其他因子有效性相对较差。如对数流通市值 IC 的绝对值峰值达到了 0.5 以上，而对数总市值的 IC 峰值则在 0.3 附近，说明流通市值相比于总市值具有更好的预测能力。若此时简单地对各细分因子等权加权，则有时会损失某些表现较强的因子的信息价值。顺便提一下，从规模类因子的各细分因子的 IC 方向来看，从 16 年 12 月开始，整个市场的市值风格偏好发生了明显的变化，以往以小为美的偏好开始转变为以大为美，且整个 17 年上半年 IC 值全部为正，若此时继续坚持购买小盘股，恐怕投资者不得不为自己的执着买单。

四、大类代理因子的合成通过对同类细分因子的分析，我们可以了解到细分因子之间存在较强的相关性，对大类因子的解释程度上存在冗余信息；基于大类因子下的细分因子蕴含相同的信息的前提，本文对大类因子下的细分因子进行了合成处理，以期得到一个能够更好代理该大类因子的变量。根据前文所提出的三个方法，我们来一一验证。以估值因子为例，我们列举了三种方法下各因子占比前 20%的股票构成的股票池所得到的累积收益率、最大回撤、年化波动率、夏普比率、胜率占比以及换手率。

表 2 三种合成估值代理因子方式的绩效指标（前 20%股票）

图 3 三种合成估值代理因子方式的累计收益对比（前 20%股票）

图 4 三种合成估值代理因子方法的累积收益图

根据表格数据可知，针对特定的估值类因子而言，PCA 方法合成得到的因子综合表现更好，具有更大的累积收益和更低的回撤值，同时夏普比率和胜率都是表现最好的，而且其平均换手率最低，仅为 13.87%，如果考虑手续费对回测结果的影响，PCA 方法合成得到的因子将具有更加优秀的表现。在逐步回归方法中，合成得到的估值因子的换手率达到了惊人的 56.67%，一定程度上说明了逐步回归法得到的结果不具有稳健性，导致不同月份有效因子的细分成分存在很大差异。

为了节约行文的篇幅，此处仅列举出以夏普率为比较基准的条件下不同合成方法对大类因子细分因子合成的影响。对于其他大类因子各合成方法的具体表现，就不再赘述，有兴趣的读者可以联系作者获取。

表 3 不同合成方法下不同大类因子的夏普率比较

根据表格内容可知，不同大类因子对应的最优合成方法存在差异，总体而言，相比于纯粹的等权组合，PCA 和逐步回归法具有一定的比较优势。在八大类因子中，逐步回归法占优的次数为 4 次，PCA 的方法占优的次数为 3 次，而等权的方法仅有一次占优。同时，结合我们对各大类因子下细分因子的定义，可以发现 PCA 方法更适用于细分因子之间具有高相关性的大类因子。以波动率因子和技术因子为例，技术因子的各细分因子的平均相关系数值为 0.41 ，而此时合成的技术大类因子夏普值为 0.48 ，波动率因子之间的平均相关系数为 0.90 ，而合成的波动率类因子的夏普值为 1.03 。

基于以上的统计结果，我们对不同的大类因子应用不同的合成方法，作为该大类因子的代理变量。即杠杆率因子采用等权方法，估值因子、波动率因子和营运能力因子采用 PCA 方法，而成长、质量、规模和技术类因子则采用逐步回归法。在得到新和成的大类因子后，我们对不同的大类因子进行 IC 分析，如下表所示：

通过对不同的大类因子采取不同的合成手段，可以看出 IC 相关系数的显著比例有明显提高，合成因子的总显著比例（ IC 为正的显著比例和 IC 为负的显著比例之和）都占 50%以上[dy1] 。

表 4 融合不同合成方法下大类因子 IC 统计变量表

五、大类因子的权重配置由于投资者的行为偏差导致的市场异象，alpha 因子的效果已经衰减，面对因子这片蓝海，我们需要挖掘新的可以解释市场异象的因子或者运用新的因子构建方法；上文我们已经通过三种方式对细分因子进行的合成，构建了能够解释细分因子，充当大类因子的代理因子，接下来我们对合成之后的大类因子构建多因子模型，在对大类代理因子的权重设定上我们采用了四种方式：

1，大类代理因子的等权配置；这里的等权是指每个代理因子的权重绝对值为 1，权重的正负由前几期的大类因子 RANK IC 决定。此次报告我们将大类因子的 RANK IC 均值与 RANK IC 均值绝对值的比值作为新大类代理因子的方向，即每个大类因子的权重为 1 或者-1。

2，大类代理因子的 IC 均值加权配置，即根据前几期大类因子的 RANK IC 的均值对当期的代理因子配置权重。此次报告我们将大类因子在过去 45 天 IC 均值作为新大类代理因子的权重。

3，大类代理因子的 IR 加权配置，即根据前几期大类因子的 IR 对当期代理因子配置权重。此次报告我们将大类因子在过去 45 天 IR 作为新大类代理因子的权重。

4，通过最大化复合大类因子的 IR，利用前几期大类代理因子的绩效指标即 IC，利用上文提及的公式，假设测试期内 N 个因子的权重向量分别为，因子 IC 值的向量分别为，IC 构成的协方差矩阵为，则复合因子的，其中，通过对 W 求导，可以直接解得最优权重的解析解为，用此权重对当期代理因子配置权重。此次报告我们将大类因子在过去 45 天 IC 序列作为计算新大类代理因子的权重的依据。其中，在计算协方差矩阵时，考虑到矩阵的可逆性，我们使用了两种方式，分别是普通的协方差矩阵和使用 Ledoit-Wolf 压缩方法计算得到协方差矩阵。

由于我们选取的因子大部分为财务因子，因子的更新速度较缓慢，所以在月调仓的前提下，我们在计算因子的 IC 时，将采取固定因子暴露度，将之与当期与下期之间的所有日收益率序列进行相关系数计算，将得到的 IC 序列对下期大类代理因子运用上述四种方法进行权重设定。

通过以上四种方式计算的大类因子的权重中，在大部分情况下使用压缩矩阵计算最大化复合 IR 的权重相比使用普通协方差矩阵计算最大化复合 IR 权重的波动幅度较小，稳定性较佳。

关于不同方式的大类代理因子的权重配置时间序列对比图详见附录 2。

以估值大类因子的权重配置统计分析为例，下面的表格展示了对于估值类代理因子，即使同样是使用最大化复合 IR 的方式优化权重，使用压缩矩阵和一般矩阵的权重偏度明显有差异，使用一般矩阵时权重右偏，而使用压缩矩阵时权重分布则是左偏，并且峰度大于 3，比正态分布陡峭，有最小的离散系数，说明相比其他权重配置方式，使用压缩矩阵的权重配置在单位均值上的离散程度最小，稳定性较好；使用 IC 均值加权时离散系数最大，说明使用此种方式配置权重时受市场风格影响较大，对市场变化的敏感程度更强，跟下面实际选股结果吻合[dy3] 。

表 5 估值大类因子权重配置统计分析

关于不同方式的大类因子的权重配置统计分析对比表格详见附录 3。

以考察各种权重配置方式下选择后 20%股票进行交易的绩效指标为例，下面的表格使用常见的绩效指标综合评价各种配置权重的方式，可以看出在夏普比率上各种权重配置方式相比单个大类因子选股有提高，其中使用压缩矩阵最大化复合 IR 的方式相比使用一般矩阵高 0.15 左右；使用多因子策略时的换手率相比单因子有明显的增大，也说明了权重配置上受市场风格的影响较大，资产配置在时间序列上分散程度较广泛，使用 IR 加权时，换手率高达 66%，说明此种权重配置方式受市场风格轮动的影响程度较大；使用压缩矩阵最大化复合 IR 的权重配置方式拥有最小的最大回撤，而等权方式拥有最大的最大回撤值，与通过观察权重配置统计分析的结论相同；在所有权重配置方式中，除了等权配置外，其余方式选股的胜率都在 60%以上，并且使用压缩矩阵最大化复合 IR 比使用一般矩阵的胜率高出 2.5 个百分点。综合上面的绩效指标考察，使用压缩矩阵最大化复合 IR 的权重配置方式的选股优势较明显。

表 6 不同大类因子权重配置方式的选股绩效指标（后 20%股票）

关于不同方式配置权重的大类因子的选股绩效指标详见附录 4.

图 5 展示了等权配置的累积收益率，可以看出等权配置大类代理因子的多因子策略中第三、四、五组的绩效区分度较不明显，除了第一组在 2015 年牛市期间的涨幅不大之外，其余各组均在此段时间内的收益有大幅提高，其中第二组在熔断股灾期间跌幅较大。

图 6 展示了在 IC 均值配置权重下的累计收益，可以看出相比等权重配置大类因子的权重，使用 IC 均值使得各组的累计收益的区分度更加明显，其中第五组的收益长期高于其余各组，对市场变化的敏感程度更强。

图 7 展示了在 IR 配置权重上各组累积收益图，可以看出相比等权重配置大类因子的权重，使用 IR 均值使得各组的累计收益的区分度更加明显，但其效果逊色于使用 IC 均值配置大类代理因子权重的效果。

图 8 和图 9 展示了在通过最大化复合 IR 获得下期因子权重的方法各组累积收益图，可以看出使用 Lediot-Wolf 计算协方差矩阵各组累积收益的区分度更明显，累计收益更高，稳定性更好。因此，Lediot-Wolf 提供的估计协方差矩阵，在一定程度上将各大类因子的 IC 中存在的噪音减弱，将偏离平均水平的 IC 协方差矩阵系数压缩至中心水平，进而可以获得更高的 IR，达到权重优化的效果。

图 5 等权配置大类因子的多因子累积收益图

图 6 IC 均值加权配置大类因子的多因子累积收益图

图 7 IR-IC 加权配置大类因子的多因子累积收益图

图 8 最大化复合 IR 配置大类因子的多因子累积收益图（普通协方差矩阵）

图 9 最大化复合 IR 配置大类因子的多因子累积收益图（压缩协方差矩阵）

六、结论在对因子的配置上，通常需要从收益率，风险，风格变动，可投资容量上进行综合考虑，配置因子和配置一般资产一样需要从风险溢价上进行权衡，而因子作为资产风险收益的底层驱动力，合理的因子配置无疑可以捕捉到资产的价格趋势，本次报告涉及了常见的因子合成方式和因子权重配置方式，在大类因子合成方式上采取了 PCA，逐步回归，等权的方式，在因子权重配置上采取了等权，IC 均值加权，IR-IC 加权，最大化复合 IR 的方式。通过本次报告的研究，我们可以了解到：

         大类因子下细分因子存在一定的相关性，因子之间的多重共线性会导致因子的权重配置不合理，可能导致选股结果对个别因子的暴露纯度过大，资产分散化程度不足。

         大类因子在不同的合成方式下效果差异较大，因此针对不同大类因子宜采用不同的合成(降维)方式； PCA 方法适用于具有较强相关性的细分因子，降维效果明显，在一定程度上解决了多重共线性问题，但是主成分代表的经济含义不明；逐步回归（ stepwise ）方法稳健性不佳，在不同的时期上同一大类因子下不同的细分因子的占比可能存在较大差异，这可能导致选股的换手率过大，增大投资者在佣金上的开销。

         通过计算大类因子的 IC 进行配置权重时，权重取值波动频繁，说明大类因子同样受到市场风格轮动的影响，并且这种程度不亚于普通细分因子。

         在数种大类因子权重配置方式中，通过观察各种选股绩效指标，使用压缩矩阵最大化复合因子 IR 的权重配置方式的效用最好，此种方式可以将各大类因子的 IC 中存在的噪音减弱，将偏离平均水平的 IC 协方差矩阵系数压缩至中心水平，进而可以获得更高的 IR，达到权重优化的效果。

七、附录附录 1 细分因子 IC 变化图：

图 10 估值因子 IC 变化图

图 11 波动率因子 IC 变化图

图 12 营运能力因子 IC 变化图

图 13 规模类因子 IC 变化图

图 14 技术因子 IC 变化图

图 15 杠杆因子 IC 变化图

图 16 质量因子 IC 变化图

图 17 成长因子 IC 变化图

附录 2 IR 相关的权重对比图：

图 18 杠杆大类因子权重对比

图 19 成长大类因子权重对比

图 20 财务质量大类因子权重对比

图 21 规模大类因子权重对比

图 22 运营能力大类因子权重对比

图 23 估值大类因子权重对比

图 24 技术大类因子权重对比

图 25 波动率大类因子权重对比

附录 3 大类因子权重配置统计分析

表 7 估值大类因子权重配置统计分析

表 8 波动率大类因子权重配置统计分析

表 9 技术大类因子权重配置统计分析

表 10 规模大类因子权重配置统计分析

表 11 财务大类因子权重配置统计分析

表 12 营运能力大类因子权重配置统计分析

表 13 杠杆大类因子权重配置统计分析

表 14 成长大类因子权重配置统计分析

附录 4 不同方式配置权重的大类因子的选股绩效指标

表 15 使用等权配置权重的选股绩效指标

表 16 使用 IC 均值加权配置权重的选股绩效指标

表 17 使用 IR 加权配置权重的选股绩效指标

表 18 使用一般矩阵最大化复合 IR 配置权重的选股绩效指标

表 19 使用压缩矩阵最大化复合 IR 配置权重的选股绩效指标