股票模型怎么建立的

原标题:多因素模型股票选择示例-FRM学习笔记(7)

文章来源于网络,若有侵权,请联系我们删除。

  点击上方“风控圈子” 

  选择“星标”公众号

  每天早上8:30,一起实现自我增值

  开篇

  前一节我们讲到了多因子(素)模型,多因子模型是量化投资领域应用最广泛也是最成熟的量化选股模型之一,建立在投资组合、资本资产定价(CAPM)、套利定价理论(APT)等现代金融投资理论基础上。

  多因子选股的核心思想在于,市场影响因素是多重的并且是动态的,但是总会有一些因子在一定的时期内能发挥稳定的作用。在量化投资实践中,由于不同市场参与者或分析师对于市场的动态、因子的理解存在较大差异,因此构建出各种不同的多因子模型。有对多因子模型以及其他理论基础不清楚的同学可以翻看上一篇笔记,今天我们来研究下多因子模型在量化选股上的应用:

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  01

  多因子模型的演变过程

  在这里我们先主要回顾一下多因子模型的演变过程:

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  1981年,大卫?布斯和雷克斯?桑奎菲尔德成立了维度投资顾问公司,买入小市值、低估值的股票,获得了高额回报。但是市场中的小市值、价值股表现明显超过市场,而这一效应不能用CAPM模型解释。

  1992年,Fama和French对美国股票市场决定不同股票回报率差异的因素的研究发现,股票的市场的beta值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异,因此提出了著名的三因子模型。

  1997年,随着市场交易实践和研究的不断深入,研究者又发现市场中的动量现象无法用三因子模型解释,卡哈特(Carhart)在Fama和French的三因子模型基础上加入动量效应,构建了四因子模型。动量是物理学名词,是与物体的质量和速度相关的物理量,一般而言,一个物体的动量指的是这个物体在它运动方向上保持运动的趋势。而股市中的动量投资策略依据的就是动量效应,又称为“惯性效应”,即某个时段跌得最深或涨得最凶的股票往往会沿着原来的方向继续运动。

  2013年,Fama的学生阿斯内斯 (Asness)对公司“质量”进行量化,其逻辑是在其他条件一定的情况下,财务质量高的上市公司应该带来更高的投资回报,因此有必要引入刻画公司资产质量的因子。并提出了五因子模型。

  2013年法拉瑞利发现低波动率(低beta)股票组合的实际收益比高波动率(高beta)股票组合的要高,又将波动率因子引入,建立了六因子模型。

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  图片截取自论文Buffet’sAlpha

  ? 巴菲特在小市值因子上没有暴露

  ? 没有追涨杀跌的交易行为

  ? 高配低估值股票

  ? 高配低Beta股票

  ? 高配高财务质量的股票

  02

  因子选取

  大佬们都在用多因子模型选择适合的投资组合,那么对于我们普通的韭菜,怎样才能建立一个多因子模型选股呢,其实多因子量化选股已经是一个相对成熟且大致框架较为固定的策略,主要有以下几个步骤

  具体可分为五个步骤:因子选取、因子有效性检验、因子筛选、综合评分模型以及模型的评价和改进

  1.怎样因子选取:

  因变量:例如选取沪深各股票近5日、10日、15日、20日、25日、50日、75日、100日、125日、175日、225日、275日、325日、375日复权实际涨幅。

  初选自变量:因子的选择主要基于经济逻辑和市场经验,在经典的规模、估值、动量、波动率等全市场通用因子基础上,根据宏观、行业、公司基本面、市场特征,结合各类特异因子来构造投资组合。影响股价收益的因子见仁见智,但并非所有因子对股票的影响都是显著的,为了简化研究成本,先筛选出目前国内外发现的较为有效的四类因子:

  基本面因子(规模因子、估值因子、成长因子、盈利因子、偿债能力因子)、

  技术因子(动量因子、换手因子)、

  行为因子和市场预测因子作为候选因子进行研究。

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  03

  因子有效性的检验:

  选出了因子,接下来就是要选出有效的因子,简单来说,每一个因子都是一个指标,把股票按每个指标值从小到大的顺序都排一下,然后分别选取每个指标最高、最低极端的2组计算他们的区间收益率(一般为月度,分组目前一般采用5档)及收益率与因子的相关性。

  比如:我们认为身高高的力量可能会大,于是身高最高的组和身高最矮的组选出来,看一下身高高的力量是否真大,身高最矮的力量是否就真的小。

  为什么不必计算全部?因为如果最大最小的两组收益率都对因子有相关性,那么中间的组也就无需计算了。

  所谓相关性是指:如果因子指标高,收益率也高,那么就是正相关;反之就是负相关。因为选取了两组极端的股票组合,假如跟因子是正相关,那么因子指标高的那组就是“高收益组”,反之亦然。

  然后统计“高收益率组”各月收益率在各种市场状况(牛市、熊市)下跑赢业绩比较基准的概率,这是因为我们选股的目的是跑赢市场,获得正的阿尔法,如果“高收益率组”收益率超过基准业绩的概率小于50%,那么这个因子就是无效的,应予以剔除。

  当然也可以要求更高更苛刻的概率标准,来确保找到更有效的因子。

  反复这样操作,我们就找到了有效的因子。

  05

  剔除冗余因子

  当然可能这些因子之间有很强的相关性,我们可以据此剔除掉一些,同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。什么叫很强的相关性?这个可以自己设置一个阈值,既可以是超过0.5的也可以是超过0.6,根据自己的经验来调整。

  具体方法如下:假设需要选出K个有效因子,样本期共M月,那么具体的冗余因子剔除步骤为:

  (1)先对不同因子下的N个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高; 

  (2)按月计算个股的不同因子得分间的相关性矩阵; 

  (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值;

  (4)设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

  06

  多因子选股的判断方法

  多因子选股的判断方法分为回归法(OLS)和打分法。

  6.1多元线性回归:是利用股票历史收益率对筛选出的多因子进行回归,估计出回归方程系数,然后将最新的因子带入回归方程估计股票未来收益,以此为依据进行选股。回归方法的问题是很难找到一个精确拟合的回归方程,模型误差比较大。

  例如运用回归结果:

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  1.从上图看出,低估水平是个股日收益对上证指数日收益的回归截距项,即实际发生的阿尔法收益,其越负,近期涨幅越高。验证了寻找负阿尔法而获取未来正阿尔法收益这种方法的有效性。

  2、其次几乎都有与利润增幅有关,可见基本面的调研与分析,是有效的。但利润增幅是逐渐披露的。这需要要跟踪财报的信息披露。

  3、值得注意的因子:周转弹性,即提高资产周转率对净资产收益率的影响。周转弹性越高涨幅越高。意思是高销利率高负债的公司,提高销利率或提高负债率而提高净资产收益率,都不如提高资产周转率效果好。这种类型的公司涨幅高。市净率,市净率越低涨幅越大。可见二级市场资本的厌恶风险的特性,选择接近帐面价值的股票是有利于防守的。

   

  由此模型只能找出过去的一段时间在该模型下被低估的股票,至于对未来的预测,模型能力有限,因为它们的R2决定系数都偏低。解释过去还勉强,预测误差可能较大。但验证的一些逻辑是有用的。尤其是量化寻找低估水平和基本面调研寻找利润增长都是有效的选股方法。如果两都结合起来,再加上组合投资,可以有效降低风险提高收益。

  6.2打分法:是根据各个因子的大小对股票进行打分,然后根据一定的权重加权得到一个总分,根据总分对股票进行筛选。

  基本面因子、技术因子、行为引子和分析师预测因子作为四个因子大类,其内的子因子服从加法原理,而四个因子大类之间服从乘法原理,公式如下:

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  例如:每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的50到100只股票等等。打分法的优点操作简单,不容易受到极端值的影响。但是权重相对依赖于主观判断,确定比较困难,对结果的影响较大。

  下面我们看一个例子:

  华泰证券在2011年对中证800指数成份股在2005年1月至2011年5月的走势,构造了一个等权重多因子策略。 

  选股因子包括:总市值、市盈率TTM、营业利润同比增长率、净资产收益率、前1个月涨跌幅、前1个月日均换手率、前1个月波动率、户均持股比例变化、机构持股变化、最近1个月净利润上调幅度等10个因子。

   这10个因子按等权重的方式,计算各股票的综合得分。按各指标排序,把800只成份股分成:(1-50)、(1-100)、(101-200)、(201-300)、(301-400)、(401-500)、(501-600)、(601-700)、(701-800)、((751-800)等10个组合;股票组合调整周期为月,每月最后一个交易日收盘后构建下一期的组合。

  以下就是按照上述10个因子等权重方式,回测出的各档股票组合收益率情况。

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

  07

  模型的评价及持续改进

  在计算综合评分的过程中,各因子得分的权重设计、交易成本考虑和风险控制等都存在进一步改进的空间。因此在综合评分选股模型的使用过程中会对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。因子和参数的获取只能通过历史数据回测来获得,但是在回测过程中,防止出现过度优化也很重要。

  多因子量化选股本质是基于历史数据的统计分析,通过寻找那些与股票收益率最相关的因子,并基于套利定价理论(APT),将多个影响因子进行组合,构建综合选股指标来筛选股票。任何一个多因子选股模型具有一定的时效性、风险性,需要使用者根据市场情况进行调整和更新,这是多因子选股策略存在的不足。多因子选股模型作为一种量化投资选股策略,最大的优势在于其结果是根据客观的数据和完整的模型得出的,可以避免交易者个人主观意念的干扰,具有一定客观性。多因子选股研究的对象主要是因子,因此单因子的回测和有效性检验是整个多因子模型的重要组成部分。

  预告

  下一节我们将介绍FRM第一节课中的

  【2007-2008年的金融危机】以及【GRAP行为准则】

  想一起学习FRM的同学可以,添加小助手,备注:FRM学习

  本文详细学习内容请参考GRAP官方指定FRM教材Handbook及Notes

  参考网站:https://www.garp.org/

  全文完,感谢您的耐心阅读

  请顺手点个“在看”吧~

  ▼ 往期精彩回顾 ▼

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

股票模型怎样建立的

股票模型怎样建立的(网络配图 侵删)

发表评论

免责声明:本站部分内容转载于网络,其中内容仅代表作者个人观点,与本网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。

本站联系邮箱:douxingdu02@163.co m