1 统计结果的有效性
量化简单来看,其实是对数据的统计。
所以,我们常常进行的回测,其实就是在统计历史数据,来验证数学模型。
一个数学模型为什么能够有效呢?
这要回归到统计学上。
从样本分析的角度来看,统计结果的有效性,受到两个因素的影响:
样本的规模
样本的代表性
得到的收益情况,回撤大小以及其他衡量指标,是统计的结果;而回测所使用的历史数据,是统计的样本。
以总统选举为例,凭什么让预测的结果更加准确呢?
一个是样本的规模,例如选择500人进行调查,会比选择100人的误差更小。
另一个是样本的代表性,选择的500人如果限制在民主党或者共和党,这样得到的结果,肯定不能代表全部的民众。
2 从样本角度看回测
一头被饲养的猪,在被杀之前的一天,都认为人类是好的,因为无偿给它提供了粮食。
但如果让这头猪了解到,其他猪的处境和最终的结果,恐怕它的判断会有所不同。
样本的规模和代表性,也是我们回测的时候需要考虑的两个因素。
2.1 样本规模
一个策略可能是由多条规则构成,例如我之前在文章《投资10年300倍,你也可以。》中提到的规则就有:
二八择时
多因子回溯选股
指数高低价比值止损
我们判断这些规则是否有效,前提是这些规则能够得到应用,并且应用的频率足够高。
很显然,二八择时、多因子回溯选股这两条规则都在不断地触发,而指数高低价比值止损却仅仅触发了一次。
因为数据样本过小,根本不足以说明规则是否有效。
2.2 样本代表性
这一点可以从回测数据所涉及的市场范围和时间长短进行评判。
回测的市场越多,涵盖市场的类型就越广泛,就越具有代表性。
这也是为什么,现在很多报告里面,都喜欢通过展示不同市场下的验证结果,因为这样的可信度更高。
回测的时间越长,涵盖市场的状态就更多,就更具有代表性。
牛市回测效果很好的策略,放在熊市中恐怕要大打折扣;熊市回测效果很好的策略,放在牛市中可能也会跑不赢指数。
回测数据包含了越多的牛熊周期,策略的可信度就越高。
3 从样本角度看之前公布的两个策略
动态因子 ——《动态因子策略,圣杯?》
动态多因子 ——《投资10年300倍,你也可以。》
两个策略的选股原理,都是通过过去因子的回测结果,来预测之后一天的因子有效性。
3.1 样本的对比
从样本规模来看,如果过去回测的时间,使用一天两天,或者是一周两周,都可能会有比较大的偏差。
但是我们使用几个月、半年、甚至一年,样本的规模大了,偏差就小了。
当然,更大规模的样本会使得预测的偏差更小,但是差异不会太大。
从样本代表性来看,按理来说样本时间越长,代表性应该是越好的。
但如果我们从更大的市场范围,特别是发达国家的市场了解到:好的公司市值会越来越大,差的公司市值会越来越小。
动态多因子策略,因为回测时小市值因子的效果特别好,其实是限制了样本的代表性。
市场是一直在变化,或者可以说越来越规范化。
如果小市值因子现在马上就失效,结果会怎么样呢?
对于动态多因子策略,因为统计历史至今的因子回测结果,需要几年甚至更长的时间,才能扭转小市值因子的有效性。
这也就意味着,我们需要长时间基于一个无效样本统计的结果进行交易,想想也是挺可怕的。
对于动态因子策略,因为只统计了最近一年的因子回测结果,旧样本的退出,新样本的加入,会明显影响回测结果,也许半年之内就可以重新适应市场。
从样本角度的对比,其实动态因子策略更加有效。
3.2 动态因子策略和动量策略的区别
之前有人提出过疑问:动态因子策略其实是一个动量策略。
这也引起了我的深思。
动态因子策略是根据股价过去的变化,统计因子过去的有效性,来预测因子未来的有效性。
动量策略是根据股价过去的变化,来预测股价未来的变化。
两者之间有什么区别呢?
随着对统计学的学习,我发现区别就在样本上。
动量策略选股,虽然针对的是所有股票,但是每个股票之间是独立的,也就是说样本的范围其实仅仅是一个股票。
而动态因子策略,是通过全市场的股票,动态统计当前有效的因子,两者样本的规模和代表性都有根本性的差别。
因此把“因子”换成“技术指标”,我有这么一个假设:
通过全市场的股票,动态统计当前有效的技术指标,进而预测未来有效的技术指标,并以此进行选股,其效果恐怕也不会太差。
有兴趣的朋友可以自己验证一下。
【参考图书】
书名:《海龟交易法则》
作者: 柯蒂斯·费思[美]
译者: 乔江涛
出版社:中信出版社
ISBN:9787508639093