△作者曾建立过一个效果良好的棒球预测模型:PECOTA,本章可算是作者的领域,因此写得相当详细。在棒球预测史上,2003年出版的《点球成金》(布拉德皮特主演过同名电影)一书引发了大众的关注,它也成了对棒球进行数据分析的代名词,本章的写作也有意依照《点球成金》一书的形式,突出了球探和数据怪才两种预测系统的冲突,当然最后的观点(毫无悬念地)依然是需要综合人和机器两者共同的努力。
△背景一:为什么棒球运动适合预测
1、棒球是1对1的运动,每人都有各自的统计数据,比赛中很少会有连锁反应,这样避免了非线性对预测结果的影响;
2、棒球比赛每年都能产生大量的数据,各种假设都能得到及时的检验与反馈,并能不断修正与改进。
△背景二:棒球预测的商业价值
职棒大联盟中,棒球球员打满6个赛季之后才是自由球员,而那时他们已近30岁,绝大部分都已过了运动能力的巅峰时期(棒球运动有老化曲线这一概念,下文会提到)。也就是说,比起30岁之后的自由球员,年轻球员对球队的贡献更大,而且通常买入价也更便宜。
于是棒球行业最具价值的部分就是对年轻球员的甄选和培养——在他们进入大联盟之前。所以棒球运动对于预测能力——球探或者数据怪才的工作——极为看重,也愿意为此付出大笔的金钱。在棒球领域,信息革命的显性价值,就是一张数百万美元的支票。
△背景三:老化曲线
老化曲线用来衡量一名运动员状态随年龄的变化。在棒球运动中,二十八九岁之前,大多数球员的技术水平都会持续提高,但之后通常会开始走下坡路,三十五六岁时尤为严重。
但真实的老化曲线因人而异,并不会这么平缓,通常如下
另外老化曲线不止限于体育运动,也适用于诗人、经济学家、首席执行官等等。
△一个好的棒球预测系统
一个好的棒球预测系统需要考虑三个方面的影响:
1、影响球员表现的外在因素;
2、区别看待技术和运气;
3、熟知老化曲线。
第1点相对较容易分析,主要是球场因素和联盟因素:职棒大联盟中每个球队的主场地形都是不同的,有的适合进攻,有的适合防守,这些对所有球员的影响都是一样的,因此较容易统计;同时职棒大联盟下又有美联和国联(类似于NBA的东西区),球员身处不同的联盟,会因为联盟整体的实力差而对统计数据有不同的影响。
第2点涉及到对统计指标的筛选,比如对投手的评价用三振数比输赢数更好,对打者用本垒打数比用平均击球数更好。对统计指标的选择是棒球预测模型的核心,《点球成金》出版后的时代,球探和数据怪才对数据的争论焦点其实并不是该不该用数据,而是该用哪些数据,这一点在那些统计数据并不丰富的场合——比如小联盟中——尤为关键。
第3点中,由于个体间的老化曲线都是不同的,因此无论是詹姆斯取1条作为标准,还是赫贝卡取26条作为一套系统,精确程度的提高都是有限的。作者的PECOTA系统中,借鉴了以上两套系统中的特点,采用了相似分数法(取任意两名球员为一组,初始1000分,比较时有一处不同则扣若干分。高相似组可得到950甚至975分),最后同一名球员能有不同的“高度相似组”(取决于得分的多少),实际上对老化曲线进行了扩展,在同一时刻,一名球员可能拥有多条的老化曲线(相当于他不同的成长轨迹),随着时间的变化,比如第二年,同一名球员对应的老化曲线又会发生改变(取决于第二年他的“高度相似组”都变成了哪些人)。
插一句,从此处可以看到棒球预测相对政治预测复杂度提升了很多。因为政治预测时只需要关注党派,再盯住候选人,结果就差不多了,而棒球预测需要面对的情况要复杂得多。实际上这也是本书写作的体例,到第八章提出贝叶斯定理之前,每一章都是另一个越来越难以预测的领域。
△球探和数据怪才的结合
数据怪才有一个致命的缺点:若某项参数难以被量化(比如目前还没有有效的测量手段),那么该参数就会被忽略——不管它是极重要的,还是极不重要的。
而且,作者也承认,球探和数据怪才的对立实际上是一个伪命题:加若数据怪才只认数据不认球员,球探们在考察球员的时候肯定是要接触数据的。因此他对前“点球成金”时代中,球探表现不如数据怪才的解释是,那时候的球探预测时带有更多的个人偏见,比如他们执着于错误的参数,而数据怪才们挖掘出了正确的参数集。
若预测者没有个人偏见,单纯靠数据分析是无法打败球探的。所以优秀的球队都是依赖球探和数据怪才的共同协作。
△数据的不足
作者认为,对大联盟球员而言,预测的重点是他能否保持足够久的状态,这时,就算你预测他明年几乎和今年一样通常差距也不大;而对小联盟球员而言,预测的重点是他能否有足够实力进入大联盟,相当于预测鲤鱼跃龙门的概率,需要的不但是数据,还要有大胆的猜测。
而在大联盟之外,大学或高中球员,光凭数据进行的预测,效果会差很多。这一方面是由于数据本身不丰富,另一方面还是因为——球员的心理。
书中引用球探桑德斯的观点,认为对棒球运动员而言,24岁才是心理成年的分界线,在此之前,衡量一名球员更重要的是心理而不是生理参数。
很显然,心理参数需要球探的主观去判断,光凭数据是无法分析的。作者总结了桑德斯的五条心理指标(1、赛前准备和职业道德;2、全神贯注和集中精神;3、竞争力和自信心;4、压力管理和自谦;5、灵活应变与学习能力),就我看来,这五条指标只是两个方面:态度和自信心。
棒球运动金字塔的底座,是数十万名业余球员,在此之上是数千名职业球员,在最顶端的,只有750人能在指定时间加入大联盟,而其中能够入选全明星队的,只有几十人。
在如此巨大的竞争压力下,只有天才中的天才才能仅靠身体和技巧跻身大联盟,剩下的天才们之间,水平只有毫厘之差,此时决定他们成就差距的,便是态度和信念,职业运动员必须在职业生涯早期就克服自我怀疑。
△总结
作者认为,在竞争积累的领域(比如棒球预测中,最好的系统间彼此差距不超过一两个百分点)中,最出色的预测者必须不断地创新。而当我们乐于待在宏观与细节之间的“舒适地带”时,很少能有新的想法,因为我们在使用固有的分类模型——却不去寻求更多的模型。寻找新想法的一个有效方法是从极端的角度出发来重构世界。
吃预测饭的关键是要有一套自己的行之有效的方法,并保持不断地改进,和认真的态度,这样才能够在有可能成功的时候——你的模型和你的态度敲开了正确的大门时——能抓住,还能够有进一步提高的空间(仅有敲开大门的水平是不足以在顶尖领域立足的)。
△人与机器
这一章中,人与机器的对立其实并不明显,因为球探本身就是主观与数据的融合体。而棒球运动对于预测的巨大需求(和商业回报)也使人们更关注结果的正确,并不在意本人的主观立场,相反对于好的想法从善如流。这种态度在接下来的几章中(天气预测、地震预测等)就很少见到了。
所以作者会在下文中提出,建立交易预测的市场能促进预测水平的提高,虽然这种想法在很多领域是难以实现的。
△思考
老化曲线部分是一个很好的例子,无论是用1套还是26套老化曲线,实际上是用有限的模板取套在无限的事物上,在大多数情况下这种简化是可以被接受的,但这样做无疑会错过很多天才(或者错过了某一未知类型的所有天才)。
更重要的是,本来只是权宜之计的有限模板,经过长期使用后,反而会固化在人们的心里,成为人自我突破的障碍。