《模型思维》——斯科特·佩奇

联想

1、迈克尔指出任何值得做的事情都必定会招致质疑

真理掌握在少数人手里。一个健身的女孩杨洋她教练说：“当你被所有人都理解的时候你得普通成什么样”

2、模型是用数学公式和图表展现的形式化结构，它能够帮助我们理解世界

跟中学时代的数学模型、物理模型应该就是一样的，至少本质是相近的

3、多模型方法背后的原理基于这样一个古老的思想，那就是“管中窥豹需多管齐下”

梁启超说每次从一个问题一个角度去看书，下次再从另一个角度去看。横看成岭侧成峰，远近高低各不同

4、友谊悖论：如果网络中任何两个节点的度不同，那么平均而言，节点的度会低于其相邻节点。平均而言，人们的朋友比他们自己更受欢迎

《人类网络：社会位置决定命运》也有类似的阐述。乔吉拉德说每个客户背后都有250个关系亲密的人

5、我们先来考虑一下这个管理名言：重要的事情先做。它说的是，在面对多项任务时，你应该首先完成最重要的那项任务。这个原则有时也被称为“大石头优先”原则，意思是当你要将一些大小不一的石头装入一只桶中时，你应该先装入大石头，如果你先放入小石头，那么大石头就放不下了

《如何掌控自己的时间和生活》中也着重强调先做最该做的A1重要事件。也比较符合接近28法则

6、虽然增加模型可以提高准确性（根据多样性预测定理，必定会是这样），但是在已经拥有了一定数量的模型之后再继续增加模型，每个模型的边际贡献就会下降

过度学习到150%，再过度效果就会下降

7、群体的智慧：任何多样性的模型（或人）的集合将比其普通成员的预测更加准确

三个臭皮匠顶个诸葛亮。头脑风暴是公司集思广益非常好的方式。本因坊秀哉棋力应该赢不了吴清源，但是他随时打卦和门人一起研究对付吴清源，最后集体的智慧赢了吴清源

8、体重稍稍超标的人寿命更长

在一定范围内身高稍微偏矮一点其实会更长寿

主题体会

要把事情做好必须具备模型思维、而且要在合理的范围内具备多个有效的模型思维。模型思维不仅需要数学能力，更需要创造力。但是所有的模型又都是错误的。书中提到的模型有些就像中学时代的数学物理公式，我的理解是凝练出最本质的东西。从书中说要有模型思维但所有的模型又都是错的，我其实并不是特别理解这个，但从这一看似矛盾的观点让我想到看问题要尽量正反两面都想想，就像太极图一样，物极必反。

疑问

1、他曾在模型思维课程里讲过一个观点：在离散状态马尔科夫（数学模型）过程中，如果把人生看成努力和不努力两个状态，只要状态转移矩阵确定了，长期来看，在每个状态下所停留的时间比例也就都确定了

2、要想成为一个有智慧的人，你必须拥有多个模型。而且，你必须将你的经验，无论是间接的，还是直接的，都放到构成这些模型的网格上。

查理·芒格

查理芒格又说过他这辈子见过的聪明人没有一个不是每天都阅读的，那可以认为阅读是有利于构建模型思维的吗？

3、多模型思维能够通过一系列不同的逻辑框架“生成”智慧。不同的模型可以将不同的力量分别突显出来，它们提供的见解和含义相互重叠并交织在一起。利用多模型框架，我们就能实现对世界丰富且细致入微的理解。

4、多模型思维的成功取决于一定程度的可分离性

5、虽然，能够推导出的东西取决于我们的假设，但是我们通过模型发现的绝不仅仅是重言式。因为我们很少能仅凭检验推断出假设的全部影响，我们需要形式逻辑。逻辑还可以揭示不可能性和可能性。利用模型进行推理，我们可以得到精确的，甚至是令人出乎意料的关系。我们可以发现自身直觉的制约性

5、阿罗要求集体排序是单调的（如果每个人都将A排在B之前，那么集体排序也是如此）、独立于无关的备选项（在其他备选项的排名发生了变化的情况下，如果任何人对A和B的相对排名都没有发生变化，那么A和B在集体排名中的顺序也不会改变），且是非独裁的（没有任何一个人能够决定集体排序）

6、在向网络中添加节点的同时，是可以减少连接所有节点所需边的总边长的

7、基于模型的解释必须包括正式的假设和明确的因果链条，而且这些假设和因果链条都要面对数据

8、模型还可以通过提供框架来帮助设计，因为只有在适当的框架内我们才可以考虑不同选择的含义

9、人们所犯的错误是否能够相互抵消，取决于具体情境

10、在非策略性行为的环境中，学习机制一般能发挥作用，人们能够学习最好的行动。我们还将证明，在策略性的博弈环境中，则“世事难料”

11、偏好要与效用函数一致，就必须满足完备性、传递性、独立性和连续性。完备性要求对所有备选方案定义偏好排序。传递性排除了偏好循环，也就是说，如果有人偏好A甚于B，偏好B甚于C，那么他必定偏好A甚于C。换句话说，如果一个人在苹果与香蕉之间更喜欢苹果，在香蕉与奶酪之间更喜欢香蕉，那么他在苹果与奶酪之间必定更喜欢苹果。这个条件排除了不一致的偏好。

独立性要求人们分别评估彩票的结果

12、当我们的模型只能产生效率低下甚至糟糕的宏观结果时，就会产生张力，爱尔法鲁模型就是这种情况。在爱尔法鲁模型中，一个共同的固定规则可能会导致完全无效率的周期性结果：这个星期爱尔法鲁酒吧是过度拥挤的，而下个星期却空无一人

应用

参考中学时代的数学模型、物理模型，接触一个新事物前先尝试构建个模型去解决它，做完后验证反思其模型有效性，如果构建不出来就先做做完再反思总结或者做前参考做过且做的很好的人的做法。我觉得模型思维只是个名称，最重要的是做一件事能从中总结出这件事的本质是什么，真正去理解了本质才有可能能触类旁通，模型思维只是个工具，而且书中强调过所有模型都是错的

新知识观点

1、具备模型思维的人更优秀

2、拥有多个模型能避免每个模型本身所固有的局限性（消除每个单个模型的盲点）

3、没有模型就会受到各种认知偏差的影响：会对近期发生的事件赋予过高的权重、会根据“合理程度”分配概率、会忽略各种基本比率。没有模型，处理数据的能力就会受到极大的限制。有了模型就能澄清相关假设且更有逻辑地进行思考，还可利用大数据来拟合、校准、检验因果关系与相关性。

4、所有模型都有三个共同特征：

①它们都要简化，剥离不必要的细节，抽象掉若干现实世界中的因素，或者需要从头重新创造。

②它们都是形式化的，要给出精确的定义。

③所有模型都是错误的

5、我们需要同时利用多个模型才能理解复杂系统

6、一方面，我们需要模型来连贯地思考。另一方面，任何只具有少数几个活动部件的单个模型都无法解释高维度的复杂现象

7、数据是缺乏意义、组织或结构的

8、柏拉图将知识定义为合理的真实信念。更现代的定义是对相关关系、因果关系和逻辑关系的理解

9、层次结构的基础是智慧（指识别和应用相关知识的能力）、需要多模型思维。智慧体现在懂得如何选出最优模型，智慧可通过求出各种模型的平均结果来实现。行动时有智慧的人都会应用多个模型，他们使用模型来排除某些行为、选择某些行为。有智慧的个人和团队会有意让模型之间相互“对话”，探索不同模型之间的重叠和差异。

智慧包括选择正确的知识或模型

10、构建模型方法：

①具身法：建模包括重要部分，同时对于不必要的维度和属性，要么剥离，要么将它们整合在一起考虑。

②类比法：可对现实进行类比与抽象。

③另类现实法：有意不去表征、不去刻画现实。

11、模型的7大用途：

推理：识别条件并推断逻辑含义。

解释：为经验现象提供（可检验的）解释。

设计：选择制度、政策和规则的特征。

沟通：将知识与理解联系起来。

行动：指导政策选择和战略行动。

预测：对未来和未知现象进行数值和分类预测。

探索：分析探索可能性和假说。

12、构模时先确定最重要的行为人、实体及相关特征。后描述这些组成部分如何互动和聚合，能推导出一些东西，并说明原因何在

13、辛普森悖论：每个亚种群中的女性人口比例大于男性，但在整个种群中却是男性人口的比例更高

14、帕隆多悖论：两个没有胜算的赌局，当交替轮流进行时，是有可能带来正的预期回报的

15、玻意耳定律：pV=k

16、大多数社会现象都不具备这三种性质：社会行动者是异质性的、互动是在小群体内展开的、行为人也不遵守固定的规则。（社会现象要比物理现象更加难以预测）

17、成功的拍卖制度设计必须符合这样一些要求：不会受策略性操纵的影响、能够产生有效率的结果，同时又容易被拍卖参与者所理解

18、启蒙时代显著的经济增长在很大程度上取决于知识的可传播性（知识通常表现为模型形式）

19、在最重要的行动中，决策者要使用多个复杂的模型，模型与数据紧密相关

20、选择取决于用途：在预测时，我们经常需要大模型；而在解释时，小模型则更好一些

21、多模型思维可能需要学习非常多的模型

22、在新的领域应用模型对创造力、开放性和怀疑精神的要求也非常高。我们必须认识到，并非每个模型都适合每项任务。如果一个模型无法解释、预测或帮助我们推理，那就必须将它放到一边，考虑其他模型

23、通过构建多个模型并使用多数规则，将比只使用其中一个模型更加准确

24、孔多塞陪审团定理：多数投票正确的概率比任何人（模型）都更高；当人数（模型数）变得足够大时，多数投票的准确率将接近100%

25、多样性预测定理

多模型误差=平均模型误差-模型预测的多样性

26、

27、多样性预测定理则意味着，如果能够构建一组多样的中等准确性的预测模型，我们就可以将多模型误差减少为接近于零

28、对象构成了数据，将对象分为不同类别就能创造出信息，而将估值分配给各个类别则需要知识

29、数据的维数限定了可以创建的模型数量，最多可以有7个模型

30、如果能构建出多个多样性的、准确的模型，我们就可以做出准确的预测和估值，并选择正确的行动

31、粒度问题：在怎样的精细程度上划分数据

32、拥有的数据越多，模型就越精细

33、该模型的R2：一个模型中能够解释的变差比例

34、创造过多的类别会导致对数据的过度拟合，而过度拟合会破坏对未来事件的预测

35、分类误差：在每个类别中，家庭的均值可能会略有不同

36、构建的类别越大，分类误差就越大，因为类别越大，我们就越可能将具有不同均值的家庭集中到同一个类别中

37、估值误差：因估计均值错误而出现的误差

38、模型偏差：增加类别的数量能够通过将具有不同均值的家庭归入同一个类别减少分类误差

39、均值方差的增加：构建更多类别则会增加对每个类别均值估计的误差

40、模型误差分解定理

偏差-方差权衡

模型误差=分类误差+估值误差

41、

42、成功的一对多思维取决于创造性地调整假设和构建新的类比，以便将为某个特定目的而开发的模型应用到新的领域

43、理性行为者模型是起到“黄金标准”的作用，还是“稻草人”的作用，抑或是介于这两者之间，都取决于模型的目的

44、构建与人相关的模型时，一个主要的挑战是如何准确评估他们的目标和目的

45、人们愿意生活在一个“融合”的社区中，但如果与自己同一种族的人在社区中的比例低于10%，人们就选择离开。

46、对人建模的最后一个挑战来自人的主体性：我们有采取行动的能力，改变行为的能力以及学习的能力

47、人们采取的学习方式因环境而异。为了搞清楚自己需要学习多少个小时才能在考试中取得好成绩，或者自己需要每个星期锻炼多少次才能保持好身材时，人们可以根据个人经历或通过内省来学习

48、理性行为者模型

行为者个体的偏好由在一组可能的行为上定义的数学形式的效用函数或收益函数来表示。行为个体选择函数值最大化的行动。在博弈中，这种选择可能需要相信其他博弈参与者的行为

49、使用效用函数能使模型成为可分析、可检验且易于处理的。我们可以用数据估计函数，可以推导出最优行为，还可以通过更改参数值来提出各种各样“如果……将会怎样”的问题

50、选择理性行为者模型的理由

“似乎”：基于智能规则做出的行为可能与最优或近似最优行为无法区分。

学习：在重复的情况下，人们应该能够接近最优行为。

大的“赌注”：在重大决策中，人们会收集信息并认真思考。

唯一性：最优行为通常是唯一的，从而使模型成为可检验的。

一致性：最优行为创建一致的模型。如果人们学会了利用这样的模型，就不会改变自己的行为。

基准：最优行为提供了一个基准，作为人们认知能力的上限

51、人在决策时会受到各种各样的偏差（包括现状偏差）的影响

52、快速、直观的基于规则的思考（快思考）和深思熟虑（慢思考）。快思考更容易受到上述各种偏差的影响。从长远来看，我们可以从大脑的结构中推断出一些行为模型，但是一定要记住，大脑具有巨大的可塑性。能够通过慢思考来克服各种偏差

53、在尝试构建更符合现实的模型时，我们必须牢记易处理性这个原则

54、损失厌恶：面对收益时，人们表现为风险厌恶，面对损失时，人们却表现为风险偏好

55、双曲贴现意味着，人们对近期的贴现更强

56、根据对模型用途的设想，我们可以选择假设损失厌恶和双曲贴现，只要这些假设似乎更能匹配大多数人的行为

57、在基于最优化的模型中，对偏好或收益的假设是最基本的；而在基于规则的模型中，对行为的假设才是最基本的

58、行为规则既可以是固定的，也可以是适应性的。固定规则意味着始终适用相同的算法。

59、市场中一个常见的固定规则是零智能规则：接受任何能够带来更高收益的报价。这个规则意味着永远不会采取愚蠢的（即减少效用的）行动

60、爱尔法鲁模型：适应性规则

有100个人，每个人每个星期都要独立地决定是否前往爱尔法鲁酒吧。如果决定前往，且只有60个人或更少的人到场，那么这个人的收益为1，否则收益为-1，决定不前往爱尔法鲁酒吧的人收益为0。

每个人都有一套规则来决定是否参加。这些规则可以是固定的，也可以依最近一段时间以来的参加人数而定。每个星期，每个人都要按照遵循他的规则集合中曾产生过最高收益的规则行事

61、为了达到均衡，我们并不需要假设最优化行为。人们可以通过遵循简单的规则来产生均衡；在这种均衡中，任何人都无法通过改变自己的行为来让自己受益

62、最优行为可能是一种不切实际的假设，特别是在复杂情况下。另一方面，如果一个系统产生了稳定的结果，而且某个人可以采取更好的行动，那么这个人很可能会找到这种更好的选择

63、卢卡斯批判

政策或环境的变化可能引起受影响者的行为反应。因此，使用过去的行为数据估计的模型将不准确。模型必须考虑到人们对政策和环境变化做出反应这一事实

64、中心极限定理

只要各随机变量是相互独立的，每个随机变量的方差都是有限的，且没有任何一小部分随机变量贡献了大部分变差，那N≥20个随机变量的和就近似一个正态分布。

中心极限定理一个非常重要的特征是，随机变量本身不一定是正态分布的。它们可以有任何分布，只要每一个随机变量都具有有限的方差，并且它们中的任何一小部分随机变量都不贡献大部分方差

65、多重效应会导致更大的不平等

66、所有正态分布的图形看上去都是相似的，大约68%的结果在均值的一个标准差内，大约95%的结果在两个标准差内，并且超过99%的结果在三个标准差内

67、平方根法则（The square root rules）

N个相互独立的随机变量，都具有标准差σ，对这些随机变量的值的标准差σμ和对这些随机变量总和的标准差σΣ，分别由以下公式给出：4

[插图]

均值的标准差公式表明，大的总体的标准差要比小的总体的标准差低得多。由此可以推断，在小的群体中应该会观察到更多的好事和更多的坏事

68、产生幂律分布要求非独立性，通常以正反馈的形式出现

69、幂律分布

一个定义在区间［xmin，∞）上幂律分布5可以写成如下形式：

P(x)=Cx-a

其中，指数a>1决定了尾部的长度，同时常数项[插图]确保总概率的分布。

幂律中指数的大小决定了大事件的可能性和大小。当指数等于2时，事件的概率与其大小的平方成比例。大小为100的事件，发生的概率与[插图]（或一万分之一）成比例。当指数增加到3时，该事件的概率与[插图]成比例。对于2或更小的指数，幂律分布缺乏一个可明确定义的均值。例如，从指数为1.5的幂律分布中抽取出来的数据均值永远不会收敛。换句话说，它会无限地增加

70、齐普夫定律

对于指数为2的幂律分布（a=2）：事件等级×事件大小=常数

71、优先连接模型

一连串物体（人）一个接一个地到达。第一个到达者创建一个实体。后续每次有人到达时都应用以下规则：在概率p（较小）的情况下，新到达者创造一个新的实体；在概率（1-p）的情况下，新到达者加入现有的某个实体。加入某个特定实体的概率等于该实体的大小除以到目前为止所有到达者的数量

72、自组织临界模型，它通过在系统中建立相互依赖关系的过程产生幂律分布，直到系统达到临界状态为止

73、森林火灾模型

“森林”最初只是一个空的N×N网格。每个周期在网格上随机选择一个格点。如果该格点为空，那么就以概率g在那里种上一棵树。如果该格点上已经有树，那么闪电会以概率（1-g）击中该格点。如果该格点有一棵树，那么树会着火，火势会蔓延到所有连接到该格点的有树的格点

74、长尾分布的三个含义，即它们对公平、灾难和波动性的影响

75、社会效应会创造更大的赢家

76、如果组成幂律分布的实体规模出现了波动，那么幂律的指数就可以作为衡量系统层面波动性的一个代表。由此可以推断，企业规模的分布应该会影响市场波动性

77、长尾分布是由于反馈和相互依赖性而产生的

78、机会的增加可以创造风险激励

79、线性模型

在线性模型中，自变量x的变化，会导致因变量y的线性变化，用如下方程表示：

y=mx+b

其中，m等于直线的斜率，b等于截距，即当自变量等于0时的因变量值

线性回归模型的目标是找到能够最小化到各数据点的直线

线性回归可以告诉我们关于自变量系数的如下内容：

符号：自变量与因变量之间的正相关或负相关。

显著性（p值）：系数上非零符号的概率。

大小：对自变量系数的最佳估计

80、实力-运气方程

成功=a×实力+（1-a）×运气

其中，a位于区间［0，1］上，是技能的相对权重

81、如果不同的参赛者之间实力差异很小，那么运气就会在很大程度上决定谁输谁赢。我们可以预期，在竞争最激烈的比赛中，比如奥运会，进入决赛的选手之间的实力差异很小，因而运气就非常重要了。莫布森把这种情况称为“实力悖论”

82、大系数与新现实

线性回归揭示了自变量与我们感兴趣的（因）变量之间的相关程度。如果这种相关是因果关系，那么具有大系数变量的变化就会产生很大的影响。基于大系数的政策在保证能够带来改进的同时，排除了涉及更多根本性变化的新现实

83、指数增长模型

时间t的资源值Vt，其初始值为V0，且以速率R增长，可以写成如下方程：

Vt=V0（1+R）t

84、72法则

如果一个变量在每个周期内以R（增长率小于15%）的百分比增长，那么下面提供了一个很好的近似：

[插图]

72法则量化了最高增长率的累积效应

85、具有正斜率的凸函数会以递增的值增加，具有负斜率的凸函数就会变得不那么陡峭，也就是说，最初具有较大负斜率的凸函数将逐渐走平

86、所有有机物都包含两种形式的碳：不稳定的同位素碳-14，以及稳定的同位素碳-12

87、通过测量碳-14与碳-12的比例，就可以估计化石或人工制品的“年龄”，这种技术被称为放射性碳年代测定法

88、半衰期模型

如果每H周期，剩余数量的一半会衰减，那么在t周期后，剩余的比例为：

[插图]

半衰期模型的一个新应用是在心理学中。早期的心理学研究表明，人们几乎以接近固定不变的速度忘记信息。人们记忆的半衰期取决于事件的显著性

89、凹函数与凸函数相反。凹函数的斜率是递减的。具有正斜率的凹函数会呈现收益递减的特点：当我们拥有的东西越来越多的时候，每个额外东西所能带来的价值会越来越少

90、柯布-道格拉斯模型

给定L个工人和K个单位资本，总产出如下所示：

产出=常数×LaK（1-a）

其中a是介于0到1之间的实数，表示劳动力的相对重要性。

91、简单增长模型

产出函数：[插图]

投资规则：I（t）=s×O（t）

消费-投资方程：O（t）= C（t）+I（t）

投资-折旧方程：M（t+1）= M（t）+I（t）-d×M（t）

其中，O（t）=产出，M（t）=机器，I（t）=投资，C（t）=消费，s=储蓄率，d=折旧率

92、索洛*增长模型

经济体中的总产出由以下方程给出：

[插图]

其中，L表示劳动量，K表示实物资本量，A表示技术水平。长期均衡产出O*由下面的方程给出：13

[插图]

长期均衡产出随劳动力数量的增加、技术的进步、储蓄率的提高而增加，同时随折旧率的上升而下降

93、创新有两个效应。首先，创新直接增加产出；其次，创新间接导致更多的资本投资，从而导致产出再次增加。因此，创新是持续增长的关键

94、减少攫取和腐败以及促进创新，都能推进经济增长

95、一旦包括了非线性，直觉就变得不够用了

96、我们定义了度量价值和权力的两个标准。第一个标准是“最后上车者价值”（last-on-the-bus value，简称LOTB），它等于一位行动者在团队已经形成的情况下加入团队时的边际贡献。第二个标准是夏普利值（Shapley value），它等于行动者遍历所有可能的加入团队的序列，加入团队时的边际贡献平均值

夏普利值

给定合作博弈{N，V}，夏普利值的定义如下：

N个博弈参与者加入联盟的次序有N！个，让O代表这所有N！个次序。对于O中的每一个次序，将博弈参与者i增加的价值定义为当博弈参与者i加入时价值函数发生的变化。博弈参与者i的夏普利值等于他在O中所有次序上增加价值的平均值

97、合作博弈

合作博弈由N个博弈参与者和一个价值函数组成。这个价值函数为任何子集S⊆N分配一个值V（S）赋值。这些子集称为联盟。没有博弈参与者组成的联盟的价值等于零，即[插图]。所有N个博弈参与者的价值V（N）等于博弈的总价值

98、夏普利值的公理基础

夏普利值唯一满足以下公理：

零性：如果博弈参与者为任何联盟增加的价值都等于零，那么该博弈参与者的价值等于零。

公平性／对称性：如果两个博弈参与者对任何联盟都具有相同的增加价值，那么这两个博弈参与者具有相同的价值。

完全分配性：博弈参与者价值的总和等于博弈的总价值V（N）。

可加性：给定两个定义在相同博弈参与者集合之上的博弈，它们的价值函数分别为V和[插图]，那么在博弈（V+[插图]）中，一个博弈参与者的价值等于该博弈参与者在V和[插图]的价值的总和

99、一个政党控制的席位百分比与它实际拥有的权力之间可能存在着脱节

100、网络由节点以及连接节点的边（edge）组成。由边连接起来的节点互为邻居。如果沿着边，可以从任何一个节点到达任何其他节点，就将这样的网络称为连接的网络

101、网络统计量

度：节点的邻居数（即边数）。

路径长度：从一个节点到另一个节点必须遍历的最小边数。

介数：经过某个节点连接两个其他节点的最短路径数量。

聚类系数：一个节点的邻居对当中，同样也由一条边连接的邻居对所占的百分比

102、随机网络的蒙特·卡罗方法[插图]

为了检验一个具有N个节点和E条边的网络是不是随机网络，可以创建大量具有N个节点和E条边的随机网络，并计算出度、路径长度、聚类系数和介数的分布。然后，执行标准的统计检验，以确定接受还是拒绝那个网络的统计数据可能抽取自该模拟分布的假设。

103、质量和度的网络形成模型

创建d个互不连接的节点。在每周期t中创建一个质量为Qt的、从分布F中抽取出来的新节点。根据其他d个节点的度将这个新节点连接到那些节点上。用Dit表示在时间t时节点i的度，那么给定N个节点时选择节点i的概率等于：

[插图]

104、大多数人之间用不着6度就可以连接起来了

六度分隔

假设每个节点有100个“圈内好友”（C），他们彼此都是朋友；以及20个随机朋友（R），他们没有与节点共同的朋友。

一度：C+R=120

二度：CR+RC+RR=2000+2000+400=4400

三度：CRC+CRR+RCR+RRC+RRR=328000

四度13：17360000

五度：>10亿

六度：>200亿

105、网络最重要的性质是，它在受到冲击时是不是仍然能保持连接

106、缺乏局部聚类的稀疏网络更容易出现故障

107、互联网的度分布意味着，绝大多数节点的连接很少，因此即便它们发生了故障，网络也能保持连接

108、SIR模型

[插图]

其中，Precover，Pspread，和Precover分别等于传染病的传播概率、接触概率和痊愈概率

SIR模型会产生一个临界点，在临界点上，产品或传染病性质的微小变化，就意味着失败与成功之间巨大分野

109、广播模型

It+1=It+Pbroad×St

其中，Pbroad表示广播概率，It和St分别等于时间t上的感染者（知情者）和易感者的数字

初始状态为I0=0，且S0=NPOP。

110、扩散概率（diffusion probability）定义为接触概率（contact probability）和分享概率（sharing probability）的乘积

111、扩散模型

[插图]

其中，Pdiffuse=Pspread×Pcontact

112、巴斯模型

[插图]

其中，Pbroad=广播概率，Pdiffuse=扩散概率

113、熵是对不确定性的一个正式测度。利用熵，我们可以证明不确定性、信息内容与惊喜之间的等价性。低熵对应于低不确定性，同时揭示的信息很少。熵在数学上等于概率与它们的对数之和的相反数

114、信息熵

给定一个概率分布（p1，p2，…pN），信息熵，H2等于：

[插图]

注：上面的下标2表示使用的是以2为底的对数

115、公理基础：熵

[插图]，其中，a>0。

这种熵测度是唯一满足以下四个公理的测度：

对称性：对于任何转置概率，都有连续函数[插图]。

最大化：对于所有N，[插图]处最大化。

零性：H（1，0，0，…0）=0。

可分解性：如果[插图]

[插图]其中，[插图]

116、最大熵分布

均匀分布：给定范围［a，b］，使熵最大化。

指数分布：给定均值μ，使熵最大化。

正态分布：给定均值μ和方差σ2，使熵最大化

117、伯努利瓮模型

每一次，从一个装了G个灰球和W个白球的瓮中随机抽取一个球，结果等于抽取出来的球的颜色。在下一次抽取之前，球要先放回瓮中。令[插图]表示灰球的比例。在抽取N次的情况下，可以计算出抽取出来的灰球的期望数量NG，及其标准差[插图]

118、简单随机游走模型

Vt+1=Vt+R（-1，1）

其中，Vt表示时间t上的随机游走值，V0=0，R（-1，1）是一个可能等于-1或1的随机变量。在任何时间段内，这个随机游走的期望值都等于零，且标准差为[插图]，其中的t等于周期数

119、结果路径依赖是指每一周期的结果都取决于先前的结果

120、波利亚过程

一只瓮里面装着一个白球和一个灰球。每一周期，都随机抽取出一个球并将这个球与和它颜色相同的另一个球一起放回到瓮中。抽取出来的球的颜色表示结果

121、均衡过程

一个瓮包含一个白球和一个灰球。每一周期都随机抽取出一个球，并将与抽取出来的球颜色相反的球与抽取出来的那个球一起放回到瓮中。球的颜色表示结果

122、风险价值（value at risk，VaR）衡量的是在某个特定时间段内损失特定金额的概率

123、局部多数模型

二维方格上的每个单元都处于两种状态之一：开或关。每个单元有8个邻居。2在每个周期中，随机选择一个元胞。3当且仅当其中它的5个或更多邻居处于另一个状态时，这个元胞才会改变自己的状态

124、纯粹协调博弈

在纯粹协调博弈（pure coordination games）中，每个博弈参与者都要在两个行动A或B中选择一个。如果两个博弈参与者都选择了相同的行动，那么每个博弈参与者的收益为1。如果两个人各自选择了不同的行动，那么每个人的收益都为零。

[插图]

一个纯粹协调博弈有两个有效的均衡：两个博弈参与者选择A或者两个博弈参与者选择B。它还有一个无效的均衡，也就是每个博弈参与者都在A和B之间进行随机选择。我们可以从纯粹协调博弈的角度重新解释局部多数模型：在这个博弈中，每个元胞都是一个博弈参与者，它必须选择一个共同行动来对抗它的8个邻居。如果博弈参与者只有在随机激活时才能改变行动，那么某个博弈参与者就可以通过选择与它的大多数邻居所选择的行动相匹配的行动来增加自己的收益。这种策略被称为短视最优响应（myopic best response），因为它没有考虑到邻居可能的未来行为。

一个博弈参与者有5个邻居选择了B，那么这个博弈参与者可以通过从A切换到B来在短期内增加自己的收益，但是，如果这个博弈参与者和邻居是被其他选择A的博弈参与者的“海洋”所包围的一个孤岛，那么这个博弈参与者保持A不变反而可能获得更高的期望收益。最关键的一点是，局部多数模型中的行为规则虽然只是一个假设的规则，但却可以植根于博弈论模型中

125、协调的悖论

如果人们是在局部进行协调的，那么从全局的角度来看，整体配置将会是斑块状的、多样性的

126、当技术和城市化使人与人之间的联系更加紧密之后，协调的力量可以产生更大的同质性行为和信念

127、生命游戏

方格上的每个元胞都或者是活的（开的）或者是死的（关的）。每个元胞的邻居由网格上的8个相邻元胞组成。元胞根据如下两个规则同步更新自己的状态：

活的规则：对于一个死元胞，当恰好有三个活的邻居时，这个死元胞就会变活。

死的规则：对一个活元胞，当活的邻居小于两个时或当有三个以上的活邻居死去时，这个活元胞就会死去

128、一个离散动态系统（discrete dynamical system）由可能的配置空间，以及一个转移规则（transition rule）组成。我们可以把配置空间视为世界的多维状态，例如生命游戏中的活元胞和死元胞的初始集合，而转移规则则是将时间t时的配置映射到时间t+1时的配置上。

一个李雅普诺夫函数是从配置到实数的一个映射，它满足两个假设：第一，如果转移函数不处于均衡状态，则李雅普诺夫函数的值就会减少某个固定的数量（对此，稍后会给出更多的解释）；第二，李雅普诺夫函数具有最小值。如果这两个假设成立，那么该动态系统必定达到均衡。

李雅普诺夫函数

给定一个离散时间动态系统，它的转移规则由xt+1=G（xt）组成。对于实值函数F（xt），如果对于所有的xt，都有F（xt）≥M，而且存在一个A>0，那么下式成立，这个实值函数F（xt）是李雅普诺夫函数：

F（xt+1）≤F（xt）-A，如果G（xt）≠xt

如果对于G，F是一个李雅普诺夫函数，那么从任何x0开始，必定存在一个t*，使G（xt*）=xt*，即该系统会在有限时间内达到均衡。

首先为逐底竞争博弈构建一个李雅普诺夫函数。这个函数刻画了该博弈的博弈参与者的策略环境，以便每一个博弈者都更愿意提供恰好低于平均水平的水平。

逐底竞争博弈

有N个博弈参与者，每个博弈参与者在每个时期都要提出一个支持水平，其取值范围为{0，1，…，100}。提出了最接近平均支持水平2/3的博弈参与者可以获得那个期间的奖励

129、一个离散动态系统（discrete dynamical system）由可能的配置空间，以及一个转移规则（transition rule）组成。我们可以把配置空间视为世界的多维状态，例如生命游戏中的活元胞和死元胞的初始集合，而转移规则则是将时间t时的配置映射到时间t+1时的配置上。

李雅普诺夫函数

F（xt+1）≤F（xt）-A，如果G（xt）≠xt

如果对于G，F是一个李雅普诺夫函数，那么从任何x0开始，必定存在一个t*，使G（xt*）=xt*，即该系统会在有限时间内达到均衡。

逐底竞争博弈

130、一个离散动态系统（discrete dynamical system）由可能的配置空间，以及一个转移规则（transition rule）组成。我们可以把配置空间视为世界的多维状态，例如生命游戏中的活元胞和死元胞的初始集合，而转移规则则是将时间t时的配置映射到时间t+1时的配置上。

李雅普诺夫函数

F（xt+1）≤F（xt）-A，如果G（xt）≠xt

如果对于G，F是一个李雅普诺夫函数，那么从任何x0开始，必定存在一个t*，使G（xt*）=xt*，即该系统会在有限时间内达到均衡。

逐底竞争博弈

131、自组织活动模型

一个城市里，有A种活动可以参加，每一天都由L个时间段组成。在人口规模为M的城市中，每个人都要选定一个日程安排。在这里，日程安排是指这个人在L个时间段内分配L种活动（从一个更大的K种可能性的集合中）。一个人要面对的拥挤水平则设定为等于同时选择同一种活动的其他人的数量

132、纯交换经济由一个消费者集合组成，每个消费者都有自己的商品禀赋和偏好

133、取一半或乘三加一法则”（HOTPO），它也被称为考拉兹猜想

134、在马尔可夫模型中，状态之间转移发生的概率是固定的

135、在统计均衡中，单个实体可以继续在各种状态之间移动，但是各种状态之间的概率分布仍然是固定的

136、首先，马尔可夫模型允许结果是路径依赖的，接下来会发生的事情将取决于当前的状态。其次，马尔可夫模型还允许对历史记录进行长期建模，但对于这种情况，模型的某个假设必定会被违背

137、佩龙-弗罗宾尼斯定理（Perron-Frobenius Theorem）

一个马尔可夫模型必定收敛于一个唯一的统计均衡，只要它满足如下四个条件：

状态集有限：S={1，2，…，K}。

固定转换规则：状态之间的转移概率是固定的，即在每个周期中，从状态A转换为状态B的概率总是等于P（A，B）。

遍历性（状态可达性）：系统可以通过一系列转换从任何状态到达任何其他状态。

非循环性：系统不会通过一系列状态产生确定的循环。

138、销量-耐久性悖论

销量-耐久性悖论（sales-durability paradox）说的是，产品或创意的流行程度与其说取决于它们的相对销量，不如说取决于它们的耐久性。只需要将拥有某种类型商品的人的比例设定为状态，就可以用马尔可夫模型来解释这个悖论。在这里我们考虑两种不同的地板，一种是瓷砖（耐用品），另一种是油毡（销量更大的商品）。当销量更大的商品（在这里这个例子中是油毡）不那么占主流时，就会产生这种悖论。

在我们的模型中，假设油毡的销量是瓷砖的3倍。为了刻画耐久性差异，假设每年有1/10的人必须更换他们的油毡地板，而需要更换瓷砖的人则只有1/60。在由此而得到的马尔可夫模型的均衡中，有2/3的地板都是用瓷砖铺就的。4

销量-耐久性悖论背后的逻辑，也可以用来解释市场份额与品牌忠诚度（某人改用其他品牌的产品的可能性）之间的正相关关系。在马尔可夫模型中，更低的品牌忠诚度在均衡状态时必然意味着更低的市场份额，因为忠诚度所起的作用就像耐久性一样。这种经验规律有时也被称为“祸不单行法则”（double jeopardy law）。如果一个企业的产品的品牌忠诚度较低，那么其销售量往往也较低

139、马尔可夫决策模型

马尔可夫决策模型（Markov decision model）是对马尔可夫模型的一种修正，方法是将行动包括进来，行动会带来回报，而回报则以状态为条件，还会影响状态之间的转移概率。考虑到行动对转移概率的影响，最优行动并不一定是能够最大化即时回报的那个行动

140、任何一个系统动力学模型都由源、汇、存量和流量组成。源产生存量；存量是某个变量的数量或水平；流量描述了存量水平的变化；汇能够捕获来自存量的流量输出；汇和源是不包含在模型中的过程的“占位符”；存量水平会根据源和流量随时间推移而变化

141、洛特卡-沃尔泰拉方程

假设一个生态系统由H只野兔和F只狐狸构成。野兔的数量以g的速度增长，狐狸的数量则以d的速度减少。当野兔和狐狸相遇时，野兔以a的速度死亡，狐狸以b的速度增长。根据这些假设，可以给出如下微分方程组：3

[插图]

从这个微分方程组可以推导出两个均衡，一个是灭绝均衡，即F=H=0；一个是内点均衡，即[插图]和[插图]给出

142、WORLD3模型包括了在一个共同的框架内以不同速度增长的多个彼此互动的过程，因而利用它，决策者能够看到各种各样的相互依赖关系。这个模型包含了大约150个变量、300个方程和500个参数，生育率、经济增长率和土地使用率等无不包括在内

143、骚乱模型

假设有N个人（用i来索引），每一个人都有一个“骚乱阈值”（riot threshold），不妨记为T（i）∈{0，1，…，N}。在一开始，骚乱总产值为零，即T（i）=0的那些人都会参加骚乱。令R（t）等于在时间t参加骚乱的人的数量。在时间t上，如果T（i）<R（t-1），那么第i个人就会参加骚乱

144、骚乱模型有各种各样的变体，可以用来分析人们什么时候会起立鼓掌、人们的观点会怎样变化（例如，会不会接受同性婚姻）、时尚潮流的改变（例如，愿不愿意佩戴蝶形领结），以及市场动态演变

145、谢林派对模型

N个人参加一个派对，每个人都有一个可观察的类型A或B。每个人随机选择两个房间中的一个。在每个时刻，每个人都有p的概率走到另一个房间去。第i个人的宽容阈值为Ti。对于这个人，如果他所属的类型的人在当前房间内所有人当中所占的比例低于这个阈值，他就离开这个房间

146、谢林隔离模型

有N个人，每个人都属于类型A或类型B，随机排列在一个M×M的棋盘上。棋盘上还有部分空间未被占用。第i个人的宽容阈值为Ti。对于这个人，如果他所在方格的8个相邻方格中同一类型的人所占的百分比低于他的阈值，就会重新定位到一个随机的新方格上

147、乒乓球模型

规模为N的种群中的每一个实体随机采取一个初始行动，或者为正（+1），或者为负（-1）。系统的初始状态S0设置为零。系统的所有未来状态St则等于平均行动再加上一个随机变量，即：

[插图]

每个实体i都有一个响应阈值（response threshold）Ti>0，它从［0，RANGE］中均匀抽取出来。如果状态的绝对值大小｜St｜小于它的阈值，该实体就采取与以前相同的行动，否则，就采取减少状态绝对值大小的行动。即：

如果｜St｜≤Ti，那么Ai（t+1）=Ai（t），否则Ai（t+1）=-signSi（t）

其中，εt是从{-1，+1}中随机抽取出来的

148、正反馈强化行动，负反馈抑制行动。只有正反馈的系统会爆炸或崩溃，只有负反馈的系统将稳定或循环，同时具有正反馈和负反馈的系统则可能会产生复杂性

149、空间竞争模型

备选项包括N个空间属性：[插图]。

做出选择的个体的理想点：[插图]。

个体选择了备选项后得到的收益（效用）等于：[插图]，其中，C>0是一个常数

150、享受竞争模型

备选项包括N个效价属性（valence attribute）：[插图]。

个体用各个属性上的权重来表示：[插图]。

151、享受模型：这个模型根据商品的内在属性解释商品的价值。估值的差异取决于对商品属性的不同潜在偏好。这些属性可能是商品的物理组成部分

152、协调模型：这种模型将价格解释为社会建构的。戈雅画作的价值取决于其他人相信它真的有那么高的价值。在最初，人们对戈雅画作的价值有自己的看法。然后，他们与社会网络中的其他人互动并更新自己的看法。两个人都可以将他们的价值设定为等于两人估价的平均值，一个人可以改变他的估价以匹配另一个人给出的价值，或者每个人都可以根据其他人的估价来调整自己的估价。给定这三种假设中的任何一种，估价都可以实现局部收敛。这样，相互之间有联系的人将会具有类似的估值。分配给商品的最终价值将取决于价值的初始分布、社会网络以及配对发生的顺序

153、预测模型：这类模型将价格解释为对未来价值的预测。根据这种模型，佛罗里达州奥卡拉市的土地价值、比特币或股票价值，都取决于人们将来愿意为它们付出多少钱。这些估值取决于预测模型，而预测模型又取决于属性和类别。我们可能会将奥卡拉市归类为气候温暖的、税率很低的非沿海城市。人们的估值的变化源于不同的预测模型。投资者会使用多种预测模型。这些模型可能依赖于属性，或者，就像对比特币进行估价一样，也会对协调做出假设

154、标准式零和博弈（two-player normal-form zero-sum games）。在这种博弈中，每个博弈参与者选择一个行动，并根据博弈参与者自己的行动和另一个博弈参与者的行动获得一定收益。此外，博弈参与者双方的收益总和为零

155、博弈的纳什均衡（Nash equilibrium）是指这样一种策略，它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的

156、这种一方为另一方排除最优策略被称为迭代消除被占优策略

157、在序贯博弈中，博弈参与者按照某个特定的顺序采取行动

158、在连续行动博弈中，行动对应于努力水平。通过选择更大的努力，博弈参与者能够增大自己赢得奖励的概率。这个博弈还允许考虑任意大数量的博弈参与者

159、努力博弈

N个博弈参与者中的每一个人都要选择以货币形式表达努力水平，以赢得价值为M的奖励。一个博弈参与者赢得奖励的概率等于他的努力水平除以所有博弈参与者的总努力水平。如果令Ei表示博弈参与者i的努力水平，那么他的获胜概率由以下方程式表示：1

[插图]

均衡努力水平为：[插图]

160、同伴效应模型用博弈论来解释聚类现象，即一个人与他的朋友一起进行协调博弈。而在分类模型中，人们会“迁移”到与他们相似的其他人附近。一群优秀的学生之所以聚在一起，可能是因他们要协调完成某个共同行动（同伴效应），或者也可能是因为优秀的学生就喜欢找优秀的学生一起玩（分类效应）。如果只有数据快照（snapshot of data），那么这两者是无法区分的

161、分类模型：学生最初先会形成一些人数为4的随机小组。在具有两种类型的任何一个小组中，与至少两个其他人的类型相反的人，会与相反类型的某个人交换小组。也就是说，{H，H，H，M}会变为{H，H，H，H}，而且{M，M，M，H}会变为{M，M，M，M}；并且，任何{H，H，M，M}这种形式的小组有同样的概率成为{H，H，H，M}或{M，M，M，H}。

两个模型都与数据一致，从而导致了识别问题。只有数据快照，我们无法确定吸烟、看漫画书或喜欢滑板到底因为同伴效应导致的，还是因为分类效应导致的。在某些情况下，我们可以推断出使用哪种模型更好。例如，美国中西部地区的人们喜欢说“pop”（泡泡）、沿海地区的人们喜欢说“soda”（苏打），对于这种倾向，我们可以有把握地认为这是由同伴效应驱动的，因为很少从外地移居波士顿的人，会将可口可乐称为“苏打水”。但是，对于某些利害关系更大的行为，例如学业成绩、滥用药物、肥胖和幸福，就需要用更多的时间序列数据来识别哪种模型才适用了。利用时间序列数据，我们就可以分辨出人们到底是在改变自己的行为（同伴效应），还是在更换他们的朋友（分类效应）。在许多情况下，这两个因素都有。2

162、重复博弈维持合作

在重复囚徒困境博弈中，如果继续进行下一次博弈的概率P超过了诱惑收益T减去奖励收益R的差与诱惑支付的比，那么采用冷酷触发策略就能维持合作

163、连通性与声誉

通过声誉机制维持合作有一个条件：个体必须能够知悉自己邻居的行为偏离合作的可能性。为了评估关于这种行为偏差的信息传播出去的可能性，我们可以应用在向传染病模型中加入网络时学到的三个结果。首先，网络的度越大，关于偏离合作行为的信息传播出去的可能性就越大。其次，度分布的变化，特别是超级传播者的存在，也会增加信息传播出去的可能性。再次，如果一个人所背叛的那个受害者，与这个人的其他邻居没有任何联系，那么这个人的邻居就不会知道这个人背叛了他人。因此，要保证声誉扩散，网络必须具有很高的聚类系数，而聚类系数又是社会资本的一个衡量指标

164、冷酷触发策略是一开始选择合作，后面也一直继续合作，直到另一个博弈参与者背叛为止，然后就一直背叛。始终合作和始终背叛这两种策略与名字的含义一样：盲目地选择合作或背叛，无论其他博弈参与者的行为如何。针锋相对（或一报还一报）是指在第一次合作，然后每一次都复制另一个博弈参与者在前一次中的行为，两个人都使用针锋相对策略的博弈参与者将永远合作。欺负好人策略则剥削始终合作的博弈参与者，更具体地说，这种策略是，在前两次选择背叛，如果另一个博弈参与者在这两次都没有背叛过，那么就选择永远背叛；而如果另一个博弈参与者在前两次已经背叛过了，那么就先转而在接下来的两次选择合作，然后一直采用冷酷触发策略

165、合作行动模型

一个种群由N个人组成，他们或者是合作者，或者是背叛者，连接于一个网络中。在每一次互动中，合作者都要承担合作成本C，而其他人则可以获得合作收益B。背叛则不会产生任何成本和收益。合作优势比率B/C刻画了合作的潜在收益

166、聚类自我引导合作

如果一个空节点的邻居包括了一个合作者（其度数为D且有K个作为合作者的邻居），同时这个空节点的所有非合作者邻居都没有合作者的邻居，那么这个空节点会成为一个合作者，当且仅当合作优势比例高于与合作者数量之间的比例时

167、集体行动问题

在集体行动问题中，N个人中的每个人都要选择是搭便车（f）还是为集体行动做贡献（c）。个人的收益取决于自己的行动和合作者的总数。个人可以通过搭便车获得更高的收益，即，收益（f，C）>收益（c，C+1），但是当每个人都做出贡献时，所有人的收益总和实现最大化

168、公共物品供应问题

有N个人，每人要将自己的收入I（I>N）配置到一种公共物品（PUBLIC）和一种私人物品（PRIVATE）上，每个单位的成本为1美元。每个人都有以下形式的效用函数：

效用[插图]

社会最优配置：PUBLIC=N（如果N=100，那么每个人捐献100美元）。

均衡配置：PUBLIC=1/N（如果N=100，每个人捐献0.01美元）

169、利他主义者提供的公共物品

N人有利他主义偏好，其对总效用的权重为α：

[插图]

均衡纯粹的利他主义者（α=1）：PUBLIC=N

均衡一般解：6[插图]

实例：α=1/2：PUBLIC≈N/4

170、对于这种本地公共产品，人们可以根据自己的偏好将它们归入不同的社区。这就是所谓的蒂布特模型

171、拥塞模型

在N人中，M人选择使用一种资源。其效用可以写成如下形式：

效用（M）=B-θ×M

B表示最大收益，θ是拥塞参数。其余（N-M）人不使用这种资源，并且效用为零。9

社会最优解：[插图]，且效用[插图]

纳什均衡解：[插图]，且效用[插图]

172、当一个模型产生的结果与常识相反时，就需要对结果细加思量

173、可再生资源开采模型

令R（t）表示第t期开始时的可再生资源数量，再令C（t）表示第t期内耗用的资源的总量，g表示资源的增长率。那么，第t+1期的资源数量量由以下差分方程给出：11

R（t）=（1+g）［R（t）-C（t）］

均衡消费水平：[插图]

174、能够有效解决集体行动问题的那些社群有如下共同特点：能够就某些明确的界限达成一致、同意明确界定的规则、授权实施渐进式制裁、拥有解决纠纷的机制

175、任何一个制度都要包括两个因素：一是人们用来交流信息的渠道，二是人们用来根据所揭示的信息做出决策、重新配置资源或安排生产的程序

176、机制设计（mechanism design）的对制度进行建模的框架。这个框架强调了真实制度的如下四个方面：信息，指参与者知道些什么及应该向他们揭示什么；激励，即采取特定行动的利益和成本；集结，个人行为如何转化为集体结果；计算量，这是对参与者认知能力的要求

177、一种机制由六个部分组成：一个环境（世界的相关特征）、一个结果集、一个行动集（也称为消息空间），一个行为规则（人们根据这个规则来做出行动）、将行动映射到结果的结果函数，以及将环境映射到一组希望得到的结果的社会选择对应

178、帕累托有效

在一个结果集中，对于某个结果，如果存在每个人都喜欢的另一个备选方案，就说这个结果是帕累托占优的。相对应，所有其他结果都是帕累托有效的

179、收入等价定理

在任何拍卖中，如果竞买人从已知的共同分布中抽取独立私人价值，那么只要满足如下条件，拍卖就必定会给卖方带来同样的收入、给买方产生同样的预期收益：每个竞买人的出价都是为了最大化自己的预期收益、最高出价的竞买人总能赢得拍卖标的，同时价值为零的竞买人的预期收益为零

180、公共项目决策问题

V1，V2，…，VN表示N个人赋予一个公共项目的货币价值，并假设该公共项目的成本为C。那么当且仅当C<V1+V2+…+VN时，这个项目才会启动

181、多数投票平均分担机制

个人投票表示赞成或反对启动某个公共项目。如果多数人投票支持该项目，那么该项目启动，并且每个人都承担C/N的成本。如下面的例子所表明的，这种机制可能会违背效率条件和自愿参与原则

182、枢轴机制

个人i对一个成本为C的项目提交自己的估值[插图]。如果所有个人的值的总和超过了成本，那么就启动这个公共项目，即：

[插图]

如果[插图]，那么个人i不用交税；如若不然，个人i就要缴纳数额为[插图]的税收。这个机制是激励相容的[插图]、有效率的，而且个人行为也是符合理性。它还实现了占优策略的有效结果。但是，正如下面的例子所表明的，这个机制可能会违背预算平衡条件。

实例：（V1，V2，V3）=（60，120，150），C=300。

这个公共项目本应启动，因为300<60+120+150。个体1要缴纳的税收为30，即总成本减去其他人估值之和的结果（300-270）；个体2要缴纳的税款为90；个体3要缴纳的税款为120。由此得到的总税收为240，低于项目的成本

183、离散信号模型

一个规模为N的种群由S个强者类型的个体和W个弱者类型的个体组成；这两种类型的个体发送信号的成本分别为c和C，且c<C。种群中所有发送信号的成员平均分配B的收益（B>0）。这个模型有三种可能的结果：

混同[插图]：两种类型的个体都发送信号。

分离[插图]，且[插图]：只有“强者”类型的个体发送信号。

部分混同[插图]：“强者”类型的所有个体和“弱者”类型的部分个体发送信号

184、连续信号模型

一个规模为N的种群由S个强者类型的个体和W个弱者类型的个体组成，两种类型的个体发送信号的单位成本分别为c和C（C>c）。发送最大信号的所有个体分享利益B。任何大小为[插图]的信号都能够将强者类型分离开来。如果CW≥cN，那么所有强者类型都会分离开来。如若不然，就存在部分混同均衡，其中一部分弱者类型的个体也会发送信号

185、强化学习模型

假设一个由N个备选方案组成的集合{A，B，C，D，…，N}、与各备选方案对应的奖励的集合{π（A），π（B），π（C），π（D），…，π（N）}，以及一个严格为正的权重的集合{w（A），w（B），w（C），w（D），…，w（N）}。那么，选择备选方案K的概率如下：

[插图]

在选中了备选方案K之后，w（K）会增大γ×P（K）×（π（K）-A），其中γ>0等于调整速率（rate of adjustment），A<maxKπ（K）等于渴望水平

186、强化学习的效果

在学会选择最优备选方案模型的框架中，当渴望水平被设定为等于平均获得的奖励时，强化学习（最终）几乎总是会选择最优备选方案

187、复制者动态

假设一个由N个备选方案组成的集合{A，B，C，D，…，N}、与各备选方案对应的奖励的集合{π（A），π（B），π（C），π（D），…，π（N）}。在时间t，一个种群的行动可以用这N个备选方案上的概率分布来描述：（Pt（A），Pt（B），…，Pt（N））。且这个概率分布随如下复制者动态方程而变化：

[插图]

其中，[插图]等于第t期中的平均奖励。

188、复制者动态能够学会最优行动

在学会从一个有限的备选方案集中选择最好的备选方案的过程，无限种群复制者动态几乎总是收敛到整个种群都选择最优备选方案

189、居心险恶的人与魔法灯

在一次考古探险中，一个居心险恶的人发现了一盏青铜灯。他擦了一下灯，结果召唤出了一个精灵。精灵说：“我会赐予你一个愿望，因为我是一个仁慈的精灵。我可以给你想要的任何东西！不但如此，对于你认识的每一个人，我都将给予他们给你的两倍。”这个居心险恶的男人仔细想了一会，然后抓起了一根棍子，递给那个精灵，说：“好吧。现在请你抠出我的一只眼睛吧

190、慷慨／妒忌博弈

在这个博弈中，有N个博弈参与者，每一个博弈参与者都要选择：是慷慨（G），还是妒忌（S）。

收益（G，NG）=1+2×NG

收益（S，NG）=2+2×NG

191、文化能否压倒战略

我们现在将传染模型和学习模型结合起来，以便剖析组织理论中由来已久的一个理论观点：文化压倒战略。16简而言之，这个观点声称，改变行为的战略激励终将归于失败。理论组织家强调，文化——即现有的既定规则和信念的力量实在太强大了。经济学家的观点则相反：推动行为的，只能是激励。

为了将这些相对立的谚语式诊断转变成条件逻辑判断，我们首先必须应用网络传染模型的一个变体。在这个模型中，经理，或者也可能是CEO，宣布了一个新战略，并给出了推动变革所能带来的好处的多项证据。这位经理或CEO甚至可能会对组织的核心原则加以重新界定，以便反映这种新行为的要求。然后，组织中的其他个体决定是否采取这种行为，这取决于经理或CEO对其战略的说服力有多大。一开始，只有一部分人执行这个计划。当他们在工作网络中与他人互动时，就会热情洋溢地传播新战略。当然新战略也会面临挑战，会有一种反向的力量拉动人们不去采用新战略。有三个特征决定了新策略能否顺利展开：接触率（Pcontact）、扩散率（Pspread）和放弃率（Precover），它们很自然地映射到了基本再生数中的参数R0上，即：

[插图]

如果再加入存在超级传播者的可能性，就可以得出这样的结论：只要如下三个条件中任何一个条件成立，文化就会压倒战略，否则，战略就能压倒文化。这三个条件分别是：如果人们不相信新战略，如果人们很快就放弃了新战略，如果新战略的拥护者相互之间的连通性不够好。

我们的第二个模型是，将复制者动态方程应用于这个用来表征员工之间互动的文化战略博弈。我们可以将员工的不同选择用博弈论的语言分别表示为文化行动（做他们目前所做的事情）和创新的战略行动。我们还假设，经理或CEO已经确定了收益结构，如果两个博弈参与者都选择创新的话，他们都能获得更高的收益；但是，如果只有一个博弈参与者选择创新，那么他的收益将会减少。

[插图]

文化／战略博弈

这个博弈有两个严格的纯策略纳什均衡：一个是两个博弈参与者都创新（战略胜过了文化），另一个是两个博弈参与者都不创新（文化胜过了战略）。乍一看，经理或CEO似乎已经给出了足够大的激励，能够保证员工会选择创新的行动。但是通过分析，我们发现，经理或CEO必须动员起足够多的初始支持者才能使创新成为现实。如果一开始就支持新战略的人的比例没有超过20%，那么文化就会胜过战略。如果要增加创新战略的收益，那初始支持者的比例可能会更低，但仍然会产生有效的结果。17

这两个模型表明，字面上相反的两个谚语“文化压倒战略”和“人们会对激励做出反应”都是正确的。根据第一种模型，具有很高人格魅力的CEO可以制订能够胜过文化的新战略。根据第二种模型，文化能胜过“弱激励”，但是不能胜过“强激励”

192、伯努利多臂老虎机问题

一个备选方案集{A，B，C，D，…，N}中的每一个备选方案都能够产生一个成功的结果，但是各自的概率{PA，PB，PC，PD，…，PN}都是未知的。在每一个时期，决策者选择一个备选方案K，并以概率PK得到一个成功的结果

193、取样并择优启发式（sample-then-greedy），即先对每个备选方案都尝试固定的次数M，然后选择具有最高平均收益的备选方案。而在确定尝试次数M大小的时候，我们可以参考伯努利瓮模型和平方根规则。平均比例的标准差有一个上界[插图]。如果每种备选方案都进行了100次的测试，那么平均比例的标准差将等于5%。如果应用两个标准差规则来识别显著差异，当两个比例相差大约10%时，我们就能够自信地将它们区分开来了。例如，如果一个备选方案在70%的时间内都取得了成功的结果，而另一种方法则只在50%的时间内取得了成功，那么就有95%以上的置信水平相信我们能够选中正确的备选方案。

第二种启发式称为自适应探测率启发式（adaptive exploration rate heuristic）。它的程序是，第一阶段，先让每种备选方案各完成10次试验。第二阶段，再进行总共20次试验，但是试验次数根据各备选方案在第一阶段的成功率按比例分配

194、贝叶斯多臂老虎机问题

给定备选方案集{A，B，C，D，…，N}，以及对应的收益分布{f（A），f（B），f（C），f（D），…，f（N）}。决策者对每个分布都有先验信念。在每一期，决策者选择一个备选方案，并获得收益，并根据收益计算出新的信念

195、要确定最优行动，需要经过如下四个步骤。首先，要计算出每个备选方案的即时期望收益。其次，对于每个备选方案，都要更新关于收益分布的信念。再次，在得到的关于收益分布的新信念的基础上，根据我们所掌握的信息确定所有后续时期的最优行动。最后，我们将下一期行动的期望收益与未来的最优行动的期望收益相加

196、吉廷斯指数

为了说明如何计算吉廷斯指数，考虑下面这个只有两个备选方案的例子。备选方案A产生的收益抽取自{0，80}，且0和80出现的概率相等。备选方案B在{0，60，120}当中产生一定的收益，而且这三个收益的概率也是相等的。我们假设，决策者试图最大化10个时期内的总奖励。

备选方案A：收益等于零的概率为1/2，在出现了这种结果之后，在剩下的全部9期内都会选择备选方案B（备选方案B的期望收益60），这样就得到了540的期望收益（9乘以60）。收益等于80的概率也为1/2，即便出现了这个结果，在第二期的最优选择仍然是选择备选方案B。于是有1/3的概率，备选方案B产生了120的收益，因此总收益等于1160（80加上9乘以120）。同样，有1/3的概率，备选方案B产生了60的收益，在这种情况下，备选方案A是剩下的所有8期的最优选择，这样产生的总收益等于780（60加上9乘以80）。最后，还有1/3的概率，备选方案B产生了零的收益，在这种情况下，备选方案A是剩下的所有8期的最优选择，这样产生的总收益等于720（9乘以80）。

把上面这些可能性全都考虑进去，可以得出，在第一期，备选方案A的吉廷斯指数如下：

[插图]

备选方案B：有1/3的概率，收益等于120。如果发生了这种情况，那么所有未来时期的最优选择也仍然是备选方案B。因而10个时期的总收益将等于1200。如果收益等于零（概率为1/3），那么所有未来时期的最优选择都将是备选方案A（备选方案A的期望收益为40），因而，期望总收益将等于360（9乘以40）。如果收益等于60，那么决策者在所有未来时期都应该选择替代方案B，总回报为600；但是，如果在第二个时期选择了备选方案A，那么有一半时间备选方案A总是产生80的收益，此时总回报为780（60加上9乘以80）；另一半时间它产生零收益，并且所有后续时期的最优选择都将是备选方案B（会产生60的收益），于是得到的总收益为540（9乘60）。由此可知，在第二期中选择备选方案A才是最优选择，这种选择产生的期望收益等于660×（1/2×780+1/2×540）。

把所有可能性都考虑进去，不难推出，备选方案B在第一期中的吉廷斯指数如下：

[插图]

根据这些计算结果，备选方案B是第一期的最优选择。最优长期选择则取决于第一期内学习的结果。如果备选方案B产生了120的结果，那么我们将永远坚持选择备选方案B。

上述的分析表明，在采取行动时，我们更关心的是备选方案能够成为最优选择的概率而不是它的期望收益。此外，如果某个备选方案会产生非常高的收益，我们应该更有可能在将来选择它。相反，如果它只能产生平均收益，那么即便收益水平高于另一种备选方案的期望收益，我们一直坚持这个备选方案的可能性也不会太高。在尝试的早期阶段尤其如此，因为我们希望找到更高收益的备选方案。这些结果在我们讨论的诸多应用中都是成立的。如果采取行动没有风险，也不需要付出高额成本，那么这个模型告诉我们，即使高收益行动的概率很低，我们也要努力去探索它们

197、空间竞争模型：民主、共和两党的总统候选人在意识形态空间中互相竞争以吸引选民。我们有理由预计，各候选人倾向于温和的中间立场、选情会比较胶着，不同政党候选人获胜的顺序是随机的。除了少数例外情况外，总统选举不会以某一方压倒多数获胜结束。为了检验美国总统大选获胜者的顺序是不是随机的，我们构建了从1868年到2016年38次总统大选的获胜政党的时间序列。该序列如下（字母R、D分别表示共和党、民主党）：

RRRRDRDRRRRDDRRRDDDDDRRDDRRDRRRDDRRDDR

然后我们可以计算出不同长度的子序列（块）的熵。长度为1的子序列的熵为0.98。长度为4的子序列的熵为3.61。统计检验表明，我们不能否认这个序列是随机的。作为比较，在长度为38的随机序列中，长度为1的子序列的熵为1.0，长度为4的子序列的熵为3.58。

198、分类模型：如果我们将每个州视为一个类别，同时假设不同州之间存在着异质性，那么空间竞争模型意味着一旦候选人选定了初始位置，某些州就不再具有竞争力了。这个模型的预测是，在少数几个立场温和的州，选举竞争将特别激烈。2012年，奥巴马和罗姆尼都在10个州花掉了自己电视广告预算的96%以上。他们每个人都将广告预算的一半多用于3个温和的州：佛罗里达州、弗吉尼亚州和俄亥俄州。2016年，希拉里·克林顿和特朗普也将一半以上的电视广告预算花在了3个温和的州：佛罗里达州、俄亥俄州和北卡罗来纳州。7

多臂老虎机问题的模型（回溯性投票）：选民将更有可能将选票再一次投给有良好执政业绩的那个政党。给绩效好的政党投票，相当于拉一个会带来高收益的杠杆。经济繁荣通常会使竞选连任者受益。有证据表明，当经济表现良好时，选民更有可能投票给执政党的候选人。而且，在执政党内部，现任候选人的影响也大于非现任候选人

199、分类模型：如果我们将每个州视为一个类别，同时假设不同州之间存在着异质性，那么空间竞争模型意味着一旦候选人选定了初始位置，某些州就不再具有竞争力了。这个模型的预测是，在少数几个立场温和的州，选举竞争将特别激烈。2012年，奥巴马和罗姆尼都在10个州花掉了自己电视广告预算的96%以上。他们每个人都将广告预算的一半多用于3个温和的州：佛罗里达州、弗吉尼亚州和俄亥俄州。2016年，希拉里·克林顿和特朗普也将一半以上的电视广告预算花在了3个温和的州：佛罗里达州、俄亥俄州和北卡罗来纳州。7

200、表示为一个长度为N的二进制字符串，这就是NK模型中“N”的含义。至于“K”，则指与该字符串的每一位交互以确定这一位的值的其他位的数量。如果K等于零，那么价值函数就是线性的。如果K等于N-1，则所有的位都相互交互，每个字符串的值都是随机的

201、NK模型

一个对象由N位二进制符号组成，s∈{0，1}N。

这个对象的价值表示为V（s）=Vk1（s1，{s1k}）+Vk2（s2，{s2k}）+…+Vk1（s1，{s2k}），其中，{sik}等于一个从原字符串中除了第i位之外随机选择出来的有k位的子字符串的集合，而且Vk1（s1，{s1k}）是从区间［0，1］中抽取出来的一个随机数。

K=0：得到的是一个关于位的线性函数。

K=N-1：任何位的变化都使每个位产生新的随机贡献

202、NK模型的一个重要含义是，我们需要适度的相互依赖性，因为这种互动能够产生更高的峰值

203、技术和人力资本模型——增长模型

产出取决于实物资本（K）、受过教育的人的劳动（S）和未受过教育的人的劳动（U），具体生产函数如下：

产出=AKαSβUγ

参数A、α、β和γ刻画了技术和三种投入要素相对价值。高技能工人和低技能工人的相对市场工资是：7

[插图]

（Wages是高技能工人的工资，Wages是低技能工人的工资）

不平等的原因：有利于受过教育的工人的技术变革会使β增大、使γ减少。这一点，再加上低技能工人供给的增加，会增加不平等

204、对才华的正反馈——优先连接模型

存在N个生产者。开始时，每个生产者的销量均为零。第一个消费者随机选中了一个零销量的生产者，购买了产品，使该生产商的销量为正。随后，每个后续消费者都以概率p从销量为零的生产者那里购买、以概率（1-p）从具有销量为正的生产者那里购买。当从具有销量为正的生产者那里购买时，消费者选择生产者的概率与该生产者的当前销量成正比例。

不平等的原因：更多的联系增加了社会影响，创造了正反馈

205、CEO的薪酬——空间投票模型

CEO薪酬由薪酬委员会投票决定。在美国，薪酬委员会通常由现任和前任CEO（他们当然更喜欢高薪）以及薪酬专家（X）组成。而在其他国家，薪酬委员会的组成人员中还有工人（W），因而导致中间选民更偏好比较低的薪酬水平。

[插图]

不平等的原因：CEO通过相互“俘获”来确定自己的薪酬。任何一位CEO的薪酬的增加，都会使所有CEO更加偏好更高的薪酬

206、资本租金模型（皮凯蒂）——72法则

经济由工人和资本家组成。工人的工资增长率为g，即经济增长率。资本家在时间t有财富Wt。资本的回报率为r（税后净额），且资本家的消费为一个不变的常数A。资本家的收入将比工人的增长更快，当且仅当：

[插图]

不平等的原因：在市场经济中，资本回报率必定超过经济总增长率（即r>g）。拥有大量财富的资本家只将自己资本收入的一小部分用于消费，因此他们在总收入中的份额将随着时间的推移而不断提高

207、选择性婚配模型——分类模型与分类

每个人都有自己的教育水平：{1，2，3，4，5}。（其中1=辍学，2=高中毕业，3=上过大学，4=大学学位，5=研究生）

令P（m，j）和P（w，j）分别表示男人和女人具有教育水平j的概率。收入（g，ℓ）表示性别为g、收入水平为ℓ的人的（估计）收入。一对夫妇组成的家庭的收入，包括了一个受教育程度为ℓM的男子和一名受教育程度为ℓw的妇女的收入。其家庭收入估计如下：12

收入（M，ℓM）+收入（W，ℓw）

不平等的原因：受过良好教育的女性人数的增加、高教育水平的工人工资的增加，以及选择性婚配（人们喜欢与收入水平相同的异性结婚的倾向）导致了家庭之间收入不平等的增加

208、代际收入（财富）动态变化——马尔可夫模型

将所有人口划分为4个人数相等的收入（或财富）类别。我们可以估计一个类别中的个体（或家庭）在一代的时间内流动到另一个类别中的转移概率（如下图所示）。更平等的转移概率对应更大的社会流动性。

[插图]

收入水平（收入等级）之间的转移概率

不平等的原因：社交技能、隐性知识、对风险和教育的态度以及遗产，减少了收入阶层之间的流动性

209、持续不平等（杜鲁夫）模型——谢林隔离模型+局部多数模型

所有个人分别属于不同收入类别，并按不同收入类别分离居住。个人将自己的部分收入用于教育，从而产生正面的溢出效应，这种溢出效应随社区收入水平的上升而增强。生活在社区C中的孩子的未来收入取决于自己天生的能力、教育支出和溢出效应。教育支出和溢出效应的贡献取决于这个社区的收入水平，IC。

个人收入C=F（能力、教育支出（IC）、溢出效应（IC））

不平等的原因：在低收入社区长大的儿童获得的教育机会较少、受益于经济溢出效应的可能性也更低