第二章 概率介绍
在本章中,我们描述了一个紧凑的概率论知识。每一个很细微的想法,单独来看每个都比较简单。然而,它们结合起来在描述不确定性的问题上变得强大。
2.1 随机变量
随机变量X表示一个不确定的量。变量可以表示实验的结果,如硬币的正反面,也可以表示为现实世界实际测量的一个波动特性(如气温的变化)。如果我们考虑许多实例{Xi}(共 I 个)那么每次它们都可能具有不同的值。然而,一些值可能比另一些值更加容易出现,随机变量X的概率分布Pr(X)决定。(注:Pr = Probability)。
随机变量有两种,离散的(discrete)和连续的(continuous) ,离散的变量从定义好的集合中取值。可能是你扔一个骰子,结果在1-6中取值,也可能是预测天气,在“晴天”,“雨天”,“雪天”之间抉择。离散集可能是有限的,如52张扑克牌,也可能是无限的,自然数集合中取一个数。离散变量的概率分布可以表示为图2-1所示的直方图或Hinton图。每个结果都具有与之相关的积极概率,并且所有结果的概率之和始终为一。
连续型随机变量从实数值中取值。随机变量的值可能是有限的,例如完成限时两小时的考试的总时间在0-2小时之间;或者无限的,你不知道下一辆公交车到达的世界,可以在整个实数范围内定义无限变量,或者限制在某个值之间。
可以通过绘制概率函数(pdf)的方式来可视化连续形变量的概率分布。如图2.2所示,概率密度的分布表示随机变量取某个值的相对的倾向。然而,无论概率函数如何,对概率函数整体积分的结果永远为1.