1 问题
(1)已知A公交车每5分钟一趟,B公交车每10分钟一趟,某人可以选择乘坐A、B两辆公交车,问这个人平均等公交车的时间。
(2)已知A公交车平均每5分钟一趟,B公交车平均每10分钟,某人可以选择乘坐A、B两辆公交车,问这个人平均等公交车的时间。
2 思考
可以看到这两个问法,问题(2)其实只比问题(1)多了平均两个字,但是结束和计算方法完全不同。
2.1 问题(1)
2.1.1 一种车的情况
我们先假设只有A车,那在问题(1)的答案是什么呢?问题(1)的说法是A车每5分钟一趟,深层的含义其实是:
1)每隔5分钟必有一辆A公交车经过某个公交站;
2)等待的时间最长只会是5分钟。
因此,如果只有A车,等车的最少用时是0分钟,也就是某人刚到某站,车就来了。而最长等车时间是5分钟,也就是某人刚到某站,A车刚走。
假设某人达到公交站后,A公交车还有 X 分钟到达车站,此时,等车时间就是 X 分钟。X 的取值范围是[0,5],并且我们知道 X 在[0,5]区间中取到某个值会对应一个概率,而所有取值的概率加起来等于1。也就是说其实 X 是一个连续型随机变量。 f(x) = P{ X = x },表示X取值为x的概率,则f(x)就是X的概率密度函数。问题(1)就变成了由概率密度函数计算期望的问题。
于是,在没有说明人到达车站后,公交车到达车站的时间服从什么分布的情况下,会默认车到达车站的时间的概率是一样的,也就是X服从[0,5]区间上的均匀分布,从而得到 f(x) 为:
于是最终算得E(x) = 2.5。一看就知道这是合理的答案。
2.1.2 两种车的情况
由上一小节可知,如果只有A,那等车的时间X服从[0,5]区间上的均匀分布。同理如果只有B车,等车时间Y服从[0,10]区间上的均匀分布。那现在A、B两车同时有会怎么样呢?
这时就会变成,某人到达车站后,A车还有X分钟到达,B车还有Y分钟到达。我们需要计算出X取值为x,Y取值为y的概率。对应到从标系我们可以看到其实就是计算取以下区域中的某个点的概率。
同理,我们知道,取任意一点的概率是相同的,因此X,Y在这个区域内服从二维均匀分布。
这个时候,等车时间怎么算呢?其实对应这个平面中的每一点,我们的等车时间都是min(x,y),也就是哪种车先到我们就坐哪种车,因此期望计算公式为:
(1)
在上图所示区域中计算二重积分,可以把式(1)变化成以下式子:
最后的计算结果是 2+1/12,也就是平均等车时间是2分5秒。再想想这个答案是合理的,因为只有一辆A车时,平均等车时间是2分30秒,如果有两辆车,等车时间自然会比一车辆短。
2.2 问题(2)
问题(2)需要关注“平均”这个字眼。
2.2.1 一种车的情况
假设只有A车,A车平均每5分钟来一趟。那最短等待时间还是0分钟,那最长要等待多久呢?显然不是5分钟了,其实有可能是无穷大,因为题目只说两辆A车到达时间平均间隔5分钟,但是没说固定是5分钟。所以当只有A车的情况下,平均等车时间就是5分钟。
这个场景其实是与泊松分布和指数分布两个分布有关。下面我们来简单后顾一下这两个分布的定义和作用。
1、泊松分布:
泊松公布是一种离散型分布,会有以下一些用途:
(1)一本书中打印错的字数;
(2)某段固定时间内服务器收到的请求数;
(3)某医院某小时内出生的婴儿数;
2、指数分布:
这里的 就是泊松分布的。指数分布用于表示泊松分布中两个事件之间的时间间隔的概率。指数分布的期望为:。
因此,A车到达车站的时间服从指数分布:
2.2.2 两种车的情况
同理,两种车的情况下,由于两车是相互独立的。所以两种车达到的时间在整个第一象限服从二维分布,概率密度
求期望时同样是在以下区间内求:
积分的结果是 3+1/3,即3分20秒。同理,这个答案是合理的,因为只有一种A车的情况下,平均等车时间是5分钟,多一种车,等车时间当然缩短了。