Binomial Distribution 所表示的是,假如我们知道一个事情实际的可能性(success rate),那么在这个success rate的背景下,产生某一个特定结果的可能性是多少。
比如说,我们知道实际上卖一条金鱼产生positive experience的可能性是80%,那么我们真的去卖10条金鱼给不同的客人,然后拿10个reviews。这10个reviews的结果:7好+3差, 8好+2差, 9好+1差,这些情况产生的可能性分别是多少?这和就是Binomial Distribution去解决的问题。
理解这个的assumption就是,当我们看到10个reviews都是positive的时候,不代表这个东西的success rate就是100%。因为每个单一评价产生有自己的概率 = sucess rate,最后呈现出来的结果,是一个概率组合问题。
那么比如说我们已知sucess rate = 95%,然后需要实际reviews呈现出48个好的review,2个差的review的结果,就可以用下面这个式子来体现。
首先看后半部分,分别就是这种形式呈现的可能性,0.95%的可能性产生positive reviews,我们有48个,以及0.5%可能性,我们有2个reviews。但是由于这个呈现的结果是可以乱序的,所以在之前需要加上 (50 48)这项:分子表示的是50个reviews产生的所有可能性,除以的两个数分别是positive和negative reviews内部的重复产生的可能性。
有一种解决方法叫Laplace's rule of succession。就是在我们的样本之后随即加上两个reviews的结果,一个是positive 一个是negative。那么比如是一个10/10的情况,加上这两个样本后,真实的success rate我们就可以得到是91.7%。
比如再如下的三个例子的比较中,根据这个定律,那么第二种reviews的情况,就代表这个货品的真实sucess rate是最高的。
但是直接assign 50% 50%的比率,其实也并不完全合理。