昨天晚上,五岳散人盲吃阳澄湖大闸蟹失败,他本人也认输了。但是结果比较微妙,因为首先,阳澄湖的螃蟹还没到成熟的季节,必然影响口感;第二,打赌虽然赌得是能不能吃出阳澄湖螃蟹的特质,但其争论的根本在于能不能吃出螃蟹的差异性,而五岳散人认为他把6只太湖蟹误认为阳澄湖,说明他是能够吃出10只里边6只螃蟹是一类的,所以他没有输
真的这样嘛?
微博大v奥卡姆剃刀老师认为,假设五岳散人每次都是瞎蒙,所以每次蒙对的概率为三分之一,在这种情况下,五岳散人正好吃出六次的概率也是极低的,只有5.69%。他计算的公式是:
吃出六次的概率=组合数*(能吃出的概率)^6*(1-能吃出的概率)^4
其中组合数是10个里边取6个的组合数,在这里是210。可以证明,当能吃出的概率是3分之一时,按照这个公式,结果正好是5.69%
公式没有错,但是以此论证五岳散人确实能吃出来,就是不妥的。
因为考虑一个极端的情况,假如五岳散人确实每次都能吃出来,因此能吃出来的概率等于1,那么上述公式的最后一项就是0了。所以假如五月散人百发百中,那么十次里边能吃出六次的概率为0!
再考虑一个情况,假如五岳散人基本上每次都能吃出来,只不过由于各种原因他会犯微小的错误,因此他有95%的概率吃出来,5%的概率吃不出来。带入公式,发现他吃出六次的概率为0.096%!!
也就是说,考虑三个命题:
1、五岳散人瞎蒙的,每次都有三分之一的概率吃中。
2、五月散人百发百中,每次都有1的概率吃中。
3、五岳散人确实能吃出来,但是他会犯一些错误,所以每次都有95%的概率吃中。
在十次吃中六次的条件下,我们更加相信哪个命题?我们更加相信他是瞎蒙的!!
问题在于,二项分布的概率是恰好六次的概率,即使他有90%的可能性吃中,真正实现的次数也不一定是9次,也可能是10次、8次,甚至7次6次,而一个恰好,就把概率大大降低了。
随便搜了一个概率论课本,二项分布有个例题,某临床药的有效率为95%,去给10个人吃,恰好有8个人被治愈的概率,其实只有0.074,而恰好有9个和十个被治愈的概率则分别是0.3151和0.5988,可见每个正好被治愈人数的概率是不高的,然而至少8个以上的人被治愈的可能性,则高达98%。
那么,下一个问题是,他到底是吃出来还是吃不出来呢?这个没人知道,我们只能知道在十次他吃出六次的前提下,他最有可能的准确率,也就是能吃出来的概率最有可能是多少。
这样我们就很容易想到,这个最有可能的概率,就是能够使十次吃出六次的概率最大的那个概率。这种估计方法叫做最大似然估计。
如此,这个问题就变成了最简单求极值问题,上述公式对能吃出来的概率求一阶导数然后令其等于0,可以很容易得知,在0到1中间,最大值是25%,这个时候能吃出来的概率是0.6。
(十个里边吃出六个,当然估计他每次有0.6的概率是最可信的,这么计算只是为了说明似然估计的原理)
我们知道,瞎蒙的概率是0.33,这个概率是0.6.那么是否就能认为散人显然不是瞎蒙的?
首先,即使我们可以这么认为,这个结论也是蛮可怜的。因为这意味着,我们所有卖螃蟹的人都拿这三种螃蟹卖给散人,然后告诉他这三只都是太湖蟹,散人十次里边有四次会被骗;虽然一个瞎蒙的人十次里边有六到七次会被骗,但是作为资深美食家,这个结果实在是不能令人佩服呀。
其次,虽然我们估计出来一个概率,但是这个概率我们有多大的把握认为散人确实是有0.6的概率吃出来。下一次让散人吃,他还是有0.6的概率吃出来吗?如果不是,那么我们的估计就没有什么意义。
在这里,容易看出,即使散人真的有0.6的概率吃出来,那么他恰好吃出六次的概率只有25%,换句话说,这种测试进行四场,只有一场他能吃出六次来。而我们之所以推测他能够吃出的概率是0.6,是建立在他能吃出六次的基础之上的,而这个基础本身就不牢固,因此估计也是不可靠的。
在统计学中,我们把一个估计可能犯错误的可能性作为衡量参数估计可靠性的指标,例如我们知道了能够吃出概率的分布(0.6),我们于是就知道了散人十次吃出六次的分布(0.25),那么我们预测散人下一次吃,还是十次吃出六次,就有75%的可能性预测错了,所以散人十次能吃出六次的显著性是非常低的。既然如此,那么散人能以0.6的可能性吃出每一次的太湖蟹来,也是不可信的。
同样,如果我们判定散人能够吃出来,那么我们犯错误的概率其实就是散人吃不出来的概率,也就是40%,这么低的显著性水平,实在是可怜。一般要求超过5%或者至少10%,然而如果是5%,上边已经算出来,假如我们认定散人再5%的显著性水平上能吃出来,那么出现十次吃出来六次的概率为0.096%,太低了。
所以这个约架约得实在是莫名其妙,从头到尾既不能证明谁赢了,也不能证明谁输了。好在能够科普很多知识,例如双盲实验的重要性,再例如我们如何处理随机事件,如何通过样本推断整体等等。
(把最后一段删了,就不放地图炮了)
— 完 —
本文作者:zcw gaizhili
【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)