格格党

手机浏览器扫描二维码访问

第7讲 通过少量信息得出切实结论的贝叶斯推理与内曼-皮尔逊式推理的差异(第1页)

第7讲通过少量信息得出切实结论的贝叶斯推理与内曼-皮尔逊式推理的差异

7-1用贝叶斯推理解开壶的问题

在上一讲中,我们已经了解到如何用标准的概率性推论——内曼-皮尔逊统计学来解答关于壶的判断问题。这是用假设检验的方法,如果可以设定显著水平为10%,那么从“观察到黑球”的现象,就可以得出“是B壶”的结论。但需要注意的是:如果反复使用这种方法,那么一定要意识到还有10%的概率会做出错误的判断。下面将要阐述的是:如果把显著水平设定为通用的5%或1%,就只是从“观察到只有1个球”这个假设检验中,则不能够对壶的问题做出判断。

从另一方面来讲,如果运用贝叶斯推理,按照前4讲中所述的方法,也可以对壶的问题进行概率性推论,并且不需要类似显著水平这样的概念。下面,我们用贝叶斯推理方法对壶的问题来进行说明。

7-2把A壶和B壶分别设定为一个类别

首先,我们再重复一遍问题设定。

问题设定

面前有一只壶,已知这个壶不是A壶就是B壶,但是单从外表看不出究竟是哪个。而目前已知的是:A壶中有9个白球和1个黑球,B壶中有2个白球和8个黑球。现在,如果从壶里取出1个球,并且这个球是黑色的,那么,面前的这个壶究竟是A还是B呢?

和之前一样,我们先来设定类别。由于需要判断的问题是:面前的这只壶,是A壶还是B壶?因此,需要设定的类别自然也分为A和B。

接下来的步骤是设定先验概率。由于我们暂时不知道这只壶是A壶还是B壶,并且也不知道壶里装有什么颜色的球(在观察球之前),所以,只能运用“理由不充分原理”。换言之,将“是A壶”和“是B壶”的先验概率均设为0.5,此时,用长方形来表示的可能存在的情况,则如图表7-1所示,总共被划分成两等份。

图表7-1根据理由不充分原理设定的先验分布情况

然后,设定在各类别中,出现黑球或白球的条件概率。在“是A壶”的情况下,出现黑球的条件概率为0.1,出现白球的条件概率为0.9;而在“是B壶”的情况下,出现黑球的条件概率为0.8,出现白球的条件概率为0.2。把这些具体情况填入图中,则如图表7-2所示,共有4种可能出现的情况。

图表7-2条件概率的设定

下一步,是把4种可能出现的情况的概率填写进去。同时,请回想一下,前面我们曾讲:“长方形的面积”可视为概率(图表7-3)。

图表7-3计算四种可能性的概率

由于最终观察到球的颜色为黑色,因此白球的可能被完全排除在外,如图表7-4所示。把观察到黑球的2种情况用图来表示,并将各概率标准化处理,如下所示:

(该壶为A壶的后验概率):(该壶为B壶的后验概率)

=0.5×0.1:0.5×0.8

=1:8

=19:89

换言之,在观察到黑球的前提下,该壶为A壶的后验概率为19,约等于0.11;而该壶为B壶的后验概率为89,约等于0.89。由于后者是前者的8倍,因此,判断该壶为B壶较为妥当。

图表7-4排除掉两种可能性

7-3贝叶斯推理无论在何种条件下,都能得出一个暂时的结果

正如大家所看到的,贝叶斯推理并没有像内曼-皮尔逊统计学的假设检验那样,有关于显著水平的设定。贝叶斯推理的强项是“无论在何种条件下,都能得出一个暂时的结果”。但是,这个结果并不像内曼-皮尔逊统计学那样,得出一个单方面的判断(非A即B),而是认为两种可能性都有,并赋予这两种可能性相应的比例关系,仅此而已。而“看到数值之后,做出判断”的工作,就留给统计学家们了。因此,贝叶斯推理也常被称为“总经理的概率”,它的含义是:贝叶斯推理就像是公司职员进行筛选和鉴别,最终由总经理根据下属报告上来的数值进行判断。

关于判断究竟是哪个壶的问题:假设在A壶的10个球中,黑球的个数为x;B壶的10个球中,黑球的个数为y,之后观察到出现了黑球,那么:

(该壶为A壶的后验概率):(该壶为B壶的后验概率)=x:y

因此,当壶中的黑球较多时,结果为该壶的后验概率也就越大(在前面的例子中,x=1,y=8)。这个推理可以将“由于观察到出现了黑球,因此有可能会是黑球较多的那个壶吧”这一简单的推论合理化。统计学家看到x:y的比例之后,可以做出“该壶为A壶”或“该壶为B壶”,或是“不管得出何种结论都不妥当”之中的任意一种判断。

7-4贝叶斯推理和内曼-皮尔逊式推理中,“风险”的含义不同

特别需要注意的一点是,在贝叶斯推理和内曼-皮尔逊式推理中,各自“风险”的含义是完全不同的。

第6讲中曾讲到,在内曼-皮尔逊式推理中,显著水平是其风险的指标。其含义是:例如,将显著水平设定为5%,那么如果用同一种方法,反复使用假设检验的话,有5%的概率会得出错误的结论。因此,采用大胆一点的说法是:5%概率的风险,并不是针对“现在判断得出的结论”进行的直接评价。毕竟,“风险”针对的是所使用的方法论,给只不过是“通过在风险概率为5%的某种方法所下的结论”的间接评价值。

另外,本讲中会提到这样一个观点:所谓根据贝叶斯推理得出的结论的“风险评价”,其实就是“后验概率”本身。实际上,在壶的推理的例子中,由于计算出“该壶为A壶的后验概率”约为0.11,那么,如果做出“该壶为B壶”的判断,则这一判断出错的概率也约为0.11。这并不是方法论本身存在的风险,而是由于A的可能性与B的可能性的比例为1:8,这一风险从而直接被认可。

用比喻性的说法来解释:假设检验的风险存在于结论之外,而贝叶斯推理的风险则存在于结论的后验概率本身之中。

还有一个必须留意的问题是:贝叶斯推理之所以能在不考虑显著水平的情况下做出判定,是因为设定了先验概率这一“奇怪的”概念。如前所述,先验概率基本上是一种“主观的”概念。也就是说,贝叶斯推理不会直接认为“概率是×”,而是采取“相信概率应该是×”“总之,先设定概率为×吧”这样的态度。因此,在这种先验概率的基础上被推断出来的后验概率,通常有其任意性,而责任则归于在统计学者的判断。这也是为什么贝叶斯推理被称为“总经理的概率”的原因所在。

图表7-5关于壶的判断的贝叶斯更新

热门小说推荐
重生香江的导演

重生香江的导演

导演!不应该如此草率,带你见证做牛导演的诞生。...

足坛第一狂徒

足坛第一狂徒

踏上这片绿茵,我就是足坛第一狂徒!本书又名踢球,从断腿开始。跟我走吧,带你体验足球世界的疯狂与残酷!...

盛世小女官

盛世小女官

前世被人陷害,满门抄斩。重生归来,她势要披荆斩棘,杀出一条血路!...

我榜下捉婿翻车了

我榜下捉婿翻车了

◆晚九点日更◆疯度翩翩x美艳色批◆强取豪夺x强取豪夺◆接档僧妻外室今天喀血了吗求收,文案最下—本文文案—一裴三郎君颜如清风玉雪,晕然动人,是京城闺秀们心目中的檀郎。关瑶,也觊觎了他好几年。一朝再遇,她多番撩拔,得手和失败间来来回回数次后,关瑶决定既然追不到,那就…抢吧!发榜之日,关瑶趁乱把人抢回府,硬是摁着头和自己拜了堂。夫君霎阴霎晴,高冷冻人,偏她口味特殊,还就喜欢这人傲得跟孔雀似的。只某日,她一如既往去缠他,边抱着小臂晃了晃,边拉着长音撒娇夫君呀裴和渊与她对视几息,忽然凑过来吧唧亲了她一口,当场给关瑶亲蒙了。狗血淋头,这厮…居然失忆了?失忆后的裴和渊,犹如云中仙人摔进麦芽糖堆,学了一身黏人的本领,恨不得天天在后头给她提裙。清冷谪仙劲儿化了灰,关瑶受不了没脸没皮这货,干脆留了和离书。二醒自一场漫长的梦,裴和渊发现自己多了个娘子。娘子秾丽绝艳,柳骨葳蕤,简直就是他梦中神女!像是走路凭空捡到宝,裴和渊自此转了性,天天就想和娘子恩爱不离,就差把宠妻如命四个字刻在脑门儿上。正当他暗自得意于自己眼光好,寻了这么个美艳可人的妻时,突然天降和离书与一大笔钱,还留了话让他去瞧瞧脑子???好极,这刺激可大发了,他不仅恢复全部记忆,还有了新目标。抢怎么了?她不也抢过他?待之以人,还之彼身罢了。三数月后,关瑶正美滋滋吃着冰,前夫突然出现在跟前,平静问她娘子,跟我回去,还是我绑你回去,你且选一个。声音低凉清润,可那双清和剔透的眸子,这会黑寂如潭,神鬼莫挨。六月的天,关瑶瞬间打了个冷颤。救命啊你怎么还有第三幅面孔呢?媳妇儿你看我骚得可爱否?和离后我被迫破镜重圆了排雷◆1v1双洁双处,重生文◆男主又冷又疯莫得底线,女主有钱有颜冇得脑子◆男女主都不是正经人,极扯,剧情狗血味儿重,熏人且冲鼻◆男女主人设不完美,完美的人设你绑架我壁咚我强吻我,我也写不粗来(摊手jpg)◆朝代架空◆全员猛女—★外室今天喀血了吗文案★一某次执行任务时,沃檀救了个容色澄彻的美郎君。她见色起意,想着男人都爱养外室,决定自己也养个玩玩。可救人后沃檀发现,她那外室是个爱吐血的病秧子。推他一把,他立马倒地。亲他一口,他当场闭气。跟他开句黄腔,他能咳到撅过去好在病秧子除了不能睡,人还是蛮勤快,煮饭浆洗样样习得,起码她执行完任务回到家,能喝到口热乎粥了。而且病秧子脾气顶好,很是温怜可亲。在宅子里,她操刀舞剑,他抚琴赋诗,两人看起来九不搭八,十分般配。直到后来,她得知这人就是她大主子的对家,当朝九王爷。且武功,不一定在她之下。知晓真相那日,沃檀提着剑往家赶,咬着牙在想是先杀了他,再上了他,还是先上了他,再杀了他?二九王爷景昭恭俭仁恕,行之有纲,是先帝最为宠爱的儿子。若非身有不足之症,早便入主东宫当了太子。某日他意外遭刺,亲卫悉数被杀,人也不知所踪。后来,卫从们找到人时,他们王爷正被个女流氓抱着腰舔脸。王爷耳根通红,无奈地偏了偏脸,温声哄那女流氓先用膳吧。卫从们涕泪横流这太作孽了!他们得以死谢罪啊!直到后来,值守的卫士看到他们不愿意回王府的爷,故意把袍子扯得松松垮垮,敞着颈下锁骨,勾引人家小姑娘过来摸卫从们纷纷以手掩面瞎了算了。...

每日热搜小说推荐