贝叶斯思维:我怎么判断我自己的判断对不对呢?

贝叶斯思维:我怎么判断我自己的判断对不对呢?

SimpRead from zhuanlan.zhihu.com

今天无意中发现有朋友在我的文章下给出了一条有趣的留言评论,如下图所示:

今天我们就以这个案例,来继续了解贝叶斯思维的一大应用:自我反思。

需要提前说明,“自我反思”并不是指 “考虑一下自己的言行哪里出了错”,而是指“对自己的思考过程展开思考”。一些朋友习惯于把这个过程叫做“元认知”,而我习惯用“自我反思” 这个词。大家可以将两者视为同义词。

接下来,我们正式开始这趟自我反思之旅。

首先,我们把这位留言评论的朋友暂定名为张三,将我暂定名为李四。张三在网络上看到了李四写的一篇文章,这篇文章由图片和文字构成。于是,张三根据自己的经验,做出了判断:李四抄袭。

我们需要先画一个正方形,然后再用一条线来将方块分割成两部分。这两部分的比例代表了先验概率,也就是张三在没有细读那篇文章之前,所认为的 “李四抄袭” 的概率。

先验概率的设置并没有固定的方法,它有很强的主观随意性,所以这条线也有很多种不同的画法。

张三可能会认为,李四可能抄袭了,也可能没有抄袭。他没有任何理由偏向于两种可能性中的任何一种,于是他可以认为两者是等概率的。也就是说,李四抄袭的概率是 0.5,没有抄袭的概率也是 0.5,如下图所示:

张三也可能提前就对李四有不好的印象,他早就认为李四是个很可能抄袭的人,于是他的先验概率可能是这样的:

张三也可能认为,李四只不过是芸芸众生的一员。而大多数人是不抄袭的,因此李四不抄袭的概率更大些,如下:

接下来,张三了解了一些新信息。他仔细读了读李四的《轻松学会贝叶斯思维》这篇文章,发现其中有一些和别人写的书非常相似的地方。虽然他没有标明书名号,但从截图来看,他所指的应该是《统计学管我什么事》和《超预测》这两本书。

他认为,李四可能读过那两本书,然后将别人写的话或者画的图,不做修改或者略作修改后,就复制粘贴到自己的文章里,还署上了自己的名字。这种行为就叫做抄袭。

于是,他接下来就要思考,给定这些新信息,李四抄袭了的概率有多大?

首先,要考虑如果李四抄袭了,那么出现这些相似之处的概率有多大?

可以认为,这种概率是非常大的,但并不等于 100%。毕竟,我可能抄袭得非常巧妙,以至于我的文章和别人的作品没有相似之处,但我依然是在抄袭。

如下图所示:

贝叶斯思维者还需要进一步追问:如果李四没抄袭,那么出现相似之处的可能性有多大?

这是一个最关键的问题,所以我需要用不同的表达方式,反复强调一下这同一个意思。

贝叶斯思维者一定要追问:如果我的想法是错误的,那我有多大可能性依然能看到眼前所看到的这些信息?

而非贝叶斯思维者则不会这么追问。他们了解到了一些新信息,觉得这些新信息和自己的想法是兼容的,甚至一定程度上佐证了自己的想法,于是就更坚定的相信自己的想法了。

非贝叶斯思维者经常在犯确认偏误。他们选择性地关注、解读和记住那些能支持自己的想法的信息。而贝叶斯思维者则要学会规避这一认知偏差。

贝叶斯思维者总是习惯性地问自己:如果我的想法错了,那会出现什么情况?

非贝叶斯思维者则不愿意或者没办法设想自己出错的可能性。

虽然我收集到的信息不多,但我认为,张三可能没有很好的贝叶斯思维习惯。因为,张三很可能没有追问贝叶斯思维者总是要追问的问题。张三很可能没有去思考,如果他头脑中的判断出错了,那他有多大的可能性依然能观察到目前这些现象,收集到眼前这些证据,了解到这些新信息?

假设张三问了这样的问题,并且仔细思考了一番,那这些图要继续怎么画呢?

应该这么画:

上图中红色部分又占了下面那个长方形的大部分面积。这就表示,在李四没有抄袭的情况下,也很可能出现相似之处。

由于李四抄袭的情况下很可能出现相似之处,李四没有抄袭的情况下也很可能出现相似之处。因此,仅仅得知出现了这些相似之处,我们还无法做出进一步的判断,无法确定李四更可能是抄袭了还是没有抄袭。

有人要问,这怎么可能呢?

如果李四没有提前读过《统计学管我什么事》和《超预测》这两本书。李四不是将别人的写的话或者画的图,不做修改或者略作修改后,就复制粘贴到自己的文章里,那么,李四写的文章怎么可能和别人写的文章或者画的图,出现这些相似之处呢?

问出这种问题,恰好就说明了,这人不懂统计学。

让我举个例子。几乎在每一本介绍逻辑学的书当中,都会出现下面这张图:

几乎在每一本介绍逻辑学的书当中,也都会出现下面这个截图中的红框内的语句:

换言之,几乎每一本介绍逻辑学的书,都会出现这些图片或语句的相似之处。无论是张教授写的书,还是史密斯教授写的书,或者是山口美子教授写的书,或者是伊万教授写的书,都有这些相似之处。

问题来了,是不是张、史密斯、山口美子、伊万等世界各国的写过逻辑学书籍的人,都是在互相抄袭呢?

显然不是的。

既然他们没有互相抄袭,那他们写的东西里,为什么会出现这些相似之处呢?

因为他们写的书都是在谈论 “逻辑学” 这个话题,而当谈论到三段论时,就几乎不可避免地要出现对当方阵以及三段论的有效性判断规则。而这些都是业内人士的常识,谈不上抄袭。

当我对你说 “1+1=2” 时,我不是在抄袭皮亚诺。当我对你说 “地球绕着太阳转” 时,我不是在抄袭哥白尼。因为这些是普通人的常识。

当我说 “思想无内容则空,直观无概念则盲” 时,我也不是在抄袭康德。因为业内人士都知道,这是康德在《纯粹理性批判》中说的话。

如果有人懂统计学,了解贝叶斯思维,那就会发现,用这种图示的方式来介绍贝叶斯思维,以及对贝叶斯思维的要点的阐释,已经是业内人士的常识了。

比如,下面这张图就截图自 “贝叶斯定理” 这一维基百科词条,它就是用这种方块之间的比例来表示贝叶斯思维的要点:

最后,我们回到本文的中心主旨:我怎么应用贝叶斯思维来判断我自己的判断对不对呢?

引用《轻松学会贝叶斯思维》一文末尾的三个要点:

1. 要记得考虑一下先验概率,也就是 P(A)。在我们这个案例中,就是 “李四抄袭” 这一事件发生的先验概率有多大?

2. 要记得考虑一下 P(B/~A)。在我们这个案例中,就是去追问,假设李四没有抄袭,李四的文章和其他人的作品出现相似之处的概率有多大?

3. 要记得根据收集到的信息,不断将先验概率更新为后验概率。也就是说,要进一步了解和李四相关的信息,了解一下他的别的文章,以及统计学领域的别的文章,从而利用这些新信息来不断更新自己的旧思想。

让我用更通俗易懂的话来阐释一下贝叶斯思维者的三个习惯:

1. 有自知之明:贝叶斯思维者知道自己有着各种各样的信念,也对这些信念有着某种先验概率的可信度的赋值。他们不会羞于承认这些先验概率很可能是自己的偏见。因为他们知道,所有人都是要站在偏见的地基之上,不断根据新证据来修正自己的信念的。

2. 不会死要面子:贝叶斯思维者是不在乎面子,不怕被证据打脸的。甚至,贝叶斯思维者也不觉得自己的想法被证明是不可信的时候,自己就算是被打脸了。他们很乐意去了解那些反对自己的观点的信息,因为他们不把这看作打脸,而是将其看作 “在永无止境的进步空间中又有所成长了”。他们不会只想着证明自己是对的。他们更渴求了解真相,而如果承认错误能了解真相,那他们会非常愉悦地承认错误。如果一定要用“打脸” 这个词,那么贝叶斯思维者都是自虐狂,他们总是在尝试自己打自己的脸。

3. 勤劳且谨慎:贝叶斯思维者的好奇心非常旺盛,他们渴求各种各样的新信息。他们不会轻易做出判断。即便在下判断时,他们也会附带提到自己对那一判断的可信度是多少。基本上,贝叶斯思维者不会认定某个信念的可信度是 0 或 1,而是认为那个信念的可信度是 0 到 1 之间的某个数。

Report Page