为什么-得到听书笔记
seainm作者
朱迪亚·珀尔,美国国家科学院院士,IEEE智能系统名人堂第一批10人之一,“贝叶斯网络”之父,2011年因创立因果推演算法获图灵奖。
核心内容
让因果重新回到科学的范畴,研究怎么用科学的视角看待因果。
内容摘要
因果
因果是一种超越经验的思考能力
例子:在偷尝禁果后,上帝问夏娃,“你都做了什么?”。夏娃回答,都是因为蛇,蛇骗我吃的苹果。这里,上帝问的是事实,夏娃回答的是因果。这是因为,夏娃猜到上帝可能会责备她,她想找个理由以获得宽恕。责备本身尚未发生,不在夏娃的经验之内,可这却代表了人类非常自然的思考方式。
弗朗西斯·高尔顿
达尔文表弟,19世纪著名的发明家、人类学家,统计学的鼻祖。
- 高尔顿板实验:1877年高尔顿设计的实验,小球从中央落下,经过一排排小格挡,落在排列整齐的竖槽中。小球通过滤形成了钟型曲线,也被称为「正态分布」。高尔顿在第一次过滤后面增加了一层过滤,形成了更加平缓的钟形曲线。这种叠加,和高尔顿观察到的身高变化并不相符。
- 回归平庸:高尔顿观察600多英国名人,发现他们的后辈普遍不如父辈有名。
- 相关性:高尔顿研究身高发现,身高和父亲有关联,但不是绝对的因果,他称之为相关性。
- 卡尔·皮尔逊:高尔顿的学生,他认为「世界只有相关,没有因果」,这成为了很多科学家的共识
如何看待因果
在珀尔看来,因果是人类的主观思维方式,而客观世界,只有相关没有因果。可以说,因果,是人类使用的一套学习模型,用以演绎和预测。
完善因果思考的方法
区分混杂因子
辛普森悖论:一种药,对男人有害,对女人也有害,但是对人类有益。实验组40f、20m,对照组40m、20f。实验组,8m、3f 患病,对照组12m、1f患病。针对m, 患病率30%到40%,f 5%到7.%,说明药对男性女性都有害。如果总的来看,患病率从22%到18%,说明是有利的。
混杂因子:同时影响原因和结果的因素,如上诉例子的性别。
区分:阻断混杂因子,样本不能直接相加,得分开计算。服药前男女的平均患病率是17.5%,之后是23.5%,这个药,对人类就是有害的。
找到中介因素
中介因素:a->b->c,其中的b就是中介因素。吃柠檬(a),预防坏血病(c),这里的b其实是维生素c的摄入。
这里称之为中介因素,倒不如说是「真」因,a不是重点,重点是b。如果因果模型无法被反复验证,说明只有a,而没有发现b。