袁岚峰:统计学当中有一些非常反直觉的例子。其中有一个我自己看到的时候也非常惊讶的例子,叫做辛普森悖论。这个是不是统计学当中,一个最著名的反直觉的例子?

刘军:这是一个非常著名的案例,但是对它深层次的理解,其实对我们认知,对我们整个对各种事物的判断其实非常有益。辛普森悖论的基本现象就是说,你从整体看,比如说医生甲比医生乙要好,他(治愈)成功率要高,比如说他有百分之九十的成功率,医生乙只有百分之八十的成功率。但是如果你说你作为一个病人,你是不是应该根据这个成功率去选医生甲?其实不应该。你应该再仔细去看看,他这个百分之九十是怎么来的。

袁岚峰:是的。

刘军:有可能都是轻病的人去找医生甲,因为他水平不太高。

袁岚峰:是。

刘军:轻病的人(治愈)的成功率当然就高了。重病的人都快去世了,你找到医生乙,虽然他是百分之八十(的成功率),但已经是很厉害了。这是辛普森悖论的一个很重要的启示,当人去做决定的时候,其实应该把你的条件尽量地加进去。这个conditioning(条件作用)其实跟贝叶斯推断是非常吻合的。

刘军:还有一个例子也是非常著名,就是regression to the mean(均值回归)。

袁岚峰:向平均值回归。

刘军:平均值回归的概念其实也很有趣。它还有很多不同的表现,比如winner's curse(赢者的诅咒),类似的就是“赢者的诅咒”。你直观是这么想,比如说有一个比较常见的解释,期中考试成绩好,比如说有前十名,期末的时候有五个同学(成绩)就跌下来了,不在前十名了,(你认为)他们就骄傲了。但是不是骄傲了?其实这个是regression to the mean(均值回归)的问题。可能都是运气往上走的人(成绩)比较好。但是下一次他运气不一定好,所以就下来了。