Author Topic: 数据误导  (Read 2154 times)

万精油

  • Administrator
  • Hero Member
  • *****
  • Posts: 1829
数据误导
« on: 四月 24, 2013, 09:56:45 pm »
有人给我看了下面这张单身男女分布图,红圈表示女多,蓝圈表示男
多,圈越大差别越大。然后说男人找对象要到东部,女人找对象要到
西部。



初看起来,好像有道理。后来我到原图的网站看了一下,发现一个可
以调年龄的图。于是我把年龄调到通常找对象的年龄20到39岁。于
是又下面这张图。全国一片蓝。



显然,如果要平衡,下面一个年龄段必须是红的。果不其然,40-64
年龄段就是祖国山河一片红。



按理说,除了老年人,每个年龄段的男女基本上是平衡的。扣掉已婚
人口,男女仍然应该平衡。怎么解释有些年龄段全蓝,有些年龄段全
红呢?我想了一下,找到一个合理解释。问题出在婚姻中男人年龄一
般比女人大。如果真要比较,应该男女年龄有一个错位,比如3-4岁。
我想这样来比就不会有那种全红全蓝的情况。

这个例子告诉我们,但看数据不看背景,常常可以得出很误导的结论。
如果但看第一张图,我们甚至可能得出美国包二奶的情况很严重。:)

马克吐恩有名言:Lies, Damned Lies, and Statistics. 谎言,大谎言,还有统计。:)
« Last Edit: 四月 24, 2013, 10:07:37 pm by 万精油 »