FEATHER EDUCATION
从AP统计学角度看美国大选民调的各种偏误

每年五月份,AP考试轰轰烈烈地来啦,考AP,除了可以转学分省钱省时间,还能干嘛呢?学以致用啊!看看我们的Jack老师,用AP统计学分析美国大选民调。炫起酷来,溜得不要不要的。
Jack老师,何许人也?“全能小天王”啊!看完文章详解。
 
据美国媒体11月9日报道,美国大选日到来之时,几乎所有的民意调查员、分析师和政界人士都相信希拉里会跳着华尔兹,轻松入主白宫。大家来看网上几组数据:
根据Real Clear Politics网站11月8日的数据,NBC /SM,希拉里支持率47%,特朗普支持率41%,希拉里领先6个点;

ABC/Wash Post Tracking,希拉里支持率47%,特朗普支持率43%,希拉里领先3个点;
FOX,希拉里支持率48%,特朗普44%,希拉里领先4个点(注:FOX长期偏向保守主义,是本次大选中少数偏向特朗普的主流媒体);

CBS,希拉里支持率45%,特朗普支持率41%,希拉里领先4个点;
Reuters/Ipsos,希拉里支持率42%,特朗普39%,希拉里多3个点;
CNN,预计希拉里为45%,特朗普为42%,希拉里支持率多3个点。

http://mmbiz.qpic.cn/mmbiz_jpg/IiaCMtbS63BZpQbRkh6mVyGKPBRviasiaPfoHN8wziaMJBjVul6sSpLU55TrxJJiaib4T82VAtZgrDPN9aznp71DpBPw/0?wx_fmt=jpeg

 

选举结果出来了,Donald Trump 入主白宫,这脸真的打得啪啪响。
各大机构连一个简单预测都错得那么谱,确实让我们大统计学有点抬不起头来。
作为教统计学的老师,我也只能捂脸蹲墙角。
 

http://mmbiz.qpic.cn/mmbiz_jpg/IiaCMtbS63BZpQbRkh6mVyGKPBRviasiaPfqR60ue3acTASj7gjTHl1XN9PXXbJ0xaRXzFLZTEmLkxrwluZ20ib8Mw/0?wx_fmt=jpeg

AP统计学中planning a study 一章虽然全是文字概念,考试比重也占得不大,但希拉里就因为这个做不成总统了,可见其重要性不低呀。

今天我们就从AP统计学的知识点来看看,大选的偏误(bias)究竟是怎么一回事?

Response Bias人们通常不太愿意让别人知道他们的一些隐藏观点,尤其比较极端的观点。Trump的观点在主流媒体中常常不受待见,他也经常有一些不合时宜的出格言论,这时候所谓隐形选民就会出现。当你心仪的候选人在电视辩论中说了你不同意或者不爱听的话,这个时候立马让你做民调,你会干什么?答案是不说话,但是还是会投票给他。

Sample selection bias抽样的样本并不能很好代表总体。共和党的支持者多为教育水平偏低的蓝领阶层,大多数的调查可能对这个群体的取样不足。传统民调如CNN等媒体一般是通过座机电话进行,但随着手机的普及和固定电话用户数量的萎缩,特别是只使用手机的年轻人更多,使得传统民调对象选择的代表性下降、民调结果的误差更大。

Voluntary response bias:人们可以自由选择是否接受民意调查机构的访问。当然,民意调查机构无法强制让人们回答问题。这就意味着,Trump的支持者可能因为不愿意表露自己的想法,直接拒绝民调机构提出的调查问题。

此外,民意调查机构的样本数量不够大也可能是潜在的因素。我们知道抽样分布(Sampling Distribution)的标准差等于总体标准差除以样本容量n的平方根;因此样本越小,置信区间就会越大,估计不确定就会上升。
当然,还有许多因素阻碍民调机构去获取真实的总体结果。比如希拉里的“邮件门”在选前一周持续发酵,让不确定因素陡然增加。
长期以来,美国大选民调的准确度就不太理想,民调机构也是谬误不断。即使是著名的盖勒普公司,也常有出错的时候。1948年美国大选,盖洛普和多数民调机构预测,杜威会击败杜鲁门,但结果是杜鲁门胜了。2000年小布什对战戈尔,盖洛普的民调产生过大幅波动,最终结果也不符。而2012年奥巴马对战罗姆尼时,盖勒普预测罗姆尼的支持率比奥巴马还高,被媒体反复引用,结果罗姆尼还是输了。民调机构看来真不比章鱼“保罗”好多少呢。

今年美国大选民调,盖洛普干脆不出声,玩不起就躲了呗。

统计学理论很丰满,但现实却很骨感。