为什么高考作文题目是可以预测的?

很多中学老师认为高考题是可以预测的。他们声称,他们可以感受到问题的趋势,并在考试前帮助学生解决问题。上学的时候一直觉得赌题不靠谱。难道出题的人没有自由意志吗?事实是,我们都没有自由意志。

百度最近发布了一个新东西,“百度预测”,目前提供世界杯、城市、景点、高考四大项目的预测。尤其是高考,百度认为[1]2014的高考作文题目会出现在《时间的礼物》《多彩人生》等六个领域,并给出了每个领域的准确命中概率。当然不可能直接告诉你高考作文题是什么,但是有了这个范围,学生需要准备的题目就会从无限变成有限。百度称,这一预测是“基于大量短文和搜索数据”。各领域列出的作文题目关键词,如“时间的礼物”,包括“记忆”、“未来”、“成长”、“遗忘”,都是中学生作文中的常用词。

换句话说,百度通过数据分析预测的高考作文题,是最常见的作文题,都是老生常谈。换句话说,使用数据分析进行预测的隐含假设是,未来的事件将继续落入最近流行的刻板印象中。

但是提问者有必要尊重刻板印象吗?想出“让未来记住今天”或者“守心之门”这种低俗的话题难道不可耻吗?在回答这个问题之前,我们先研究一个更大的问题:什么是可预测的,什么是不可预测的。

近年来,美国出现了一位伟大的预测家内特·西尔弗(Nate Silver)。美国人非常喜欢体育数据,一些棒球杂志上充满了详细的数据。基于统计模型,Silver做了一个软件,通过分析职业棒球的数据来预测每个球员未来的表现。结果,他的预测超过了所有最有经验的侦察兵。不仅如此,他的政治预言更是令人瞠目结舌。在2008年大选中,西尔弗预测了50个州中的49个州的总统选举结果。西尔弗赢得了全部35个参议院席位。更重要的是,他的预测与政治专家相差甚远——事实证明,听专家的远不如听数据分析的。2012,Silver出了一本书《信号与噪声》(信号与噪声的中文翻译),里面讲了预测的知识。