当我们测智商时,我们测的到底是什么?

来源:观察者网

2019-01-17 07:59

刘权啸

刘权啸作者

莱顿大学博士,动物演化行为学、认知科学研究者

(文/观察者网专栏作者 刘权啸)

近日,“DNA之父”詹姆斯·沃森在美国公共广播公司(PBS)的新出的纪录片《美国大师:解码沃森》中的言论因为涉及“种族主义”的歧视言论而引发轩然大波。

“黑人与白人的智力测试结果存在差异,我相信这个差异就是遗传因子决定的。”91岁的沃森依然坚定维护自己早年备受争议的“种族智力论”。为此这位声名赫赫的科学家在几天之间被剥夺了多项荣誉,“身败名裂”。

沃森的言论一向饱受争议

现如今,我们在社交媒体中越来越爱使用“种族天赋”这个词,但是大众似乎相对乐于接受“运动天赋”、“颜值天赋”,但一旦涉及到“智力”这样的话题,我们就很难一笑而过了。

因为几乎所有宣扬某个民族“天生智力低下”的言论,即使背后有多么华丽的“科学权威”光环加持,都不能不让那些民族回忆起自己在殖民主义压迫下的血泪史,也必然遭到不论种族的舆论一致谴责和唾弃。

不光是针对黑人,英国《卫报》爆出的爱因斯坦亚洲之行日记中对于中国人智商的言论同样也曾引发舆论哗然。

“而在上海,欧洲人形成一个统治阶级,而中国人则是奴仆,他们好像是受折磨的鲁钝的不开化的民族,而同他们伟大文明的过去毫不相干的。”

爱因斯坦在1922年给妹妹的信中提到了中国

作为普通人,除了用道德和“政治正确”来抨击这样的言论,我们更应该静下心来看一看沃森言论中的前提:

“黑人与白人的智力测试结果存在差异”

其实,不仅目前科学界对遗传因子与智力的关系研究还很初级,而且“智力测试”这个东西可能本身就不太靠谱。我们通过各种途径测出的所谓IQ值最多不过是自娱自乐的小游戏罢了。

智力一直是人类引以为傲的特性,从上万年前茹毛饮血的原始社会到现在的智能设备高度普及,似乎人类一切的成就都和智力密不可分。因此,智商这一衡量人类智力的标准一直受到人们的追捧,甚至有门萨协会(Mensa International)这样一个专门给高智商人群交流的组织。更别说很多幼儿园,小学,甚至会给新生做智商测试来分班等等。仿佛一个高智商的人,就天生要注定成功。

然而真的是这样吗?智商真的能代表智力吗?

当我们测试智商时,我们测的到底是什么?目前学术界对智商的衡量标准并没有一致认同的观点,在诸多观点之中比较流行概念是“g factor”。

心理学家查尔斯·斯皮尔曼(Charles Spearman)最早观察发现学生在不同科目上的分数有着一定的正相关性,比如一个学生数学分数高,他的法语分数也会比较高。因此斯皮尔曼认为在人类中有一个内在的因子决定着一个人的智力水平,这个因子被他叫做g factor。

这个概念在后来被其他学者所使用和推广,其中最为著名的一个实验是在1998年由琳达·高弗莱森(Linda Gottfredson)所做。她找来一不同社会地位的人,然后做了四项测试,发现每个人做的不同测试的分数有大约40% - 50%左右的相关性,她认为这个40% - 50%的相关性就是g factor,也就是人类的“智商”。40%的相关性大概是什么样子呢?下图中间就是(-0.37)就是37%相关性的样子,左边和右边的图分别是4%和86%。

虽然看起来这个g factor确实存在,似乎你在一项能力测试中分数越高,再另一项测试里分数也会较高,然而测量这个g factor的实验有很多问题。

首先,这个40%-50%的结果并不恒定,其他科学家很难重复出一样的结果,甚至同一批人做不同的两组测试的结果也会不一样。

而且,这些测试本身的设计就带有隐含的“偏见”。下图中这两个测试就是高弗莱森测试里的例子,需要根据之前的数字和词组找到对应的答案。第7题实验者认为对应父亲(father)的正确的答案是母亲(mother),因为是男性对应女性的关系。

然而如果按照题干中兄弟:姐妹(brother:sister)的亲缘关系,更合理的答案是表亲(cousin)或者孩子(child)。这个测试与其说是在测试智商,不如说是在测试谁和出题人的文化背景相似。


除此之外,这类测试大多需要阅读文字和理解词语,因此一个人的阅读和理解能力很容易影响他的成绩,进而产生虚假的相关性。这就像是在北极测试谁跑得快,一些人因为穿的太少在半路被冻僵,最后到达终点的是穿的足够多的人,由此测试者得出结论,宣称穿的多跑得快。

除了结果不一定准确外,这些测试根本就不全面。幼儿园经常拿来测小孩子的方法(Naglieri Non-verbal ability test)就像下图中这样。

虽然这些测试题目看起来五花八门,五颜六色,但从科学的角度来看,这些不同的题目仅仅测试了一种能力——通过图形找规律能力。诚然,寻找规律是一项重要的智力因素,但有些时候打破规律反而更重要。

智力包含许多要素,比如记忆力、推理能力、关联空间和时间的能力,以及最终能够解决问题和创新。如果智商测试不能够完整的测试出这些能力,那么我们会浪费很多聪明的人类大脑。

目前,人类仍在摸索到底哪些能力算是智力。

哪怕是很多相似的能力也不一定是同一项能力。就拿记忆力来说,时间推理和空间推理是一组近似的能力吗?有些动物可以判断时间的先后,而另一些动物可以判断空间位置的前后,但这些动物却做不好另一项判断。这暗示了这两项能力是分开发展的。

如果这也适用于人类,那么我们目前测试推理能力基本只测试时间推理而没有空间推理,也就是说目前的测试根本就不全面,这样残缺的结果到底有多少意义呢?

其实,智商这个概念本身从逻辑上就不一定成立。并不是所有的智力能力都是相辅相成的。在鸟类里,虎皮鹦鹉能够轻松学会不同的人工规则,但它们的记忆力则相对较差,而另一种鸟类斑胸草雀,虽然记忆力很好,但在学习规则上则慢很多(Spierings & ten Cate, 2016)。这似乎表明有的时候不同智力因素是拮抗的,是此消彼长的关系。

这种权衡在动物界里并不罕见,能够迅速找到猎物的捕食者的捕食精确度反而低,擅长吸引配偶的雄鸟通常不怎么会筑巢,勤劳的蜜蜂更难发现花蜜最多的花朵。

如果这样的拮抗关系也出现在人类的认知能力里,那么智商到底该怎么测定?是记忆力好的人智商高还是能够快速学会规则的人智商高呢?

哪怕并不存在这种此消彼长的关系,仅仅是独立的能力,智商也很难客观的衡量到哪种能力功对智力的贡献更大。人类发明了阿拉伯数字,但论起对数字的记忆力,黑猩猩远比人类厉害。在一项研究里,黑猩猩必须通过视觉记住一堆随机排列的数字,在数字消失后,按照由小到大的顺序点击这些数字之前所在的位置。当这些数字出现的时间降低到210毫秒时,黑猩猩保持着80%左右的准确率,而人类则降到了40%以下。

大猩猩对于数字的记忆力让人类相形见绌

如果有一个智商测试特别强调注意力和记忆力,那么显然在这个智商测试中,黑猩猩比人类智商更高。

目前人类连智力是什么都没有定论,更别说用智商精确测量智力的方法了。如果在沃森的论断中作为前提的“黑人与白人的智力测试结果存在差异”本身就不成立,那他由此得出的任何结论都无从谈起了。

人类需要一点一点增加对脑科学、行为学、演化学的基础研究,在积累了足够的知识之后,再去量化各种智力相关的能力。有朝一日,人类才能总结出一个合理的智商概念。

诚然,智力是存在差异的。在一些相关的调查研究里,亚洲人有着优秀的智力表现,在许多学术型考试中有着亚洲文化背景的学生也更容易考出高分。相较于许多亚洲国家,特别是中国,近十几年的高速发展,大部分非洲国家依然处于贫穷之中。因此,不乏有些人认为这种智力的差异可能跟人种有关,认为亚洲人天生聪明。但相比于基因和人种,这些差异更可能来源于社会资源、环境和教育。

早年的调查发现在即便在同一个国家里,住在高速公路、机场附近的小孩在学校的学习成绩更差(Stansfeld et al., 2005),他们住的地方越吵闹成绩也越差。假如连噪音这样简单的因素都可以显著地影响智力发育,即便智力差异有着一定的基因基础,这些基因带来的差别又能有多明显的?当然,人类调查很难排除所有因素,也有可能那些住在吵闹地区的孩子家长就有着不高的智力水平,但在可控的动物实验里也发现了类似的结果。

一项2008的研究中(Holveck, Vieira de Castro, Lachlan, ten Cate, & Riebel, 2008),科学家通过转移刚刚孵化的幼鸟,创造出两批鸟巢,其中一批只有2-3只幼鸟,而另一批则有5-6只,这些鸟巢里的幼鸟都来自不同的父母。因为父母所提供的食物基本是一样的,所以在有着较少幼鸟的巢穴长大的鸟有着更多的资源和关爱。

当这些鸟成年后,科学家检测了它们学习鸟鸣的能力,即便是来自同一对生父母,如果这些小鸟的生长环境不一样,它们的学习也有差别。有着优质资源的幼鸟比没有这些资源的兄弟在学习鸣叫的精确度上提高了大约10%。

这说明了即便基因组成相似,如果没有合适的环境,后天的智力发育也会有很大的差别。更为惊奇的是,这种鸟类学习鸣叫所需的基因组FoxP1和人类学习语言的基因是非常接近的。

人类不同个体的智力水平确实有差别,而这种差别可能分布于不同的地域或是人种之中。但更多的科学证据表明,这些差异来自于资源、环境和教育。

可能我们有些人认为亚洲人聪明,然而并不是我们天生就聪明,我们的“天赋”实际上是我们的文化与环境造就的,而非天生写在我们的基因里。我们的文化认可聪明的人,我们乐意让孩子去发展智力,更重要的是聪明的亚洲人自己也在非常努力的学习。

放眼全世界,在这样一个只需12小时就能达到地球任何一个角落的现代社会里,在这样一个高度全球化的背景下,我们需要人和人的合作,和不同的人的合作。如果我们只是肤浅看到不同人种在智商上的差异,不去想这种测量方法是否精确完整,不去深究这些差异真正的原因在哪,不去改善这些差异,那我们的社会就难以进步,我们的生活也必然会受到影响。

其实,抛去地域,抛去人种,抛去表面的那一层肤色,我们的内在都是同一个物种,我们基因的相似度远远高于那些微不足道的差异。用0.001%的差异去定义99.999%的相同,哪怕是诺贝尔奖得主,恐怕也无法证明其中的科学性。

本文系观察者网独家稿件,未经授权,不得转载。

责任编辑:戴苏越
基因 智力 种族主义
观察者APP,更好阅读体验

最后通牒?以色列放话“要么签,要么打”

“这把火怎么点着的?”

布林肯来华谈的怎么样?是否不虚此行?

“看看,这就是美国的警察”

习近平会见布林肯:中美应彼此成就,而不是互相伤害