从量性研究与质性研究看社会科学研究

对科学的误解很多,在我看来其中很严重的一项就是夸大了数学/量化在科学研究中的地位。

比如,谢宇(2006, p.28)就声称“定量是唯一的科学方法,没有定量的方法就没有科学的东西。”谢宇教授文中多次提到达尔文对社会科学研究方法的启迪,那么请问,达尔文的进化论中用了什么定量的方法?如果没有的话那进化论还是科学吗?显然,进化论是不是科学并不需要统计学家来操心。现代对进化论最强有力的支持来自于分子生物学层面的证据,而不是什么新式的数学工具。量化并不是唯一的科学方法,量化也不是科学的必要方法。

设想达尔文时代生物学界统计泛滥,并使达尔文深受影响,以至于他的每步推论都要追求统计上的可靠性,那么进化论还会出现吗?不会,因为他将步步受阻,每个研究结论都会被追问得模棱两可,整个研究将迷失在无数的细节中,完全看不到方向在哪里。糟糕的是当今社会科学研究就是这么回事,大量的研究者们操持着统计工具挣扎在每个课题的一个个孤立的环节上。可以说统计学的泛滥是当今社会科学研究进展缓慢的罪魁祸首之一。

其实对统计学泛滥的反思也由来已久,谢宇(2008)文中就提及邓肯对统计至上主义的批判。谢宇(2006, p.206)也承认“只有对社会过程有实质性的理解,统计方法才能产生富有成效的研究。”可问题的关键恰恰在于,你如何才能获得对社会过程的实质性的理解?

对社会现象或自然现象要获得实质性的理解,就是要建立完整的逻辑链条。逻辑链由证据和推论构成。一个逻辑链要越可靠,那么证据越多越好,推论越少越好。

定量研究者自以为可以利用统计来检验他们的推论。事实上统计只能用于否定性的检验,而不能用于肯定性的检验。即便通过了统计检验的推论仍然未必是真正成立的推论,即便排除了抽样误差造成的偶然现象,却完全可能是基于对现象的误解而形成的推论。谢宇(2006)的第4章专讲因果关系,里面提到很多的负面案例,把其中的错误作为对统计的各种误用来解释。而事实上,其实归根到底都是同一种错误,就是由于研究者在对社会过程缺乏理解的情况下胡乱推论然后滥用统计进行检验。书中对各案例的辨析虽然补充了一些证据而加深了一丁点对过程的理解,其实仍然是严重不足的,每个案例都是如此。从严格的科学性的角度来看依然是在随意解释。我在阅读时不禁感慨,量性研究者真的是无可救药啊!

质性研究者和量性研究者的根本区别就在于,前者尽可能用证据构建逻辑链,而后者更倾向于用推论构建逻辑链。在质性研究中,研究者持开放的心态广泛并深入地收集证据,尽可能通过证据来构建逻辑链条,从而获得对现象的深刻理解。从一定程度上来说,质性研究就如同侦探断案。质性研究不但强调要有详尽的证据,而且注重要有多方的证据,即对涉及到同一社会事件的不同社会角色收集证据(并尽可能采用不同的手段,问卷、观察、访谈皆可)。这就使得在质性研究里一根逻辑链条要由好几股组成,从而加强了其可靠性。在收集证据时研究者可能会由于各种原因而产生偏见,质性研究者深知这一点但是并不因此而逃避(那是定量研究者的态度)。质性研究者不回避自己可能产生的偏见,同时也深知不可能完全克服自己的偏见,因此他们在报告中摆明自己的立场,对其可能产生的偏见留给其他研究者来评说。

其实质性研究方法现在已经得到越来越多的研究者的认可,本不需要我再赘述,在Google scholar上搜索“social sciences”可以发现引用最多的文献中以质性研究占多数。但是在马戎为谢宇(2006)一书所写的前言部分对质性研究(书中称为定性研究)的完全不着边际的误解(把它理解为定类尺度),又让我意识到国内学界对质性研究的陌生。

当然质性研究也不能解决全部问题。就某个社会现象来说,可以收集的证据数不胜数,证据永远没用充足的时候,因此对社会现象的理解也就可以不断深入。这是实情,这是无法改变的实情。但是就社会科学这一整体来说,这种每个课题都永无止境的现象阻碍了不同问题之间的整合。社会科学作为一个整体能不能建立起基础性的理论呢?

谢宇(2008)文末宣称社会学不应当再去探寻普适的法则,我不同意这个论断。社会科学的研究者往往从实际问题出发开始研究。从实际问题出发本来就不可能发现基本的规律,不是基本的规律就不可能成为普适的法则。要发现基本的规律,只有从基本的问题入手。打个比方,如果早期的物理学家们都一心各自钻研具体问题,比如陀螺为什么能稳定的旋转,水柱在空中为什么会散开,等等无数的实际问题,而且在每个问题上都得到独立的结论。那么他们能够从这些研究中综合出物理学的基本规律吗?很难。实际问题并不是没有意义,问题在于实际问题和基本规律之间是脱节的。即便我们弄清楚了基本规律在大多数时候仍然无法轻易解决实际问题,更何况反过来要从实际问题中发现基本规律呢?必须要研究最核心的问题才行。经典物理学是从直接解决力和运动的基本问题入手的,生物学是从解决遗传和变异的问题开始突破的。那么社会科学的基本问题是什么?有什么问题的解决能够导致社会科学领域的突飞猛进?我个人认为应当是人的决策和行为问题。即人是如何做出决策从而决定其行为的,其中的机制如何,这是社会科学的一个基本问题。这个问题本身属于心理学问题。社会科学应当建立在心理学的基础上,在我看来是理所当然的。不过基本问题解决了并不等于相关的实际问题就一并解决了,这在哪个学科都一样,在自然科学领域理科再发达也不能替代工科,生物学再发达也不能替代医学,在社会科学领域心理学再发达也不可能替代其他社会学科。尽管如此,基本理论的建立必然对整个领域产生难以估量的推进。

然而,当前社会科学界最最糟糕的现象就是忽视心理学。很多社会现象其实心理学都有解释,但是各个专业的研究者各行其是,只看见自己眼前的一点现象,意识不到自己研究的现象的心理学基础。在我看来社会科学界忽视心理学是极其荒谬的。社会科学界的很多领域的研究者,从经济领域到教育领域的研究者,都缺乏基本的心理学知识。这要放在自然科学界,就如同说哪个工程、建筑、船舶、电子、生物等领域的研究者没学过物理和化学,这是根本不可能的事。就好比一个人连重力、弹力、摩擦力的基本知识都不知道就去研究盖房子了,这要放在鲁班的时代还行,放在今天那样做只能算是民科的瞎鼓捣。然而社会科学界的研究者恰恰就是如此!

科学研究并不仅仅是一个方法论的问题,还必须建立在相关理论的基础知识上。不耐心学习必要的基础知识,不打下夯实的理论基础,以为有了科学方法就可以开始搞研究,这是可笑的民科观念。因此,在我看来整个社会科学界简直就是民科的大本营。一个认真的社会科学研究者应该打下心理学的坚实基础,了解人的心理和行为的基本规律,理解相关的基本概念,建立基本的知识框架。其学习范围包括普通心理学、认知心理学、社会心理学、发展心理学、进化心理学等。一个教育研究者除了应当学习最起码的普通心理学外,还应当接受认知心理学、社会心理学和发展心理学方面的充分训练,否则的话就是在闭门造车。可悲的是,现在教育领域绝大多数的博士培训项目都没有心理学方面的要求。这样培训出来的博士,即便掌握了研究方法,仍然是半个民科。

更新:

[2009-12-13] 其实质性量性的划分本身就很粗糙,不好太当真。比如达尔文搞出进化论,那叫质性研究还是量性研究?没法归类……

参考文献

  • 谢宇. (2006). 社会学方法与定量研究. 社会学人类学论丛. 北京: 社会科学文献出版社. ※
  • 谢宇. (2008). 奥迪斯·邓肯的学术成就:社会科学中用于定量推理的人口学方法. 社会, 28(3), 81-105. ※

谢宇教授关于研究方法的错误论述

偶然读到谢宇教授介绍邓肯(O. D. Duncan)的文章。为了偷懒,就先看了中文版。感觉某些地方很费解,于是又看了英文版。两相对照,发现翻译似上有不妥之处,造成了理解障碍。另外,文章还有严重的概念混淆。先说翻译问题。

翻译问题

一个翻译问题就是把“population thinking”翻译成了“总体逻辑思维”。估计谢教授是采用了统计学中的译法而把population译成了“总体”,毕竟谢教授是专门搞统计的。但我感觉还是译为“种群思维”较为恰当,毕竟这个词是从进化论借用过来的,而进化论中的population就是种群的意思。而且“总体逻辑思维”这一译法若不作说明,很难让人反推到“population thinking”这一原文,我还以为是什么东方整体思维之类的东西呢。

在网上查了一下,提到“总体逻辑思维”的文章似乎都与谢教授有关,也就是说这是他的独门译法。在其他人的文章中,比如演化博弈与演化经济学:互补性与差异性一文里就译作“种群思维”。

概念问题一

文中把物理学和社会科学拿来对比,因为我原来是学物理的,因此很容易地发现了文中不少的概念错误。上面提到的翻译是小问题,但是下面这些概念问题就严重了。

首先个体差异和测量误差这两个概念在文中被完全混淆了,比如:

Individuals can vary a lot in their behaviors and opinions. The social scientist’s job is to describe the regularities in such variations. For the physical scientist, variations are undesirable measurement errors, i.e., extraneous noises to be eliminated. For the social scientist, variations are the very essence of social reality.

还有和偏差(deviation)混为一谈的。比如:

Technically, such deviations are called measurement errors.
In population thinking, deviations are the reality of substantive importance; the mean is just one property of a population. Variance is another, equally important, property. (p.3)

测量对象之间的个体差异和测量误差/偏差完全是不同的概念,但是文中居然把它弄混了。举个最简单的例子,如果要研究物体的体积和质量的关系,就要找 到不同体积和不同质量的物体来做研究。物体的体积和质量各不相同,这就是研究对象之间的差异性。在测量某个物体的体积或者质量时,每次的测量值不尽相同, 这就是测量误差。一个是存在物多样性的问题,一个是测量的问题,这两个概念可以说是毫不相干。

再如,谢文中说道:

For Darwin, variation is reality, not some undesirable error on the part of the observer. (p.2)

这里隐含的意思是,在物理学里”variation”是被当做”undesirable error on the part of the observer”的。这显然是错误的。举个例子,即便是古代的天文学家观测天象时,也不会把观察到星体的亮度不同当做是观测的误差,而是把它当做不同的星体之间的差异。

事实上,任何研究只要涉及到变量,就涉及到个体差异。没有个体差异哪来的变量呢?那不就成了常量了吗?在这一点上自然科学和社会科学并无差异。另一方面,测量存在误差这在哪里也都是一样的,社会科学和自然科学也没有差异。谢教授的文章却把自然科学中的尽可能消除测量误差和社会科学中的重视个体差异这两个不同层面的事情对立起来,这个对比可以说是完全错位了,在此基础上的对总体逻辑思维(种群思维)和类型逻辑思维的比较也就没有道理。由此所作的种种发挥更是成了空中楼台。

概念问题二

文中的第二个概念问题就是混淆了典型(typical)的和理想的(ideal)。比如:

According to typological thinking, natural science should focus on typical phenomena, such as the typical human body, the typical falling object, and the typical circle. Furthermore, scientists should try to isolate extraneous, confounding factors, such as temperature, size, and location, when studying these typical phenomena. A strong assumption, which has worked well in natural science, is that once we understand the typical phenomena, we can generalize the knowledge to individual, concrete cases. (p.2)

物理学家控制了无关变量的目的是创造理想的研究对象,而不是典型的现象。完美的圆是理想的圆,不是典型的圆(什么叫典型的圆?)。自由落体运动是理 想的落体运动而不是典型的落体运动。事实上,理想的恰恰是非典型的。采用理想模型是物理研究里的常用方法,它是出于控制变量、简化问题的目的,而并不是研究典型问题的意思。文中把物理学研究的理想模型等同于现实存在中的典型现象,这是又一个错位;作者再进把它引申到和社会科学中的差异性进行对比,就完全不搭调了。

概念问题三

文中的第三个概念问题就是对理想思维方法(文中称为类型逻辑思维)和种群思维方法(文中称为总体逻辑思维)的并列比较。理想思维方法表达的是分离和 控制变量的思想,而种群思维方法表达的是以群体(不是个体)为研究对象的思想,这是两个不同维度的思维方法,把它们并列在一起比较是没有道理的。

其实物理学里面也有研究群体现象的分支,比如统计物理学(事实上还真有用统计物理学来研究社会现象的)。研究群体现象时也可以采用分离和控制变量的 研究方法,这两者并不矛盾。社会科学的研究问题也不全是群体问题,也有大量的个体问题。并不是牵涉到很多人的现象就是群体现象,关键是涉及到的个体之间有没有相互作用。比如儿童失学问题就是个体问题。儿童失学并不是失学儿童相互作用的问题,其中的个案是相互独立的,因此这仍然是个体问题。再就是,有的问题本来就可以同时从个体或群体的两个不同层面去研究。比如教育问题既有个体的层面也有群体的层面。

对物理学的误解

除了概念的混淆,作者对物理学的研究方法也存在误解。这篇文章拿社会科学来和物理学比较,刚好我前两天也在思考类似的问题。原本希望能从这篇文章中 获得启发,刚好可以借助作者对物理学的误解来获得别样的启发。

作者对物理学/自然科学的误解集中反映在下面这段话里:

Adhering to Plato’s typological thinking in the physical sciences has resulted in a great success story. This kind of thinking also resolved the potential conflict between science and religion for a long time, as natural laws, from this perspective, provide sufficient, physical, or immediate causes governing natural objects, instead of relying on “final causes” directly from the God. One can trace highly successful examples in Copernicus, Galileo, and Newton to this line of reasoning. In typological thinking, real life deviations from the perfect world of being are considered nuisances, imperfections in making copies, and thus trivial and ignorable, unworthy of a true scientist’s attention. The core of this philosophy is that a scientist can make a great scientific discovery only if he/she knows how to go beyond the nuisances posed by deviations in the world of being. (p.2)

这些说法并不符合物理学的实际情况。在物理研究里,某些时候的确需要建立理想模型,忽视无关的干扰变量。但这是取决于研究的程度,而不是什么预设的 根本准则。就落体运动来说,一开始当然研究受空气阻力影响最小的实心铁球而不是羽毛,等自由落体的规律弄清楚了可以再来逐步研究复杂的情况。物理学从来没有规定只能研究理想状况。其实理想与否是相对的,就落体运动来说实心铁球比乒乓球要“理想”,乒乓球又比羽毛要“理想”,理想状况并非绝对的。物理学也没有总是忽视偏差干扰,因为不通过扎实的研究你就不知道什么是真正的“偏差干扰”,常常在细小的“误差”里隐藏着玄机。比如开普勒就从8角分的误差里发现了天体的轨道是椭圆的,而不是完美的圆。当然,物理学家也并不是总在琢磨每个测量上的误差。值不值得钻研,需不需要深究,这取决于研究的目的和条件。

在英文第3页(对应中文第85页),作者还举了测量声速的例子。这个例子仍然是片面的。如果每次在同样的环境里测量声速,那其实是测量同一个对象, 这里的确只有测量误差的问题。但是如果一次在空气里,一次在水里,这就是不同介质中的声速的“个体差异”了。一般来说是不能把这些声速的测量值求平均的, 因为这个平均值没有意义。如果再把光速考虑进来,就相当于不同的“种群”了。这里和所谓的类型逻辑思维或者总体逻辑思维(种群思维)没有任何关系。

另,文首引用了邓肯教授的一段话,称社会学不应该像物理学。这一论断也是错的,其错误在于它把物理学当作了铁板一块。物理学从微观的粒子物理到宏观 的统计物理还有宇宙物理,有的侧重理论有的注重实验,具体的研究方法并不相同。其实社会科学很像物理学,社会科学也有多个层面,有个体层面的研究,有小社群的研究,也有针对大到国家规模的人群的研究。对于不同层面的研究要采用不同的方法。统计物理的方法不能推广到整个物理学,粒子物理也不能,宇宙物理也不 能。类似地在社会科学领域,人口学的方法也不能推广到整个社会科学,人类学也不能,认知科学也不能。有的研究方向注重数学工具的应用,有的方向注重田野调查,有的方向注重实验,要按照研究的具体问题来选择合适的方法,不要宣称哪种方法是唯一正确的方法。

补充:又读了谢宇教授所著的《社会学方法与定量研究》发现以上提及的错误在该书前几章的相应部分里也全部存在。

参考文献

  • 谢宇. (2006). 社会学方法与定量研究. 社会学人类学论丛. 北京: 社会科学文献出版社. ※
  • 谢宇. (2008). 奥迪斯·邓肯的学术成就:社会科学中用于定量推理的人口学方法. 社会, 28(3), 81-105. ※

教育研究的糟糕声誉

Kaestle是美国威斯康辛大学的一位教育史教授,1992年他采访了33位教育研究的主管和研究者。这个关于美国教育研究的口述史的一部分发表在1993年的Educational Researcher上,题为“The awful reputation of education research”(教育研究的糟糕声誉)。

教育研究为何声誉糟糕?教师们普遍认为教育研究最大的问题是不实用。这的确是个问题,在研究情景下所得出的结论放到复杂的实践环节往往不能直接套用。那么教育研究在设计时就应当考虑到其可移植性,NSF(美国国家科学基金会)在资助教育研究时就强调其不但应该是严格的而且应当是有用的。

也有人认为是因为教育研究的成果没有得到有效的传播,造成了研究和实践的脱节。事实也的确如此,教师们很少(几乎不)阅读专业的教育研究文献,因此教育研究者尝试着主动传播教育研究的成果。美国教育部在1986年出了本叫《What works》的小册子,以通俗易懂的方式介绍了在大量教育研究基础上提出的能够改进教学的41个教学策略。然而一年之后,该书的一名主要作者同时也是美国一个教育研究部门的主管,在一次同18名校长就餐时了解到,其中只有4人听说过,两人看到过,其中只有一人在工作会议上提到过这本书。很显然,只出好书是不够的,这并不是传播教育研究成果的有效方式。

也许教育研究不能得到应用的真正原因是教育一线工作者们对其需求不高。教师们忙于手头的工作,没有时间也没有心思去学习新的知识。教师显然不同于科研人员,其工作性质并不要求教师去搜寻最新的信息。教师的工作性质更接近于医生和律师,其专业知识的获取更应该集中在职前的培训阶段,因此把最新的教育研究成果融入到师范教育中去可能才是最有效的途径。

教育研究的另一个问题是其发现的新异性较低。或者说,人们们往往认为有没有教育研究对实践的影响不大。每个人从小到大都受过十几年的教育,因此似乎每个人都知道教育是怎么回事。教师们往往觉得根据自己以前所受的教育就知道应该怎么从事教学工作了,这一点上教学工作和医生或者律师的工作很不一样。每个人都是伴随着教育而成长的,常人的教育经历都远胜于医疗和法律方面的经历(除非久病成医)。另一方面,很多时候教育研究虽然推动了教育的发展,而并不被普通人所知晓,人们往往以为从来就是如此,一切就是那么简单。就算教育发生了进步,人们也不知道这其中教育研究的功劳。

怎样才能让人们认识到教育研究的价值?有的研究者提出教育研究应该和实践紧密地结合起来,应该解决具体问题,研究者应该和一线工作者合作。研究者们应当去解决地区性问题,而不是全国性的问题,因为人们更关注于自身。作者还提到了美国教育研究组织机构的不稳定,以及教育研究管理工作的政治化等等。最后作者提出了一些建议,比如教育研究者既要和教育研究管理部门协作,也要和一线工作者协作等。

参考文献

  • Kaestle, C. F. (1993). The awful reputation of education research. Educational Researcher, 22(1), 23-31.

美国教育研究机构的变迁

先是 National Institute of Education (NIE)。1972年建立,1985年被OERI正式取代。参看:http://www.archives.gov/research/guide-fed-records/groups/419.html

然后是 Office of Educational Research and Improvement (OERI)。1979年建立,2002年被IES取代。参看:http://www.ed.gov/offices/OERI/index.html

现在是 Institute of Education Sciences (IES)。2002年建立。参看:http://ies.ed.gov/

返回顶部