摘要:本文介绍了元分析方法的概念、特点及其基本过程,对元分析的使用方法做了一个简要的概述,并且对元分析的优缺点进行了评价,同时探讨了元分析方法对未来研究的启示。
关键词:元分析;效应量
1.元分析方法的一般问题
长久以来,心理学学科使用“提出问题―做出假设―进行实验―验证假设―回答问题”这一思路对需要研究的问题进行探讨。然而,不同的被试、不同的实验程序和统计方法可能使研究者们对同一问题得出不同的结果,因此,研究者们对同样问题的解释通常存在争论。如果一些观点获得的研究支持少于另外一些,即论据不够充分,那么它自然会得到较少的认同。然而,在科学研究日益繁多的今天,如何全面地探寻到对一个问题的多种解释,并且得到最可靠、最合理的答案,是一个亟需解决的问题。而“元分析”方法,恰巧可以为这样的要求提供支持。
对于“元分析”这一概念,研究者们给出了从各个角度出发的界定。目前普遍以Glass于1976年提出的定义为主:元分析是以综合已有的发现为目的,对单个研究结果进行综合的统计学分析方法。也称为“典型或定量元分析”。而Ellenberg认为,元分析是对具有共同研究目的相互***的多个研究结果给予定量分析、合并分析,剖析研究间差异特征,综合评价研究结果。Sacks则将元分析定义为“对以往的研究结果进行统计学的合并和严谨的系统综述方法”。从以上三条定义中不难看出,元分析方法是一种应用特定的设计和统计学方法对以往的研究结果进行整体的和系统的定性与定量分析。
Glass认为资料分析应该划分为三个水平。首先是初始分析(Primary analysis),是对单个研究资料的最初分析,通常是统计方法的直接应用;其次是二次分析(Secondary analysis),是对初始问题的再研究或用“旧资料”回答新问题而对资料进行的再分析;最后一种即元分析,是对大量分析结果(分别来自各个单独的研究,即初始分析和二次分析的研究结果)“综合”或“整合”式的资料统计分析,有助于弥补单项研究的不足。从这一点来说,元分析与文献综述在作用上是类似的,即概括地论述某一问题的现状。然而,传统的文献综述通常以定性分析或描述为主,难以给出定量的结论,并且难以从众多研究(如500个)结果中得出一个一般性的结论。此外,综述者究竟使用了哪些文献常常不得而知,并且传统综述中没有足够重视研究质量、样本大小等因素对研究结论带来的影响。另外,使用同样的文献,不同的综述者可以得出不同的结论。而与传统的文献综述相比,元分析能最大限度地减少各种偏向,确保结论的科学性、客观性和真实性。首先,元分析运用各种手段从一群***研究中组织和提取信息,并对这些研究的结果做出总的估计,是一种定量方法;其次,它包含某一研究课题下所有可接受的文献,全面而客观,弥补了单一研究的不足;第三,元分析给出的通常是一般性的结论,是系统的和可重复的;最后,元分析方法能发现单一因果分析或关系分析研究所不能发现的潜在规律。
因此,我们不难看出,元分析能够解决研究结果的矛盾,定量估计研究效应的平均水平,为进一步的研究和做出决策提供全面的文献总结,并且能从一定程度上提高统计分析的功效,揭示和分析多个同类研究的分歧,为确定新的研究问题和对新实验的设计提供帮助。此外,元分析方法具有处理大量文献的能力,不受研究数目的限制,很大程度上节省了研究的费用,解决了研究发表偏向等问题。
2.元分析的实现方法
早期的元分析技术主要有票数计算法和概率组合技术两种。票数计算法是对所收集的文献中正的和负的结果分别进行计数,做出定量的总结统计。概率组合技术则是将某一课题以前发表的许多报告到的概率水平值进行整理,组成一个总体概率值。由于票数计算法无法区分出一类错误和二类错误,无法表达t检验中的差异,而概率组合技术则更多地偏向于统计那些显著的结果,而对未发表的不显著的结果存在一定程度的忽视,会导致过高估计研究课题的效度,因此这两种方法渐渐不再被使用。
目前,对元分析中资料的统计学处理通常使用“效应量”(effect size)这一概念,也就是将收集到的统计量(多个***研究的结果)合并或汇总成某个单一的效应量或效应尺度,即用某个合并统计量反映多个***研究的综合效应。通常提取到的数据资料包括计量资料(连续性变量)、计数资料(即离散型的二分类变量)以及假设检验统计量。
Q=∑ki=1Wi(Yi-Y)2同时,针对前文提到的对纳入研究的检验方法,通常通过检验纳入研究的异质性来实现,也即对纳入研究的结果进行同质性检验(test for homogeneity),以判断多个研究是否具有同质性,之后才能根据其结果选用正确的统计分析模型。通常采用Q检验的方法。
其中,Q值服从自由度df=K-1的χ2分布,因此可以用卡方检验来确定纳入研究异质性情况。
经过以上步骤,虽然得到了研究的效应值,但它并不能直接做统计推断,这样就无法知道效应是否显著,因此要合并假设检验统计量。目前被广泛接受的方法是Fisher法:首先,如果文献中没有给出确切的p值,可将各检验统计量如t值、χ2值转为p值;然后,按公式将p值转为χ2值,其中Pi为各***研究的单侧概率。在判断时,自由度为参加元分析的文献数k的两倍,即df=2k,具体的查表等检验方法与一般的χ2检验相同。
目前,已有公司开发出专门用于进行元分析的软件,应用以上原理,可以快速地对数据进行处理,得到统计结果。
3.对元分析方法的评价
如前文所述,与传统的文献综述相比,元分析能最大限度地减少各种偏向,确保结论的科学性、客观性和真实性。但这种方法也有许多不足之处。在进行元分析的过程中,一些经典的问题还需要尽量避免,并且努力找出解决的方法。
例如,具有统计学显著意义的研究结果较无显著性意义的结果或无效的结果被报告和发表的可能性更大,这一现象被研究者们称为“文件柜问题”,也叫发表偏见。另外,各个研究的质量参差不齐,如果把高质量和低质量的研究合并在一起,并给予相同的权值,就会对低水平的研究给予过多重视,从而带来结果的偏向甚至是错误的结论。同时,也有学者提出元分析不应该将研究对象、结果测量指标、实验设计以及测量方式等不同的各项研究所得的结果结合在一起,这样难以得出正确结论。最后,存在一个元分析本身的质量控制问题,即元分析缺乏一个公认的和科学的评价标准,这在一定程度上也导致了元分析方法的误用和滥用。
4.对科研的启示
我们在阅读文献时,经常会遇到某一篇或几篇研究的结果与领域内的其他文献观点不同甚至截然相反的情况。尤其在一些争论不休的问题上,当双方势均力敌,论战旷日持久的时候,作为后来的研究者,总会感到很困惑。我认为,元分析这一方法可以一定程度上定量地衡量这些研究的结果,继而给出一个较为可信的答案。同时,我认为也不能过多地依赖这种方法,随着研究方法的日益改进,设备仪器愈发先进,元分析在处理一些数据的时候也会受到一定的局限,同样地,元分析方法自身的缺点也需要每一个使用者认清并努力避免。总之,在研究中善用而不滥用统计方法,才能得到最真实的答案。(作者单位:宁夏大学教育学院)
参考文献:
[1] Abrams,K.R.Jones,D.R.Jones,D.R.Sheldon,T.A.& Song,F.(2000).Methods for meta-analysis in medical research(pp.31-33).J.Wiley.
[2] Glass,G.V.McGaw,B.& Smith,M.L.(1981).Meta-analysis in social research.Beverly Hills,CA:Sage publications.
[3] Hyde,J.S.& Linn,M.C.(1986).The psychology of gender:Advances through meta-analysis.Johns Hopkins Univ Pr.
[4] 毛良斌,郑全全.(2005).元分析的特点,方法及其应用的现状分析.应用心理学,11(4),354-359.
[5] 权朝鲁.(2003).效果量的意义及测定方法.心理学探新,23(2),39-44.