摘 要:贝叶斯统计与经典统计学作为当今统计学两个重要的分支,本文就对经典统计学派和贝叶斯统计学派在思想和方法上的联系与区别进行了比较分析。
关键词:贝叶斯;经典统计;统计思想;统计方法
贝叶斯方法是由英国学者Bayes在其发表的论文《论有关的机遇问题的求解》中提出来的,并且在和经典学派的争论中发展起来。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两统计学派的比较研究中发现,相比于经典统计方法,贝叶斯统计方法在直观性、易于理解等很多方面更具有优势。
一、 基本理论的差异
1.概率的解释不同
一直以来,经典统计学派对贝叶斯统计的主要批评在于贝叶斯统计在概率理解上的“主观性”。经典统计学认为概率必须是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。贝叶斯统计是完全同意概率公理化,但认为概率也可以用经验确定,一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。
2.统计推断利用的信息不同
贝叶斯统计与经典统计在统计推断最主要的不同在于贝叶斯统计运用先验信息。经典统计学的统计推断是基于总体信息和样本信息。总体信息即总体分布或总体所属分布族中包含的信息,包括总体认识、参数范围、变量的方式和特征等;样本信息是从总体中抽取的样本中所包含的信息,这是最“新鲜”的信息。而贝叶斯统计方法在此基础上还利用了先验信息,先验信息主要来源于经验和历史资料。
3.样本和总体参数的利用与认识不同
经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”,即只靠考已经出现的数据(样本观测值),而认为未出现的数据与推断无关。基于在样本利用方式上的差异,使得贝叶斯统计不承认经典统计中的“无偏性”这一评判标准。
三、点估计与区间估计
1.贝叶斯定理与似然函数
贝叶斯定理是贝叶斯统计学的理论基础,贝叶斯公式的密度函数表示形式为:
θ为模型的参数向量,x表示为数据向量,即样本观察值,其中,函数 p(x |θ )集中了总体信息和样本信息,被称为似然函数,它是未知参数θ 的函数。
在似然函数上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ 的函数,而样本x 在似然函数中是一组观察值,所有与试验有关的θ的信息都被包含在似然函数之中,使似然函数值达到最大的θ 值有比其他θ 值更大的说服力,此θ 值即为经典统计中的最大似然估计;而我们可以证明,在贝叶斯统计中,当在“无信息 ”的条件下, θ 的最大后验估计就是经典统计中的最大似然估计。
在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。
2.置信区间
在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。例如,一家电生产企业为估计其产品的平均寿命的可信区间。贝叶斯统计中的可信区间由后验分布求得,参数被认为是随机变量,因此我们可以说,平均寿命θ 落入最终区间的概率是90%。而在经典统计中,参数θ 是一个常量,而求出的置信区间要么包含平均寿命 θ ,要么θ 在此区间之外,很多人在实际应用经典统计的过程中,误把置信区间理解为平均寿命θ 落入某个区间的概率是90%,而事实上,我们只能说重复做100 次此实验,大约有90 次求出的置信区间能使之包括真实的产品寿命θ ,而这对于只做一两次实验的人来说是毫无意义的。
相反,贝叶斯统计的方法清晰明了,而且在置信区间的寻求和计算上也简单得多。在条件方法下,对给定的样本x和可信水平1-α通过后验分布可求的具体的可信区间,计算方便。而在经典统计中寻求置信区间有时是困难的,要构造一个枢轴量(含有被估参数的随机变量),使它的分布不含有未知数。这是一项技术很强的工作,比求可信区间复杂的多。
四、假设检验
1.基本检验思想的比较
经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0 为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(X|H0 为真),X 是样本向量。
而在贝叶斯统计中,可以直接求得在样本X 给定的条件下,参数的后验概率,因而得出H0 和H1 和后验概率,即判定的是P(H0 为真|X)和P(H0 为假|X)。这是两种检验方法间的根本区别。
2.先验选择与显著性水平的“主观性”
经典统计学派攻击贝叶斯学派很重要的一点就是贝叶斯统计中先验分布选择的主观性。在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒
绝域的变化,而贝叶斯统计在后验均值估计中的最基本特征是伸缩性。后验分布的精度是样本信息分布的精度与先验分布精度之和,当似然函数的精度较大时,后验分布主要受样本信息支配;相反,则主要受先验信息支配。而经典统计中的显著性水平也是一个主观的概念,有研究证明:在贝叶斯检验中,先验信息的变化引起拒绝域的变化,实际上就是相当于在选择经典统计检验中的显著性检验水平。因此,两者都具有主观的成分
3.多重检验问题
贝叶斯统计在检验问题中的一个优势在于多重检验问题,这是经典统计所办不到的。例如:在一次企业对两种生产方法的比较检验中,我们将假设设为:H0:θ =0; H1:θ 0,H0 表示两种方法无显著差别,H1 表示方法一优于方法二,H2 表示方法二优于方法一。贝叶斯统计在后验概率中计算H1 和H2 的概率,而经典统计方法则很难去处理此类问题。
转载请注明出处学文网 » 贝叶斯统计与经典统计比较