如何讲好FISHER确切概率法

摘 要: FISHER确切概率法是双总体的比率假设检验的重要方法,也是数理统计教学的重要内容,但现有的课本对该方法原理的介绍都过于简略,以致学生往往很难理解和掌握该方法。本文针对这一实际情况,对FISHER确切概率法进行详细系统的证明,并指出了讲解该方法的要点,同时结合MATLAB程序实现该方法, 教师可以在课堂上演示。实践证明,这种深入剖析且可视化的讲解方法,大大提高了学生的学习兴趣,收到了良好的教学效果。

关键词: 比率假设检验 FISHER确切概率法 MATLAB程序算法

前言

双总体的比率假设检验是数理统计学科中比率假设检验的一项重要内容,在大样本的情形下,根据中心极限定理,用正态逼近法进行检验。20世纪英国统计学家FISHER提出了确切概率法,该方法在大小样本的情形下都可以使用。相比较正态逼近法,该方法适用范围广且比较精确,可以检验水平保证不超过给定的α;缺点是计算麻烦。所幸随着计算机的高速发展,计算已然不成问题,但仍存在难以理解其原理的问题。笔者在教学过程中发现,现有的数理统计和医学统计教科书对该方法的介绍都是点到即止,对原理剖析得不够透彻,增加了理解难度,学生普遍反映难以理解该方法。因此笔者在此详细探究FISHER确切概率法的证明过程,以补充教科书的不足;根据学生反馈对难点进行重点讲解;并给出了MATLAB程序实现该方法的的详细算法,教师可在课堂上演示,以加深学生对该方法的理解,提高学生的学习兴趣。

1.FISHER确切概率法[1]

1.1问题的提出

例:某公安局有两个刑侦组,在过去一年内第一组接手25件人命案,结果侦破了23件,第二组接手35件人命案,结果侦破了30件。问:两个组的侦破能力有无区别?

对该问题进行数学解释,设第一组侦破率为p,

X=1表示第一组侦破成功,其概率为p0表示第一组未能侦破成功,其概率为1-p

即X服从均值为p的伯努利分布,X,…,X为来自总体X的样本,n=25。

同理设第二组侦破率为p,

Y=1表示第二组侦破成功,其概率为p0表示第二组未能侦破成功,其概率为1-p

即Y服从均值为p的伯努利分布,Y,…,Y为来自总体Y的样本,m=35。

两两总体X,Y***,x,…,x,y,…,y为对应的观察值,原假设为H∶p=p,则本质为一个双总体的比例假设检验。显然,该问题p=x=0.92,np(1-p)=1.84

事实上,若H成立,当t=x+y固定时,则检验统计量S=∑X是一个服从超几何分布的随机变量[2],该结论在教材上都是直接指出,而没有详细的解释和证明,学生普遍反映不能理解,下面将给出该结论的详细证明。

1.2检验统计量所服从的分布

统计量S=X在t=x+y固定情况下概率是一个条件概率,由条件概率公式可以得出:

P(S=i|S+S=t)=。

而P(S=i,S+S=t)

=P(S=i,S=t-i)

=P(S=i)P(S=t-i)(X,Y***可得)

=cp(1-p)cp(1-p)(由伯努利分布的定义可得)。

在原假设H∶p=P成立时,上式可以化简得到:

P(S=i,S+S=t)

=ccp(1-p)。

原假设H∶p=p成立时,根据伯努利分布有P(S+S=t)=cp(1-p)。

因此,P(S=i|S+S=t)

=

=。

由超几何分布的概率函数可知,检验统计量服从超几何分布。超几何随机变量是离散型的随机变量,它的值可列的。显然,检验统计量S的取值s满足s≥0,s≥t-m,s≤n,s≤t,因此它的范围为[max(t-m,0),max(t-m,0)+1,…,min(n,t)]。

已知了检验统计量的分布,接下来的任务就是根据其分布来确定该统计量的取值出于哪些范围是属于小概率事件,而该范围就是拒绝域,即接下来的任务就是如何确定拒绝域。因为这之前学生接触过的检验统计量一般为正态分布、t分布、卡方分布等连续型的随机变量,很少接触这种离散型的检验统计量,所以学生可能一时不知道该如何确定这种离散型统计量的假设检验拒绝域,这时可以通过借鉴连续型统计量的情形来引导学生推导。

1.3拒绝域的确定

借鉴连续型的情形,对于给定的检验水平α,我们希望找到两个整数c和c,使得P(S≤c|S+S=t)=,P(S≥c|S+S=t)=,类似连续型情形可以确定拒绝域为[max(t-m,0),c]∪[c,min(n,t)](见***1)。

***1 拒绝域的确定

然而这种希望不一定能实现,因为检验统计量是离散的,所以满足P(S≤c|S+S=t)=的c不一定存在。放宽条件,寻找d和d,使得

P(S≤d|S+S=t)≤(1)

P(S≥d|S+S=t)≤(2)

这样的d和d一定存在,但并不唯一,选择满足(1)等式的最大的正整数为e,满足(2)等式的最小的正整数为e,确定拒绝域为{s≤e∪s≥e}。相对于随机取满足(1)(2)的拒绝域{s≤d∪s≥d},前者有较优良的性质,即它们的检验水平都是≤α,但是犯第二类错误的概率前者是小于等于后者的(对这一点学生也需要一点时间去理解,可以举他们熟悉的置信区间在相同的置信度下取区间长度最小进行类比,以便于他们接受)。

1.4拒绝域的转换

虽然已经知道了检验统计量的分布,确定了拒绝域的形式为{s≥e∪s≤e},求出满足条件的e和e肯定是可以的,但在计算上很麻烦。值得庆幸的事,该定义域可以进行等价转换。

将P(S=i|S+S=t)简记为p(i),

则P(S≤e|S+S=t)=p(i)≤,

P(S≥e|S+S=t)=p(i)≤,

显然s≤ep(i)≤(因为e是满足(1)式中最大的正整数),而s≥ep(i)≤(因为e是满足(2)式中最小的正整数。因此拒绝域转换为min(p(i),p(i))≤,等同于2min(p(i),p(i))≤α

1.5问题的解决

对于例题,n=25,m=35,t=53,p(i)=代入公式,2min(p(i),p(i))=2min(0.374,0.878)>0.05,没有落入拒绝域,所以接受原假设,认为两个组的侦破能力(侦破率)无区别。

2.MATLAB程序算法[3][4]

2.1MATLAB简介

Matlab(MatrixLaboratory,即“矩阵实验室”)是最优秀的数值计算软件。主要特点有:功能强大适用范围广;编程效率高;界面友好用户使用方便;语句简单内涵丰富;功能齐备的自动控制软件工具包等。它已经成为线性代数、自动控制理论、数理统计、数字信号分析与处理等高级课程的基本数学工具。

2.2主要算法

整个算法的流程见***2。

***3 子函数P(begin)的算法流程

核心算法是p(i)的计算,采用递推来简化计算。

p(i+1)=

=

=

p(i+1)=p(i)×。

3.结语

鉴于很多教科书上对FISHER确切概率法原理的阐述过于简单,笔者从原假设H∶p=p入手,详细阐述了该方法的原理,并给出了详细的MATLAB算法流程,教师可以在课堂上演示,达到较好的教学效果。对于H∶p≥p和H∶p≤p的情况教师可以让学生参看教科书自行推导,有编程基础的学生可以动手尝试一下写实现包括三种原假设FISHER确切概率法的程序。实践证明,这种诱导型的教育方法可以较好地增强学生的参与性和调动学生的主动性,收到较好的教学效果。

参考文献:

[1]陈家鼎.数理统计学讲义[M].北京:高等教育出版社,2006.

[2]徐勇勇.医学统计学[M].北京:高等教育出版社,2002.

[3]张志涌.MATLAB教程[M].北京:北京航空航天大学出版社,2006.

[4]张瑞丰.精通MATLAB 6.5[M].北京:中国水利水电出版社,2004.

注:南方医科大学公共卫生与热带医学院院长基金(GW200832)

本文为全文原貌 未安装PDF浏览器用户请先***安装 原版全文

转载请注明出处学文网 » 如何讲好FISHER确切概率法

学习

陈富国:Interbrand如何量化品牌价值

阅读(50)

对于哈雷摩托车迷来说,这个品牌已经成为他们生命中的一部分,也许只有哈雷摩托车制造商破产,才能让他们想到放弃。类似的情况在耐克的消费者中同样存在。从这个角度来看,品牌是一个客观存在,它必须会引起消费者的联想,好的或者不好的。因此,问题

学习

宗白华流云小诗

阅读(22)

本文为您介绍宗白华流云小诗,内容包括宗白华的流云小诗描述了什么,宗白华的流云小诗赏析。关键词:物象;意境;“初发之芙蓉”

学习

刍议篮球比赛中防守快攻的方法

阅读(26)

本文为您介绍刍议篮球比赛中防守快攻的方法,内容包括篮球进攻全场区域紧逼防守的战术,篮球防守战术大全集。摘要:本文首先说明了防守快攻的内涵;阐明了培养快攻的意识和作风具体方法及把握有利时机,稳妥推进快攻过程的重要性;论述了篮球快攻

学习

浪尖上的皮筏子

阅读(37)

《后汉书》中曾记载了古代匈奴人“乘马革渡河”和护羌校尉邓之川在青海贵德“缝革囊为船”载兵渡河的情景。宋《武经部要》一书中说:“浮囊者,以浑脱羊皮吹气令满,系其空,束于腋,以人浮以渡。”《唐书·东女国传》中记载:“用牛皮为船以渡。”

学习

亭下水库水资源管理现状分析及保护对策研究

阅读(34)

本文为您介绍亭下水库水资源管理现状分析及保护对策研究,内容包括横山水库大还是亭下水库大,亭下水库与皎日水库哪个大。【摘要】简述亭下水库水资源保护现状、问题,并作了分析,同时,为今后水库水资源保护工作提出了一些合理化的建议,为科学

学习

企业考核激励机制的作用与实施

阅读(32)

本文为您介绍企业考核激励机制的作用与实施,内容包括企业考核及激励机制,绩效考核制度对企业的激励作用。摘要:国有企业为充分发挥员工的工作积极性,调动干部和员工的创新能力,必须将考核

学习

华佗导引功

阅读(25)

本文为您介绍华佗导引功,内容包括华佗导引,华佗创编的导引养生功法。1?郾练习者选坐或卧位,平心静息,两手掌相互搓揉,犹如洗手的动作,每一部位必须揉到,至两手发热;继之,以两手掌交替洗揉腕、臂,日行3次,每次不拘次数,以揉热发烫为宜。

学习

英勇不屈的阮文追

阅读(36)

后来,他的父亲被法国鬼子抓去坐牢,一直关到一九五二年。一九五四年日内瓦协议签订后,照理人们可以在和平环境中过日子了,可是他家乡的得市、永桢、维川等地方,却受到美帝国主义和吴庭艳集团残酷的扫荡。阮文迫一家出走西贡,在新平郡的新坡、富

学习

农民 大孝子陈立祥

阅读(40)

“屋漏偏逢连夜雨”这句话用在一个叫陈立祥的人身上,真的是恰到好处。父亲本已卧病在床多年,母亲又身患癌症,弟弟妹妹也都还未成年。一个堂堂七尺男儿是怎样撑起这个伤痕累累的家?又是怎样历经艰难险阻为母亲求医问药的?最重要的是到底是什么

学习

李亦畲“老三本”的价值

阅读(32)

亦畲公逝世后,“自藏本”由次子逊之(1882~1944年)收藏。现传亦畲公曾孙旭藩,家人视谱如命,罕有睹其全貌者。“启轩本”传至第三代李福荫(1892~1943年,启轩之孙)时,福荫先生鉴于太极拳谱辗转抄录错讹颇多,遂据“启轩本”厘定次序,分为章节。油印、

学习

教育的艺术

阅读(29)

本文为您介绍教育的艺术,内容包括教育艺术期刊,教育是实践的艺术内容简介。法国伟大的思想家卢梭说过:“教育的艺术就是让学生喜欢你所教的东西。”我认为在音乐教育中,要真正做到使受教育者喜欢我们所教的东西,就必须坚持科学性与艺术性的

学习

洛阳——牡丹花都

阅读(50)

本文为您介绍洛阳——牡丹花都,内容包括洛阳牡丹花都最新消息,洛阳牡丹花都井盖。“千年,华夏圣城,文明之源,天下之中;丝路起点,运河中枢,牡丹花都,山水之城;三代创世,魏晋风流,汉唐雄风,宋家文气”,简短数句就将中华古都洛阳概括,洛阳是中国历史上建

学习

电线电缆绝缘老化机理及其表现形式研究

阅读(40)

本文为您介绍电线电缆绝缘老化机理及其表现形式研究,内容包括电缆绝缘老化分析方法是什么意思,电线电缆绝缘击穿的原因分析。【摘要】绝缘材料在使用一定的年限以后,绝缘性能都会呈现一定程度的劣化,这被称为“绝缘老化”。绝缘材料的老化

学习

社会偏见的媒体因素及消减对策

阅读(29)

本文为您介绍社会偏见的媒体因素及消减对策,内容包括如何避免社会知觉中的偏见,社会偏见参考文献。社会偏见“是一种缺乏客观依据,固定的、先入为主的观念和态度。在社会心理学中,偏见多指否定性、拒斥性的态度”。①有的社会偏见(多是强势

学习

区间[0,1]上的几何概率

阅读(25)

本文为您介绍区间[0,1]上的几何概率,内容包括0.1分布的概率怎么求,0-1区间和0-200区间元素相同吗。一、问题的提出

学习

液氨储罐内液氨质量精确计算

阅读(34)

本文为您介绍液氨储罐内液氨质量精确计算,内容包括液氨储罐的液氨怎么计算吨数,液氨储罐的储存系数。摘要:通过对液氨储罐结构分析及对液氨、气氨密度与温度的关系和现有液氨储罐液位检测系统的分析,并经过温度修正和体积修正,对不同环境温

学习

GPS到底有多精确

阅读(25)

本文为您介绍GPS到底有多精确,内容包括gps卫星精确到多少米,gps可以精确到毫米吗。GPS定位的那些事儿!

学习

概率的定义与发展史

阅读(37)

本文为您介绍概率的定义与发展史,内容包括概率的起源和发展史,概率的概念和意义。初中阶段我们学习的概率内容比较基础,到了高中和大学阶段,概率内容将进一步丰富和深化,为了让同学们对概率知识板块有个全面的了解,下面就概率的定义和发展史

学习

概率知多少

阅读(33)

本文为您介绍概率知多少,内容包括概率知多少读后感,概率知多少纪录片全集。气象播音员在预测天气时要用到数学。他用“机会”和“几率”这样的字眼,表示他无法确定明天的天气。在气象人员和其他许多现代科学家的工作中,都用得到数学中的“

学习

奇迹的概率

阅读(23)

本文为您介绍奇迹的概率,内容包括奇迹概率系列作品,奇迹概率系列。我们先来看看常见的扑克牌魔术。大家都知道魔术中是有“把戏”的,尽管如此,魔术师表演时,我们还是会看得很入迷,感觉很多不可思议的地方简直是“奇迹”。例如,从除去大小王的

学习

小概率事件的原理及应用

阅读(67)

本文为您介绍小概率事件的原理及应用,内容包括小概率事件原理及其应用论文,什么叫小概率事件其原理及应用。摘要:小概率事件原理是概率论与数理统计这门学科中的一个基本原理。然而正确理解小概率事件的原理及其推断方法,并能辩证地分析、