二项分布是概率论中非常重要的一类分布,在实际生活中,常常会有类似放回抽样、连续射击、连续投篮等重复发生的问题,那么这些问题中某事件发生若干次的概率分布,就是二项分布问题.
一、二项分布的常规问题
例1 在大豆的杂交试验中,基因为[XxYy]的抗旱高杆植株自交,在后代的基因中显性基因有2个的概率是多少?
解析 有[X]或[Y]为显性基因,而自交后的基因中每个基因座上出现显性基因的概率为[p=12],因此出现隐形基因的概率为[q=12],而个体基因中有两对等位基因,于是自交后的基因中显性基因的个数为2个的概率为[P(x=2)=C24122122=616=38].
点拨 在[n]次***重复试验中,设事件[A]发生的次数为[k],在每次试验中事件[A]发生的概率为[p],那么在[n]次***重复试验中,事件[A]恰好发生[k]次的概率为[P(X=k)=Ckp(1-p)n-k(k=0,1,2,…,n)],实际上,它就是二项展开式[[(1-p)+p]n]的第[k+1]项. 通过以上运算我们也可以得到显性基因为0到4个的概率并且它们满足二项展开式,即:
[12+124=C04120124+C14121123+]
[C24122122+C34123121+C44124120]
[=116+416+616+416+116=1].
于是我们可以看出自交后的群体中显性基因为零的概率为[116],显性基因有一个的概率为[416],显性基因有两个的概率为[616],显性基因有三个的概率为[416],显性基因为全部的概率为[116].
例2 在一次数学考试中, 第14题和第15题为选做题. 规定每位考生必须且只需在其中选做一题. 设4名考生选做这两题的可能性均为[12].
(1)其中甲、乙两名学生选做同一道题的概率;
(2)设这4名考生中选做第15题的学生数为[X]个,求[X]的分布列及数学期望.
解析 (1)设事件[A]表示“甲选做14题”,事件[B]表示“乙选做14题”,则甲、乙两名学生选做同一道题的事件为“[AB+AB]”,且事件[A],[B]相互***.
[P(AB+AB)=P(A)P(B)+P(A)P(B)]
=[12×12+(1-12)×(1-12)=12].
(2)随机变量[ξ]的可能取值为0,1,2,3,4. 且[ξ?B(4,12)].
[P(ξ=k)=Ck4(12)k(1-12)4-k]
[=Ck4(12)4(k=0,1,2,3,4)].
所以变量[ξ]的分布列为
[[ξ]\&0\&1\&2\&3\&4\&[P]\&[116]\&[14]\&[38]\&[14]\&[116]\&][Eξ=0×116+1×14+2×38+3×14+4×116=2]
或[Eξ=np=4×12=2.]
点拨 应用二项分布时,应注意判断是否满足以下应用条件:(1)每次实验只有两类对立的结果;(2) [n]次事件相互***;(3)每次实验某类结果的发生的概率是一个常数. 本题中考生之间的选题是相互***的,4个考生选做是4次***重复实验,因此本题随机变量服从二项分布.
例3 某家具城进行促销活动,促销方案是:顾客每消费满1000元,便可以获得奖券一张,每张奖券中奖的概率为[15],若中奖,则家具城返还顾客现金1000元,某顾客购买一张价格为3400元的餐桌,得到3张奖券,设该顾客购买餐桌的实际支出为[ξ]元.
(1)求[ξ]的所有可能取值;
(2)求[ξ]的分布列;
(3)求[ξ]的期望[Eξ].
解法一 (1)[ξ]的所有可能取值为3400,2400,1400,400.
(2)[P(ξ=3400)=(45)3=64125?],
[P(ξ=2400)=C13(15)(45)2=48125],
[P(ξ=1400)=C23(15)2(45)=12125],
[P(ξ=400)=C33(15)3=1125].
[ξ]的分布列为
[[ξ]\&3400\&2400\&1400\&400\&[P]\&[64125]\&[48125]\&[12125]\&[1125]\&]
(3)[Eξ=3400×64125+2400×48125+1400×12125]
[+400×1125=2800.]
解法二 设该顾客中奖奖券[η]张,则[ξ=3400-1000η,η~B(3,15)].
(2)[P(ξ=3400)=P(η-0)=(45)3=64125],
[P(ξ=2400)=P(η=1)=C13(15)(45)2=48125,P(ξ=1400)=P(η=2)=C23(15)2(45)=12125,P(ξ=400)=P(η=3)=C33(15)3=1125.]
(3)[Eξ=3400-1000Eη=3400-1000×35=2800.]
二、二项分布与超几何分布
例4 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球. 求:
(1)有放回抽样时,取到黑球的个数[X]的分布列;
(2)不放回抽样时,取到黑球的个数[Y]的分布列.
解析 (1)有放回抽样时,取到的黑球数[X]可能的取值为0,1,2,3. 又由于每次取到黑球的概率均为[15],3次取球可以看成3次***重复试验,则[X~B3,15].
[P(X=0)=C03150×453=64125],
[P(X=1)=C13151×452=48125],
[P(X=2)=C23152×451=12125],
[P(X=3)=C33153×450=1125].
因此,[X]的分布列为
[[X]\&0\&1\&2\&3\&[P]\&[64125]\&[48125]\&[12125]\&[1125]\&]
(2)不放回抽样时,取到的黑球数[Y]可能的取值为0,1,2,且有:[P(Y=0)=C02C38C310=715];[P(Y=1)=][C12C28C310=715];[P(Y=2)=C22C18C310=115].
因此,[Y]的分布列为
[[Y]\&0\&1\&2\&[P]\&[715]\&[715]\&[115]\&]
点拨 有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是***重复试验,这种抽样是二项分布模型. 而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,这种抽样为超几何分布模型. 因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.
例5 零件的加工都需要一定的工序,国家规定加工某种零件的尺寸误差不得超过1.00mm. 质检人员到某厂检查,从该零件的生产加工线中随机地抽出15个零件作样本,经检测得各零件误差尺寸的茎叶***(以小数点前一位数为茎,小数点后一位数字为叶)如下:
[0
1][1 3 2 1 5 9 8 7 3 2
1 2 3 5 4][零件误差尺寸(mm)]
(1)某检查人员从这15个零件中,随机地抽出3个,求恰有1个误差超标的概率.
(2)以此15个零件的样本数据来估计这批零件的总体数据. 若从这批数量很大的零件中任选3个,记[ξ]表示抽到的零件尺寸超标的个数,求[ξ]的分布列及期望[Eξ].
(3)在这15个零件中,任取3个,记[η]表示抽到的零件尺寸超标的个数,求[η]的分布列及[Eη].
解析 (1)设“15个零件中任选3个,恰好有1个零件尺寸超标”为事件A,则[P(A)][=C15C210C315=4591.]
所以从这15个零件中任选3条恰好有1个零件尺寸超标的概率为[4591.]
(2)依题意知,这批零件中尺寸超标的概率[P=515=13],所有[ξ]的取值为0,1,2,3,其分布列如下:
[[ξ]\&[0]\&[1]\&[2]\&[3]\&[P(ξ)]\&[C03(13)0(23)3]\&[C13(13)1(23)2]\&[C23(13)2(23)1]\&[C33(13)3(23)0]\&]
即:
[[ξ]\&[0]\&[1]\&[2]\&[3]\&[P(ξ)]\&[827]\&[49]\&[29]\&[127]\&]
所以[Eξ=0×827+1×49+2×29+3×127=1.]
也可由:[ξ?B(3,13)],即[ξ?B(3,13)]服从二项式分布,所以[Eξ=1.]
(3)依条件,[η]服从超级几何分布:[N=15,][M=5,n=3], [η]的可能值为0,1,2,3. 则[η]的分布列为:[P(η=k)=Ck5C3-k10C315(k=0,1,2,3)]
[[η]\&[0]\&[1]\&[2]\&[3]\&[P(η)]\&[2491]\&[4591]\&[2091]\&[291]\&]
所以[Eη=0×2491+1×4591+2×2091+3×291=1]
或由公式[Eη=MnN,]得[Eη=1].
点拨 超几何分布和二项分布都是离散型分布,超几何分布和二项分布的区别在于:(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是不放回抽取,而二项分布是放回抽取(***重复). 超几何分布和二项分布的联系:当总体的容量非常大时,超几何分布近似于二项分布……即当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,且每次抽取时又只有两种试验结果,此时可以把它看作***重复试验,利用二项分布求其分布列与期望.
1. 为拉动经济增长,某市决定新建一批重点工程,分别为基础设施工程、民生工程和产业建设工程三类,这三类工程所含项目的个数分别占总数的[12, 13, 16],现在3名工人***地从中任选一个项目参与建设.
(1)求他们选择的项目所属类别互不相同的概率;
(2)记[ξ]为3人中选择的项目属于基础设施工程、民生工程和产业建设工程的人数,求[ξ]的分布列及其数学期望.
2. 某学生在上学路上要经过4个路口,假设在各路口是否遇到红灯是相互***的,遇到红灯的概率都是[13],遇到红灯时停留的时间都是2min.
(1)求这名学生在上学路上到第三个路口时首次遇到红灯的概率;
(2)求这名学生在上学路上因遇到红灯停留的总时间[x]的分布列.
1. (1)[P=3!] [P(A1B2C3)=6P(A1)P(B2)P(C3)][=6×12×13×16=16]
(2)
[[ξ]\&0\&1\&2\&3\&[P]\&[127]\&[29]\&[49]\&[827]\&]
[Eξ=0×127+1×29+2×49+3×827=2]
2. (1)[P(A)=(1-13)×(1-13)×13=47]
(2) [[ξ]\&0\&2\&4\&6\&8\&[P]\&[1681]\&[3281]\&[827]\&[881]\&[181]\&]