敏感问题调查模型浅析

摘要:本文针对敏感性问题造成的无回应给出了要调查问题所占比例的点估计,证明了该估计是无偏估计,几乎处处收敛,依概率收敛,而且从理论上证明了当黑球比例与白球比例的差的绝对值越大时,得到的估计值越接近实值。

关键词:敏感性问题;抽样调查

无论是进行社会问题研究还是进行市场需求的统计分析研究,运用的最为普遍的是抽样调查。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。抽样调查可以分为两类,即概率抽样和非概率抽样。

现在被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。抽样调查按抽样的组织形式划分,有以下几种主要方法:(1)简单随机抽样(也叫纯随机抽样,SPS抽样)。(2)等距抽样(也叫机械抽样或系统抽样,SYS抽样)。(3)类型抽样(也叫分层抽样,STR抽样)。(4)整群抽样(又称集团抽样)。(5)多阶抽样(又称多级抽样)。(6)二重抽样(又称两相抽样)。(7)比率抽样(PPS抽样)。

抽样调查中存在的主要问题:1.确定样本框难度大。2.被调查者不配合。3.调查者素质较低,能力差。4.问卷调查表设计不合理。针对上述提到的问题,我们应该认真研究合适的调查方法和技巧:(1)健全调查网络,建立稳固的调查队伍提升调查员的业务素质,这是减少调查误差的关键。(2)宣传统计法律,打消被调查者的心理顾虑,这是取得准确调查数据的基础。(3)采用迂回访谈,经常换位思考,消除防范心理,从而获得准确数据。(4)科学判断评估。抽样调查除了本身存在的抽样误差外,还存在调查误差。因此对调查数据质量进行科学评估显得尤为重要。

大部分的抽样调查,都会遇到随机抽样误差以外的误差,这些误差会导致产生偏差,使得置信叙述没有意义。产生误差的原因主要有:涵盖不全,即在选样本过程中,如果总体当中的有些部分,根本未被纳入选择范围,这时就发生了涵盖不全的问题,即使从该总体中随机抽样,所得结果还是有偏的;无回应,即无法得到已经被选入样本的个体的资料,最常发生无回应的原因,是联络不上受访对象或者受访对象拒绝回答。一项抽样调查中所宣称的误差界限只包括随机抽样误差。涵盖不全、无回应以及其他实际困难也会造成较大的偏差,但是误差界限并没有包含这些项目在内。从而,我们应尽可能减少这方面造成的偏差。好的技巧都有减少误差的作用。

当调查的问题比较敏感时,被调查者一般不愿意回答,或者即使同意回答但是却做出虚假的答复,这都会造成无回应的发生。例如涉及“你是否”,“曾经是否作弊”,运动员“是否服用兴奋剂”的问题,有过如此经历的人是不愿意承认的。

我们以调查体育运动员服用兴奋剂所占的比例为例,为了得到实际的值,调查人员让运动员在无人的场所内,从装有黑球和白球的袋子中任意取一球,观察其颜色后放回,并承诺若取得黑球就讲真话,取得白球就讲假话,被调查者只需要在匿名的调查表中选“是”或者“否”即可。其中,袋中黑球和白球的比例分别是p0,q0(p0+q0=1)。

下面的问题是如何得到p值的估计p,p是否p是的无偏估计,为了得到更精确的估计,我们的抽样调查方法应该如何改进。

一、p值的估计p

对于任意一名运动员,设事件A1=“回答曾服用兴奋剂”,事件A2=“实际服用兴奋剂”,利用全概率公式得到

p1=P(A1)=P(A1|A2)P(A2)+P(A1|A2)P(A2)

=p0P(A2)+q0P(A2)

=p0P(A2)+q0(1-P(A2))

=q0+(p0-q0)P(A2),

于是,当p0≠q0时,我们有

p=P(A2)=P(A1)-q0p0-q0=p1-q0

p0-q0。

根据概率的统计定义:若是调查了n名运动员,其中有m名运动员回答“是”,则我们用频率来近似概率,便有p1=m/n。从而得到p的估计值p=p1-q0p0-q0。

例:在运动员服用兴奋剂比例的调查中,设袋中黑球与白球的比例分别是p0=3/1.,q0=7/10,运动员中回答“是”的比例是p1=19/30,从而我们得到p的估计值

p=19/30-7/103/10-7/10=16。

二、p是p的无偏估计

命题1:当p0≠q0时,p的估计p是p的无偏估计。

分析:要得到p是p的无偏估计,只需证明Ep=p,又Ep=Ep1-q0p0-q0,于是只需要求出Ep1即可。

证明:设X1,X2,……,Xn是***同分布随机变量序列,其中

Xi=1,第i名运动员回答是

0,第i名运动员回答否,i=1,2,3,……,n,

则有

p1=X1+X2+…+Xnn,

且EXi=P(Xi=1)

=P(Xi=1|取到黑球)P(取到黑球)+P(Xi=1|取到白球)P(取到白球)

=pp0+(1-p)q0,

从而有

Ep1=E(X1+X2+…+Xnn)=EXi=pp0+(1-p)q0,

所以

Ep=pp0+(1-p)q0-q0p0-q0=p。

命题2:当p0≠q0时,对于p值的估计p,有pp,a.s. 。

证明:由强大数定律[1],我们有p1EX1 a.s., ,即存在样本空间Ω中的点集Ω0,满足P(Ω0)=0,且limn∞p1=EX1,ω∈Ω\Ω0,从而有

limn∞p1-q0p0-q0=EX1-q0p0-q0=p,ω∈Ω\Ω0或limn∞p=p,ω∈Ω\Ω0,

即pp,a.s.。

几乎必然收敛和依概率收敛这两种收敛性分别对应强大数定律和弱大数定律,强大数定律比弱大数定律要强,从而几乎必然收敛可以推得依概率收敛[2],我们得到下面的结论:

推论:当p0≠q0时,对于p值的估计p,有pPp。

三、如何设计才能减少误差

命题3:当p0≠q0,且|p0-q0|增大时,p的方差Dp减小。

证明: Dp=D(p1-q0p0-q0)=Dp1(p0-q0)2,由命题1的证明过程知

Dp1=DXin=EXi-(EXi)2n=

pp0+(1-p)q0-(pp0+(1-p)q0)2n,

从而有

Dp=Dp1(p0-q0)2=pp0+(1-p)q0-[pp0+(1-p)q0]2n(p0-q0)2

=p(p0-q0)+q0-p2(p0-q0)2-2pq0(p0-q0)-q20n(p0-q0)2

=p(p0-q0)-p2(p0-q0)2+p0q0-2pq0(p0-q0)n(p0-q0)2

=p(p0-q0)2-p2(p0-q0)2+p0q0n(p0-q0)2

=1n[(p-p2)+p0q0(p0-q0)2

又p0q0(p0-q0)2=

(p0+q0)2-(p0-q0)24(p0-q0)2=

14(p0-q0)2-14,代入上式得

Dp=1n[(p-p2)+14(p0-q0)2-14]。

由此可见,当|p0-q0|增大时,p的方差Dp减小。

当|p0-q0|增大时,p会更接近p,但是往往也不会为被调查者所接受,无回应还是会发生。遇到这样的情况,我们应该怎样处理这些问题呢?

首先,用其他人取代不回应的人。因为城市里的不回应率很高,如果用不回应住户附近的其他住户来取代,可以减低偏差。其次,数据搜集完成之后,应该用统计方法给回应加权,以纠正误差来源。如果城市里太多住户没回应,就给城市里有回应的住户加权。如果样本里太多女性,就给男士们加权。加权的确可以修正偏差,但是也会增加变异性。这就需要统计学家们继续研究更多地调查方法。

参考文献:

[1] 茆诗松,程依明,濮晓龙. 概率论与数理统计教程[M].北京:高等教育出版社,2004.

[2]李贤平,沈崇圣,陈子毅. 概率论与数理统计[M].上海:复旦大学出版社,2003.251.

[3]戴维S穆尔著,郑维厚,译. 统计学的世界(第五版).北京:中信出版社,2003.

(作者单位:石河子大学商学院)

转载请注明出处学文网 » 敏感问题调查模型浅析

学习

畅行天下的奥秘 佳能PowerShot G12体验

阅读(24)

本文为您介绍畅行天下的奥秘 佳能PowerShot G12体验,内容包括佳能powershotg12操作方法,佳能powershotg9和g12对比。『小相机大作为自2008年开始,一个偶然的机会,让我第一次使用佳能G10相机,就有一种堪与单反媲美的感觉。无论画质还是操

学习

小学科学教学中的生活元素

阅读(53)

按照新课标要求,对小学生进行教学时应从学生周边事物着手,引导学生对自然进行探索,从而获取相应的知识技能,以保证学生对于学科学习的热情。本文将以科学课程教学为例,对该课程生活元素挖掘与利用方式方法展开全面论述,旨在提高课程教学质量,保

学习

影像(一)

阅读(39)

本文为您介绍影像(一),内容包括影像中心,影像一键测量仪服务电话。胡兀鹫胡兀鹫是一种大型猛禽。它的长相极为奇特,眼睛前方和后方长有黑色的须状羽毛,形成宽大的贯眼黑纹,颏下长着一撮长长的富有弹性的须状羽毛,很像一把山羊胡须,再配上锐利

学习

道教招魂仪式习俗之探析

阅读(633)

【摘要】招魂是我国流传已久的习俗,招魂本身是一种巫术行为,其涉及的内容颇多。道教是一个非常重视仪式的宗教,道教有独特招魂仪式。【关键词】道教;灵魂;招魂仪式在中国民间社会中,婴孩之失魂、丢魂,老人之去世往往会请道教法师举行招魂仪式。

学习

医院信息管理系统中电子病历系统运用

阅读(35)

在医院信息管理系统中引入电子病历系统,有助于提升医院病例的管理成效,全面提升医院信息化管理水平。虽然当前在科学技术快速发展的背景下,医院信息化建设也取得了一定的成效,但是整体来看,信息化建设依然存在一些不足。通过电子病历系统的运

学习

从印度崛起看全球IT产业的战略迁徙

阅读(37)

本文为您介绍从印度崛起看全球IT产业的战略迁徙,内容包括为什么说印度的it行业最厉害,印度和中国it产业对比。全球IT产业正在经历一场持久而剧烈的变革,它推动着全球IT产业发生一场重大蜕变。和传统的制造业一样,全球IT产业也正在经历一场

学习

从《人性的证明》看日本的“耻”文化

阅读(26)

[摘要]日本文化以“耻”文化享誉世界,“耻”文化的精髓大多指本人因做错事、无法达到自己预想的目标、无法完成任务、被公众嘲笑、在公众面前失仪丢丑,被指弱者为耻,即使无人指责他,但本人内心却充满了耻辱感,他必须通过某种方式,来消除

学习

安徒生和他的《丑小鸭》

阅读(25)

本文为您介绍安徒生和他的《丑小鸭》,内容包括安徒生丑小鸭全文免费阅读,安徒生丑小鸭的全文。作者简介:汉斯・克里斯蒂安・安徒生是世界文学宝库中的一位童话创作巨人。他于1805年出生在丹麦中部的一个叫欧登塞的小城市。父亲是一个穷苦

学习

臧健和:揪心饺子冷链

阅读(24)

“湾仔码头”是遨游中国速冻食品行业的黄金品牌,也是臧健和花了32年搭建的一个水饺王国美梦。从1978年起在香港湾仔码头开始卖手工包制的水饺,到投资设厂轰轰烈烈抢滩华南、香港半壁速冻食品的江山;从一位朴实的山东妇女,到成为演绎“水饺王

学习

王延平:用“外脑”成就全球路

阅读(30)

在纽约最繁华的第五大道40街,亚光家纺租用了整整一层写字楼作为样品展厅和办公室,雇用了十多名美国本土的顶尖销售、设计、物流人员,短短数年内实现了在欧美高端市场65%的市场占有率。从草根到霸主亚光家纺之所以走到今天“毛巾霸主”的位

学习

倚马可待 第10期

阅读(24)

袁宏小字虎,小时家里很贫困,曾为人运租。他文思敏捷,颇有才华,所作《咏史诗》,极为人称赞。袁虎所作的《东征赋》,对当时名士都作了称赞,唯独不谈陶侃的功绩。陶侃之子陶范拿着刀质问袁虎:“先公勋业如是,君作《东征赋》,云何相忽略?”

学习

超载超限运输的成因及社会危害性分析

阅读(22)

本文为您介绍超载超限运输的成因及社会危害性分析,内容包括10张图读懂超限超载运输危害,运输超载超限的原因。长期以来,公路超载超限运输现象在我国愈演愈烈,已成为影响交通安全和对公路基础设施破坏的重要原因之一。在一些严重的地区,几乎

学习

资料管理论文范文

阅读(20)

资料管理论文范文第1篇管理系统在企事业单位中档案资料管理模式中的应用有着较强的积极作用。无论是企事业单位内部使用还是以产品形式来进行开发使用,管理系统的需求都呈增加的发展趋势。伴随着社会经济的快速发展,档案资料管理所面临的

学习

何谓庞氏骗局?

阅读(25)

何为庞氏骗局庞氏骗局的名称源于波士顿巨骗查尔斯・庞兹,他编造的一个投资骗局于1920年崩盘。庞氏骗局是一种投资欺诈,其支付给投资者的回报不是来自真正的投资或实业产生的利润,而是来自后续投资者投入的钱。这种骗局提供的回报一般要比其

学习

浅析《荆棘鸟》的象征意义

阅读(21)

本文为您介绍浅析《荆棘鸟》的象征意义,内容包括荆棘鸟有什么寓意,荆棘鸟的象征意义。《荆棘鸟》是澳大利亚女作家考琳・麦卡洛的作品,被誉为澳大利亚的《飘》。这部长篇小说巧妙了运用了象征手法,以主人公梅吉与拉尔夫的爱情为主线,讲述了

学习

浅析高梯度磁选机的发展现状及应用

阅读(40)

本文为您介绍浅析高梯度磁选机的发展现状及应用,内容包括赣州产2000高梯度强磁磁选机价格,高梯度磁选机技术参数。高梯度磁选机在使用的时候主要的用途是分选弱磁性矿物。这种设备具有较高的适应性,同时,其工作的可靠性非常高,在维护方面也

学习

工厂化瓶栽杏鲍菇培养及出菇技术浅析

阅读(26)

本文为您介绍工厂化瓶栽杏鲍菇培养及出菇技术浅析,内容包括杏鲍菇工厂化催蕾的正确方法,工厂化杏鲍菇出菇后如何选菇。工厂化瓶栽杏鲍菇产品品质好,机械化程度和生产效率高。随着国内消费品质的提高和劳动力成本的上升,瓶栽杏鲍菇将是杏鲍

学习

35KV高压SF6断路器与真空断路器选用浅析

阅读(28)

本文为您介绍35KV高压SF6断路器与真空断路器选用浅析,内容包括35kv高压真空断路器二次原理讲解,35kv真空断路器和sf6怎么区分。高压断路器是电力系统的重要执行元件,是集故障、检修、参数测量频次最多的一种重要电气设备。人们对供电质量

学习

浅析景观生态学原理在城市绿地景观规划中的应用

阅读(39)

本文为您介绍浅析景观生态学原理在城市绿地景观规划中的应用,内容包括城市绿地生态学和园林关系,景观生态学原理分析绿地规划结构。本文通过对景观生态学思想的起源、发展及基本原理的研究,从总体规划特征及规划模式方面介绍了景观生态学

学习

地铁列车PIS系统错误报站故障原因浅析

阅读(21)

本文为您介绍地铁列车PIS系统错误报站故障原因浅析,内容包括地铁afc系统怎么读,地铁列车dcu故障是什么故障。乘客信息系统(PassengerInformationSystem,以下简称PIS系统)是运用在地铁、轻轨等公共交通上,向乘客信息同时收集乘客信息的系统

学习

《比况短语浅析》中的几个问题

阅读(34)

[作者]江苏省高邮市界首中学[内容]《中学语文教学》今年第2期,发表了内蒙古民族师院中文系王同志的文章《比况短语浅析》(以下简称《比况》),该文从“结构特点”、“句中功能”、“表义功能”三方面,对比况短语进行了阐述,这对人们理解和使用

学习

带电作业安全条件浅析

阅读(32)

本文为您介绍带电作业安全条件浅析,内容包括带电作业证报考条件,带电作业条件。带电作业有很大的优越性,要想使它创造更大的价值,必须掌握它的安全条件,才能更好地为生产服务。关键词:带电作业;安全距离;电场强度;绝缘引言带电作业工作有很大的