浅谈统计分析中的误差控制

【摘 要】本文通过对统计分析流程的介绍,针对不同的阶段容易产生误差的地方进行剖析,合理进行误差控制,减小非系统误差的产生,从而达到对非系统误差的控制。

【关键词】统计设计 资料收集 数据整理 统计分析 非系统误差

统计工作主要分为统计设计、资料收集、整理汇总、统计分析、信息反馈五个阶段,统计工作的前四个阶段均是容易产生统计误差的阶段,其中统计分析是统计工作中最关键的一步,对信息反馈阶段的基础,它是保证统计工作成果准确性的重要部分。因此,统计分析中的误差控制显得尤为重要。

一、统计分析的基本步骤

(一)样本采集。样本采集是进行统计分析的前提和基础,是统计分析的数据来源。样本采集有不同途径,首先,通过实验观察和测量调查,来直接的获取到信息的方法。二是通过文献检索,阅读获得间接信息。样品采集过程中,除了要注意数据的真实性和可靠性,而且还特别注意两种不同类型的信息之间的区别:一个连续的数据,也称为测量数据,是指通过实际测量获得的数据;二是间歇性的数据,是指类的事情,也被称为计数数据,等级等属性点数获得的计数数据。对不同的样本数据,在样本采集的初期就应该进行分别对待,保证后续工作的顺利进行。

(二)整理样本数据。整理数据由统计设计标准的分类收集的数据汇总过程中。由于收集到的数据大部分是无序的,零散的,不系统的,统计进入所需的研究数据核查的目的和要求按照之前的计算,不包括其中的一部分不真实的,然后总结或列表,从而简化了原数据可视化,系统化,并能反映在初次分配中的数据。

(三)数据分析。分析数据是指整理数据的基础上,相应的统计计算,获得的数据分布的总体统计特征的统计结论的过程中,它是核心和关键的统计分析。数据分析通常分为两个层次:第一个层次是用来形容一种方法来计算的统计数据反映的集中趋势,分散程度和相关的强度与外部代表性的指标,第二个层次是基于描述性统计,并与推论统计方法进行数据处理,以此来推断总体样本的信息,并进行分析和推测的整体特点和规律。

二、统计工作过程中误差控制

(一)统计设计。统计设计是确定统计工作的主要目的、预期达到何种效果的统计流程、规则的重要步骤。统计设计方案要求考虑问题要全面,针对不同的统计目的确定样本及样本容量。样本量的大小不取决于总体的多少,而取决于:1.研究对象的变化程度;2.所要求或允许的误差大小(即精度要求);3.要求推断的置信程度。当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,在统计设计阶段,合理的确定样本及样本容量是减少统计分析误差的根本条件。

(二)样本采集。样本采集过程即统计资料搜集过程。数据的准确性、真实性是确保统计工作顺利进行以及统计分析、信息反馈的根本要素。样本采集过程应注意一下问题:

1.统计调查人员培训。在进行统计调查之前,统计工作的设计者、组织者应该针对统计调查人员进行一次业务培训。每一项统计调查都是为统计分析的最终目的服务,为更好的收集统计数据,应该让统计调查人员透彻理解统计调查的具体规则、必需调查项目以及必须遵守的相应素质,以减少被调查者对统计调查的误解与抗拒,以此确保统计调查数据的真实性与完整性。

2.调查方式。统计调查有比较实用的调查方式,调查的方式有普查、重点调查、典型调查、抽样调查、统计报表制度等。具体收集统计资料的调查方法有:访问法、观察法、报告法等。具体采用哪种方式,选取的原则就是结合统计调查目的,节省统计调查经费,选取最优的调查方式或多种调查方式相结合。

3.数据完整。统计数据要求各项数据必须完整,如果某一样本各项数据不完全,就决定该样本才具失败,该样本必须被舍弃,因此,缺失数据项目太多会影响样本的容量,最终会使得统计调查结果失真,失去统计调查意义。

(三)数据整理。数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程。它是数据统计分析的基础。数据整理一般遵循以下流程:

有上述流程可以看出,应该加强数据审查工作,在这一阶段,很容易判断出是否出现人工录入失误或数据缺失项等相关问题,减少非系统误差出现。

(四)数据分析。在统计分析阶段,要求统计分析人员熟悉统计调查的目的、数据结构及构成等客观因素,根据数据的汇总分类等预处理结果,合理地选择拟合模型。在此阶段,应该注意的就是正确看待每一种统计分析方法的假设条件以及拟合优度等理论要求。

三、结束语

在统计设计阶段由于设计者不可能完全掌握统计调查对象的总体趋势,在数据分析阶段由于采用拟合模型分析,所以存在一定的系统误差,而这些系统误差是不可避免的,只能通过统计专业人员的专业知识进行理论上的优化,降低系统误差。在数据采集、数据整理阶段,只有加强人员培训、数据审查等办法避免数据输入等非系统误差。同时,在避免非系统误差的同时也应该审查被舍弃的样本数据,避免遗漏正常的异常值,导致异常值丢失对调查对象的总体认识的影响。

参考文献:

[1]范冰,范伟达. 市场调查教程(第二版)[M].复旦大学出版社. 2008,7

[2]贾俊平. 统计学(第三版)[M]. 中国人民大学出版社.2011,2

浅谈统计分析中的误差控制

转载请注明出处学文网 » 浅谈统计分析中的误差控制

学习

怎样种植杨树

阅读(16)

本文为您介绍怎样种植杨树,内容包括种植杨树最新政策,杨树几月种植最好。一、苗木选择

学习

卫生间里的爱情法则

阅读(32)

我当了副处长后,手中的权力直按影响到一些大小老板的财富增长,每天面对的尽是些恭维和笑脸,多少有些飘飘然。这时我正好结婚10年,日子里缺少刺激和感动。

学习

“KWL表格”在小学英语阅读教学中的妙用

阅读(39)

本文为您介绍“KWL表格”在小学英语阅读教学中的妙用,内容包括kwl英语阅读教学策略是谁提出来的,kwl在初中英语阅读教学中的应用。英语新课标要求:英语阅读教学的目标,不仅仅是培养学生的阅读理解能力,英语阅读教学的目标理念必须建立在人

学习

知识链知识获取:技术实现与应用举例

阅读(15)

本文为您介绍知识链知识获取:技术实现与应用举例,内容包括知识链指算法设计,数据获取技术的核心。摘要:知识获取是知识链组建的首要目标。文章从技术角度定义了知识链知识获取,介绍了新兴的知识获取技术:数据挖掘、Web挖掘、文本挖掘,并分别

学习

略论三门球运动的规律

阅读(16)

三门球运动是一项新型的球类运动,它最显著的特点就是三方同场角逐。全国众多中小学将该项运动引入体育教学与训练之中,为提高学生的身心健康水平发挥积极的作用。三门球运动作为一种高级的运动项目,有其内在的发展规律,只有遵循和掌握这些规

学习

刘勰的《文心雕龙》赏析

阅读(27)

本文为您介绍刘勰的《文心雕龙》赏析,内容包括刘勰文心雕龙名句赏析,刘勰文心雕龙全文翻译。关键词历史;为情造文;全面总结;创作经验

学习

遵守公司规章制度范文精选

阅读(11)

本文为您介绍遵守公司规章制度范文精选,内容包括遵守公司规章制度语句,公司规章制度格式范本。遵守公司规章制度篇1今天为大家准备了简单的实习单位鉴定意见评语汇编欣赏,希望内容对您有所帮助,具体情况请看全文介绍。

学习

华学生:诚信著春秋 质量兴大业

阅读(26)

华学生,从一支建筑施工队起家,把一个小小的工程处发展成为注册总资本金为1.16亿元,总资产逾3亿元,下辖云南大同建筑集团有限公司文山公司、云南大同建筑集团有限公司昆明公司、云南汇同贸易股份有限公司、文山州华宇房地产开发有限责任公司

学习

人类体能的极限在哪里

阅读(24)

本文为您介绍人类体能的极限在哪里,内容包括人类的身体是有极限的全文,人类的体能极限是多少。人的速度极限是多少

学习

浅析中国古代王位之争

阅读(17)

本文为您介绍浅析中国古代王位之争,内容包括古代帝王之争,中国古代权力之争的最终结果。摘要:王位之争与帝王的存在,是中国封建社会的重要历史现象,王位之争的实质是典型武力征伐的专制独裁,是为了满足统治者个人的享受欲、权力欲、荣誉

学习

后现代语境下的媚俗艺术

阅读(24)

摘要:媚俗艺术往往被说成是假艺术、坏艺术、文学垃圾等,和坏趣味系在一起。但是每个事物都有两面性,它有被批判的一面,又显露其正面功能。后现代社会是个无不包容的社会,在此,媚俗艺术成为“常规”艺术,作为“常规”艺术每个人必然不能幸免于此

学习

我们,还是孩子。作文600字

阅读(19)

本文为您介绍我们,还是孩子。作文600字,内容包括我还是个孩子600字优秀作文,我们还是我们600字作文。我们,曾经为作业太多而抱怨过。我们,曾经为被家长骂而哭泣过。我们,总是想着别人的不对。老师布置作业太多,或者家长真不疼我。可是,有没有

学习

耶基斯―多德森定律

阅读(27)

本文为您介绍耶基斯―多德森定律,内容包括耶基斯多德森定律,耶基斯多德森定律。动机与目的是相随的.比如,甲同学学习的目的是为了更好地为国家和人民服务;乙同学的学习目的是为了能考入名牌大学;丙同学的学习目的是考出好分数,让爸妈高兴.学