直线回归的应用

【摘 要】采用最小二乘法配置回归直线,把非线性拟合参数问题加以线性化,进行参数估算,得到回归直线实际应用的数学模型,进行了误差分析,并给出了应用的实例。

【关键词】直线回归;回归方程;方差分析

0.引言

“回归”是个借用已久因而相沿成习的名称。若某一变量Y随另一变量X的变动而变动,则称X为自变量,Y为因变量。这种关系在数学上被称为Y是X的函数,但在其他领域里,自变量与因变量的关系和数学上的函数关系有所不同。例如成年人年龄和血压的关系,通过大量调查,看出平均收缩压随年龄的增长而增高,并且呈直线趋势,但各点并非恰好都在直线上。为强调这一区别,统计上称这是血压在年龄上的回归。

直线回归(linear regression)是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化,并且它们的变化在直角坐标系中呈直线趋势,就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。回归分析的方法在园艺植物、医学领域等的生产和科学研究中有着广泛的应用,如利用温度或雨量的变化,预测某种园艺植物的主要物侯期 ( 萌芽、开花 ) 、产量、品质以及病虫害发生;应用实生苗的某些性状,预测成年树的某些性状等。

直线回归分析中两个变量的地位不同,其中一个变量是依赖另一个变量而变化的,因此分别称为因变量(dependent variable)和自变量(independent variable),习惯上分别用y和x来表示。其中x可以是规律变化的或人为选定的一些数值(非随机变量),也可以是随机变量,前者称为I型回归,后者称为II型回归。

1.直线回归方程式

将x与y两个变数的n对观察值(x,y),(x,y)...(x,y)分别以坐标点的形式标记于同一直角坐标平面上,作成散点***,如果这两个变数的 n 对观察值在散点***上呈线性,则说明两变数间的数量关系可用直线回归方程来表示。在解析几何上,表示一个平面上的任何直线方程的一般形式为:

=a+bx (1)

上式称为“y依x的直线回归方程”,x是自变量;a是x=0时y的值,也是回归直线在y轴上的截距,叫做回归截距(intercept);b 是回归系数(coefficient of regression),表示x每增加一个单位,y平均将要增加 (b>0)或减少(b

要使(1)式成为实际资料的最佳线性配合,并满足预测要求,必须使观测值yi与回归值偏离达到最小。当变量x取x(i=1,2,・・・,n)时,可以得到=bx+a(i=1,2,・・・,n)。它与实际收集到的yi之间的偏差是y-=y-(bx+a)(i=1,2,・・・,n)。

这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。由于(y-)可正可负,为了避免相互抵消,可以考虑用

y

-代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y-a-bx)・・・(2)来刻画n个点与回归直线在整体上的偏差。

这样问题就归结为:当a,b取什么值时Q最小,即总体偏差最小。为此分别求Q关于a,b的偏导数,并令他们等于零:

Q(a,b)=

(y-a-bxi)(-2)=0

Q(a,b)=

(y

-a-bxi)(-2x)=0

解得

=

=

-b,其中=x,=y.

此时回归直线为=+x。

通过求(2)式的最小值而得回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法。该方程是实际资料的线性最佳配合。

2.直线回归方程式的计算

例1、测得某地10对父子身高(单位:英寸)如下:

表1

如果x与y之间具有线性相关关系,求回归直线方程;如果父亲的身高为78英寸,试估计儿子的身高。

分析:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归方程。用“最小二乘法”求回归直线方程的关键在于正确地利用回归方程中系数公式求出系数,这样回归方程也就建立起来了。

首先根据实际观测值计算出下列数据:

=∑x/n=668/10=66.8,=∑y/n=670.1/10=67.01

L=∑x-(∑x)/n=44794-(668)/10=171.6

L=∑xy-=44842.4-=79.72

L=∑y-(∑y)/n=44941.93-(670.1)/10=38.529

b===0.465

a=-b=67.01-0.465×66.8=35.948

=35.948+0.465x

所以当父亲的身高为78英寸时,估计儿子的身高约为72.2138英寸。

评注:“最小二乘法”是求回归直线方程常用的方法,在回归直线方程中,a,b是回归直线方程中的系数,其中b是回归直线的斜率,表示自变量变化1个单位时因变量的平均变化值。

例2、某医生研究儿童体重与心脏横径的关系,测得13名8岁正常男童的体重与心脏横径,数据见表。试作回归分析。

(1)以体重作为自变量,心脏横径作为因变量,作散点***,发现呈直线趋势,可拟合直线回归方程。在作回归直线***时,以x变数为横坐标,y变数为纵坐标,并标明名称和单位。若不是以零起始的,要在近原点处划一折断号。划出直线***后,应将实际观察各点标明在***上,且将回归方程以及相关系数(或决定系数)分别标于直线的上方或下方。同时应注意,绘制的回归直线两端不要超出x变数的取值范围。

表2 13名8岁健康男童体重与心脏横径的关系

(2)求回归方程:本例n=13, (下转第92页)

(上接第58页)∑x=301.5,∑x=7072.75,∑y=116.3,

∑y=1044.63,=23.19,=8.95,∑xy=2713.65,

L=∑x-(∑x)/n=7072.75-301.5/13=80.2692,

L=∑y-(∑y)/n=1044.63-116.3/13=4.1923,

L=∑xy-(∑x)(∑y)/n=2713.65-301.5*116.3/13=16.3846,

b===0.2041,a=-b=8.95-0.2041*23.19=4.2121,

回归方程式为=4.2121+0.2041x。

根据直线回归方程可作出回归直线,并不是所有的散点都恰好落在回归直线上,这说明用去估计y是有偏差的。

3.应用直线回归的注意事项

(1)作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律;如对儿童身高与小树的生长数据进行回归分析既无道理也无用途。

(2)直线回归分析的资料,一般要求应变量Y是来自正态总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严密控制的值。若稍偏离要求时,一般对回归方程中参数的估计影响不大,但可能影响到标准差的估计,也会影响假设检验时P值的真实性。

(3)进行回归分析时,应先绘制散点***(scatter plot)。若提示有直线趋势存在时,可作直线回归分析;若提示无明显线性趋势,则应根据散点分布类型,选择合适的曲线模型(curvilinear modal),经数据变换后,化为线性回归来解决。

(4)绘制散点***后,若出现一些特大特小的离群值(异常点),则应及时复核检查,对由于测定、记录或计算机录入的错误数据,应予以修正和剔除。

特别要指出的是:利用直线回归方程进行预测或控制时,一般只适用于原来研究的范围,不能随意把范围扩大。若需要扩大预测和控制范围,则要有充分的理论依据或进一步的实验依据。

【参考文献】

[1]丁勇.直线回归的最小面积法[J].工程数学学报,2003(03).

[2]李平.非等精度测量条件下的一元线性回归[J].大学物理实验,2003(03).

[3]孙彦清.最小二乘法线性拟合应注意的两个问题[J].汉中师范学院学报,2002(03).

[4]吴传生.概率论与数理统计.高等教育出版社,2004,7.

直线回归的应用

转载请注明出处学文网 » 直线回归的应用

学习

科蓝软件 国内领先的银行IT解决方案供应商

阅读(67)

本文为您介绍科蓝软件 国内领先的银行IT解决方案供应商,内容包括科蓝软件合作银行,科蓝软件与银联。公司在渠道类IT解决方案市场占有率较高,市场排名第一位。其中在直销银行和移动银行这两大快速增长的市场领域保持领先,优势逐年扩大。银

学习

秋延后黄瓜栽培技术略谈

阅读(37)

本文为您介绍秋延后黄瓜栽培技术略谈,内容包括黄瓜的晚秋延后栽培流程,秋延后黄瓜新品种。秋延后黄瓜栽培,是秋黄瓜的延后栽培,利用大棚生产播期较秋黄瓜晚,上市收获期可延至11月底或12月上、中旬,冬季天气尚好,可延至元旦前后罢园。其栽培技

学习

绿叶集团开拓“新直销”之路徐建成:坚持以产品为导向

阅读(39)

本文为您介绍绿叶集团开拓“新直销”之路徐建成:坚持以产品为导向,内容包括绿叶直销模式图,绿叶直销徐建成。2017年4月14日,春风送爽、春意盎然,时值绿叶集团获得国家商务部直销经营许可证一周年之际,绿叶集团在苏州总部隆重召开“新直销、

学习

现代企业专利事务管理

阅读(25)

本文为您介绍现代企业专利事务管理,内容包括公司软件专利管理办法最新,实用企业专利管理表格。笔者从事专利审查业务三十多年,对中国近十年来专利申请数量的飞跃发展深感欣慰。专利申请数量增加了,专利管理方面有没有跟上形势发展呢?为此,笔

学习

故乡的老槐树

阅读(54)

本文为您介绍故乡的老槐树,内容包括故乡的老槐树原唱,家乡的老槐树原文。故乡的山上有很多松树和槐树,每当春暖花开季节,那洁白的槐花如雪如银,一串串、一朵朵缀满枝头,满树摇曳,千种风姿,万般神韵。淡淡素雅的槐花,弥漫着沁人心脾的清香,在空气

学习

不会撒娇的女人好不好命?

阅读(29)

我的闺中密友H君,是一位拼杀在京城不折不扣的职场女精英。BOBO短发、干练皮裙、九寸高跟,名牌包包,就职于高薪高压的IT行业,游走在光怪陆离的创投圈,可谓是文能经营公众号,武能扛起桶装水,进能侃晕天使投资,退能看懂财务报表。可就是这样―位女

学习

DF100A型100kW短波发射机自动化原理及故障分析

阅读(35)

本文为您介绍DF100A型100kW短波发射机自动化原理及故障分析,内容包括短波发射机指标,100kw短波发射机自动调谐。摘要DF100A型100kW短波发射机自动化系统,在国家广电总局七二六台运行已经近七年了,它的主要特点是实现自动调谐,减轻了值班员

学习

利用能力素质模型提升员工能力素质应用研究

阅读(26)

本文为您介绍利用能力素质模型提升员工能力素质应用研究,内容包括员工素质模型的建立与应用,能力素质模型与胜任力模型的区别。[摘要]员工能力素质关系到员工的发展,更关系到企业业绩提升。如何提升员工能力素质是企业管理中不可或缺的

学习

DAC:电脑提升好声的关键

阅读(221)

本文为您介绍DAC:电脑提升好声的关键,内容包括如何用dac跟声卡改善电脑音质,电脑有声卡还需要dac吗。一拨80、90后的年轻人用主板的集成声卡配一对100多元2.1多媒体音箱听歌,在没有比较的情况下觉得效果不错,但是只要其中某一个接触到了DA

学习

浅论电影《无极》

阅读(28)

【摘要】陈凯歌的《无极》称得上是中国大陆电影中的大片,可以说从这部影片的策划、立项到投资、开拍到完成、发行的运作过程等角度来看,《无极》在中国大陆有许多开创性的东西。【关键词】《无极》题材架构运作在看电影《无极》之前,我是这

学习

一种两用扩展伞

阅读(42)

本文公开了一种两用扩展伞,其结构中包括伞柄、设置在伞柄上的伞骨和铺设在伞骨上的伞面,与所述伞面周边连接有扩展面,所述伞骨末端连接有扩展杆,所述扩展面铺设在所述扩展杆上。本设计的伞体结构可以变化,不仅可以满足单人使用,而且可以满足双

学习

刘璇:两个人生,一种热爱

阅读(47)

本文为您介绍刘璇:两个人生,一种热爱,内容包括刘璇一生所爱,刘璇最大的爱是陪伴。刘璇曾说过:“我有两个人生,前一个,是体操运动员的人生,我是被动选择的。后一个,是退役后的人生,是我主动选择的。”她用“个”,而不是用“段”,她对此的解释是,因

学习

损人利己者诫

阅读(24)

本文为您介绍损人利己者诫,内容包括损人利己的人原文,小人重利损人利己原文。随着时代的发展,古典名著《水浒》中的英雄好汉也逐渐被人们重新认识,他们中有的杀人如麻,只要是冲撞了他们,或他们“认为”哪个该抢该杀,伸出大拳便打,抡起板斧就砍

学习

杨婧:不忘初心,方得始终

阅读(58)

阳光透过窗子洒向教室,书架上错落有致地摆放着一本本读物,蓝色的地面像一片温柔的海洋。色彩点缀下的斑斓教室,是孩子们追寻知识和快乐的世界。在渴望的眼神、愉快的笑声和孩子们凝神学习的身影上,杨婧看到了自己一直守护的执著和最初的梦想

学习

危重症患者潮湿环境相关性皮肤损伤的护理

阅读(30)

通过对危重患者潮湿环境相关性皮肤损伤(MASD)的临床观察进行分析和总结,探讨重症患者发生潮湿环境皮肤相关性皮肤损伤的危险因素、护理问题诊断,以及护理措施。潮湿环境相关性皮肤损伤是临床常见护理问题,但目前相关的研究和证据不足,尚需要更

学习

浅谈皮棉质量及危害性杂物对纺纱的相关影响

阅读(43)

本文为您介绍浅谈皮棉质量及危害性杂物对纺纱的相关影响,内容包括纺织厂怎样控制棉纱棉花质量问题,籽棉回潮对皮棉的影响。棉花是我国农业生产的主要经济作物,是纺织工业的主要原料,棉花经过生长发育、采摘、晾晒、运输、加工、检验一个较

学习

上证指数与标准普尔500指数的相关性研究

阅读(53)

本文为您介绍上证指数与标准普尔500指数的相关性研究,内容包括标准普尔500指数的计算方法是什么,标准普尔500指数最新价格。一、引言随着全球经济一体化的发展,各国经济相互影响相互渗透,全球金融市场发展迅速,国际资本市场也呈现出一体化

学习

氟化物防龋齿相关的研究

阅读(33)

本文为您介绍氟化物防龋齿相关的研究,内容包括氟化物防龋文献,氟化物防龋齿论文。本研究是为了氟化物能减少儿童和成人的龋坏,还能在龋洞形成前使早期有龋坏的牙齿恢复正常氟化物;氟化水源;氟化食盐;含氟溶液;牙面涂氟法在目前各种防龋

学习

回归质朴 本真为文

阅读(60)

本文为您介绍回归质朴 本真为文,内容包括回归原始质朴生活的句子,人们需要回归质朴。近年来,高考作文浮华矫饰之风渐盛,质朴本真之气渐衰。中学生为试而文,失去了清纯真朴之色。事实上,质朴才是作文的最高境界。质朴、本真应该成为学生作文

学习

父爱的异化与回归

阅读(17)

本文为您介绍父爱的异化与回归,内容包括父爱的语言阅读全文,父爱的思考全文。父亲,无论在教育子女、家庭管理、社会角色上都占据重要地位,中国传统社会的父亲承担着更多的社会职能。当我们把目光转向文学世界时就会发现,从“父亲”形象的变

学习

MMIC LNA设计中无源二端口网络相关特性分析

阅读(14)

结合MMIC低噪声放大器(LNA)设计技术,探讨了线性无源二端口网络在MMICLNA设计中的相关特性。为了实现MMIC低噪声放大器指标的精确设计,首先由无源二端口网络的散射参数矩阵推导了其相关特性,然后结合法国UMS公司的PH25工艺,提出了一种MMIC低噪