多元线性回归模型探析

《湖南理工学院学报》2016年第4期

摘要:基于液态烃脱硫装置生产操作运行数据,针对实际液态烃脱除H2S情况构建多元线性回归模型,分析相关操作参数与H2S含量的之间影响因素,并通过拟合优度检验、方程显著性检验以及变量显著性检验对模型进行了验证,得到了较为可靠的多元线性回归模型,最后基于回归模型提出降低液态烃中H2S含量解决方案.

关键词:脱硫;H2S含量;相关分析;多元线性回归;模型检验

脱硫装置原料液态烃来自上游炼厂重油催化装置及焦化装置,原料液态烃进入抽提塔底部,与塔上部注入的溶剂逆流接触、液液抽提,经抽提脱除绝大部分硫化氢.脱硫后液态烃H2S含量常出现异常偏高的现象,影响后续碱洗脱硫醇流程.本文通过分析液态烃进料量、脱硫前液态烃硫化氢含量、脱硫剂循环量、脱硫剂醇胺含量、抽提塔上部温度等因素对脱硫后液态烃H2S含量的影响,并逐一进行验证,建立液态烃H2S含量与各影响因素之间的多元线性回归模型.

1数据预处理

1.1自变量的选取

根据实际操作经验,选取了正常生产中5个可能的影响因素数据,即液态烃进料量1a、脱硫前液态烃硫化氢含量2a、脱硫剂循环量3a、脱硫剂醇胺含量4a、抽提塔上部温度5a.考虑到液态烃脱硫受到液态烃处理、溶剂循环量、原料硫化氢含量、溶剂醇胺含量的综合影响,在正常操作条件下,对数据进行比值处理,新增液态烃进料量与循环溶剂量比163aaa(料剂比)、液态烃总硫与循环溶剂量比1273aaaa(总硫剂比)、液态烃总硫与溶剂循环总醇胺比值12834aaaaa(总硫醇胺比).将液态烃H2S含量作为因变量b,其它影响因素作为自变量a,H2S含量与筛选后的因素。

1.2源数据无量纲化

为H2S含量与各因素散点***.H2S含量与其影响因素之间并不是呈简单的线性函数,而是其它类函数,如指数函数.那么对源数据取对数就将其关系转换成线性函数,并进行线性回归.

2 相关性分析

2.1相关概念解释

2.1.1Pearson相关系数

Pearson相关系数可以相当精确地反应两个变量之间的线性相关程度,判断这些自变量与MSBE含量的线性相关强度.其中相关系数用r表示,描述的是两个变量间线性相关强弱的程度以及相关性的方向,n为样本量,iX和iY为变量的观测值,X和Y为观测值的均值.r的绝对值越大,表明相关性越强.r为负数,表明因变量与自变量呈负相关关系;r为正数,表明因变量与自变量呈正相关关系.一般而言,r的绝对值大于0.95为显著性相关,大于等于0.8为高度相关,在0.5~0.8之间为中度相关,在0.3~0.5之间为低度相关,小于0.3则为不相关.

2.1.2P值

P值是一个概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率.在因变量与自变量的相关性分析中,原假设为因变量与自变量无相关性,P值表示对原假设的支持程度[2].通过SPSS计算出P值后,将给定的显著性水平(通常取0.05)与P值比较,就可作出检验的结论:如果p值,则在显著性水平下拒绝原假设,即因变量与自变量相关;如果≤p值,则在显著性水平下接受原假设,即因变量与自变量不相关.

2.2双变量相关性分析

由于所选取的自变量较多,为了简化分析,先通过两两变量之间的相关性分析对自变量进行筛选,排除不相关的因素.将取对数后的数据导入SPSS中进行双变量相关性分析,显著性水平取值为0.05。在各自变量(1,2,,8)iXi与因变量Y的相关性分析中,排除Pearson相关系数r大于0.3且P值大于0.05的自变量,即排除和溶剂循环量(3X)和抽提塔上部温度(5X)的因素.其余自变量因素P值小于0.05,拒绝原假设,说明二者相关,其中1X、2X、6X、7X、8X自变量与与脱硫后液态烃H2S含量呈中度正相关,且7X总硫料比Pearson相关系数r达到了0.774.4X自变量与与脱硫后液态烃H2S含量呈中度负相关,即醇胺含量越高液态烃H2S含量越低.从双变量相关性分析中,可以初步得出单因素自变量与H2S含量相关性较低,综合因素自变量特别是液态烃总硫与溶剂循环量比值7X可以显著性地反映出与脱硫后液态烃H2S含量的相关性.

3多元线性回归模型的建立

3.1模型的建立

从相关性分析中,我们确定了脱硫后液态烃H2S含量的影响因素,但却难以区分各影响因素的主次,以及重复影响因子,此时需要运用多元回归模型进行区分和预测.在SPSS软件中对因变量(液态烃H2S含量的含量)和自变量(液态烃进料量、脱硫前液态烃硫化氢含量、脱硫剂醇胺含量、料剂比、总硫剂比、总醇胺比值总硫醇胺比)作多元线性逐步回归.在多元线性逐步回归过程中,其基本思想是:对全部的自变量X按它们对Y贡献的大小进行比较,并通过F检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个偏回归方程.当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和.如果由于引入新的变量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除.在引入了两个自变量以后,便开始考虑是否有需要剔除的变量.只有当回归方程中的所有自变量对Y都有显著影响而不需要剔除时,再考虑从未选入方程的自变量中,挑选对Y有显著影响的新的变量进入方程.不论引入还是剔除一个变量都称为一步.不断重复这一过程,直至无法剔除已引入的变量,也无法再引入新的自变量时,逐步回归过程结束.在多元线性逐步回归过程中,经建模分析确定多元线性回归的自变量X7,排除了其它自变量的组合.并根据回归标准化残差直方***,可以判断出本模型的残差数据服从正态分布.确定的数学模型为

3.2模型的检验

模型检验是由统计理论决定的,它是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验.主要包括拟合优度检验、方程显著性检验、变量显著性检验[3]等.

3.2.1拟合优度检验(R2检验)

为了检验描述MSBE含量的多元线性回归方程与观测值的拟合优度,我们采取拟合优度检验的方法来说明.拟合优度检验方法是构造一个可以表征拟合程度的指标R2.其中总变差平方和S总是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;回归平方和S回是总变差平方和中被回归方程解释的部分,是回归方程中所选取的解释变量Xi对被解释变量Y所造成的影响;S残是总变差平方和中未被回归方程解释的部分.R2的取值范围是,R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越接近0,说明回归直线对观测值的拟合程度越差.通过SPSS软件实现R2检验.模型(1)的R2检验结果为0.599,调整R2为0.589拟合优度非常好.

3.2.2方程显著性检验(F检验)

解释自变量与液态烃H2S含量的含量之间的线性关系,我们计算统计量F的值来说明总体上被解释变量与所有解释变量之间的线性关系是否显著.通过公式FFINV(,回归自由度,误差项自由度),计算在特定显著度0.05,F临界值=FINV(0.05,1,42)的条件下F检验的临界值.当统计量F的值大于临界值时,即可认为在总体上,自变量与因变量呈显著的线性关系.计算结果见表8,通过比较,模型(1)F值明显大于F临界值,通过了F检验,且呈显著的线性关系.

3.2.3变量显著性检验

(t检验)通过t检验我们可以看出每个自变量对MSBE含量的影响,如果某个自变量对H2S含量的影响并不显著,就从回归方程中将它剔除.从以上检验结果中可以看出,模型(1)中的自变量X7和截距T检验的P值都小于0.05,即模型(1)通过T检验.

3.2.4模型检验结果

通过对模型进行拟合优度检验、方程显著性检验以及变量显著性检验,得出模型一回归效果都十分显著,拟合优度较佳.同时,结合实际生产结果及理论研究,液态烃总硫含量和溶剂循环量在实际操作中对H2S脱除都有重要的影响,即本模型为多元线性逐步回归的最优结果.

4结论

通过上述分析,我们得出影响脱硫液态烃H2S含量与综合影响因素的多元线性回归方程7Y1.632X15.146.由于作多元线性回归的数据是对原数据取对数后的数据,现将其还原为123{1.6321n(/)15.146}e.aaab(2)结果表明液态烃进料量和液态烃原料H2S含量对脱硫液态烃H2S含量的影响较大,在正常温度和醇胺控制范围内,通过提高溶剂循环量,增大脱硫溶剂与液态烃的液液接触面积,可明显降低脱硫液态烃H2S含量.同时发现脱硫溶剂有效组分醇胺含量在较低浓度120g/L期间仍可以满足液态烃脱H2S的生产要求.本文模型建立在正常醇胺浓度120g/L~250g/L范围,因此本模型中醇胺对脱硫H2S影响较小,经检验,建模及回归方程符合实际生产运行情况.通过实时的原料液态烃分析,当进料量和原料液态烃H2S发生明显变化时,可根据脱硫建模方程的数据计算,适当提高或降低溶剂循环量;溶剂醇胺含量低于120g/L,建议加入新鲜MDEA脱硫溶剂,保持适当醇胺组分浓度,提高脱硫效果.

参考文献

[1]王惠文.多元线性回归的预测建模方法[J].北京航空航天大学学报,2007,33(4):500~504

[2]林彬.多元线性回归分析及其应用[J].中国科技信息,2010,(9):60~61

[3]刘京娟.多元线性回归模型检验方法[J].湖南税务高等专科学校学报,2005,18(5):49~49

作者:龚琛荥1,曹诗怡2单位;1.岳阳兴长石化股份有限公司,2.湖南理工学院

多元线性回归模型探析

转载请注明出处学文网 » 多元线性回归模型探析

学习

浅谈提高生产线设备稼动率

阅读(21)

本文为您介绍浅谈提高生产线设备稼动率,内容包括生产线稼动率的计算公式,设备稼动率用什么表更直观。【摘要】提高设备稼动率,对于以自动化产线和半自动化产线为生产模式的企业是极为重要的。设备作为生产线的主要载体,其稼动率的高低决定

学习

浅论三十年代现代诗派

阅读(21)

本文为您介绍浅论三十年代现代诗派,内容包括现代诗派诗刊,三十年代诗派名言。内容摘要:三十年代现代诗派以杂志《现代》为阵地兴起和发展起来,它的兴起和发展有内在和外在原因。现代派诗歌具有鲜明的“青春”型特征,是由当时特殊的时代背景

学习

新货币经济学

阅读(23)

本文为您介绍新货币经济学,内容包括新货币经济学理论,经济时代的新货币。摘要20世纪80年代以来,西方金融理论的新发展主要沿着两种思路展开:一种思路是在宏观经济模型中加入货币的因素;另一种思路是从货币与各种金融资产的替代效应出发,提出

学习

医务人员手卫生依从性差的原因分析与对策

阅读(13)

本文为您介绍医务人员手卫生依从性差的原因分析与对策,内容包括医务人员手卫生依从性分析,医务人员手卫生依从性多少达标。【摘要】手卫生依从性是全球公共卫生关注的焦点,如何改善手卫生依从性低的问题成为各大医院重点关注且急需改善的

学习

电脑“上档键”操作小攻略

阅读(24)

本文为您介绍电脑“上档键”操作小攻略,内容包括电脑上档键是哪几个按钮,电脑上档键。Windows操作系统中鼠标是电脑必备的输入设备,但是鼠标也不是万能的,特别是在进行一些特定的操作时,使用快捷键更方便一点,以下就是Shift键确关的一些妙用

学习

环保之家的绿色理念

阅读(11)

本文为您介绍环保之家的绿色理念,内容包括环保是种理念绿色是种态度,关于绿色环保方面。环保不是某个人的事,而是每个家庭成员共同的大事。在现实生活中。我们往往越来越依赖于那种“轻轻一喷”的清洁方法以及层出不穷的各色清洁剂。然而

学习

浅谈flash中引导层动画

阅读(91)

本文为您介绍浅谈flash中引导层动画,内容包括flash中引导动画和逐帧动画的特点,flash引导层如何让动作变速。【摘要】在Flas制作中经常碰到一个或多个对象沿曲线运动的问题,它是对运动对象沿直线运动动画的引申,通过学习引导层的使用,物体

学习

罗莎·卢森堡

阅读(23)

本文为您介绍罗莎·卢森堡,内容包括罗莎卢森堡简历,罗莎卢森堡的文章。她出生时,犹太人是没有国家的民族,而信仰注定了她将漂泊一生。正是这一切带来了记录的混乱,并使学者们对她的真名莫衷一是。在祖国波兰(当时仍属于沙俄),人们叫她“罗扎”

学习

逆作法在土建施工中的技术重点分析

阅读(30)

本文为您介绍逆作法在土建施工中的技术重点分析,内容包括何为逆作法施工技术,逆作法施工的新技术有哪些。【摘要】随着我国建筑行业的不断发展,土建施工的规模也在不断扩大,逆作法在土建施工中已经应用的十分广泛。不过现阶段,逆作法施工技

学习

李白的斗酒诗百篇

阅读(27)

本文为您介绍李白的斗酒诗百篇,内容包括李白斗酒诗百篇,李白斗酒诗百篇完整版。一、李白身世与酒

学习

奥丽芙·基特里奇

阅读(23)

本文为您介绍奥丽芙·基特里奇,内容包括奥丽芙基特里奇解析,奥丽芙基特里奇小说免费阅读。Olive是Crosby小镇的一名数学女教师,冷漠,易怒,为人刻薄,说话、做事总是不留情面,常伤害别人的感情。因受父亲自杀影响,Olive总是冷眼看待世界,拒绝虚假

学习

“耳朵虫”的秘密

阅读(25)

“苍茫的天涯是我的爱,绵绵的青山脚下花正开”,无意间,这样一首神曲已经红遍大江南北。身边不少朋友都跟我反映自己到哪都会被“灌输”这首歌。更可怕的是,夜深人静之时,脑海中不知道为什么也会回旋起“你是我天边最美的云彩,让我用心把你留下

学习

顾客满意度评价模型综述

阅读(76)

本文为您介绍顾客满意度评价模型综述,内容包括顾客满意度评价模型,顾客满意度模型的构建及实证分析。摘要:本文通过对顾客满意度概念相关文献的回顾,识别了关于顾客满意度现存的两种主要观点,进而对目前主要顾客满意度评价模型进行了综述,并

学习

浅谈非线性编辑

阅读(27)

本文为您介绍浅谈非线性编辑,内容包括浅议非线性编辑技术,非线性编辑器是什么。Abstract:Thepapermainlydiscussesthenonlinearediting.

学习

回归生活 自由作文

阅读(17)

本文为您介绍回归生活 自由作文,内容包括回归自由经典句子,回归简单享受生活的作文。《语文课程标准》对小学作了如下要求:“能把自己的见闻、感受和想象写出来,做到内容具体,感情真实,有一定条理,语句通顺,书写工整,注意不写错别字,会用常用的

学习

面向仓储系统的自动化WSAN“感知—控制”模型研究

阅读(32)

摘要:建立正确的“感知-控制”模型是实现基于RFID和WSAN的物流仓储系统的关键。研究执行器节点自主移动环境下的多维事件协作检测和跟踪算法;研究基于合同网协议和多竞价拍卖算法的多执行器节点实时任务分配方法,并利用WSAN动态拓扑度相关

学习

线性方程组通解的几种写法

阅读(39)

本文为您介绍线性方程组通解的几种写法,内容包括线性方程组通解的格式,怎么求非齐次线性方程组的通解。关键词:线性方程组行最简形矩阵通解

学习

非线性电阻电路的研究

阅读(21)

本文为您介绍非线性电阻电路的研究,内容包括非纯电阻电路的计算,非线性电阻的电路模型。【摘要】非线性电阻电路在工程科学中有广泛的应用,其设计方法也多种多样。本实验初步研究了非线性电阻电路的伏安特性曲线及非线性电阻电路的应用。

学习

线性问题与非线性问题算子方程近似解法浅析

阅读(25)

本文为您介绍线性问题与非线性问题算子方程近似解法浅析,内容包括线性问题的最优解怎么求,拉普拉斯算子是线性还是非线性的。摘要:本文结合相关文献综述了算子方程近似解法的各种稳定性和收敛性理论,在其过程中也渗透了稳定性和收敛性的

学习

由HO模型所想到的两个问题

阅读(29)

本文为您介绍由HO模型所想到的两个问题,内容包括玩火车模型是玩n比例还是ho比例,ho比例的火车模型好还是n比例的好。[摘要]本文以HO模型为基础,对贸易的最终走向及贸易中国际收支的短期和长期均衡问题提出了一些看法