Logistic模型实例中的应用

摘 要 广义线性模型是一类有着广泛应用的统计模型,可适用于连续数据和离散数据。而logistic模型作为广义线性模型的一个特例,在实用上,尤其是医药、生物、保险和经济社会数据的统计分析上有重要意义。本文主要介绍logistic模型,并通过解决一个调查实例来体现出logistic模型的适用性。

关键词 广义线性模型 logistic模型 极大似然估计

中***分类号:O212 文献标识码:A

线性回归模型(linear regression model)在定量分析的实际研究中是最流行的统计分析方法了,但线性回归也会受到限制。在过去的几十年里,广义线性模型(GLMs)已经成为了一种常用的统计工具来拟合精算数据。广义线性模型是对经典的线性回归模型的进一步推广。许多社会科学的观察都是分类的而不是连续的,分析分类变量时,通常采用的一种统计方法是对数线性模型(log-linear model)。在本文中,笔者将提供对数线性模型的一种特殊形式——logistic回归模型。

1 理论介绍

1.1 logistic模型

logistic回归,作为广义线性模型的一个特例,一般用来预测二分类变量的情况,其形式为: ( / 1-)=+

其中:,,…,为自变量; 为事件发生的概率,为截距。为回归系数, / 1-被称为事件的发生比(odds)。

在已知和的情况下,某一种特定情况发生的概率可以通过以下等式得到: = exp( + )/1+exp( + )

其中,截距及回归系数由极大似然估计得到。

Logistic回归时最为常用的预测被解释变量为0-1变量的模型,其与普通线性回归的区别在于:logistic回归通过logistic联结函数,将线性模型的预测平面转换为预测曲面。但是一旦取定阈值以后,判别函数其实依然是线性的。

与线性回归估计未知参数时主要采用最小二乘估计不同,logistic回归模型是非线性模型,最常用的是极大似然估计。

1.2 最大似然估计

***性回归分析中,最大似然估计法可以得到与最小二乘法相同的结果,与最小二乘法相比,最大似然估计法既可以用于线性模型,也可以用于更为复杂的非线性估计。Logistic的似然函数形式如下:L(%a)=(1-)1-

然而,使似然函数L(%a)最大化的实际过程是非常困难的,一般是通过使似然函数得自然对数变换式最大的方法,而不是直接对似然函数本身求最大。其logistic回归模型的对数似然值为:[L(%a)]=[(1-)1-]=[()+(1-)]={(+)-[1+exp( +)]}

上式称为对数似然函数。为了估计能使[L(%a)]最大的总体参数和值。先分别对和求偏导数,然后令它等于0;形式为:

, ( 1 )

由式(1)可以得到如下的结果:=

这意味着观测值之和等于预测概率之和。这一性质在评价模型拟合情况时非常有用。最大似然估计得渐进方差和协方差可以由信息矩阵的逆矩阵估计出来。信息矩阵实际上是二阶导数的负值的期望,可以用下列形式表达:(%a)=E[-2ln(L)2/%a2],信息矩阵的逆为:[(%a)]-1。夂徒ソ讲畹墓兰凭褪切畔⒕卣蟮哪娴亩越窍呱显刂担越窍咭酝飧髟刂滴飨畈问涞男讲罟兰啤?

2实例和模型

2.1 例子

在汽车安全性的调查研究中,随机抽取150名男性以及150名女性,进行关于买车时是否将空气调节和动力转向作为重要因素的调查,下表给出他们的性别、年龄及每个人做出的反应。

我们运用R软件及离差分析的方法确定哪个是比较好的模型,并且看看哪个因素影响比较显著。假设为反应重要与不重要的比率,,,表示不同年龄的女性,,,表示不同年龄的男性。

2.2模型1

我们建立只与“性别”有关的广义线性模型,根据R软件的计算结果可知,中间模型与全模型有明显差别。

则模型1的形式为:=exp(1.0116 -0.7433)/1+exp(1.0116 -0.7433)

再有R软件计算结果,根据方差分析可知,常数模型与中间模型有明显的差别。

2.3模型2

我们建立只与“年龄”有关的广义线性模型,根据R的运算结果可知,中间模型与全模型无明显差别。

可得模型2的形式为: =exp( -0.4055+1.2905+2.3179)/1+exp( -0.4055+1.2905+2.3179)

由方差分析可知,常数模型与中间模型无明显的差别。

2.4 模型3

我们建立“年龄”和“性别”线性的广义线性模型,根据R的运算结果可知,中间模型与全模型无明显差别。

可得模型3的形式为: =exp(0.07461 -0.57234+1.25966+224900)/1+exp(-0.07461-0.57234+1.25966+224900)

由方差分析可知,常数模型与中间模型无明显的差别。

通过对三个模型的对比,我们得到模型3是最好的模型并且得到“年龄”的影响比较显著。

3 logistic模型的适用性

首先,一般的判别分析方法要求变量服从多元正态分布,现实中一般达不到这个要求,而logistic回归对于变量的分布没有具体要求,适用范围更广,与现实更吻合;其次,logistic模型建立后,将自变量带入模型得到概率值,给人直观明了的感觉,在实际运用中非常简单、方便;最后,logistic模型适用范围很广,例如在***治经济学的选举问题,社会学和人口研究中人们的行为等等。

Logistic模型实例中的应用

转载请注明出处学文网 » Logistic模型实例中的应用

学习

我们爱团购

阅读(38)

这是一个有个性的年代,但是人们却更寻求归属感。交朋友讲究“圈子”,买房子先看社区,教育孩子按理念分成各种阵营……育儿论坛里的团购,就是一种特殊的“归属”,它能把许多毫无逻辑关系的妈妈拢在一起。虽然大家性格迥异、住得很远、收入水平

学习

工会管理制度

阅读(19)

本文为您介绍工会管理制度,内容包括工会管理办法全文,工会采购管理制度。没有规矩,不成方圆,想把后援做大做强必须建立一系列规范而又合理的制度。然后根据大家自身情况去进行管理。

学习

论成人教育的逻辑起点

阅读(17)

摘要:对成人教育的逻辑起点问题的探寻有助于我们明晰成人教育领域的基本问题,这也是有关成人教育问题的反思和批判。通过对“人是什么”、“教育是什么”、“成人教育是什么”的探寻与反思,我们明白,成人的反身性和自增性也是成人教育的逻辑

学习

西安国际港务区

阅读(41)

本文为您介绍西安国际港务区,内容包括西安国际港务区官方批准文件,西安国际港务区招聘。西安国际港务区概况

学习

“开心辞典”

阅读(28)

本文为您介绍“开心辞典”,内容包括开心辞典全文解释,开心辞典全文讲解。在一次音乐课上,我请学生为歌曲选择一种伴奏型,并提供了三种答案:进行曲、华尔兹、摇滚乐。一方面为提高学生学习的兴趣,另一方面也想考考学生对音乐知识的掌握情况。

学习

简单而不简约

阅读(31)

本文为您介绍简单而不简约,内容包括简约但不简单上一句,简单而不简约啥意思。记得徐老师为学生们上的那堂示范课,他先是用“爷爷、爸爸、孙子剃头”的笑话开启了学生的兴趣,从而让学生体会到了重复的含义,接着又把学生们请到台上来玩了一把

学习

生命的滋味作文200字

阅读(37)

本文为您介绍生命的滋味作文200字,内容包括我尝到了成功的滋味200字作文,幸运的滋味作文200字。生命如歌,生命如诗。生命是多味的,酸,甜,苦,辣,咸样样俱全。生命是坎坷的,不是一帆风顺的。生命是经过困难之后磨练出来的,所以生命是多味的。生命

学习

青少年更需提防“维特效应”

阅读(18)

“维特效应”是指1774年德国大文豪歌德发表的小说《少年维特之烦恼》,描述了一个青年因失恋而自杀的故事,小说发表后,造成极大的轰动,不但使歌德在欧洲名声大噪,而且在整个欧洲引发了模仿维特自杀的风潮,“维特效应”因此得名。

学习

化学清洗工艺技术研究

阅读(20)

本文为您介绍化学清洗工艺技术研究,内容包括清洗化学残留剂哪种最干净,化学清洗技术总结。摘要:随着现代化技术与信息化手段的优化和进步,社会已进入科技时代,这对化学清洗技术的发展和优化起到了良好的促进作用,化学清洗技术作为一种在石化

学习

浅析杜甫《登岳阳楼》中“吴楚东南坼”

阅读(37)

本文为您介绍浅析杜甫《登岳阳楼》中“吴楚东南坼”,内容包括登岳阳楼杜甫注释译文赏析,登岳阳楼杜甫诗歌抒情句子赏析。“吴楚东南坼”一句,历来评论赏析大致包括以下几种:

学习

黑暗者

阅读(24)

本文为您介绍黑暗者,内容包括黑暗者小说免费全文阅读,暗黑者完整版。神秘的黑衣人近距离接触,然后进行威胁,可是几乎没有什么结果。既然这样,那他们为什么还要来访?

学习

曲直向前 福慧双全

阅读(25)

星云大师已经86岁高龄,弘扬佛法也有大半个世纪,从上世纪六十年代起,他在台湾就开创了佛光山,倡导中华佛教,培养佛教人才,到如今佛光会在全球五大洲的七十多个国家建立分会,拥有几百万信众。已故中国佛教协会会长赵朴初先生曾经说过,当初佛陀未能

学习

台湾蝴蝶谷范文精选

阅读(37)

本文为您介绍台湾蝴蝶谷范文精选,内容包括台湾的蝴蝶谷阅读短文答案,台湾的蝴蝶谷第三段中心句。台湾蝴蝶谷篇1创新整合点

学习

基于TAM的信息检索可视化模型

阅读(21)

本文为您介绍基于TAM的信息检索可视化模型,内容包括数据可视化模型的评估,可视化检索最新研究成果。提要本文从技术接受模型(TAM)的角度出发,构建了信息检索可视化基本模型,并简单分析其影响因素。

学习

物理学中常用的理想化模型

阅读(26)

本文为您介绍物理学中常用的理想化模型,内容包括理想化物理模型有哪些,物理学中为什么要采用理想化模型。摘要:构建理想化模型是物理教学研究中的常用方法。在处理实际问题中,如何构建模型的方法和对中学阶段常见物理模型的种类的了解,是处

学习

多元线性回归模型的实例分析

阅读(29)

本文为您介绍多元线性回归模型的实例分析,内容包括多元线性回归模型0代表什么,多元线性回归模型预测的优缺点。摘要:本文我们给出关系的定义,讨论关系学中的重要分支之一等价关系,给出关系学在密码学中的应用.

学习

风险度量中的VaR模型概述

阅读(41)

本文为您介绍风险度量中的VaR模型概述,内容包括var风险分析模型,var模型是计算风险的吗。一、来源及定义

学习

如何建立量化交易模型

阅读(31)

本文为您介绍如何建立量化交易模型,内容包括量化交易模型100例,期货量化交易策略模型。“量化交易”这一新生事物,国内近年才兴起的新鲜交易方式,在西方国家早已出现已久。“量化交易”也叫量化投资,就是借助现代统计学和数学方法,利用计算

学习

基于期权的报童模型研究

阅读(21)

本文为您介绍基于期权的报童模型研究,内容包括期权定价理论中的模型研究,基于sabr模型的期权定价研究。[摘要]在经典报童模型基础上,引入期权机制,建立基于期权的报童模型。研究发现,在分散决策型供应链中引入期权机制,可以通过制定合适的价

学习

T梁钢模型的结构分析

阅读(27)

本文为您介绍T梁钢模型的结构分析,内容包括t梁钢束规格相差太大有什么问题,t型梁结构分析。摘要:介绍了T梁钢模型的基本结构,详细叙述了T梁钢模型在脱模、模扇接缝、梁体预埋件的安装、模扇装拆及砼振动等工序过程中的处理方法,并对T梁钢

学习

现代远程开放教育省开课网考系统架构及模型设计研究

阅读(23)

本文为您介绍现代远程开放教育省开课网考系统架构及模型设计研究,内容包括远程课程如何开课,国家开放大学网课试题。【摘要】本文主要研究了二级管理模式下省开课形成性考核网考系统和终结性考试网考系统的系统架构及模型设计,从而为现代