EM算法及其推广的几种算法

摘 要 引入了可处理缺失数据的EM算法。EM算法是一种迭代算法,每一次迭代都能保证似然函数值增加,并且收敛到一个局部极大值。在此基础上,本文也给出了推广的几种EM算法。

关键词 EM算法 ECM算法 ECME算法 MCEC算法

中***分类号:O212.1 文献标识码:A

0前言

EM 算法是 Dempster Laind,Rubin 于 1977 年提出的求参数极大似然估计的一种方法,它可以从非完整数据集中对参数进行 MLE 估计,是一种非常简单实用的学习算法。这种方法可以广泛地应用于处理缺损数据,截尾数据,带有噪声等所谓的不完全数据。本文主要说明了EM算法的基本原理及其应用,再针对它的加速收敛性引出了推广的几种EM算法,或称为广义的EM算法。

1 EM算法原理及其应用

1.1 EM算法的思想及步骤

EM算法的每一次迭代有两步组成:E步(求期望) 和M步(极大化)。一般的,以p( |Y) 表示 的基于观测数据的后验分布密度函数,称为观测后验分布, p( |Y,Z) 表示添加数据Z后得到的关于 的后验分布密度函数,称为添加后验分布,p(Z| ,Y) 表示在给定 和观测数据Y下潜在数据Z的条件分布密度函数。我们的目的是计算观测后验分布p( |Y) 的众数,于是,EM算法如下进行。

E步:将p( |Y,Z) log p( |Y,Z)关于Z的条件分布求期望,从而把Z积掉,即

Q(( | (i),Y)EZ[log p ( | Y, Z) | (i),Y (1)

M步:将Q(( | (i),Y)极大化,即找一个点 (i+1)使

Q(( | (i),Y)=Q(( | (i),Y) (2)

如此形成了一次迭代 (i) (i+1)。将上述E步和M步进行迭代直至|| (i+1) (i)||或||Q( (i+1)| (i),Y) Q( (i)| (i),Y)||充分小时停止。

1.2 EM算法的优缺点

EM算法是一种求参数极大似然估计的迭代算法,在处理不完全数据中有重要应用。EM算法实现简单,数值计算稳定,存储量小,并具有良好的全局收敛性。但是,EM算法收敛速度相当慢,只是次线性的收敛速度,这个缺点防碍了EM算法的应用。现已提出了多种加速EM算法收敛的方法。

2 推广的几种EM算法

2.1 ECM算法

EM 算法流行的原因有二:其一,M 步仅涉及完全数据极大似然,通常计算比较简单;其二,它的收敛是稳定的,因为每次迭代似然函数是不断增加的。但是如果完全数据对数似然的估计本身比较复杂时,EM 算法就不再有吸引力了,因此Meng 和Rubin (1993) 提出了 ECM 算法,这种算法的基本思想是用一系列的计算更加简单的CM 步来代替一个复杂的 M 步。当M步没有显式的表达式时,CM步通常有显式的表达式。即使 CM 步没有显式的表达式 ,但 ECM 算法通常更加稳定,因为它的极大化是在更低维度( dimension) 的参数空间中进行的。

2.2 ECME算法

这种方法是由Liu and Rubin( 1994) 提出的,它是ECM算法的推广,在 ECM 算法中,CM 步是对完全数据对数似然函数的期望进行极大化。同样,可以把这种思想运用到观察数据对数似然上,也就是说,在CM 步上,可以考虑在一定的约束条件下,对对数似然函数进行极大化,因此就产生了ECME算法。

2.3 MCEM算法

而对于EM算法的E步,有时要获得期望的显式表示是不可能的,即使近似计算也很困难,这时用Monte Carlo方法来完成,就是所谓的MonteCarlo EM(MCEM) 方法。MCEM算法比较灵活,但是需要仔细选择模拟容量和确保正确的收敛性准则。我们可以通过增加迭代次数来提高模拟容量。除此以外,由于蒙特卡罗误差,该EM算法不具有单调性,难以估计其收敛性。

3结论

EM算法可以应用于医学研究中,尤其是临床医学中十分常见的一种数据观测形式为重复观测,其特点是在同一实验单位上进行多次重复观测,这个过程由于各种原因经常导致实验观测数据缺失。本文给出了EM算法的基本思想,并给出了几种推广的EM算法,其应用范围更加广泛。

参考文献

[1] 茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,1998.

[2] 杨基栋.EM算法理论及其应用[J].安庆师范学院学报(自然科学版),2009,15(4):30-35.

[3] 陈长生,王彤,徐勇勇,尚磊.医学科研中缺失数据的EM估计[J].第四***医大学学报,2002,23(1):59-61.

EM算法及其推广的几种算法

转载请注明出处学文网 » EM算法及其推广的几种算法

学习

论《雷雨》中的蘩漪

阅读(28)

本文为您介绍论《雷雨》中的蘩漪,内容包括雷雨中的蘩漪,谈雷雨中的繁漪。《雷雨》写于1933年,是曹禺的精心之作,该剧写的是一个带封建性的资产阶级家庭的黑暗生活与悲剧。对于剧中出现的主要人物,作者没有简单地为他们勾上代表善恶的脸谱,而

学习

浅析土压力的计算

阅读(24)

本文为您介绍浅析土压力的计算,内容包括土侧向压力计算,土压力计算。摘要:本文详细阐述了三种土压力各自的假设条件及计算方法,诣在让更多的人了解经典土压力计算的原理,为理论上的创新做准备。

学习

繁多的手势语(1)

阅读(20)

向上伸大拇指:这是中国人最常用的手势,表示夸奖和赞许,意味着“好”、“妙”、“了不起”、“高明”、“绝了”、“最佳”、“顶呱呱”、“盖了帽了”、“登峰造极”。在尼日利亚,宾客来临,要伸出大拇指,表示对来自远方的友人的问候。在日本,这

学习

景观生态学论文范文精选

阅读(32)

本文为您介绍景观生态学论文范文精选,内容包括关于景观生态地理学的论文,生态景观学论文。景观生态学论文篇1编者按:本文主要从景观生态学与景观结构;丹霞地貌景观生态设计;丹霞地貌景观生态调控三个方面进行论述。其中,主要包括:在开发过程

学习

刍议“世界三大短篇小说之王”的艺术特征

阅读(25)

本文为您介绍刍议“世界三大短篇小说之王”的艺术特征,内容包括世界三大短篇小说之王的性命,世界三大短篇小说之王的风格。お[摘要]契诃夫的小说通过幽默可笑的情节进行艺术概括,塑造出完整的典型形象。欧亨利对小人物充满了理解和同情,

学习

学会英语 与 会学英语

阅读(32)

本文为您介绍学会英语 与 会学英语,内容包括逐句学英语,中英文对照阅读学英语。在我们英语教学中,我认为教师不仅要教学生“学会英语”,而且要教学生“会学英语”,而且后者比前者更为重要。

学习

世界上18种最濒危的语言

阅读(28)

本文为您介绍世界上18种最濒危的语言,内容包括世界上最濒危的语言,中国境内的濒危语言。AccordingtotheChristianScienceMonitor,theUNAtlasofEndangeredLanguageslists18languageswithonlyoneremainingspeaker.Withaboutonelanguagedis

学习

耐人寻味的《小辞店》

阅读(23)

本文为您介绍耐人寻味的《小辞店》,内容包括小辞店全文,小辞店经典名句。一、《小辞店》的发生地究竟在哪?

学习

浅谈媒介生产中的把关人理论

阅读(84)

本文为您介绍浅谈媒介生产中的把关人理论,内容包括把关人理论在传播学中的影响,把关人理论和媒介管理的关系。摘要:媒介生产批评的主体是媒介批评。媒介生产批评通过媒介产品的各种形式,如消息、评论等载体来体现。媒介生产受到众多因素的

学习

网络安全和隐私安全分析

阅读(32)

本文为您介绍网络安全和隐私安全分析,内容包括网络隐私安全的例子,网络安全与网络隐私报告。1物联网的安全和隐私保护问题

学习

浅析丝网版画创作中肌理的应用

阅读(23)

本文为您介绍浅析丝网版画创作中肌理的应用,内容包括一分钟了解丝网版画,丝网版画的艺术特征是什么。摘要:丝网版画是版画家族里的新面孔,非常富有活力的新版种。时至今日已有30余年的发展,它的成长更加丰富了版画语言,使版画家族更加具有现

学习

论片面共犯

阅读(20)

本文为您介绍论片面共犯,内容包括片面共犯的例子,片面共犯的特点。[关键字]片面共犯;片面帮助犯;刑事责任

学习

青少年性问题行为成因的分析与对策

阅读(20)

本文为您介绍青少年性问题行为成因的分析与对策,内容包括青少年性知识缺乏的危害,青少年性意识困扰的原因与对策。[摘要]青少年性问题行为是一个不容忽视的社会问题,它不仅关乎着青少年的健康成长;社会秩序的安全、稳定;更与个体家庭生

学习

浅论静态爆破技术在路堑开挖施工中的应用

阅读(23)

本文为您介绍浅论静态爆破技术在路堑开挖施工中的应用,内容包括m型隧道开挖方法,路堑开挖时控制爆破的方法。摘要:本文首先介绍了静态爆破技术的概念、原理和在工程中的优点,然后就静态爆破技术在路堑开挖工程中的设计内容进行了详细的阐

学习

求解TSP问题的人工鱼群算法

阅读(19)

本文为您介绍求解TSP问题的人工鱼群算法,内容包括人工鱼群算法国内外研究现状,人工鱼群算法解决的问题。摘要:人工鱼群算法在函数优化问题中取得了较好的应用,但在组合优化问题中的应用相对较少。因此,文中用人工鱼群算法来求解TSP问题,并与

学习

列数字说明方法的几种表达作用

阅读(29)

本文为您介绍列数字说明方法的几种表达作用,内容包括列数字的说明方法表达了什么效果,列数字说明方法的作用例文。列数字也叫列数据,是说明文中从数量上说明事物特征或事理的说明方法。作者为了具体准确地说明事物的数量、重量、体积、面

学习

“费米估算法”的奥秘

阅读(20)

本文为您介绍“费米估算法”的奥秘,内容包括费米估算方法,费米估算法完整版。现在有一个问题:在一艘航行在太平洋的游船上,导航员称游船正航行在地球上最深的水域――马里亚纳海沟上.这时,一位游客一不小心,把一颗重5千克的水晶球掉进了海里

学习

几种名贵中药的经验鉴别

阅读(38)

本文为您介绍几种名贵中药的经验鉴别,内容包括各种中药的鉴别特征,名贵中药真假辨别方法。【摘要】名贵中药由于其药用价值和价格均较高,常常出现以次充好、以假充真或掺伪的现象。为保证保证临床用药的品种准确、安全有效,本文就西洋参、

学习

创业中常见的几种骗局

阅读(19)

本文为您介绍创业中常见的几种骗局,内容包括有关创业陷阱的内容有哪些,200个创业项目骗局大全。打火机加工回收骗局

学习

做好历史材料解析题的几种方法

阅读(18)

本文为您介绍做好历史材料解析题的几种方法,内容包括历史材料题万能解题模板,历史材料论述题解题方法。【摘要】材料解析题是每年各地中考的必考题型,陕西省中考历史材料解析题的分值占28分,所占分值比例较大。因此,中考冲刺阶段要进行专项

学习

MPSK信号一种有效的SNR估计算法

阅读(17)

摘要:对接收信号进行信噪比估计是许多通信系统要完成的重要工作。具有恒包络特性的MPSK信号是常见的调制信号,对该类信号提出了一种有效的信噪比估计算法,该算法利用信号包络的均值和方差进行估计,具有计算量小复杂度低的优点。用Matlab仿真

学习

几种常见的咽喉疾病

阅读(17)

本文为您介绍几种常见的咽喉疾病,内容包括咽喉反流性疾病吃什么药,咽喉不适要警惕四种疾病。咽喉,是从鼻和口的后方延伸向下通到气管与食道的多功能管腔的一部分。它就像呼吸系统的其他部分一样,主要受感染影响,感染经常向下扩散,或是同时向