进化博弈基本动态理论

摘要

本文主要介绍进化博弈理论的基本动态模型:对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。为了便于理解,在文中引用了一些简单的例子说明它们之间的区别与联系。在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。最后本文比较了经典博弈理论② 与进化博弈理论在动态概念上的差别。

关键词:进化稳定策略⑩;模仿者动态;随机稳定均衡

进化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态 ③(Reinforcement Dynamics)模型等等。但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonker(1978)提出的模仿者动态(Replicator Dynamics)模型。模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。

一、确定性模仿者动态

一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。按所研究的群体数目不同,进化博弈动态模型可分为两大类:单群体(Monomorphic Population)动态模型与多群体(Polymorphic Populations)动态模型。单群体动态模型是指所考察的对象只含有一个群体,并且群体中个体都有相同的纯策略集,个体与虚拟的参与人④ 进行对称博弈。多群体动态模型 ⑤是指所考察的对象中含有多个群体,不同群体个体可能有不同的纯策略集,不同群体个体之间进行的是非对称博弈。博弈中个体选择纯策略所得的支付不仅随其所在群体的状态变化而变化,而且也随其他群体状态的变化而变化。下面重点介绍单群体与多群体动态模仿者动态模型。

1.1、单群体确定性模仿者动态模型

单群体模仿者动态模型是由Taylor and Jonker (1978)在考察生态演化现象时首次提出的。他们把一个生态环境中所有的种群看作为一个大群体,而把群体中每个种群都想象或程式化为一个特定的纯策略。群体在不同时刻所处的状态一般用混合策略来表示。所谓模仿者动态是指使用某一纯策略的人数所占比例的增长率等于使用该策略时所得支付 ⑥与群体平均支付之差,或者与平均支付成正比例。为了说明的方便,本文首先给出一些符号,然后给出Taylor and Jonker (1978)模仿者动态公式的推导过程。

假定群体中每一个个体在任何时候只选择一个纯策略,比如,第j个个体在某时刻选择纯策略(当然由于突变或策略转移,同一个体在不同时刻可以选择不同的纯策略)。

表示群体中各个体可供选择的纯策略集;N表示群体中个体总数;表示在时刻t选择纯策略i的个体数。

表示群体在时刻t所处的状态,其中表示在该时刻选择纯策略i的人数在群体中所占的比例,即。

表示群体中个体进行随机配对匿名博弈时,群体中选择纯策略的个体所得的期望支付。

表示群体平均期望支付。

下面给出连续时间模仿者动态公式,此时动态系统的演化过程可以用微分方程来表示。在对称博弈中每一个个体都认为其对手来自于状态为x 的群体。事实上,每个个体所面的对手是代表群体状态的虚拟个体 ⑦。假定选择纯策略的个体数的增长率等于⑧,那么可以得到如下的等式:

由定义可知,两边对t微分可以 ⑨:

两边同时除以N得到:

上式就是对称博弈模型中模仿者动态公式的微分形式。可以看出,如果一个选择纯策略的个体得到的支付少于群体平均支付,那么选择纯策略的个体在群体中所占比例将会随着时间的演化而不断减少;如果一个选择策略的个体得到的支付多于群体平均支付,那么选择策略的个体在群体中所占比例将会随着时间的演化而不断地增加;如果个体选择纯策略所得的支付恰好等群体平均支付,则选择该纯策略的个体在群体中所占比例不变。

从上面的公式推导过程可以看出,Taylor and Jonker提出的模仿者动态仅仅考虑到纯策略的继承性,而没有考虑到混合策略的可继承性。Bomze(1986)证明了如果允许混合策略也可以被继承,那么在模仿者动态下,进化稳定策略 等价于渐近稳定性。另外,下面不加证明⑾ 地给出Hofbauer et al. (1979); Zeeman (1980)提出并证明的一个命题,“在模仿者动态下,对称博弈中每一个ESS都是渐近稳定的”。这个命题的逆命题并不成立,下面用Fudenberg(1995)的一个反例来给予说明,考察表Ⅰ矩阵所示的对称博弈:

纳什均衡(A,B)、(B,A)和一个混合策略纳什均衡(即群体中一半个体选择策略A,另一半个体选择策略B)。由于本文仅考察单一群体情形,即群体中个体无角色(Role)区分,因此不可能分离出两类个体,所以这个系统不可能收敛到非对称纳什均衡(A,B)、(B,A)。在模仿者动态下,尽管没有单个个体选择混合策略,但这个混合策略纳什均衡却是该动态系统唯一进化稳定均衡且是渐近稳定均衡,下面证明它的渐近稳定性。

提出的,在动态博弈中就显示出其局限性了。这个定义只考虑到其他参与人决策对自己的影响而没有考虑自己的决策对其它人的影响。现实中参与人的行动有先后顺序,后行动者自然会根据先行动者的选择所传递的信息来调整自己的选择;先行动者自然也会理性地意识到自己的行动会传递自己有关信息(不完全信息时)。Selten(1965)把这种信息的传递过程纳入到博弈模型中,提出了动态博弈的基本均衡概念---子博弈精练纳什均衡(Subgame Perfect Nash Equilibrium)。与纳什均衡相比,子博弈精练纳什均衡虽然可以剔除静态博弈中不可置信的威胁,但不能够从根本上解决博弈中多重均衡问题,其最大的缺陷在于没有削弱参与人理性要求。Kreps and Wilson(1982)把信息和不确定性引入到动态博弈中而提出“序贯均衡”把子博弈精练均衡与贝叶斯均衡结合起来。进化博弈理论重点研究群体行为的动态调整过程。其基本的均衡概念----进化稳定策略的直观思想是,如果一个群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,那些选择获得较低支付策略的群体随着时间的演化最终会从原群体中消失。进化稳定策略[4]是一个邻域概念,与动态系统的渐近稳定性及吸引子有相似的性质,主要描述系统局部的动态性质,因而可以把影响均衡过程的各种因素纳入到其动态模型中,特别是Foster and Young(1990)提出的随机稳定均衡(Stochastic Stability Equilibrium)概念把影响经济系统的各种随机因素都纳入到其模型中,使得由该理论均衡概念所得的预测结果更准确、更真实地描述参与人群体行为。

3.4、研究的起点不同

虽然,经典博弈理论加入了个体之间行为的互动性,但依然是从单个理性消费者或生产者出发来研究资源的最优化配置问题,这种研究方法 ⒇的最大缺陷就是无法实现由个体行为到集体行为的转化。一个明显的例子就经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,经典博弈理论无法从研究个体最优行为过渡到集体最优的资源配置。与此不同,进化博弈理论则直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,通过研究群体中个体行为的互动关系来进一步研究社会资源的配置问题。这种研究方法很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

3.5、所用数学工具不同

经典博弈理论建立在信息可以免费获取、参与人有无限信息处理能力及参与人是完全理性的等假定下而得出经济系统常常处于均衡状态的结论。在任何时候、任何条件下,参与人都能够迅速解出最优决策,因此在该理论中主要利用微积分中最优化理论来分析参与人的决策行为,通过跨时期最优化计算来把静态理论动态化。进化博弈理论由于要考虑影响系统达到均衡的各种因素,并且主要考察系统在达到均衡过程中所受到确定或随机因素的影响,因此该理论需要用较高深的数学工具如:动力系统理论、微(差)分方程理论、拓扑理论、混沌理论等来分析均衡过程。

注释: ①本文为2002年中国经济学年会的入选论文。张良桥:广东省顺德职业技术学院,邮编:528300。 ②本文把源于冯·诺意曼和摩根斯滕经纳什发展而成的博弈称之为经典博弈论,可参阅文献[1],[2]。 ③其实质就是个体与群体进行博弈,即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。Selten(1980)通过对个体引入角色限制,首次考察了非对称博弈中的均衡问题,并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡” ④其实质就是个体与群体进行博弈,即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。 ⑤Selten(1980)通过对个体引入角色限制,首次考察了非对称博弈中的均衡问题,并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡” 。 ⑥在这里所说的支付与生态学里所说的繁殖成活率或适应度(fitness)是一个等价的概念。 ⑦在许多进化博弈理论的文献中,都认为个体与自然(Nature)进行博弈。 ⑧在这里是模仿者动态的最基本的假定,由此可以得到以后的所在的结论。 ⑨ ⑩进化稳定策略与纳什均衡策略之间的区别在文献[4]中有详细的介绍。 ⑾由于该命题的证明要用到动力系统的熵理论,在此就不给出证明,可参阅文献[10]。 ⑿所谓纳什均衡是指一个策略组合,在该组合下任何参与人单独偏离都不会变动比不偏离好,也就是说,在给定其它参与人选择条件下,每一个参与人都选择了使自己获得最大期望效用或利润的决策。事实上,这个博弈也有两个非对称的纳什均衡,但由于我们所考察的是对称博弈,群体中不可能分离出两类不同的参与者,所以博弈结果不可能趋于非对称的纳什均衡。另外,由于进化稳定策略集是纳什均衡的子集,所以要找进化稳定策略首先需要找出纳什均衡,然后找进化稳定策略。 ⒀ 一个稳定状态叫做汇(Sink),如果在该状态的雅可比矩阵的特征根都在单位圆内(离散时)或者有负实部(连续时)。 ⒁由模仿者动态方程进行支付变换,可得 ⒂ 所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡 ⒃ ⒄ Foster and Young认为由于系统总会受到迁移和背景突变因素的影响,所以可以假定系统不可能达到策略单纯形的边界,当系统接近边界就会离开即边界就象一面镜子起着反射作用。 ⒅ ⒆进化博弈理论与经典博弈理论的区别在文献[3]中有详细的介绍 ⒇该理论的核心概念----纳什均衡是指假定其他人选择不变的情况下,每个个体都选择使得自己获得最大支付的策略。从数学上来讲,纳什是通过应用角谷静夫不动点定理来证明纳什均衡存在性的,并且一般的求解过程就是通过求单个个体期望支付函数的偏导数(即假定其他参与人选择不变的数学体现)并解联立方程组(纳入互动关系)得出的

参考文献

[1] 王则柯(1999):《博弈论评话》,中国经济出版社。

[2] 张良桥(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[3] Bergin, J. and L. L. Barton (1996): Evolution With State-Dependent Mutations, Econometrica, 64, 943-956.

[4] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[5] Foster, D., and P. Young(1990):Stochastic Evolutionary Game Dynamics, Theoretical Population biology, 38, 219-232.

[6] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 57, 420-441.

[7] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[8] Kreps and Wilson(1982):“Sequential Equilibrium”,Econometrica.

[9] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[10] Maynard Smith, J. and G. R. Price(1973): “The Logic of Animal Conflicts”, Nature, 246, 15-18.

[11] Selten, R. , (1980): A Note on Evolutionarily Stable Stratifies in Asymmetric Animal Conflicts, J. Theoret . Biol. 84, 93-101.

[12] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[13] Taylor, P. D. and L. B. Jonker (1978): Evolutionarily Stable Strategy and Game Dynamics, Math Biosci. 40, 145-156.

[14] Weibull, J. (1995): Evolutionary Game theory, Cambridge, MIT Press.

The basic theories of dynamics in evolutionary games

Abstract:This paper mainly introduce the basic dynamics models of evolutionary game theory: symmetric replicator dynamic model, asymmetric replicator dynamic model and some conclusions. For better understanding, Some simple examples are applied to describe the differences between them. Based on the models, this paper also introduces theorists’ research and their progress on stochastic evolutionary dynamics. Finally, We also give the differences between the concepts of dynamics of classic game theory and evolutionary game theory.

Keywords: Evlutionarily stable strategy; Replicator dynamics; Stochastic Stability Equilibrium

转载请注明出处学文网 » 进化博弈基本动态理论

学习

论煤矿机电一体化技术

阅读(25)

本文为您介绍论煤矿机电一体化技术,内容包括煤矿机电一体化技术论文,煤矿机电一体化的缺点。近年来,我国的煤矿机电一体化技术有了长足的进步,机电一体急速给煤矿产业带来了巨大的经济效益。然而,我国煤矿机电一体化技术起步较晚,不论从技术

学习

正确认识天然石材的放射性

阅读(26)

本文为您介绍正确认识天然石材的放射性,内容包括十种常见石材放射性,天然石材放射性致癌。介绍天然石材的放射性水平,建筑材料的放射性标准,装修材料放射性分类以及检测方法。通过对多种天然石材的天然放射性核素镭-226、钍-232、钾-40的

学习

我爱我的姐姐

阅读(26)

本文为您介绍我爱我的姐姐,内容包括我爱你姐姐的作文500字,以姐姐的爱为题作文500字。小荷,小荷,你是我的榜样,你教给了我许多知识。小荷啊,你知道吗,我每天都要来看你,因为我离不开你了,我刚刚注册的时候就发过誓,说我每天都要上网,上网来看你。

学习

国足又到选帅时

阅读(30)

铁打的营盘,流水的主帅。佩兰下课,中国足协迅速启动了换帅计划。对于中国足球来说,变的是走马灯般的主帅,不变的是总也上不去的成绩。能登上中国队帅位的人,到底需要达到什么样的标准?何不舍远求近?夏亮(新华社浙江分社)对于新帅的要求,中国足协在

学习

蛇的花样吃法

阅读(28)

虽然蛇的外形恐怖可怕,但其食用价值极高,根据用料和做工能烹调出多种风味的菜肴(炖、炸、烧、卤、涮)等,经常食用对人体有很大的食疗作用,是餐桌上的一道营养美味。清烧蛇肉主料:菜蛇600g。辅料:花菇1朵、熟土豆块、清红椒段数节。调料:盐5g,味

学习

从《林黛玉进贾府》看“凤辣子”之辣

阅读(26)

本文为您介绍从《林黛玉进贾府》看“凤辣子”之辣,内容包括林如海为什么要把林黛玉送到贾府,凤辣子林黛玉初进贾府。看到这个题目,耳边便响起了那熟悉的声音:满纸荒唐言,一把辛酸泪。都云作者痴,谁解其中味。《红楼梦》作为中国古典小说的巅

学习

“票房皇后”郑秀文

阅读(297)

本文为您介绍“票房皇后”郑秀文,内容包括郑秀文所有电影票房,郑秀文票房排名。近年来,在香港演艺界,“歌而优则演”、从歌坛跨进影坛的年轻女艺人为数不少,但迄今为止,只有郑秀文演出的喜剧影片几乎部部票房告捷,这在景气低迷的香港影坛十分

学习

格式塔心理疗法的九大原则

阅读(30)

本文为您介绍格式塔心理疗法的九大原则,内容包括格式塔心理疗法九项原则,格式塔九大原则。格式塔心理疗法由美国精神病学专家弗雷德里克・S.珀尔斯博士创立。其有九大原则:生活在现在不要老是惦记明天的事,也不要总是懊悔昨天发生的事,把你

学习

春意作文500字

阅读(28)

本文为您介绍春意作文500字,内容包括校园里的春意作文500字,春意更浓了作文500字。说起春天,大家都会浮想联翩,联想到鲜艳夺目的花,清澈见底的河水,瓦蓝的天空……是的,美丽的春天的确让我们陶醉,下面我们就一起进入春的世界遨游吧!春姑娘迈着

学习

农村旅游监管规定

阅读(53)

本文为您介绍农村旅游监管规定,内容包括旅游景区管理条例2019全文,旅游监管部门电话。第一章总则第一条为加强乡村旅游管理,规范乡村旅游服务,提高乡村旅游服务质量,保障旅游者和旅游经营者的合法权益,促进旅游业健康有序发展,根据相关法律法

学习

10万起,高级钟表入门级

阅读(24)

本文为您介绍10万起,高级钟表入门级,内容包括钟表入门级,2021日内瓦高级钟表大赏。穷玩车,富玩表。不仅显示着一种品位和阶层的对比,更是现实真实的体现。凡七八年前以10万元左右竞拍成功的买家,如今都在偷笑,因为表的升值幅度差不多都达到

学习

审计统计抽样方法及常用技术

阅读(23)

本文为您介绍审计统计抽样方法及常用技术,内容包括审计学统计抽样的方法,审计统计抽样技巧。【摘要】选择统计抽样时,要全面考虑每一种统计抽样方法各自的优点和运用条件,结合审计项目的特点和要求,再与丰富的审计实践经验相结合,才能做出正

学习

棋艺指导室:象棋初级教程

阅读(30)

本文为您介绍棋艺指导室:象棋初级教程,内容包括象棋实战对局初级,进阶业余棋手象棋教程。常见实用残局胜和规律残局时双方所剩子力很少,因此残局的规律性就显得更强一些。对于初学者来说就是要学习掌握实用残局的胜负规律,研究和学习“例

学习

木拱廊桥古今施工技术的结合

阅读(47)

本文为您介绍木拱廊桥古今施工技术的结合,内容包括木拱廊桥用什么方法建造的,木拱廊桥工艺流程。木拱廊桥在中国古代乃至世界桥梁建设史上占有重要地位,具有重要的工程技术价值、艺术价值和观赏价值。对木拱廊桥进行仿古建设,应将当今施工

学习

“互动仪式链”理论对少先队仪式教育的启示

阅读(24)

少先队仪式作为队组织生活的重要组成部分,在培养和强化少先队员身份认同中发挥着不可替代的作用。但现实中,少先队仪式教育却存在主体地位丧失、符号意义忽视和活动形式化倾向等问题。借鉴关国社会学家兰德尔・柯林斯的互动仪式链理论,反思

学习

保险基础理论

阅读(21)

本文为您介绍保险基础理论,内容包括保险理论的基础是什么,保险最新理论。关键词]保险理论;不确定性;风险管理;效用理论;非对称信息;逆选择;道德风险[摘要]保险业在中国还处在发展的初级阶段,实践的发展迫切要求深化我国保险理论研究。在保险理

学习

利率的决定和变动:一种理论模型

阅读(35)

本文为您介绍利率的决定和变动:一种理论模型,内容包括利率决定理论模型,利率的期限结构及其决定因素。金融工具由于种类的不同和期限的差异,其利率也是有差异的。考察利率的决定和变动,同时就是考察一种金融工具的价格,因为一种金融工具的利

学习

认知学习理论中的记忆与遗忘策略分析

阅读(24)

认知学习理论是学习理论重要组成部分,特别是信息加工理论的诞生为学习理论增添了新的活力。对于认知过程中的两个重要概念——记忆与遗忘,认知学习理论为其提供了新的概念描述以及实现策略。特别是对于遗忘策略来讲,前人对其研究甚少,但作为

学习

企业经营管理论文范文

阅读(23)

本文为您介绍企业经营管理论文范文,内容包括汽车经营管理1000字论文,关于咖啡馆经营管理的论文。企业经营管理论文范文第1篇高新企业不同于一般生产经营性企业,它在发展方向、发展侧重、管理模式及经营理念等各个方面都有很强的自身特点,

学习

理论物理范文

阅读(27)

本文为您介绍理论物理范文,内容包括理论物理范文,理论物理和应用物理区别。理论物理范文第1篇理论物理作为大学物理系本科的必修课,在大学生用一年到两年的时间学完普通物理之后开始学习。传统的所谓四大力学,即理论力学、热力学和统计力

学习

身体美学理论

阅读(23)

本文为您介绍身体美学理论,内容包括为什么说舞蹈是身体美学的巅峰,普拉提身体管理美学。身体美学(somaesthetics)概念是20世纪90年代由美国美学家理查德·舒斯特曼(RichardShusterman)提出来的。当然,这并不是说在舒斯特曼之前就没有关于

学习

科技伦理论文范文精选

阅读(74)

本文为您介绍科技伦理论文范文精选,内容包括科技伦理学论文2000字,科技伦理相关的论文2000。科技伦理论文篇1[关键词]技术伦理;《伦理学研究》;《道德与文明》;《科学技术哲学研究》;《自然辩证法研究》;《自然辩证法通讯》;《哲学研究》[基金项