博弈论论文第1篇
博弈论研究人类活动中的互动行为,在经济学中得到广泛的运用。在博弈论中,人类的所有活动,只要是互动行为,均可以看成是博弈行动。在此基础上,一种新的逻辑“博弈逻辑”(gamelogic)得以兴起,它是一种特殊的行动逻辑(actionlogic)。
博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人,在经济活动中理性的人即是使经济目标最大化的人——经济人。理性人如何使得自己的“得益”最大?关键是“推理”。
博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统,建立新的博弈逻辑系统。在这方面,日本筑波大学的金子守(MamoruKaneko)教授是这方面的权威。近几年,他在国际刊物上发表了大量有关博弈逻辑方面的论文。他不仅在模态逻辑系统的基础上建立了多个博弈逻辑(gamelogic)系统,而且,建立了与博弈逻辑密切相关的公共知识逻辑(commonknowledgelogic)系统。第二种研究纲领是研究博弈活动中的实际“推理问题”,许多博弈论专家在此方面做了大量的工作。对博弈逻辑做整体的分析不是这里的任务,本文的目的是简要论述博弈活动中的推理问题,属于第二种研究纲领。
根据博弈论,人们在实际的博弈活动中涉及到两种推理:演绎推理与归纳推理。然而,正如传统逻辑中存在着悖论(演绎悖论和归纳悖论),在博弈逻辑中同样存在着悖论。
2博弈逻辑中的演绎推理与归纳推理
博弈论有两个假定:第一,博弈参与人是理性的;第二,博弈参与人的得益不仅取决于自己的行动,同时取决于其他人的行动。
每个理性的参与人在策略选取,使自己得益最大时,要充分考虑局中其他人的策略选取。同时,每个参与人知道其他参与人与他有同样的想法。在博弈中,“每个人是理性的”是公共知识(commonknowledge),它是每个参与人进行策略选择或者推理的前提。
博弈参与人的推理表现在他对策略的选取上。决定参与人的策略选取一方面是博弈结构,另一方面是其他参与人的策略。博弈结构是不同策略组合下的支付函数或者得益函数。按照博弈的次序来分,博弈分动态与静态博弈;按照信息的分布来分,博弈分为完全信息与不完全信息博弈。在不同的博弈结构下,参与人所用的推理不同。
根据参与人推理前提与结论之间的关系,在博弈中推理分为演绎推理和归纳推理。我们来分析博弈参与人是如何运用演绎推理与归纳推理的。
(1)静态博弈的演绎推理让我们来分析典型的“囚徒博弈”的例子。
警察抓到了两个共同偷窃的小偷,对他们进行单独关押。囚徒面临这样的“***策”:如果一方“招认”,供出自己与对方以前所做违法之事,而对方“不招认”,“招认”方将无罪释放,对方会被判重刑10年;如果双方都与警方合作,选择“招认”策略,各被判刑5年;而如果双方均“不招认”,因警察找不到其他证明他们以前违法的证据,只能对他们的小偷行为进行惩戒,各判刑1年。这两个小偷如何做出选择?
囚徒困境的支付矩阵为:
附***
“囚徒困境”是一个被广泛谈论和研究的博弈。在这个囚徒困境中,小偷的最终“得益”是当场释放还是被判刑(10年、5年、1年),不仅取决于该囚徒的决定,而且取决于另外的小偷的决定。
在这个例子中,每个小偷都作这样的推理:
如果对方“招认”,
我“不招认”的结果是判刑10年,“招认”的结果是判刑5年;
“招认”的结果好于“不招认”的结果
此时,我应当选择“招认”
如果对方“不招认”,
我“不招认"的结果是判刑1年,“招认”的结果是当场释放;
当场释放比判刑1年要好
此时,我应当选择“招认”
因此,无论对方采取“招认”还是“不招认”,我最好的策略是“招认”。
无论是甲,还是乙,他们均推理得出最好的策略是“招认”。双方均招认是“纳什均衡”——这是一个稳定的结果。
在囚徒博弈中存在惟一的纳什均衡(注:纳什均衡,简单地说就是,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的;也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。)点,即两个囚犯均选择“招认”策略。一旦人们处于囚徒困境,“囚徒困境有惟一的纳什均衡点”构成参与人的“公共知识”,双方均毫不犹豫地选择“招认”。
这是静态博弈的例子。在这个推理过程中,双方的推理均是演绎的。
(2)动态博弈中的演绎推理动态博弈过程如同静态博弈,也是一个推理过程。我们来看一下动态博弈中人们是如何进行演绎推理的。先看一个例子。
有两个企业A、B。企业B独占一个行业的市场,企业A要进入这个领域,想与企业B瓜分该市场。企业B不愿意A与它一起瓜分该市场,它发出“威胁”:“如果你进入,我将打击”。当然,对B进行打击,双方均有损失。——这是双方的“公共知识”。该博弈用博弈树表示,即为:
附***
上***中的数字表明:如果A“不进入”,A的得益为0,B的得益为10;如果A“进入”,B“不打击”的话,A与B平分10,各得到5,而如果“打击”的话,A的收益为-3,B的收益为4。
这个博弈的结果是,A选择“进入”,B选择“不打击”。——它们构成“子博弈精炼纳什均衡”。对于这个博弈,B的威胁“如果A进入,我将打击”是“不可信的”威胁。
在这个动态博弈中,理性的参与人所用的推理方法被称为“逆向归纳法”又称“倒推法”(backwardinduction)。虽然被称为逆向归纳法,但它是完全归纳法,即它是演绎性的。
逆向归纳法是求解动态博弈的方法。它是演绎性的,因为它的推理是必然的。在上面的例子,我们看到,企业A作这样的推理:
假定我(A)进入,B如果“打击”,它的得益为4;“不打击”的得益为5。B是理性人。它将选择“不打击”。既然我预测到B将“不打击”,我在“进入”和“不进入”间进行选择时,“进入”的得益为5,“不进入”的得益为0,我作为理性人,将选择“进入”。
当A选择“进入”策略时,B的推理是:
如果采取“打击”,我的得益为4;“不打击”的得益为5,选择“不打击”是理性的选择。
(3)静态博弈中的归纳推理博弈中参与人运用归纳推理,原因大体有两个:一是由于信息不完全;二是由于博弈是竞争性的——零和博弈。
不完全信息博弈,又称贝叶斯博弈,是博弈论研究的重要内容。不完全信息博弈是指博弈参与人的得益函数不是公共知识时的博弈。此时,虽然博弈参与人是理性的构成公共知识。但是,总存在某个策略组合下的得益不是公共知识。这样,即使一个博弈存在惟一的纳什均衡,由于这个均衡不是公共知识,这样的均衡不能够在一次博弈中达到。而所谓竞争性的博弈是指零和博弈,在一个博弈中如果只有两个参与人,其中一方所得等于另外一方所失,此时,双方不可能形成一个大家均接受而不会改变的纯策略对。
在这样的过程中,博弈参与人如何确定自己的策略选取呢?他只能根据其他参与人“历史”中的策略“归纳地”得出对方此时的策略,从而决定自己的策略。一个例子就是,《三国演义》一书中“空城计”博弈。
诸葛亮误用马谡,致使街亭失守。孔明在西城中,准备启程。等他安排停当,司马懿引大***15万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千***士,已分一半先运粮草去了,只剩二千五百***在城中。众官听到这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将,旌旗竟皆藏匿,诸***各收城铺。打开城门,每一门用上二十***士,扮作百姓,洒扫街道。而孔明披鹤髦,戴纶巾,引二小童,携琴一张,于城上敌楼前,凭栏而坐,焚香操琴。马司懿来到城下,见到诸葛亮焚香操琴,笑容可掬。司马懿吓坏了,立即叫后***作前***,前***作后***,急速退去。司马懿之子司马昭问:莫非诸葛亮无***,故作此态,父亲何故退兵?司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏***退去,抚掌而笑,众官无不骇然。诸葛亮说:司马懿料吾平生谨慎,不曾弄险,见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之。我们兵只有二千五百,若弃城而去,必为之所擒。
我们可以用如下的博弈矩阵来表示这个博弈:
附***
这个博弈中,“进攻”是司马懿的“占优策略”。该博弈有两个纳什均衡,即:(司马懿“进攻”,诸葛亮“守城”);(司马懿“进攻”,诸葛亮“弃城”)。然而,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮知道。他们对博弈结构的知识是不对称的:诸葛亮拥有比司马懿较多的知识。当然这种知识的不对称完全是诸葛亮“制造出来的”。
司马懿是如何推理的呢?司马懿的推理是“归纳的”。司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”在司马懿看来,诸葛亮一生都是谨慎的,既然诸葛亮一生没有冒险,此次也肯定不会冒险,诸葛亮有埋伏。司马懿在“攻城”和“撤退”之间作出“撤退”的选择。
在这里,司马懿归纳作出了一个错误的策略选择。尽管如此,我们不能说司马懿是不理性的。司马懿作出错误的策略选取,是由于不完全信息造成的。在孔明-司马懿的博弈中,孔明做出的空城假象,目的就是让司马懿感到“攻城”有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,“攻城”失败的可能性较大,而“撤退”的期望效用大于“攻城”的期望效用。即:司马懿认为,“攻城”的期望效用低于“撤退”的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。
(4)动态博弈中的归纳推理下面我们来分析“酒吧问题”中人们是如何运用归纳推理的。“酒吧问题”是一个重复性的动态博弈。
“酒吧问题”(barproblem)是美国人阿瑟(W.B.Arthur)提出的。阿瑟是斯坦福大学经济学教授,同时是美国著名的圣塔菲研究所(SantaFelnstitute)研究人员。他不满意经济学中人们所认为的,经济主体或行动者(agents)的行动是建立在演绎推理基础之上的观点。他认为人们的行动是基于归纳的基础之上的。“酒吧问题”就是阿瑟为了说明他的这个观点而提出的。
在1994年《美国经济评论》的题为《归纳论证和有界理性》一文中阿瑟提出了“酒吧问题”博弈,后来在1999年的著名的《科学》杂志上题为《复杂性和经济》一文又阐述了这个博弈。
酒吧问题是指这样一个博弈:有一群人,比如总共有100人,每个周末均要决定,是去附近的一个酒吧活动还是呆在家里。该酒吧的容量是有限的,比如空间是有限的,或者座位是有限的。我们假定酒吧的容量是60人,或者说座位是60个。如果去酒吧的人数少于60,并且他也去了,他的决定就是正确的;或者,如果去酒吧的人超过60人,而他没有去——当然这只有事后才知道,他的决定也是正确的。否则,其决定是错误的。
这里,我们假定他们之间不存在信息交流。我们看到,每个人根据对总的去酒吧人数的预测,而决定去酒吧与否。如果他预测去酒吧的人数超过60人,他将做出“不去酒吧”的决定,如果其预测不超过60人,他将做出“去酒吧”的决定。他们是如何做出预测呢?
每个参与者或决策者面临的信息只是以前去酒吧的人数,每个参与者只能根据以前去的人数的信息“归纳”地得出一个规律。根据这个规律,参与人预测下次去酒吧的人数,从而决定自己去还是不去。
这是一典型的动态博弈问题。假定,前面几周去酒吧的人数如下:
44,76,23,77,45,66,78,22……
不同的行动者可根据过去的历史“归纳”出某个规律,从而做出预测。例如预测:下次的人数将是前4周的平均数(53);两点的周期环(78);与前面隔一周的相同(78)……。
通过计算机的模型实验,阿瑟得出一个有意思的结果。当不同的行动者根据过去的历史而进行行动时,去酒吧的人数没有一个可预测的固定的规律。然而有这样一个“规律”:经过一段时间以后,“平均去酒吧的人数总是趋于60”。即,经过一段时间,这个系统中的人群“去”与“不去”的人数比是60:40。尽管每个人不会固定地属于“去”或“不去”的人群,但这个系统的这个比例是不变的。阿瑟说,预测者自组织到一个均衡类型或生态均衡系统。这100人构成的系统是一个混沌系统(混沌系统的行为是不可预测的)。
这就是酒吧问题。在这个问题中,每个参与人根据历史数据进行归纳并进行预测,然而,对于下次去酒吧的确定的人数,参与人是无法作出肯定的预测。例如,有趣的是,如果许多人均预测去酒吧的人数多于60,而决定不去酒吧,此时酒吧的人数将少于60。他们的预测则错了。如果许多人预测去酒吧的人数少于60,这些人去了酒吧,此时去酒吧的人数多过60。他们的预测也错了。
附***
因此人们要作出“正确的”预测,他要知道其他人如何作出预测的。但是在这个问题中每个人的预测的信息来源是一样的,即都是过去的去酒吧的人数。每个人不知道别人如何作出预测的信息。因此,所谓“正确”预测是没有的。每个人只能根据以往历史“归纳地”作出预测,而无其他办法。阿瑟教授提出这个问题,是强调在实际中归纳推理与行动之间的实际关联。
利用归纳法的另外的例子是寡头垄断厂商之间的博弈。如果一个行业被多个寡头厂商所垄断,他们之间的竞争也是一个重复性的动态博弈。寡头厂商要确定自己最优的生产产量,但它们无法知道其他企业的产量。每个企业只能根据过去其他企业的生产产量来“推测”它们将要生产的产量,从而确定自己的最优产量。这个产量是最优的?不一定。如果是,它们就不调整自己的产量,如果不是,他们还要不断地调整。这同样是一个“归纳”和“调整”的过程。
3演绎推理的一个悖论:逆向归纳法悖论
逆向归纲法是演绎推理,它是求解完全且完美信息下的动态博弈的方法。逆向归纳法推理严密。然而,将看到,逆向归纳法面临着致命的缺陷:悖论。
让我们来看一个蜈蚣博弈(centipedegame)的例子。
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是指这样一个博弈:两个参与者A、B轮流进行策略选择:可供选择的策略有“合作”和“不合作”两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。假定这个博弈的各自的支付给定如下:
附***
蜈蚣博弈
上***中,c表示“合作策略”,nc表示“不合作”。
在这个博弈中的参与人A、B是如何进行策略选择的?
这个博弈形状像一只蜈蚣,而被命名成蜈蚣博弈。这个博弈奇特之处是:当A决策时,他考虑博弈的最后一步即第198步:B在“合作”和“不合作”之间作出选择时,因“合作”给B带来i00的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“不合作”。但是,要经过第197步才到第198步,在197步,A考虑到B在第198步时会选择“不合作”——此时A的收益是98,小于B合作时的100——那么在第197步时,他的最优策略是“不合作”——因为“不合作”的收益99大于“合作”的收益98。……如此推论下去。最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1!远远小于大家都采取“合作”策略时的收益:A:101,B:99。
根据逆向归纳法,结果是令人悲伤的。从逻辑推理来看,逆向归纳法是严密的。但结论是违反直觉的。直觉告诉我们,一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取100,当然A一开始采取合作性策略有可能获得0,但1或者0与100相比实在是太小了。直觉告我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。
是逆向归纳法错了,还是直觉错了?
似乎逆向归纳法不正确。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,但这种合作不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。逆向归纳法肯定在某一步要起作用。只要逆向归纳法起作用,合作便不能进行下去。
因此,我们不能怀疑逆向归纳法的合理性,它的推理过程严密,符合逻辑。然而如果我们用逆向归纳法来求解蜈蚣博弈,则博弈结果是我们不能接受的。
许多博弈论专家认为,蜈蚣博弈所反映的不是悖论,逆向归纳法作为求解动态博弈的方法,是有效的。蜈蚣博弈的结果尽管不是我们所期望的,但它是均衡结果。这个均衡结果反映的是多主体下个体理性的局限。这是理性的困境。
4博弈行为中归纳推理的“合理性”问题
休谟告诉我们,人们使用归纳法寻求自然现象之间的因果联系的这个过程,只不过是人的心理上的习惯联想。我们有什么其他理由认为,我们所认为的事物之间的所谓因果联系是必然的?这就是休谟问题。休谟质疑的是认识中的归纳法的合理性问题。在博弈行为中,归纳推理同样存在是否合理的问题。
我们用归纳法对自然进行认识,并根据我们归纳的结果做出相应的行动。如:我们看到天空中乌云密布,风渐渐地大了,我们想,天可能要下雨了,我们要带伞。之所以有这样的认识,是因为以往的经验“告诉”我们:当乌云增多并刮大风时,意味着要下大雨。即,当我们面对自然现象时,我们根据过去的经验来归纳并采取相应的行动。
在认识论中,我们知道,归纳推理所得出的结论是或然的。但是在认识中我们存在着这样一个信念:全称命题要么真、要么假,并且它是超越时间和空间的。我们用归纳法可以不断地接近真理。在互动的博弈中,理性的人运用归纳法进行推理时,归纳法是否有效?它的合理性在哪里?
在“酒吧问题”中,我们凭什么说,以前去酒吧的人数与下次去酒吧的人数之间有联系呢?当某人进行预测时,只有当他知道其他人预测的方法,他才能根据以往的人数和其他人的预测方法来“正确地”预测下次去酒吧的人数。这样的预测才能是“有根据的”或者说“有理由的”。但我们除了能知道以往去酒吧的人数外,我们无法知道其他人的预测的方法。即使我们知道了其他人的预测方法,但当其他人知道了我们将根据他们的预测方法来预测时,他们将改变他们的预测方法,从而使我们的预测归于无效。
在酒吧问题上,我们通过归纳法无法准确预测下次去酒吧的人数,那么我们通过对过去的历史能够知道什么?或者,在更一般的意义上说,在博弈行动中,人们通过归纳法能够学习到什么东西?这就是归纳法的合理性问题。
我们发现,在博弈中归纳法的有效性体现在参与人对博弈均衡的认识。即通过归纳性的学习,博弈参与人对该博弈均衡获得了认识,对其他参与人的均衡策略也获得了认识。
任何一个博弈均存在均衡,这也是诺贝尔经济学奖获得者约翰·纳什的贡献,被称为纳什均衡存在定理。然而,这里的均衡有两类:一类是纯策略均衡,另一类混合策略均衡。归纳法的作用就是对这两种均衡的认识。
当一个博弈存在惟一一个纯策略纳什均衡点时,并且该博弈是完全信息博弈,参与人在一次博弈中就可达到均衡点。但当博弈不是完全信息博弈时,博弈参与人通过多次博弈,“了解”其他参与人不同策略组合下的得益,一旦策略组合达到了纳什均衡,博弈方均无意改变策略。因为此时,这一点是博弈各方均能够接受的点。在这样的过程中,参与人通过归纳法认识到该策略均衡,同时认识到其他参与人的策略选择。
如果不存在纯策略均衡,而只存在混合策略均衡,博弈参与人通过归纳法同样能够认识到该混合策略均衡,同样能够认识其他参与人的策略选取,但此时是一混合策略,即参与人在其策略空间上的一个概率分布。在酒吧问题的博弈中不存在“纯策略纳什均衡”点,此时的参与人通过归纳法“认识到”平均去酒吧的人数为"60%",即每次去酒吧的人数与不去酒吧的人数的“可能”比率为60:40。
因此,当一个博弈存在纯策略纳什均衡时,博弈各参与人通过对以往的博弈历史的归纳,制定出下次的策略均衡点,从而摸索着接近该均衡,最终达到一个纯策略。而当博弈存在混合策略均衡时,博弈参与人所能够做的只是逐渐认识对方的混合策略,而相应地制订自己的混合策略,最终达到混合策略均衡。
这就是说,博弈中参与人运用的归纳推理是有效的,这种有效性是针对博弈均衡的认识而言的。
5结语
逆向归纳法悖论只是博弈论中一个悖论而已,归纳的合理性也只是多主体互动时理性人进行归纳推理的一个问题。博弈论涉及许多关于推理的逻辑“问题”。本人希望我国有更多的逻辑研究人员参与到博弈逻辑的研究中来,逻辑学家参与到博弈论的研究定能够结出丰硕的研究成果。
【内容提要】博弈逻辑(gamelogic)是随着博弈论的迅速发展而形成的一个新的学科,它是一行动逻辑。博弈逻辑研究的是理性的人在互动行动中即博弈中的推理问题。在博弈行为中存在演绎推理和归纳推理。正如在传统逻辑中存在逻辑悖论一样,博弈逻辑中同样存在悖论或者“问题”。博弈参与人运用演绎推理时存在逆向归纳法悖论,而运用归纳推理时存在归纳是否有效的问题。
【关键词】博弈逻辑/演绎推理与归纳推理/逆向归纳法悖论/归纳推理的合理性
【参考文献】
[1]潘天群.博弈生存[M].北京:中央编译出版杜,2002.
[2]MamoruKaneko,TekashiNagashima.GameLogicandltsApplicationsⅠ[J].StudiaLogica,vo157,1996.325-354.
[3]MamoruKaneko,TakashiNagashima.GamelogicandItsApplicationsⅡ[J].StudiaLogica,vo158,1997.273-303.
[4]Bermudez.RationalityandtheBackwardsIndutionArgument[J].Analysis,1999,59(4):243-248.
博弈论论文第2篇
[关键词]网上保险博弈论得益措施
在现代社会经济科技高速发展的大背景下,互联网已融入社会的各个领域当中,给人们的生活与工作带来了极大的便捷。与此同时,人们对网络的依赖也越来越强烈,基于互联网、电话等通信网络的电子商务,正在不知不觉中改变着人们的生活状态和生活方式。作为新型购物方式与时尚生活方式之一的网上购物,也正随着互联网的普及而发展,成为计算机世界中又一重要领域,受到了包括经济学家和社会学家在内的广大学者,以及社会不同群体的关注。
网上保险交易作为网上购物的一种,在这个网络浪潮中也受到了越来越多人们的关注,但与一般的网络购物性质不同,网上保险交易的实质是无形的,实现的是资金的流动。因此它比一般的网络交易具有更大的不可测性与管理难度。下面从博弈论的角度出发,分析网上保险交易发展的利弊。
一、网上保险交易的博弈论分析
考虑到网上保险交易时间上的特性,本人认为相较之于静态博弈,动态博弈更能体现出网上保险交易的特点。因此本文这里选用了一个博弈树的动态博弈结构来分析保险公司开展的网上交易。
在这个博弈中,我们有两个参与方,即经营网上保险业务的保险公司与网上投保人,为了给他们的行为有个合理的解释,我们采用经济学里的经济人的解释。即他们的行为都符合他们自己的利益最大化。另外我们还假设两个参与方的行为具有***性,即一个参与方的行为与决策是完全***的,不受另一方的束缚。
博弈论论文第3篇
关键词:C2C,诚信,纳什均衡,博弈论
Abstract
C2Cmodeldevelopingfastinelectroniccommerce,andthismodelhasagreatforeground,butthereis
abigholdbackfordevelopingofC2Cmodel.TheauthorsanalyzetheproblemofcreditinC2Cmodel.
Atlast,thepaperwillfindtheThirdPartyMediationinC2Celectroniccommerce.
Keywords:C2C;credit;Nashequilibrium;gametheory
1.C2C电子商务中的博弈论模型
1.1模型假设
C2C电子商务的交易是一个较为复杂的过程,但这里我们先做一此简单的假设,以便于更好地分析事件[1]。
①这个博弈只包括两个参与人,一个为买家,一个为卖家。买家只有两种策略,要么购买商品,要么不买。卖家也有两种策略,要么诚信而出售货真价实的商品,要么不守信而卖劣质商品甚至是纯粹的骗钱。
②假设在交易过程中,所有参与人都是完全理性的经济人,完全根据各自支付的多少来决定自己的策略。参与人同时做出决策,且各自支付的信息为各局中人的共同信息。每次博弈都是***的,上一次的交易信息并不传递到下一次的交易。
③存在***府的监督。如***府制定相关法律对行骗者进行惩罚,以至于卖家如果不诚信,他都将得到一定惩罚。
1.2模型的建立与分析
根据前面的假设,我们可以把这个博弈看作是一次的完全信息静态博弈。设计的支付矩阵如表1。
表1C2C电子商务中交易双方的纯策略博弈支付矩阵
a1、a2、b1、b2、C都是大于0的正数,a1、a2分别代表买家购买商品和卖家诚信时各自的支付,-b1、b2-c代表买家选择购买商品而卖家却欺骗买家时各自的支付,C代表卖家实施欺骗而要承担的成本,如法律的惩罚、名誉的丧失、内心的不安等等。考虑到一般的现实情况,我们认为卖家不诚信带来的支付要比诚信带来的支付多,所以有b2-c>a2。当买家不购买商品,而卖家一自保持诚信时,局中人的支付都为0,而当卖家实施行骗时,他是要付出一定的被揭发被惩罚的风险,这个成本我们用C表示。当卖家选择诚信时,买家选择购买商品,这时他的支付达到最大。当卖家选择欺骗,买家选择不购买商品,博弈结果是矩阵的右下方的格子。而当买家选定不答怎么样都购买商品时,卖家的最优决策是选择欺骗,这时他可以获得最大的支付b2-c,当买家不论怎么样都不会考虑C2C的电子商务购物方式时,卖家的选择保持他的诚信。从这个纯策略的博弈分析我们可以看到,以上买家与卖家的博弈不存在纳什均衡。不论怎么选择,双方的利益始终不能达到一致,任何一个纯策略组合都可以通过一个参与人的单独改变自己的策略而获得更大的支付。所以我们必须将这一模型扩展,它不是一纯策略博弈,而是一个完全信息下的混合策略博弈。它存在一个混合策略纳什均衡。现在我们假设买家按照一定的比率,随机的从两种纯策略选择一种作为他的实际行动,卖家同样按照一定的比率随机的选择自己的纯策略是诚信或者欺骗。比率及支付如表2。
表2C2C电子商务中交易双方的混合策略博弈支付矩阵
根据反应函数法[2],我们可以计算出这个博弈的纳什均衡。设U1为买家的期望支付,
U2为卖家的期望支付。我们有U1=p1p2a1-p1(1-p2)b1=p1[p2(a1+b1)-b1]买家的目标是U1越大越
好,因为卖家的混合策略已经设定为(p2,l-p2),所以买家的最佳反应函数是:U2=p1p2a2+p1(1-p2)(b2-c)-(1-p2)(b2-c)c=p2[p1-a2-p1b2+c]+p1b2-c
同理考虑[p1a2-p1b2+c]的情况,我们可以作出卖家的最佳反应函数
现在我们可以作出卖家的现在我们在以p1为纵轴,p2为横轴的直角坐标系中,把买家和卖家的最佳反应函数都画出来,两个反应函数重合的地方就是这个混合策略的纳什均衡,由此,我们得出了C2C电子商务中买家与卖家混合策略博弈的纳什均衡点。它是p1=c/(b2-a2),p2=b1/(a1+b1)。也就是说纳什均衡是买家以}c/(b2-a2)的概率选择参与C2C电子商务、购买商品,卖家以b1/(a1+b1)的概率选择诚信对待顾客。我们可以看到参与人的策略都是对方支付的函数,譬如当C越大,也就是当卖家选择不诚信时,法律、国家对他的惩罚越大,买家了解到这个信J急,就可以认为卖家要选择不诚信的几率较小,从而买家更愿意选择购买商品。同样我们可以假设b1远远大于a1时,买家会认为他选择买的期望支付会远远小于不买的期望支付0,所以他会选择不购买商品,而卖家在买家不太可能购买商品时他最好的策略就是诚信,这与我们计算出的纳什均衡点相符,p2=b1/(a1+b1),当b1增大时,p2增大,说明卖家随着b1增大更愿意选择诚信。
在以上这个完全信息静态博弈的分析中,我们了解到买家仍有不购买商品的可能,卖家仍有欺骗顾客的可能。这不是我们希望得到的结果,怎样解决这种结局,需要我们进一步分析买家与卖家重复博弈的情况。
1.3模型的扩展一重复博弈解决C2C电子商务的信用问题
实际C2C的电子商务交易中,买家和卖家未必就是一辈子只做这一次交易的,就算对
于同一虑拟店铺不同的买家,我们仍可假设卖家所有的以往信息是公开的,所有不同的潜在
买家都知道这此信息,所以我们可以设定这此不同的买家仍为这个博弈模型中的同一个参与人。对于扩展的重复博弈模型,我们新增以下的假设:①同一卖家虽然可能有不同的潜在顾客,但我们仍然把这此顾客看成一个买家;②买家采取“冷酷策略”,即只要在重复博弈中,卖家有一次的欺骗行为,将触发买家在以后的策略中水远选择“不买”的策略。
根据表1,我们可以得出卖家的期望支付,当卖家一直保持诚信的期望支付要大于他一次不诚信而获得的支付时,他将会在每次交易中都保持诚信的策略,设r是卖家的投资期望收益率,我们把它当作一个贴现因子。则当卖家选择不诚信经营时的期望支付为:UA=b2一C,当卖家选择一直保持诚信策略,买家就一定会一直和他交易,他将获得的支付是:UB=a2+a2
/(1+r)+a2/(1+r)2+=a2(1+r)/r。当UA<UB,即b2一c<a2(1+r)/r时,卖家会一直采取诚信策略,合作的博弈就产生了,博弈的双方最后的策略都将是买家购买商品,卖家一直保持诚信,
这就是重复博弈产生的信用机制,重复博弈解决了买家与卖家之间的“囚徒困境”,促进C2C
电子商务的推广[3]。
2.分析C2C电子商务平台的第三方中介作用
以上我们用一次和重复博弈模型分析了C2C电子商务平台中买家与卖家的策略选择,由于现实生话中信息的不对称,理性人的投机心理和对不诚信行为的惩罚力度不够等等因素,使得现实中的电子商务交易总是出现卖家欺骗顾客,买家不愿参与C2C电子商务的这种“囚徒困境”。C2C带来的种种优点不能真正体现出来,例如C2C的方式可以给买家带来便利,节省交易成本,价格便宜,给卖家降低了个人创业的门槛和广阔的潜在市场。C2C电子商务平台给买卖双方提供了诚信交易的平台,促进了电子商务的发展。
同样,我们可以从博弈分析中找到解决C2C电子商务发展缓慢的方法,在一次博弈中,双方选择的策略由各自的支付决定,而支付又和***府对不诚信的惩罚、我国法律完善程度以及法律的执行等有关,当***府重视维护诚信,有完善的电子商务方而的法律,那么当卖家欺骗顾客时他受到的惩罚越大,而当买家了解这个信息后他参与C2C电子商务模式的几率也越大。例如C2C电子商务平台中采用的支付宝等支付方式,对卖家的欺骗行为有惩罚措施,例如买家支付给卖家的货款,并不直接支付到卖家的帐号上,而是通过C2C电子商务平台等第三方或是支付宝等第四方中介单位,一旦卖家的有欺骗行为发生,买家对卖家进行投诉,卖家的货款就将被冻结。知道买卖双方达成进一步的交易协议,包括退货,换货,退还部分货款等。有效的制约了卖家的欺骗行为。
3.结论
重复博弈的意识是我们解决问题的关键,首先要保持每次交易信息的公开性,让每一个参与人都了解上一次交易双方的情况和支付,信息的公开可以让全部潜在的买家了解某个卖家的以往的诚信度。譬如C2C电子商务平台上提供的买卖双方的信誉好评评价体系。将买卖双方在C2C电子商务平台上的所有交易评价公开,使买卖双方都可以查询到对方的以往交易评价,增加了公众对没个卖家的了解。同时,要让卖家意识到长远利益的重要,改变多次交易的观念,信息的共享已使得卖家企***欺骗某个买家后改变交易对象再次行骗已没有可能,多次的交易实际是一个重复博弈的过程,由于信息的完全共享使得每个买家实际是可以看成一个参与人,卖家的每一次诚信都将影响到下一次交易双方的策略。
从以上的分析中看出,C2C电子商务平台充分发挥了第三方中介作用,为买卖双方搭
建了一个信息公开的交易平台,对促进C2C电子商务的发展起到了很好的作用。
参考文献
[1]张维迎.博弈论与信息经济学[M],上海:上海三联书店,上海人民出版社,1996。
[2]王则柯,李杰,博弈论教程[M],北京:中国人民人学出版社,2004。
[3]何建春,诚信缺失的博弈论分析[J],郑州轻工业学院学报,2004(04)。
博弈论论文第4篇
[摘要]本文从博弃论的角度对财权安排进行分析,从博弃基础,主体、动固、过程以及结论等方面着手,对该问题的分析提供了一种新的方法,最后提出了这种博弃的制约机制。[关键词]财权;博弈;实现机制财务治理是相关利益主体责、权、利相互制衡的一种制度安排,主要解决财务索取权与控制权的合理配置问题。而控制权与索取权恰恰是财权的主要内容,因此财务治理实质是指一种财权划分与制衡的财务管理体制。而财权划分与制衡的过程便是利益相关者围绕财权进行博弈的过程。一、财权概述在我国的财务理论发展过程中,主要经历了货币收支活动论、货币关系论、资金运动论、收益分配论和本金运动论等几种观点.纵观这些财务理论观点,可以归纳出几种不同的财务核心概念,即货币、资金和本金.这三个概念有一个共同点,即都有“物的价值表现”,都从数量方面说明财务本质。随着现代企业制度的产生和发展,一种反映与现代企业产权思想相适应的财务观念也在日益成熟。“财务管理不是简单的对资金运动的管理,而是借助于资金运动的管理实现产权管理,是‘价值’与‘权力’的结合”(伍中信)从这个意义上说,不管是“资金运动论”还是“本金投入与收益分配”都只是一种价值的运动。如果说,“价值”是从财务活动的现象中或从“物质流”中抽象出来的带本质的东西的话,那么某种支配这种价值的权利则是隐藏在“价值”背后的更为抽象的本质力量,该“权利价值”构成了现代财务的本质,我们将这种本质定义为“财权”。我国(公司渤将财权概括为投资权、融资权、财务预决算审批权、资产处置权和财务分配权。郭复初将企业财权概括为筹资权、留用资金支配权、成本费用开支权、定价权和分配权.伍中信将企业财权概括为筹资权、投资权、收益分配权、资金调制权和其他财权。我们根据各项财权之间的内在关系,将企业财权概括为两大类,即“财务收益权”和“财务控制权”。二、财权博弈(一)理论基础1.产权理论企业财权是一个历史的范畴,表现为两权分离的产物,本质上是一种衍生产权,并与企业制度演变一脉相承。财权起源于原始产权主体,与原始产权主体的权能相依附、相伴随。随着产权的分离,财权的部分权能也随着原始产权主体与法人产权主体的分离而让渡和分离,这样原始产权主体在拥有剩余索取权的同时,也拥有收益权这一财权(当然是产权的权能);法人产权主体在拥有占有权、使用权、处置权等产权权能的同时,也拥有了与此相联系的收益权、投资权等财权(当然也是产权权能)。这样对独资企业而言,由于产权没有分离,企业在拥有完整的产权的同时,也拥有全部的财权,不需要财权安排。对于产权分离的现代公司而言,财权随着产权的分解而分解,而分解的过程便是对财权进行划分安排的过程。2.利益相关者理论该理论认为,企业是由各利益相关者缔结的一组契约,其目标是为各利益相关者服务,其发展取决于各利益相关者之间长期稳定的合作,每个利益相关者都有平等的机会分享企业的所有权。利益相关者理论的重要代表人物布莱尔在其名著《所有权与控制:面向21世纪的公司治理探索》中指出;“公司并非简单的实物资产的集合,而是一种法律框架结构,其作用在于治理所有在企业的财富创造活动中做出特殊投资的主体之间的相互关系。”按照这种理论,最优的企业财权安排是各利益相关者共同拥有企业的财务收益权和财务控制权,而且对每个利益相关者而言,这两种权力都是对称安排的。(二)财权博弈分析博弈论是研究决策主体之间的行为发生直接相互作用时的均衡问题,它的特点在于研究参与人之间相互作用的影响进而寻求均衡而非最优。笔者认为,在现代企业制度下,利益相关者围绕财权分配发生的行为相互作用的过程也是一个博弈过程。1.财权博弈动因随着现代企业所有权与经营权的分离,企业利益相关者根据付出的物力资本和人力资本要求相应的权力来保证自身的利益。根据科斯第二定理,在交易费用大于零的世界里,不同权利的界定,会带来不同效率的资源配置.为了优化财务治理,进行财权的界定是有必要的。由于在财权分配过程中,博弈主体利益不一致,在各自效应最大化目标的驱使下,为争取赢得更大的利益空间,相关利益人围绕财权展开博弈。2.财权博弈主体财权博弈主体是企业的利益相关者,具有动态的状态依存性,动态性是因为他依存于特定的历史、经济,***治环境,而状态依存性决定着利益集团的主体,决定着谁可以分享企业的财权。可分为两类:第一类是依赖公司内部财务治理保障其利益的主体,可称为内部利益相关者,主要包括大股东、经理层、监事会成员等。而所谓公司内部财务治理,是只限于公司边界以内的财务治理,是通过公司内部合理安捧财权实现的.第二类是依赖公司外部财务治理保障其利益的主体,可称为外部利益相关者,主要包括债权人及其他利益相关者。公司外部财务治理,是指公司组织边界以外的财务治理,主要是通过签署一系列合约的方式实现的。3.博弈结果(1)降低了交易费用。企业作为一个契约结合体,而在契约的制定及执行过程中必将发生各种交易费用,通过财权博弈,进行财权的契约安捧,能抑制双方的机会主义行为,从而降低交易费用。(2)实现了财务收益权与财务控制权的合理配比,维护了各类利益主体的利益。财务收益权是安排财务控制权的主要依据,而财务控制权是实现财务收益权的重要保证,分别围绕这两种权力进行博弈,使二者达到均衡,实现对称分配。(3)实现合作。如果一种制度安排不能满足个人理性的话,就不可能实行下去。所以解决个人理性与集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性(张维迎)。通过财权博弈形成一种制度安拌解决利益相关者之间的冲突,达到长期稳定合作的目的。利益相关者围绕财权进行多次博弈之后达到的帕累托均衡的财权安排,此时,要想增加一个人的财权就意味着其他利益相关者的利益将会减少。三、财权博弈的实现机制为了使利益相关者能围绕财权展开有效博弈并最终实现博弈均衡,优化企业财务治理,达到利益相关者利益最大化,还需设计、形成有效的财务治理机制。(一)共同治理机制共同治理机制是通过建立一套有效的制度安排,是各利益相关者都有平等的机会参与公司财权的博弈,即各利益相关者通过参与财务收益权的分配来实现其产权收益;通过参与财务控制权的分配来相互制衡,以维护其合法权益,免遭他人侵害,从而达到长期稳定合作的目的,其内容包括共同的财务收益分享机制、共同的财务决莆机制、共同的财务监督机制(张兆国)。同时,应该激励利益相关者对财权的要求,使利益相关者认识到财权的重要性,增加财权博弈动力,从而使公司的财务治理更有效率和效果。(二)相机治理机制企业财务的相机治理就是在企业经营出现危机时,通过建立一套有效的制度安捧使受损失的利益相关者取得企业的财务控制权,以改变既定的利益分配格局。同时,不同的利益相关者在财权博弈中的权力对比发生了变化,从而确保了利益相关者对管理当局的事前、事中和事后监督,监督企业的经营状况和管理当局的经营行为,抑制管理当局以牺牲其他利益主体的利益为代价来追逐个人私利的道德风险行为,通过利用相机治理机制进行事前、事中和事后监督,可以确保财权在不同利益相关者之间的配置,发挥衡量监督和激励是否相容、剩余索取权和剩余控制权是否匹配的功效,使得利用财权博弈达到利益相关者价值最大化的目标。主要参考文献[1]张兆国.中国上市公司资本结构泊理效应研究(第一版)[M].中国财***经济出版社,2004.[2]伍中信.现代财务治理结构论纲[刀.财务与会计导刊,2004.[3]伍中信.财权流:财务本质的恰当描述.[4]张栋.企业控制权演变与财权配置[J].***财经学院学报,2004,(4).[5]李维安.公司泊理理论与实务前沿(第一版)[M].中国财***经济出版社,2002.
博弈论论文第5篇
一、非物质文化遗产保护下的合作者
在市场经济高度发展的今天,如何在法律保护仍不健全的情况下,发动社会力量来促成对非物质文化遗产的私力救济,值得研究。笔者对河南省武陟县某非物质文化遗产丰富的乡镇的调研资料整理后发现,当前社会中对非物质文化遗产保护有三种力量:国家、非物质文化遗产传承人以及外力保护人。国家制定相应法律、法规,颁行相应***策,成立相应机构,投入大量财力对非物质文化遗产进行保护;非物质文化遗产传承人广泛演出,广收学徒(但作用、效果有限),以达到传承、保护该非物质文化遗产的目的;外力保护者鼓励、引导传承人进行传承活动,不断发掘处于濒危的非物质文化遗产,为非物质文化遗产保护争取***策、财***支持,同时为国家保护非物质文化遗产建言献策,向国家切实反映非物质文化遗产的实际保护需求,为***策导向提供相关现实依据,外力保护者扮演着沟通国家和传承人的桥梁作用。这三种力量相互作用,在非物质文化遗产保护方面发挥着重要作用。“理论的成效在于理论能够指导实践、解疑释惑、指引未来方向,并转化为广大群众改造客观世界的现实力量。”[1]理论研究的不足可能对实践保护产生消极影响。目前,我国大多数学者对“为什么要保护”的理论研究不足,只停留在“因为要保护,所以要保护”的基础层面,没有给出保护的具体理由,亦没有给出国内外非物质文化遗产保护的专家、学者等外力保护人介入的充分理由。例如,国家作为保护主体之一,其保护义务源于职责使然,自不待言;但非物质文化遗产传承人和外力保护人同处于保护主体行列,不禁令人心生疑问:非物质文化遗产传承人或基于其传承地位(身为传承人,自然不能令其在本代失传)或基于其生计需要(混口饭吃)?但笔者经调查发现:75%①的传承人生活殷实,年收入大约为两万元,其并不靠卖艺为生;某村非物质文化遗产传承人只有5人,平均年龄为75岁,由儿女供养,不用为生活而发愁。②外力保护人大多为高校学者,这与他们的工资或者职称评定关系不大,他们为什么会介入,似乎个人英雄主义还有些道理。[2]显然,一句“因为要保护,所以要保护”根本无法解答上述问题。从博弈理论看,世界上任何两者之间都存在着博弈,任何两者在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。显然,在非物质文化遗产保护的多方合作中,国家、传承人和外力保护人之间存在着相互博弈的关系。通过博弈论,我们可以数学建模的形式,将三方主体之间的合作问题给予清晰的解答,帮助我们在保护非物质文化遗产过程中,协调三方保护者的合作关系,达到保护非物质文化遗产的最佳效果。
二、博弈论下的合作原因分析
(一)博弈论概述
博弈论又被称为对策论,它是现代数学的一个新分支,也是运筹学的一个重要组成内容。《博弈圣经》中将博弈论定义为:“是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。”博弈论研究在相互影响相互作用的环境中主体如何行动,预测博弈者在特定博弈情况中的行动选择,为分析人类行为提供了一套有力的工具。同时,博弈论坚持理论选择的均衡分析思路,“运用理性行动者模型,设定博弈者希望最大化其个人收益”。[3]博弈结果由所有人的行动共同决定,既然每个人都是理性的,会运用他所有的知识和信息追求效用最大化,则他选择行动时就会考虑别人同样为理性的。博弈论的经典案例“囚徒困境”体现了个体理性与集体理性的冲突,理性人追求利益最大化。上文中提到,国家、传承人和外力保护人在非物质文化遗产保护中都以合作者的姿态出现(国家出于责任而合作,传承人出于传承而合作,外力保护人出于学识及研究而合作),他们都基于不同的期望,在平等的对局(指保护的准入)中各自利用对方的策略变换自己的对抗策略以期待达到均衡效果,从而实现自己的期望。可见,国家、传承人和外力保护人围绕对非物质文化遗产的保护原因和互动,可运用博弈论做出恰当的解释。他们之间存在着相互博弈的关系———国家与传承人之间、传承人与外力保护人之间和国家与外力保护人之间的理性博弈。据笔者调查资料显示,影响三者间博弈均衡路径的因素主要有二:一是传承人不合作的预期成本,包括可能受到的财产损失,名气衰落,历史负罪感等;二是保护的可执行性,这又取决于国家的倡导力度,外力保护人(专家、学者、社会团体等)围绕保护非物质文化遗产形成的信息构成以及信息搜索和检验成本等。综上所述,我们可以依据他们在博弈中所扮演的角色和掌握的信息,将博弈分为三种形态:完全信息静态博弈(国家和传承人之间)、完全信息动态博弈和不完全信息动态博弈。
(二)非物质文化遗产保护下的博弈模型
1.完全信息静态博弈
(国家与传承人的博弈)在完全信息条件下,国家与传承人之间的博弈类似于斗鸡博弈。假定两人举起火棍从独木桥两端走向中央火并,各有两种战略:前进或后退。都前进则会两败俱伤;一方进一方退,进者胜退者丢面子;若都退,双方皆丢面子。[4]数字表述见表1。这个博弈有两个纳什均衡:一方进一方退。国家和传承人的博弈与此类似。双方目的明确,国家开发非物质文化遗产为了发扬文化,提高国际影响,传承人为了该技艺被开发而获得财***补贴,两方目的明确。可以假定他们在法律中债权债务关系明确,B(传承人,下同)欠A(国家,下同)100,金额可以协商。若合作,A可以获π=90,减免B债务10,B可获π=10;如果一方强硬一方妥协,则强硬方π=100,而妥协方π=0;如双方强硬,发生暴力冲突,A无法收回债务,损失-100,则A的收益支付是π=-200,B的收益支付π=-100,支付关系如表2所示。A、B各有两种选择策略:合作或不合作;选择自己的最优战略时都假定对方的战略给定:若A合作,则B不合作是最优战略(100>0);若B合作,A不合作将获得较大收益(100>0);于是双方都不合作,企***获得100的收益,却不曾考虑这一行动会给自己和对方带来负效益的100。即国家和传承人为达到利益的最大化,会选择不合作,因而陷入囚徒困境。就上述博弈而言,须外力介入(如引进可协调的推动行为)才有可能改变博弈支付,走出囚徒困境。
2.完全信息动态博弈
在上述博弈中,究竟哪方应合作,需要通过完全信息动态博弈来解决。尽管形式上有两个纳什均衡,但由于当今我国保护机制不佳,故B首先会选择不合作,因此,这是一个动态博弈。A在B选择不合作后,不会再选择不合作,因为收益支付为-200<0,故A只能选择妥协(合作)。上述结论也得到了田野调查相关资料的印证,目前有些地方***府(尤其是非物质文化遗产丰富地区)多次召开专家论证会议,其目的正在于通过这种途径加强与专家、学者的联系,与上述外力保护人合作,达到共同保护的目的。而在双方不合作的情形下,B虽然收益-100<0,但B会预期,他选择不合作时A必然会选择合作,故B的理性战略为不合作。因此,这一博弈的纳什均衡实际上是:B不合作A合作。但在这一博弈中,传承人即便是实力相对弱小,但可选择抵赖,其可视为另一种意义上的不合作。故即使B实力相对弱小,上述纳什均衡仍成立。公权力如需打破上述均衡,须引进第三者:外力保护人(专家或学者,当然还可以引进民间社团,声望绅士)。该条件下外力保护人和传承人的博弈可以如***1所示。设外力保护人(专家、学者等)成本为10,保护成功则在收益中扣除,不成功则自行承担,保护成功后专家或学者的收益是全部收益的40%。外力保护人介入后,传承人可选择合作与不合作。若传承人选择合作,有完全合作和部分合作两种情况,前者外力保护人与传承人收益支付为30,0,后者收益支付为26,10。传承人选择不合作后,外力保护人也有合作与不合作两种选择形态:如双方都不合作,学者无法完成学术研究,非物质文化遗产亦得不到保护,故收益支付为-110,-100;若传承人合作,双方皆耗费成本10,收益支付分别为-10,90;90>-100,-10>-110,说明外力保护人不合作,传承人亦不合作、此后外力保护人的最优战略选择则应当是合作。而与其介入获益-10,还不如不介入。可见,在完全信息条件下,外力保护人难以达到保护和研究的效果,这一点也得到田野调查结果的支持。
3.不完全信息动态博弈
在不完全信息条件下外力保护人与传承人的博弈如***2所示。N为自然,外力保护人可调度资源分为丰富和欠缺两种情况,Χ代表外力保护人可调度资源大小的概率。假定外力保护人介入保护的成本为10,保护成功则在收益中扣除,保护不成功则自行负担,保护成功后外力保护人的收益可设定为40%,传承人不合作需承担成本10。若传承人不合作,外力保护人合作,则收益支付分别为90、-10。本论文中所调查的专家或学者对非物质文化遗产的保护是一个不完全信息动态博弈。保护行动开始阶段,受保护传承人不知道外力保护人的社会可调度资源,外力保护人也不知道传承人的信息。如外力保护人的社会资源可调度力度不及,则双方可能各导致损失-100,因而可能发生非物质文化遗产无法得到及时、有效地保护至使其衰败、没落甚至灭绝。此时,外力保护人,传承人收益支付分别为-110,-100。如果外力保护人的社会资源可调度力度强大,无论如何必定要比传承人付出更多的努力和思考,因为外力保护人作为外来力量,不能“坐吃空山”、有“先入为主”的观念,需付出一定努力方可启动保护行动,故双方都不合作将导致外力保护人损失-5,传承人损失-200。在该博弈中,Χ值可通过如下不等式计算:-200•Χ+90(1-Χ)<10Χ>0.276,即当外力保护人的社会资源可调度力度大于0.276时,传承人的最优办法是选择合作。而外力保护人基本上都是专家、学者或者财力强大的人士,所以其社会资源可调度力度通常会大于0.6>0.276,故传承人为避免更大的损失-200,最优策略选择只能是合作。此时,外力保护人、传承人的收益支付分别为26、10,传承人的收益是通过达成一定意向协议,争取到收益是剩余(90)的40%再扣除成本10,国家收益为(100-10)60%=54。因此,国家发动公权力之外的外力保护力是合适的,也是合算的,大多数情况下达到了保护的目的。但个别情况下,外力保护人不合作,传承人不合作,国家最后放弃,外力保护人、传承人的收益支付分别为-10、90(减少即失败,因没有将手中的资源转化为财产)。至此,从博弈论—纳什均衡理论角度分析国家、传承人和外力保护人的合作关系完毕。
三、非物质文化遗产保护的建议
博弈论清晰地解读了为什么国家、传承人和外力保护人会相互合作,同时致力于保护和传承非物质文化遗产。那么,究竟该如何解决合作问题,笔者在此提出一些可操作性的建议。
(一)传承人的发展
针对传承人在传承非物质文化遗产过程中后继无人,非物质文化遗产面临失传的问题,传承人首先应该对自己所掌握的技艺进行整理和完善,加强自身的储备。其次,对非物质文化遗产进行录音、录影,使非物质文化遗产得以完整保存,不至于某传承人去世后他人再无从知晓该遗产内容。再次,注重非物质文化遗产“生态场”的保护,[5]传承人可自发成立非物质文化遗产传承社团(例如戏曲可成立剧社等)使其处于活态的演绎当中。同时配合外力保护人的采访和帮助,在申报国家项目过程中展现自身的特点。但是,传承人也会遇到自身无法克服的事项:没钱维持该艺术的继续存活;工具破烂不堪,无法使用;外出汇演没有经费,吃住行全都要自己掏腰包;由于自身小农的局限性,传承人没有高度的纪律性;不服领导者安排等。剧社运作逐渐困难,没有成绩,效率很低,且该运作弊端自身无法解决,剧社运作处于恶性循环之中。①这时就需要外力保护人的介入和帮助。
(二)外力保护人与传承人的合作
外力保护人在传承人自身无法解决困难的情况下介入,帮助传承人成立剧社,并与同行进行交流。同时外力保护人利用自己的人脉资源以及其他方法帮助他们申请非物质文化遗产项目,以期得到国家或者财团的资助,使剧社能够良性运行。同时,外力保护人需要意识到,非物质文化遗产是一个乡村文化,它无法离开生它养它的地方存活,应将其置于“适宜的生活场、自由的生存场、给力的艺术场”中才能不断发展[6]。因此,外力保护人应暂时退出运作行列,将该社团组织置于乡村的自治状态之中(虽然乡村自治仍会有很多弊端)。但由于传承人普遍具有的局限性,没有高度的纪律性,不服统一管理,致使该社团组织处于不良的运作状态。这时,外力保护人需再次介入,采取一系列措施,盘活该剧社,使其回到良性运作中。
(三)国家与传承人、外力保护人的合作
博弈论论文第6篇
博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如***事领域、经济领域、***治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。
博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。
2.博弈论的基本原理和方法
文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述
G={P,A,S,I,U}
P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够***决策,***承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。
A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。
S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。
I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。
U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。
还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。
不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。
3、博弈论与电力市场
博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。
正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。
博弈的结果是依赖于拥有的信息,采用什么样的信息披露***策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。
博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。
4、博弈论在电力市场中的应用
4.1自备电厂与公用电网之间的交易
开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力***。
文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。
文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。
4.2区域间输电交易分析
互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。
4.3转运市场中电网的固定成本分摊问题
运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。
4.4基于Pool或PX模式的多边贸易市场
电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。
在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。
文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。
该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。
对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。
4.5用博弈论解释和实现算法
文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。
作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。
鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。
用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。
博弈论论文第7篇
博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如***事领域、经济领域、***治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。
博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。
2.博弈论的基本原理和方法
文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述
G={P,A,S,I,U}
P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够***决策,***承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。
A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。
S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。
I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。
U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。
还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。
不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。
3、博弈论与电力市场
博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。
正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。
博弈的结果是依赖于拥有的信息,采用什么样的信息披露***策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。
博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。
4、博弈论在电力市场中的应用
4.1自备电厂与公用电网之间的交易
开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力***。
文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。
文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。
4.2区域间输电交易分析
互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。
4.3转运市场中电网的固定成本分摊问题
运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。
4.4基于Pool或PX模式的多边贸易市场
电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。
在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。
文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。
该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。
对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。
4.5用博弈论解释和实现算法
文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。
作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。
鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。
用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。