纯策略纳什均衡和混合策略纳什均衡
本作品内容为纯策略纳什均衡和混合策略纳什均衡,格式为 docx ,大小 12160 KB ,页数为 3页
('纯策略纳什均衡和混合策略纳什均衡简单来说,纯策略纳什均衡指的是,参与人选择的策略是确定的。比如,在性别之战中,我们通过每个参与人的最优反应确定了该博弈的两种纯策略,即(拳击,拳击)和(芭蕾,芭蕾)。在纯策略纳什均衡的情况下,我们只能知道具体的纳什均衡下每个参与人的收益,并无法求得参与人进行该博弈的整个的期望收益。(暂且称为期望收益吧),因为在参与人做选择时,并不知道对方会做出什么样的选择。假设我们自己为参与人1,我们就会开始想,现在我也不知道对方(参与人2)会做什么样的选择,我先假设他选择芭蕾的概率为p吧,那么他选择拳击的概率就是1-p,那么这个时候,我们自己在两种策略下的收益为,我们就会选择芭蕾,如果我们就会选择拳击。我们可以画出参与人1的最优反应曲线E1是双方都百分百选择拳击,E2是双方都百分百选择芭蕾,也就是我们之前求出的纯策略纳什均衡,而E3就是我们要算的混合策略纳什均衡。在该点U1=4/3由于博弈是对称的,U2=4/3由于参与人1在(拳击,拳击)时的收益1比选择(芭蕾,芭蕾)时的E3的收益4/3低,所以参与人1是肯定不会百分百选择E1作为均衡点的,同理,参与人2也不会百分百选择E2作为均衡点。既然参与人都可以自主选择自己的概率,那么只有在混合策略纳什均衡点E3这一个均衡。即参与人1分别以2/3和1/3的概率选择芭蕾和拳击,参与人2以1/3和2/3的概率选择芭蕾和拳击。所以在这个博弈里,只有一个混合策略纳什均衡,也就是E3点所代表的均衡。只要偏离这个点的概率,那么博弈的结果就会变为E1或者E2,这时总会有一个参与人不愿选择这样的结果,博弈无法达到均衡。所以最终寻找这个严格混合策略纳什均衡点的过程可以陈述为,给定其他参与人的混合策略,目标参与人在可行行动中的任意随机选择都是无差异的。即令2p=1-p,q=2(1-q),这就是寻找混合策略纳什均衡的解题方式。也可以通过同时假设两个参与人的概率,写出每个参与人在假设概率下的效用,通过让双方同时效用最大化求解。但直接使用上面说的结论会比较简单。最后总结一下,在纯策略纳什均衡时,有两个纳什均衡,但博弈会达到哪个结果并不确定,而参与人总归是要选择一个策略的,在选择策略时,自己选择策略的概率是可以由自己确定的,所以我们有了混合策略纳什均衡。会有一定的预测作用,因为如果性别之战是一个长期重复的博弈,你的之前的选择总会观测到,最终对方也会根据你的习惯选择自己的策略,比如经常比赛的足球队就可以观测到对方球队的数据,并因此做出自己的最优选择,为了使自己的收益最大化,我们必须选择一个概率,让对方随机选择策略。虽然并不知道题主的硬币正反是一个什么样的问题,但混合策略纳什均衡的原理是一样的。',)
提供纯策略纳什均衡和混合策略纳什均衡会员下载,编号:1700754656,格式为 docx,文件大小为3页,请使用软件:wps,office word 进行编辑,PPT模板中文字,图片,动画效果均可修改,PPT模板下载后图片无水印,更多精品PPT素材下载尽在某某PPT网。所有作品均是用户自行上传分享并拥有版权或使用权,仅供网友学习交流,未经上传用户书面授权,请勿作他用。若您的权利被侵害,请联系963098962@qq.com进行删除处理。