首页 > 专栏

博弈论复习题及答案

更新时间:2023-11-10 07:25:35 阅读：评论：0

不动产管理-认识自己作文

2023年11月10日发(作者：美丽河湖)

博弈论

判断题（每小题1分，共15分）

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√ ）

子博弈精炼纳什均衡不是一个纳什均衡。（× ）

衡。（√ ）

多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：

两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略

纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略

分）

参与人(player)

即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。

上策：

不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得

益始终高于其它的策略，至少不低于其他策略的策略

上策均衡：

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，

必然是该博弈比较稳定的结果

严格下策：

阶段博弈

重复博弈中的每次博弈称为“阶段博弈”。

贴现因子

下一期的一单位支付在这一期的价值。

触发战略（Trigger Strategy）

首先试探合作，一旦发现对方不合作，则也用不合作相报

复的战略。

子博弈精炼纳什均衡

（夫妻博弈）一对新婚夫妻为晚上看什么电视节目争执不下，丈夫

（记为I方）要看足球比赛节目，而妻子（记为Ⅱ方）要看戏曲节目.他

求纳什均衡。

博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈

的解。

3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头

装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽，但谁

按谁就要付出2个单位的成本。谁去按按纽则谁后到；都去按则同时

到。若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，

大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪

吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示（每格第

一个数字是大猪的得益，第二个数字是小猪的得益）：

小猪

按等待

(2)Pure NE (A, a); (B, b)

都是Pareto有效，仅(B, b)是Ｋ－Ｈ有效。

(3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。

参与人

bacd

2,33,23,40,3

4,45,20,11,2

3,14,11,410,2

3,14,1-1,210,1

B参与

人1

解答：

者）选择是否与新企业展开竞争。在位者可能有两种类型，温柔型（左

图）和残酷型（右图），回答下面问题。

进入者

在位者

进入

不进入

默许

斗争

（20，30）

（-10，0）

（0，100）

进入者

在位者

进入

不进入

默许

斗争

（-10，25）

（0，100）

（10，20）

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的

市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争

会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而

另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利

900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

答：（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作竞争

新华航空公司

合作500000，5000000，900000

售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做

广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利

润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业

可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利

润，B企业可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。

3. 答：（1）由题目中所提供的信息，可画出A、B两企业的支付矩

阵（如下表）。

B企业

做广告不做广告

A企业

做广告20，825，2

不做广告10，1230，6

（2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡

解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获

得的利润8大于不做广告获得的利润2，故在8下面划一横线。如果A厂商

由划线法易知，该矩阵博弈没有纯策略Nash均衡。

可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash均衡((),()

16、某产品市场上有两个厂商，各自都可以选择高质量，还是低质

量。相应的利润由如下得益矩阵给出：

(1) 该博弈是否存在纳什均衡？如果存在的话，哪些结果是纳什均衡?

参考答案：

由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即(低质量, 高质

量)， (高质量,低质量)。

乙企业

高质量低质量

50,50100,800质

甲

企

业

发

解：用划线法找出问题的纯策略纳什均衡点。

所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开

发)。

该博弈还有一个混合的纳什均衡((),())。

如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变

为：,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需a>10。此

时乙企业的收益为100+a。

18、博弈的收益矩阵如下表：

（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存

在一个纳什均衡，它为多少？

答：（1）此博弈的收益矩阵如下表。该博弈是零和博弈，无纳什

均衡。

John

123

13，-3-1，1-1，1

Smith2-1，13，-3-1，1

3-1，1-1，13，-3

对垄断企业2来说：

这是垄断企业2的反应函数。

其等利润曲线为：

在达到均衡时，有：

均衡时的价格为：

两垄断企业的利润分别为：

均衡点可图示为：

企业1

200

190

企业2

企业1的反应线

均衡点

（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反

应函数为：

则企业1的问题可简化为：

均衡时价格为：

利润为：，

答：该博弈分为两个阶段，第一阶段企业1选择产量q，第二阶段企业2

和3观测到q后，他们之间作一完全信息的静态博弈。我们按照逆向递

归法对博弈进行求解。

（1）假设企业1已选定产量q，先进行第二阶段的计算。设企业2，3的

利润函数分别为：

由于两企业均要追求利润最大，故对以上两式分别求一阶条件：

（1）

（2）

求解（1）、（2）组成的方程组有：

（3）

（2）现进行第一阶段的博弈分析：

对与企业1，其利润函数为；

将（3）代入可得：

（4）

式（4）对q求导：

益矩阵或扩展形表示

该博弈并作简单分析。

（2）如果老板无法看出工人是否偷懒，博弈属于哪种类型？用得益矩

阵或扩展形表示该博

弈并作简单分析。

（1）完全信息动态博弈。

前进停下

甲

2，0前进-2，-2

0，0停下0，2

28、给定两家酿酒企业A、B的收益矩阵如下表：

A企业

白酒啤酒

B企业

白酒700，600900，1000

啤酒800，900600，800

（2）分析混合策略纳什均衡。

答：（1）该博弈的支付矩阵如下表：

纳税人

逃税不逃税

税收机关

检查A-C+F， -A-FA-C，-A

不检查0，0A，-A

（2）先分析税收检查边际：因为S为税务机关检查的概率，E为纳

32、简要评论博弈论在微观经济学运用中的优缺点。

答：博弈论是描述和研究行为者之间策略相互依存和相互作用的一

种决策理论。它被广泛应用于政治、外交、军事、经济等研究领域，但

在微观经济学中的应用是最成功的。博弈论的研究方法和特征与经济学

结合得非常紧密。它强调个人理性，即在给定的约束条件下追求效用最

大化。但博弈论又比传统的经济学更进一步，它研究的不是面临非人格

化的价格参数下的决策问题，而是研究效用随各个主体的行为改变而改

变的效用最大化问题。除了国际贸易、金融、拍卖等经济领域，博弈论

在企业理论特别是寡头竞争研究方法方面做了大量的有益工作。

20世纪80年代以来，博弈论开始出现在西方经济学的教科书中，都

解释并讨论此例的纳斯均衡，为什么其均衡是一种囚徒困境。

厂商1的总收益TR由下式给出：

厂商1的边际收益MR为：

MR=30-2Q-Q

112

利用利润最大化条件MR=MC=0，得厂商1的反应函数(reaction

function)或反应曲线为：

Q=15-0.5Q (6-1)

同理可得厂商2的反应曲线为：

Q=15-0.5Q (6-2)

均衡产量水平就是两反应曲线交点Q和Q的值，即方程组6-1和6-2的

解。可以求得古诺均衡时的均衡产量水平为：Q=Q=10。

因此，在本例中，两个寡头的总产量Q为Q+Q=20，均衡价格为P=30-

Q=10。

刚才我们讨论了两寡头厂商相互竞争时的均衡产量。现在我们放松

第(6)条不能串谋的假设，假定两寡头可以串谋。它们能共同确定产量

以使总利润最大化。

这时，两厂商的总收益TR为：

TR=PQ=(30-Q)Q=30Q-Q

其边际收益MR为：

MR=30-2Q

根据利润最大化条件MR=MC=0，可以求得当Q=15时总利润最大。如果两

厂商同意平分利润，每个寡头厂商将各生产总产量的一半，即

Q=Q=7.5。其实，任何相加为15的产量Q和Q的组合都使总利润最大

1212

化，因此，把Q+Q=15称为契约曲线，而Q=Q=7.5是契约曲线上的一个

1212

点。

我们还可以求得当价格等于边际成本时，Q=Q=15，各厂商的利润为

零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率，可选择把较

好的节目放在前面还是后面。他们决策的不同组合导致收视率如下：

(1)如果两家是同时决策，有纳什均衡吗?

有（前面，后面）

(2)如果双方采用规避风险的策略，均衡的结果是什么?

(4)如果两家谈判合作，电视台1许诺将好节目放在前面，这许诺可信

吗？结果能是什么？

电视台1 许诺将好节目放在前面的许诺不可信。

因为电视台2，前面为占优策略，

而在电视台2 ，选择前面的时候，电视台1 选择后面的收益要大于前面

的收益。

所以，最终结果为（前面，后面）

36、如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触发策

略，贴现因子为δ。试问δ应满足什么条件，才存在子博弈完美纳什均

衡？

乙坦不坦

甲白白

坦白4,40,5

不坦5,01,1

白

P=a-Q

TR=P*Q=(a-Q)*Q

MR=a-2Q

因为：MR=MC

a-2Q=c

则:Q=(a-c)/2

P=(a+c)/2

π=(P-c)*Q=(a-c)2/4

每家企业的利润为(a-c)2/4n

（2）假设A企业自主降价，虽然只是微小的价格调整，但足以占领整个

试求 (a)该厂商的AC,MC及VMP各为多少?

LLL

(b)劳动工资为多少?厂商会雇用多少劳动?

由：S=D解得：W=280

由于产品市场为完全竞争市场，且要素市场也为完全竞争市场

所以，满足：产品市场均衡：P=MR=MC=W/MP

要素市场均衡：W= AC=MC=VMP

LLL

得到：AC=MC=VMP=280

LLL

由：D=S解得：P= 40，q=10

厂商追求利润最大化的情况下：

W*=VMPL=P*MPL=P*50/L

0.5

L*=[100/2*PW*]=51 (取整数)

论述题（每小题20分，共20分）

解释“囚犯困境”，并举商业案例说明。

囚徒困境是博弈论里最著名的例子之一，几乎所有的博弈论著作中

都要讨论这个例子。这个例子是这样的：两囚徒被指控是一宗罪案的同

案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白

罪行。如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，则

很难对他们提起刑事诉讼，因而两囚徒可以期望被从轻发落入狱2年；

另一方面，如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就

只需入狱1年，而不坦白的囚徒将被判入狱10年。表6-2给出了囚徒困境

的策略式表述。这里，每个囚徒都有两种策略：坦白或不坦白。表中的

数字分别代表囚徒甲和乙的得益。(注意，这里的得益是负值。)

表6-2 囚徒困境

囚徒乙

坦白不坦白

囚徒甲

坦白-5， -5-1，

不坦白-10，-2， -2

-10

情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也

是坦白。而且这里双方都坦白不仅是纳什均衡，而且是一个上策

(dominant strategy)均衡，即不论对方如何选择，个人的最优选择是

坦白。因为如果乙不坦白，甲坦白的话就被轻判1年，不坦白的话就判2

年，坦白比不坦白要好；如果乙坦白，甲坦白的话判5年，不坦白的话

判10年，所以，坦白仍然比不坦白要好。这样，坦白就是甲的上策，当

然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商

选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄断利润最大

化产量，每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什

均衡，因为给定双方遵守协议的情况下，每个厂商都想增加生产，结果

是每个厂商都只得到纳什均衡产量的利润，它远小于卡特尔产量下的利

润。

解释“智猪博弈(boxed pigs)”，并举商业案例说明。

市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研

究与开发，为新产品做广告，而对小企业来说这些工作可能得不偿失。

所以，小企业可能把精力花在模仿上，或等待大企业用广告打开市场后

再出售廉价产品。

解释““夫妻博弈”(battle of the xes)”，并举商业案例说

明。

“夫妻博弈”(battle of the xes)的例子讲的是一对谈恋爱的男

女安排业余活动，他们有二种选择，或去看足球比赛，或去看芭蕾舞演

出。男方偏好足球，女方偏好芭蕾，但他们宁愿在一起，不愿分开。表

6-6给出了这个博弈的得益矩阵。在这个博弈中，如果双方同时决定，

则有两个纳什均衡，即都去看足球比赛和都去看芭蕾演出。但是到底最

后他们去看足球比赛还是去看芭蕾演出，并不能从中获得结论。如果假

设这是个序列博弈，例如，当女方先作出选择看芭蕾演出时，男方只能

选择芭蕾；当女方先选择了看足球比赛时，男方也只能选择足球。反

比如在美国汽车产业发展史中的某些阶段，通用汽车就扮演

过这种领导者的角色(这一例子把模型直接扩展到允许不止一

个追随企业，如福特、克莱斯勒等等)。根据斯塔克尔贝里的

假定，模型中的企业选择其产量，这一点和古诺模型是一致

的(只不过古诺模型中企业是同时行动的，不同于这里的序贯

行动)。

这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。

对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价：

回顾在古诺博弈的纳什均衡中，每一企业的产量为(a一

c)/3,也就是说，斯塔克尔贝里博弈中逆向归纳解的总产量

3(a-c)/4，比古诺博弈中纳什均衡的总产量2(a-c)/3要高，

，其中R (L)为企业雇佣L名工人可以取得的收入(在最优

的生产和产品市场决策下)，假定R (L)是增函数，并且为凹

函数。

L保持不变，w降低时企业的利润就会提高，于是较低的等利

表现在图中的无差异曲线上就是，工会希望选择一个工资水

平w，由此得到的结果(w， L*(w))处于可能达到的最高的无

差异线上。这一最优化间题的解为w*，这样一个工资要求将

使得工会通过(w*， L*(w*))的无差异曲线与L*(w)相切于该

从一个长期来看，两者的均衡将维持在警察以0.33的概率巡逻犯罪者以

0.4的概率作案上面。现实中，我们看到，当严打的时候（警察出击的

落魄的意思-深候

本文发布于:2023-11-10 07:25:35，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/zhishi/a/1699572335211389.html

本文word下载地址：博弈论复习题及答案.doc

本文 PDF 下载地址：博弈论复习题及答案.pdf

上一篇：日本与中美战略竞争——贸易战、科技战及印太战略

下一篇：返回列表

标签：零和竞争

留言与评论（共有 0 条评论）