2012中山大学法学院期末试题-答案 下载本文

内容发布更新时间 : 2025/1/8 2:53:02星期一 下面是文章的全部内容请认真阅读。

中山大学法学院2012年秋季学期期末试题

博弈论

任课教师 丁建峰 考试时间120分钟

试卷说明

本试卷分为A组题和B组题,每组题的满分均为100分(包括基础题30分,选做题70分),请您任选一组题作答即可,在回答总分为70分的“选做题”时,请不要从A组和B组当中混杂挑选,这样会给评分带来实质上的困难,如发现此种情况,则只能按照您选作的两组题目中的低分组给分。在答卷的第一行,请用清楚的大字写明您选择的是A组题还是B组题。另外,答卷中要写清楚题号。

基础题

(总分30分,A组题与B组题共用)

1.找出下列博弈的纯策略纳什均衡(10分)找出它的混合策略纳什均衡(8分)计算在混合策略纳什均衡下面A和B各自的预期支付(4分)。

纯策略均衡为(D,L),(M,R)。每找对1个5分。 混合策略纳什均衡为((M,D;0.2,0.8),(L,R;0.5,0.5))(每个概率算2分) 预期支付,参与人A得3,参与人B得7.4(每问2分)

2.找出下列博弈的子博弈完美纳什均衡的均衡路径(8分)。

1

这个博弈中,最上层的丙不可能选Q,必然选P。乙选X,Y无差异。 中层以乙的决策开始的子博弈中,乙选择X。

由此可知,甲选择D在收益上占优于选择U和M,因此甲直接选D。 (此题是蜈蚣博弈的一个变形)。

此题不分点给分,凡做错的一律扣去8分。因为此题若分点,则评分过于繁琐。

A组题(70分,计算与证明)

A3(15分).考虑以下的阶段博弈重复无穷多次的情形(其中C代表合作,D表示背叛,且a>0)。

B C D

C (2, 2) (0, 2+a) A D

(2+a, 0) (1, 1)

(1)若(C,C)要作为子博弈完美均衡成立,假如A,B两人均采用冷酷策略作为保持合作的手段,求A,B两人的贴现因子的取值范围。(7分)

(2)现在A,B两人都采用有限阶段惩罚策略,且惩罚次数为2次。即,若发现对方背叛合作,另一方连续惩罚对方两次(即在观察到对方背叛后,连续两次选择“背叛”,然后继续转为合作)。问当a的取值范围为多少时,有限阶段惩罚不可能引导出无穷期重复博弈中的(C,C)均衡?(8分) 【解】(1)令2+2δ/(1-δ)>2+a+δ/(1-δ),解这个不等式,得到δ>a/(a+1),亦即 1≥δ>a/(a+1),由于该博弈为对称博弈,因此两人的贴现因子取值范围相同。 (2)A,B两人采用有限阶段惩罚,因此,受到惩罚时,背叛者的收益为组合(C,D),(D,D),(D,D)的收益。而一直合作的收益为(C,C)(C,C)(C,C)的收益。由于我们要计算有限惩罚不成功时a的取值范围,因此令背

2

叛者的收益大于合作者的收益。 即:2+a+δ+δ2>2+2δ+2δ2;

这个不等式恒定成立的条件是a>δ+δ2

由于δ+δ2在[0,1]区间上的最大值为2,亦即a>2时,这个不等式恒成立。

?1+1+4a?1+1+4a22解法2:解不等式δ2+δ-a>0,解得δ>,又因为δ≤1,因此若=1,即找不到使合作成为可能的δ。解得a的阈值为2。

A4(10分). 假设在某个有100人的小城要建一个开放式公园。需要大家来捐钱,要求每位热心市民捐100元(即,市民要么捐100元,要么不捐)。凑的钱越多盖的公园越舒适美观,每位市民的享受也就越多。但是有些人偏偏就不捐,而且不捐的人也可以到公园游玩,享受公园带来的好处。假设100人当中有n个人捐了钱,那么,每位市民不管捐没捐钱,各自从公园中得到的利益均为n2(以金钱为单位衡量)。

(1)如果只有10个人捐款,那么,如果一个市民仅仅考虑自己的利益,他会不会捐款?(5分)

(2)假如你是市长,想要每个人都捐钱,你可以游说某些人说服他们捐款。请问:你至少要说服多少人捐献,才能让其他所有人都自愿捐献?(5分) 解:(1)若只有10人捐款,那么捐款的预期收益为11*11-100=21,而不捐的预期收益为100。因此最优选择为“不捐”。 【注】题目中的“只有10人捐款”,有人计算为10*10-100=0。这个计算是错误的,不能得分。因为此时10人之中,必不包括该市民。因为捐款者如果包括该市民的话,那么该市民已经捐款,无须考虑“捐还是不捐”的问题,而且,一旦该市民决定不捐,难道还要从10人之中剔除掉他吗? 因此,“只有10人捐款”的正确理解为“在该市民决策时,只有10个其他市民捐款”,而该市民决策后是“不捐”,因此他也不可能增加捐款人的数量。

(2)设有x人捐款,则代表性市民捐款的预期收益为(x+1)2-100,不捐款的预

2

期收益为x2,令(x+1)-100>x2,解得x>49.5。亦即只有说服至少50人捐款,其他人才会自愿捐献。

A5(10分). 有个小国有三个政党,它们的“代号”分别是毛虫党、黄雀党和绿叶党,毛虫党独立参选可以获得50个议席;黄雀党独立参选可以获得80个议席;绿叶党独立参选可以获得100个议席。如果毛虫党和黄雀党联盟参加竞选,可以获得120个议席;毛虫党和绿叶党联盟参选,也可以获得120个议席;黄雀党和绿叶党联盟参选,可以获得200个议席。现在,毛虫党、黄雀党和绿叶党三个党结成联盟参加竞选,共获得了300个议席。请问,按照2012年诺贝尔奖得主罗伊德·夏普利(Lloyd S. Shapley)教授提出的方法,三党之间如何分配这300个议席最为公平合理?

【解】设三党参选次序为(毛,黄,绿)(毛,绿,黄),(黄,毛,绿),(绿,毛,黄),(黄,绿,毛),(绿,黄,毛)。毛虫党的边际贡献分别为50,50,40,20,100,100。将其平均可得60。即毛虫党得到60席。 设三党参选次序为(黄,毛,绿),(黄,绿,毛),(毛,黄,绿),(绿,黄,毛),

3

(毛,绿,黄),(绿,毛,黄),黄雀党的边际贡献分别为80,80,70,100,180,180,平均得115席。

故而绿叶党可得125席。

计算正确1个,给3分;2个,给7分;3个,给10分。

A6(10分). 考虑Marienbad游戏如下,有两个参与人和两篮彩色球,红色篮子里装了28个红球,蓝色篮子里装了18个蓝球,两人轮流从篮子里拿掉彩色球,他们每次可以拿掉任意多个球,但只能从一个篮子里拿球。举个例子:参与人1可以一次拿掉3个红球,也可以一次拿掉4个蓝球,但不能同时拿掉1个红球和1个蓝球。每一次,轮到的那一方必须至少拿掉一个球。被迫拿掉最后一个红球的一方为游戏的失败方。请解释在这个游戏中哪一方具有必胜策略,并把这个必胜策略清楚地表示出来。

【解】这个游戏中参与人1具有必胜策略。策略是,先从红色篮子中拿走9个红球,使阵型变为(19红,18蓝)。然后,不管对手如何取,总是取和对方的球颜色不同的球,且数量相等。例如,对方如果取3个红球,则我取3个蓝球。对方如果取2个蓝球,则我取2个红球。这样的策略是必胜的。

此题实际上是“尼姆”游戏的变形,胜型是1红,然后2红1蓝是胜型(可以不断尝试,最后得出一个确定的胜型,例如1红2蓝必输),3红2蓝是胜型,如此一直逆推过去,可以归纳出结论。

此题偏离正确做法的都不给分,但是,写出一个胜型来的给1分。写出两个的给2分。做法错误者最多不超过3分。

A7(25分). 一个市议会由三个议员A\\B\\C组成,他们每年投票决定是否为议员加薪。每个议员都希望加薪。但却都想投反对票,因为这样选民才会对自己有好印象。每位议员的支付如下: 加薪通过,自己投反对票,得,11 加薪没通过,自己投反对票,得5 加薪通过,自己投赞成票,得4 加薪没通过,自己投赞成票,得0

投票是同时进行的,而且采取少数服从多数的规则。 (1)(10分)证明在单次博弈中,任何加薪的提案都无法通过。 (2)(15分)证明在无穷多次博弈中,如果市民是健忘的(即议员今年投票的结果只会影响本年度他的收益,而不会影响以后年度的收益),且三位议员的贴现因子δ均大于0.5,那么每年的加薪提案都会成功通过。 (1)画出收益矩阵,容易证明,“投反对票”是一个占优策略。 以A为例,若B,C投赞成票,A投赞成票得4,投反对票得11。 若B,C中有1人赞成,1人反对,A投赞成票得4,投反对票得5 若B,C均反对,A投赞成票得0,投反对票得5 无论如何,投反对票均好于投赞成票。

此题如果推导过程有误(例如,画出错误的矩阵),则不得分。但若写“投反对

4

票的最低收益为5,高于投赞成票的最高收益4”的,得8分(这样写是正确的,但过于取巧)。写明“反对票是占优策略纳什均衡”的,补给1分。 【说明】写“无论加薪是否通过,投反对票的收益总是大于投赞成票的收益”的,不得分。因为加薪通过与否并不是预先给定的,而是与议员投反对票和赞成票有关。这样写在逻辑上是不合适的。

(2)在无穷多次博弈中,对于3个人而言,他们可以互相协调为(赞成,赞成,反对),(赞成,反对,赞成),(反对,赞成,赞成)——即,每年有1人反对,2人赞成。同时,采用冷酷策略惩罚背叛者(如果有人背叛这个合作协议,此后每年都投反对票)。因此,可以得出如下的不等式: 11+4δ+4δ2>5+5δ+5δ2 4+11δ+4δ2>5+5δ+5δ2 4+4δ+11δ2>5+5δ+5δ2

由于11+4δ+4δ2>4+11δ+4δ2>4+4δ+11δ2,因此只需要解最下面的不等式即可。 解得δ的阈值为0.5。亦即,当δ大于0.5时,以上三个不等式都成立。亦即每年的提案都会成功以多数票通过。

B组题(70分,论述题)

B3(30分). B3(35分).康德在《历史理性批判文集》中指出,“大自然迫使人类去加以解决的最大问题,就是建立起一个普遍法治的公民社会”(何兆武译,商务印书馆1990年版,第8页)。目前,中国社会正处在向着“民主法治下的良序市场社会”变迁的“伟大转型”的历程中,并且正处于一个十分关键的时点。作为一个法学学生,学习以博弈论为代表的现代社会科学知识,对你思考中国的民主、宪政、法治等根本问题有何帮助和启发?试集中论述对你启发最大的一个或两个主题。

B4(35分).以下两小题,任选一题论述。(如两题都答,按得分低者计分) (1)博弈论,英文为“game theory”,直译做“游戏理论”。请问“game theory”中的game一词,与日常语言中的game(游戏)一词,在内涵和外延上,有何相同之处与不同之处?对于“game”(游戏)含义的不同理解,会如何影响我们对于社会生活的分析与认识?

(2)设想在浩渺的宇宙中有这样一个星球,它上面有与人相类似的、能够进行理性计算的高等智慧生物(姑且称他们为“外星人”,尽管这样也许是对其他物种的冒犯——我们人类是不愿意被称为“无尾猴子”或“裸体猩猩”的)。这种外星人的社会生活,假定与本世纪的人类十分相似,唯一的不同是他们直接通过脑电波传递信息,这就意味着他们的思想过程是透明的——他们彼此会直接阅读对方的脑电波。

请问在这样的星球上,人们之间的理性互动(博弈)的形式与地球上会有何不同?

【说明】

论述题没有标准答案,出题要旨是:B3考察学生对社会现实问题的关注,以及用博弈论分析政治法律问题的能力。B4考察学生的想象力和创造力。以思路清晰,论述详明,观点新颖,

5