博弈论基础复习-11 下载本文

内容发布更新时间 : 2024/6/3 22:24:50星期一 下面是文章的全部内容请认真阅读。

《博弈论基础》复习大纲

一、 辨析题(2×5=10分) 二、 简答题(5×7=35分)

1.描述双人策略型(标准型)博弈的基本结构及其纳什均衡。你是如何理解纳什均衡的?

(1)标准式博弈记为:G={S1,S2,?,Sn;u1,u2,?,un}。其基本要素包括:局中人、策略(策略组合)、支付(支付函数) (2)局中人:博弈的参与人i

博弈的参与人集合I:i∈I ={1, 2, ?, n}

(3)纯策略:指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略,参与人i的纯策略si∈Si ①参与人i的策略集(纯策略空间)为Si,i ∈I ②策略组合:s= (s1, s2, ?,si,?, sn)

③策略组合空间:S=×iSi

(4)支付(效用):每个局中人从各种策略组合中获得的收益,由于它是参与人策略组合的函数,又称为支付函数

每个参与人的支付函数记为ui(s)=ui(s1, s2, ?, sn),si∈Si (5)Nash均衡

在博弈G={S1,S2,?,Sn;u1,u2,?,un}中,如果策略组合s*=(s1*, s2*, ?, sn*)满足对每一参与者i,si*是他针对其他参与者所选策略s-i*=(s1*, s2*, ?si-1*, si+1*,?, sn*)的最优反应策略,则称策略组合s*=(s1*, s2*, ?, sn*)为该博弈的一个纳什均衡。即:

ui(si*, s-i*)≥ui(si, s-i*), si∈Si

纳什均衡是一种相对稳定状态,没有参与者有动机独自偏离纳什均衡下的策略选

择。

2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题? 合作 背叛 合作 R,R T,S 背叛 S,T P,P 条件:(1)T>R>P>S (2) 2R>T+S或2R>2P

囚徒困境反映个人最佳选择并非团体最佳选择,说明个人利益与社会利益的冲突。

3.描述双人策略型博弈的纯策略和混合策略。

(1)纯策略:指局中人在博弈中可以选择采用的行动方案。每个局中人都有可供其选择的多种策略,参与人i的纯策略si∈Si 参与人i的策略集(纯策略空间)为Si,i ∈I 策略组合:s= (s1, s2, ?,si,?, sn) 策略组合空间:S=×iSi (2)混合策略

混合策略:若参与人i有K个纯策略:Si={si1,?,siK},则概率分布?i=(?i1,?,?iK)称为i的一个混合策略,这里?ik=?(sik)是i选择sik的概率,对于所有的k=1,2,?,K,0≤?ik≤1,∑ k?ik=1。 纯策略为混合策略的一个特例。

混合策略空间:参与人i的所有混合策略的集合,记为?i 混合策略组合空间:?=×i?i

4.简要分析扩展型博弈(博弈树)的构成要素。 博弈树的基本元素有:

(1)节点: x∈X,又称决策结,简称“结” (2)枝:连结结点的连线

(3)信息集:一些节点的集合。在同一信息集中,局中人面临完全相同的决策形势。

(4)结:包括:

①初始结:博弈的起点。

②决策结:参与人采取行动的时点。 ③终点结:博弈行动路径的终点。

5.什么是子博弈和子博弈精炼(完美)纳什均衡?什么是完美信息博弈?简析完美信息博弈中逆向归纳法的求解思路。

(1)子博弈:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足: ①x是一个单结信息集,即h(x)={x};

②对于所有的x’∈T(x),如果x’∈h(x’),则x’∈T(x)。 条件①是指子博弈必须从一个单结信息集开始;

条件②说明子博弈的信息集和支付向量直接承自原博弈。这意味着子博弈不能切割原博弈的信息集。同时,任何博弈是它自身的子博弈。 (2)子博弈精炼Nash均衡

子博弈精炼(完美)纳什均衡:扩展式博弈的策略组合s*=(s1*, s2*, ?, sn*)是一个子博弈精炼纳什均衡,如果:①它是原博弈的纳什均衡;②它在每一个子博

弈上给出纳什均衡。

(3)完美信息博弈:一个博弈的所有信息集都是单结的。 (4)完美信息博弈中逆向归纳法的求解思路:(画图解释好)

假设只有两个阶段(参与人2在观察到参与人1的行动后再行动),当博弈进入第二阶段时,给定参与人1的选择a1∈A1,则参与人2的决策是使: u2(a1, a2)

我们用a2*=R2(a1)代表上述最优化问题的解(参与人2的反应函数)。由于参与人1知道参与人2在第二阶段的决策规则,参与人1在第一阶段的决策是: u1(a1, R2(a1))

设其解为a1*,则该博弈的子博弈精炼纳什均衡是(a1*,R2(a1)),均衡结果为(a1*,R2(a1*))。

6.理解完全信息动态博弈下的纯策略和行动。 行动与策略

(1)行动:是参与人在博弈的某个时点(某个信息集)的决策变量。 行动组合:参与人的行动的有序集。

(2)策略:是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动。

在静态博弈中,策略和行动是等价的。

在动态博弈中,策略在给定信息集下完整的行动方案,与行动是不同的。

7.什么是冷酷(触发)策略?谈谈你对重复博弈中冷酷策略的理解。

(1)触发策略:如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略。

8.描述双人不完全信息静态博弈的结构,并给出相应的静态贝叶斯均衡。博弈论中对不完全信息是通过类型来处理的,对此,你是如何理解的?

(1)n人静态贝叶斯博弈的策略式表述G={A1,?,An;p1,?,pn;u1,?,un}包括:(补充符号)P23

①参与人的类型空间:?1,?,?n ②条件概率:p1,?,pn

③类型依存支付函数:ui(a1, ?, an;?i)

④参与人i知道自己的类型?i??i,条件概率pi描述给定自己属于?i的情况下,参与人i有关其他参与人类型?-i??-i的不确定性,ai(?i)?Ai(?i)表示参与人i的类型为?i时所选择的行动(即参与人的行动是类型依存的)。

贝叶斯纳什均衡:n人不完全信息静态博弈G={A1,?,An;p1,?,pn;u1,?,un}的纯策略贝叶斯纳什均衡是一个类型依存策略组合a*=(ai*(?i)),i=1,2,? ,n。其中,ai*(?i)满足:(自己补充)

(2)①一般地,将一个参与人所拥有的所有私人信息称为他的类型。 ②由于大多数博弈中,参与人的特征由支付函数完全确定,因而一般将参与人的支付函数等同于他的类型。

③通常假定,参与人i只知道自己的类型,并且知道其他局中人的类型分别为若干种可能类型中的一种,但不知道具体是哪一种,但他知道其他参与人类型的概率分布。

④通过引入“自然”这一虚拟局中人,将不完全信息博弈转换为不完美信息博弈。

⑤所有局中人的实际类型均来自于由“自然”根据类型上的联合概率分布