[转贴] 博奕论精要(童话版)
博奕论精要(童话版)那蚂蚁一直在旁边袖手微笑,待到此时,方才向狐狸说道:“狐兄豪气干云,小弟 十分敬佩,倒想领略一番。”
狐狸笑道:“不知蚁兄是要下里巴人还是要阳春白雪?”
蚂蚁奇道:“下里巴人又如何?阳春白雪又如何?”
狐狸缓缓说道:“下里巴人,至俗也,便是那乡间七旬老母,犹能听得手舞足蹈, 击节而歌。却可惜譬如那山溪之水,来势汹汹,去也匆匆,入骨不过三分矣。”
“那阳春白雪,又当如何?”
狐狸道:“夫阳春白雪也,一望无垠,恰似大海潮生,初时广袤沉静,星光点点, 不觉 有异。然细心听处,远方隐隐似有天籁之音,像那闷雷滚过,却又悠扬有如长笛呜 咽。待到听得更是真切之时,又有冰河破碎,清泉下流,入小河,汇大江,浩浩荡荡, 终归大海,成了万丈涛声,千年不绝。”
蚂蚁叹道:“怎信世间能有如此神奇之学问。你且先让我们听听那下里巴人罢!”
狐狸道:“博弈便是赌博。”
绛仙不满道:“我说不准赌博的!”
蚂蚁摇手道:“姑娘莫恼,刚才既是我说要下里巴人,才有赌博这些鄙陋之事,须 不要怪狐兄。”
狐狸宛尔笑道:“姑娘也可把它看作打架。博弈之要义,先要知你是谁,要看你出 手 然后我的还手必要是最有利自己。此为最基本也。”
“然高手过招,赢在料敌机先。纵然彼先出手,但既知我是谁,故出手后,必要想 以我之能,当如何还手。彼出招与我还招,构成一个局面,非但可定我之生死,亦可以 定彼之生死。彼必要选择对其最有利的局面为先着。是故彼未出手,我已知其意矣。”
“那也未必!”绛仙插嘴道,“我可以用对方从来没有见过的天山折梅手,对方防 不胜防,便无从计算得失了。”
“姑娘莫急,”狐狸道,“博弈论中,什么样的人用哪些招数,都是事先假定好的 ,也是大家各方都知道的,而且大家都知道大家知道的,却不允许你弄些稀奇古怪的旁 门左 道来捣乱。”
“狐兄之意我已知之,”蚂蚁沉吟道,“于我方,最想知道的是对方如何出手,只 要确 定对方的招数,我便可以在此前提下选择于自己最有利的应对措施,得到一个我的 盈利 函数。然而对方也能想象到我盈利函数最大化下的出招,并因此计算他自己的所得 。对 方所出招必定是能使他盈利最大的招数。”
“所以我便可知对方如何出招,对方也知我会如何应对。我若不如此应对,必定吃 亏; 对方若不如此出招,必定不能使其利益最大。”
“nod,”狐狸点头,“这些招数的组合,便成为了一条均衡路径。”
“但凡事总要未雨绸缪,难保中途哪个出错,出了一个对他自己不利的臭招,你下 一招 也得针对新情况,解决新问题。”
“所以,对于局中人任何招数,无论香臭也罢,如果真的发生了,我们就要根据前 面蚁兄说的原则重新计算出招和应招。但是我们只朝前看,不算旧帐。”
“如果每一个回合的每一招(无论这一招的出现如何愚蠢)我们都想好了其后的最 佳出 招和应招,即任何招数的出现,其后都有均衡路径;而最长的那条均衡路径,为整 个博 弈的均衡路径。那么,我们就算完事大吉,高枕无忧了。”
但文书还是不服气:“你这个总是分了出招的先后顺序,所以别人出后你可以悠然 地选 择自己最优的。倘若你们都是同时出招,你看到对手出招时,你的剑也已经刺出, 变不了招,岂非全都乱了套?”
狐狸笑道:“文书想的周到。不过这个虽原理与前无异,倒也不好用话来说,且先 等它一等。”
“狐兄总是这么刚愎自用,”绛仙幽幽地叹口气,“俗话说,画虎画皮难画骨、知 人知 面不知心。你怎么就一定知道对方是什么人?”
狐狸的心不觉颤了一下,因为很久以前自己也曾这般叹过,故而听来分外熟悉。 不过这好比微风吹起的一丝涟漪,很快就从水面的这边,掠过水面的那边,然后就 消失 了。
狐狸道:“按博弈论的要求,我们即便不知道对方一定是什么人,但却知道他属于 哪一 类人的概率。譬如是好人的概率是2/3,坏人的概率是1/3。能够知道这个,我们也 可以 作出选择了。”
“但是......”绛仙欲言又止,因为她想到了1/3的那种可能,所以她并不满意狐 狸的这 个回答。但是她知道这已经是最好的回答。所以也不再问。 狐狸笑着把眼睛从她身上扫过。
“先前我们知道博弈中每个人是什么类型,然后我们可以算出每个人的盈利函数, 每个 人的决策,便是根据这盈利函数来的。现在我们只知道每个人属于哪个类型的概率 ,也 还是一样按照刚才的步骤进行,只不过盈利函数成为数学期望值罢了。无论先出招 还是后出招,都是一样希望自己的盈利期望最大。”
文书嚅嗫道:“这个数学期望......”
狐狸乐了:“大二数学便有这些东东,文书缘何记不得了?譬如你有1/3的可能得 到9元钱,有2/3的可能得到18元钱,那你可能得到钱的数学期望便是9*1/3+18*2/3=15元 。一 个量乘以自身的概率,便是数学期望。”
说到这里,狐狸不觉朝蚂蚁望了一下:“现在所说,虽力图下里巴人,但......”
蚂蚁已知其意,挥手道:“下里巴人也不应是文书这样的幼儿园水平,概率的起码 意义要懂!”
“换言之,”蚂蚁笑道,“即便国人素质低,狐兄要说的,也至多是阳春白雪,未 可算 是艳阳高照。在下还听的懂,尽管放心的说下去。”
狐狸摇头道:“我要说的,就要说完了。现在我们在每个局中人的类型、每种类型 局中 人的各个招数上,都各假设一个概率,这些概率假设可全用符号来表示未知量,它 们可 以代表小数,也可以代表0,也可以代表1。”
“但是引入这些符号之时,便要这些符号之间满足概率上的约束,譬如归一化约束 。作 为代数式,这种约束是可以满足的。”
“此时,局中人选择策略,实质上便是计算概率。概率为0,便不选此策略;概率 为1, 便一定选此策略,概率若为小数,则为混合策略。”
“令μa,μb,μc......为a,b,c......决策顺序中局中人所属类型的概率向量 (各个 决策顺序的局中人可同可不同,但我们只把顺序作为区分标准),βa,βb,β c...... 为分布在相应局中人各招数上的概率向量。注意,这儿μa,βa等都是向量,譬如 μa=( μa1,μa2,......μan)。”
“由此可以列出依照a,b,c......的先后次序决策时,各人的盈利代数式: ua=fa(μa,μb,μc......;βa,βb,βc......βn)
ub=fb(μa,μb,μc......;βa,βb,βc......βn)
......
un=fn(μa,μb,μc......;βa,βb,βc......βn)”
“现在先不考虑出招较早的那些人,首先考虑最后一个决策者,他当取βn*使得 un*=maxfn(μa,μb,μc......;βa,βb,βc......βn)的βn*策略。
此时, βn* βn 可以表示为μa,μb,μc......;βa,βb,βc......βn-1的函数式。
因此可 得(n-1)个决策者的盈利式为: un-1*=maxfb1(μa,μb,μc......;βa,βb,βc......βn-1)
βn-1 同样又确定βn-1*,并消掉βn-1变量,依次类推。
最后确定μa*后,把μa*的数 值代入 其它所有人的策略代数式,即可求得依先后顺序计算的所有局中人均衡策略。此时 ,各人的盈利函数为代数方程,自变量概率向量在0-1区间又是连续的,因此完全可用 解方程的办法来求极值。” 不知道 哪位先进朋友能够介绍一些关于博奕论的书籍啊!
最好是易学的!
页:
[1]