首頁 > 文章中心 > 博弈最優(yōu)策略

      博弈最優(yōu)策略

      前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇博弈最優(yōu)策略范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

      博弈最優(yōu)策略

      博弈最優(yōu)策略范文第1篇

      [關(guān)鍵詞]公地悲劇;博弈論;內(nèi)生規(guī)則

      [DOI]1013939/jcnkizgsc201529111

      1968年英國哈丁教授(Garrett Hardin)在《The tragedy of the commons》一文中首先提出“公地悲劇”這一概念,它意味著“環(huán)境的退化會(huì)發(fā)生在任何時(shí)候,只要許多人共同使用一種稀缺資源”。本文把博弈論的概念和思想引入到“公地悲劇”這一現(xiàn)象中,致力于找出化解“公地悲劇”的方法。

      1“公地悲劇”的博弈論模型

      假設(shè)在由n個(gè)牧民共同擁有的草原上,每個(gè)牧民都養(yǎng)羊,根據(jù)世代多年放牧的傳統(tǒng),他們都知道這片草原上羊的最優(yōu)的飼養(yǎng)數(shù)量,我們把這一數(shù)量設(shè)為Q1,那么每個(gè)牧民的最優(yōu)飼養(yǎng)量為Q1/n。由于草原是公共的,只要有利可圖,牧民養(yǎng)羊的飼養(yǎng)數(shù)量越多越好。假定每個(gè)牧民能獲得收益的飼養(yǎng)量不低于Q1/n,這樣,每個(gè)牧民羊的飼養(yǎng)數(shù)量有兩個(gè)可能,一是超額飼養(yǎng),二是根據(jù)統(tǒng)一的指標(biāo)限額飼養(yǎng)。

      為了使我們的分析更具有一般的普遍性,把草原上的n個(gè)牧民簡化為兩個(gè)典型性的代表A和B,A和B共同在這片草原上放牧,把羊的飼養(yǎng)量的確定過程看作是A和B相互之間的博弈,那么A和B就有兩個(gè)可選擇的策略,即超額或限額。在A、B選擇不同的策略的情況下,A、B會(huì)出現(xiàn)收益變化:①A超額、B限額,在市場(chǎng)均衡的情況下,A的飼養(yǎng)里比B的飼養(yǎng)量多,收益也多,A的收益為a,B的收益為b,則a>b;②B超額、A限額,A的收益為b,B的收益為a,同理,有a>b;③A、B都限額,總收益為T,達(dá)到社會(huì)最優(yōu),A、B共享收益π,每人π/2,由公地放牧?xí)?dǎo)致非帕累托最優(yōu),有π>a+b,④A、B都超額,那么A、B的收益均為τ/2,有τ

      2博弈模型分析

      首先,假定以上“公地悲劇”博弈模型是在完全信息的情況下進(jìn)行的,即A、B都知道對(duì)方的策略和收益;之后,將A和B的博弈分為同時(shí)博弈和序貫博弈兩種情形。下面將對(duì)以上兩種情形進(jìn)行敘述分析。

      當(dāng)A和B同時(shí)博弈,對(duì)A來說,當(dāng)B采取限制飼養(yǎng)數(shù)量的策略時(shí),A的收益a>π/2,A的最優(yōu)選擇是超額;當(dāng)B采取超額飼養(yǎng)策略時(shí),A的收益b>τ/2;由以上分析可知對(duì)A不存在占優(yōu)策略,A所采取的策略需要根據(jù)B的策略進(jìn)行選擇。對(duì)B來說,當(dāng)A采取限額策略時(shí),B的收益為a>π/2;當(dāng)A采取超額策略時(shí),B的收益b>τ/2,B的最優(yōu)選擇是限額;同樣,B也不存在占優(yōu)策略,B所采取的策略需要根據(jù)A的策略進(jìn)行選擇。

      由以上分析可知,在同時(shí)博弈的情形下,A、B之間有著兩個(gè)納什均衡,即(限額;超額)與(超額;限額)。因?yàn)橥瑫r(shí)博弈存在的階段性,納什均衡不具有唯一解,這說明在實(shí)際情況下A和B會(huì)面臨策略選擇上的困境,在這樣的情形下,為了實(shí)現(xiàn)自身利益的最大化,A和B均有可能以一定的概率選擇超額策略或限額策略。那么,我們假定A選擇限額策略的概率是r1,選擇超額策略的概率是1-r1;B選擇限額策略的概率是r2,選擇超額策略的概率是1-r2,那么,A的最優(yōu)化模型為:

      VA=r1[[SX(]π[]2[SX)]r2+(1-r2)b]+(1-r1)[ar2+(1-r2)[SX(]τ[]2[SX)]]

      求A在概率r1下的收益最大值Max[DD(X]r1[DD)]VA,有:[SX(]π[]2[SX)]r2+b(1-r2)-ar2-[SX(]τ[]2[SX)](1-r2)=0,則,r2=[SX(]b-[SX(]τ[]2[SX)][](a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]>0

      根據(jù)支付矩陣的對(duì)稱性,可推出:r1=r2=[SX(]b-[SX(]τ[]2[SX)][](a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]

      綜上可知:r*1=r*2=[SX(]b-[SX(]τ[]2[SX)][](1+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])[SX)]為混合策略的納什均衡,這一均衡說明了當(dāng)A以概率r*1選擇限額策略時(shí),A進(jìn)行策略選擇時(shí)沒有必要參考B的策略選擇來進(jìn)行,同樣的,B以概率r*2選擇限額策略時(shí)的策略選擇也不需要考慮A的策略選擇。

      根據(jù)以上描述可得到以下結(jié)果:A、B選擇限額策略的聯(lián)合概率分布為:P(A=不超額;B=不超額)=r*1×r*2=[SX(](b-[SX(]τ[]2[SX)])2[][(a+b)-([SX(]π[]2[SX)]+[SX(]τ[]2[SX)])]2[SX)];A、B選擇超額飼養(yǎng)策略的概率分布為:P(A=超額;B=超額)=(1-r*1)(1-r*2);A、B選擇相異策略的概率為:r*1(1-r*2)+r*2(1-r*1)=2η*(1-r*2)=2r*2(1-r*1)。A和B中只要有一人選擇了超額飼養(yǎng)策略,草原的飼養(yǎng)量將偏離帕累托最優(yōu),出現(xiàn)“公地悲劇”現(xiàn)象,出現(xiàn)的概率為:P(A=超額;B=超額)+P(A=超額;B=不超額)+P(A=不超額;B=超額)=(1-r*1)(1-r*2)+2η*(1-r*2);根據(jù)概率的相關(guān)知識(shí),“公地悲劇”出現(xiàn)的概率也可表示為1-P(A=不超額;B=不超額)=1-r*1×r*2∈[0,1]。

      把A和B兩個(gè)牧民決定羊的飼養(yǎng)數(shù)量的決策過程看作是一個(gè)博弈,根據(jù)以上計(jì)算可知,“公地悲劇”這一現(xiàn)象會(huì)以一定的概率出現(xiàn)在博弈的收益中,這樣,從博弈論的視角分析“公地悲劇”就有了可行性。

      其次,A、B連續(xù)博弈。當(dāng)A和B兩個(gè)牧民中有一個(gè)人在某些方面優(yōu)于另一個(gè)人即具備先行者的優(yōu)勢(shì)時(shí),那么先行者就有觀望和利用先行者優(yōu)勢(shì)兩種選擇,這時(shí)A、B之間的博弈不再是同時(shí)博弈而是連續(xù)博弈。這里假設(shè)在完全信息的情況下,A是先行者,A先行動(dòng)、B后行動(dòng),收益矩陣和同時(shí)博弈的時(shí)候相同。

      對(duì)A來說,A知道假如他選擇超額策略,由于b>[SX(]π[]2[SX)],B的最優(yōu)策略為限額策略,那么,A將獲得a的收益,B獲得b;假如A選擇限額策略,那么B一定超額,那么A獲得收益b,B獲得a。當(dāng)A具有先行者優(yōu)勢(shì)時(shí),A能夠先行動(dòng),并獲得a的收益(a>b),所以無論如何A也會(huì)選擇超額策略,這時(shí),博弈的均衡解釋(超額;限額)。這就表示在連續(xù)一次性的博弈過程中,A、B兩個(gè)牧民的羊的總的飼養(yǎng)數(shù)量將超過草原上的帕累托最優(yōu)數(shù)量,出現(xiàn)“公地悲劇”。

      從上文中的分析可知,理論上,在一次博弈的情形下,不管是同時(shí)博弈還是連續(xù)博弈,“公地悲劇”都可能發(fā)生,但在實(shí)際情況下,因?yàn)轲B(yǎng)羊這個(gè)活動(dòng)是不間斷連續(xù)進(jìn)行下去的,那么草原上牧民之間養(yǎng)羊數(shù)量的決策過程就是重復(fù)博弈的過程。一旦存在重復(fù)博弈,牧民之間由于人際關(guān)系、文化等原因會(huì)形成一種相互牽制的情況,最終使草原上羊群的飼養(yǎng)數(shù)量限制在符合集體利益最大化的帕累托最優(yōu)數(shù)量上面。

      3對(duì)策研究

      由以上分析可知,A、B因?yàn)榇嬖赼-[SX(]π[]2[SX)]的超額收益而產(chǎn)生了超額飼養(yǎng)羊的投機(jī)心理。A和B都是理性人,都是自私的,都不愿意因?yàn)樽约合揞~而損失了額外的收益,更不愿意看到因?yàn)殡p方都超額而帶來的共同損失。當(dāng)不存在一個(gè)實(shí)際有效的機(jī)制來約束雙方行為時(shí),為了能減少自身的損失,在博弈的過程中,博弈雙方會(huì)透露這樣的信息:如果在社會(huì)交換的過程中出現(xiàn)了違約者,則拒絕與他合作,而拒絕合作給違約者造成的損失大于他不違約的損失,這樣就形成了一種可信的、有效的威脅。A和B在牧羊博弈的過程當(dāng)中自主地限制羊的數(shù)量,使其形成一個(gè)內(nèi)生的規(guī)則。當(dāng)限額策略合理地解決了“公地悲劇”問題時(shí),在接下來的重復(fù)博弈中,人們會(huì)將這一行為堅(jiān)持下去,就成為了一種制度,一種內(nèi)生的制度,“公地悲劇”便得到了解決,不再出現(xiàn)。

      4結(jié)論

      通過以上分析,當(dāng)牧民們?cè)谶x擇羊的飼養(yǎng)數(shù)量時(shí),相互之間存在一種相互約束、制約機(jī)制,并且這一博弈是重復(fù)進(jìn)行時(shí),那么,飼養(yǎng)羊數(shù)量的限額將成為一個(gè)內(nèi)生的博弈規(guī)則,它不需要借助外界或第三方的力量來保證實(shí)施便能自己起到約束雙方行為的作用,因而“公地悲劇”能夠依靠內(nèi)部的約束機(jī)制自發(fā)解決。

      參考文獻(xiàn):

      博弈最優(yōu)策略范文第2篇

      【關(guān)鍵詞】 無線電 博弈論 納什均衡

      一、博弈論的概述

      1.1概念

      博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的理論[20]。也就是說,博弈論研究當(dāng)一個(gè)主體,譬如說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人(其他企業(yè))的選擇的影響,而且反過來影響到其他人(其他企業(yè))選擇時(shí)的決策問題和均衡問題。所以在這個(gè)意義上說,博弈論又稱為“對(duì)策論”。博弈論是一種使用嚴(yán)謹(jǐn)數(shù)學(xué)模型來解決現(xiàn)實(shí)中利害沖突的理論,由于沖突、合作、競爭等行為是現(xiàn)實(shí)中常見的現(xiàn)象,因此很多領(lǐng)域都能應(yīng)用博弈論,如軍事領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、政治外交等。

      1.2博弈論模型簡介

      博弈論自產(chǎn)生到發(fā)展至今已形成了較成熟的理論體系,它并不是經(jīng)濟(jì)學(xué)的一個(gè)分支,它是一種方法,應(yīng)用范圍不僅包括經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等都涉及到博弈論。不過博弈論也具有自身的基本模型,可以對(duì)一個(gè)博弈過程用5個(gè)方面來描述,G={P,A,O,I,U}

      ① P(player):博弈的參與方。

      ② A(action):博弈方可選擇的全部行為或策略的集合

      ③ O(orders):博弈的次序。

      ④ I(information):博弈的信息。

      ⑤ U(utility):博弈方的收益。

      以上五個(gè)方面是定義一個(gè)博弈時(shí)必須首先設(shè)定的,確定了上述五個(gè)方面就是確定了一個(gè)博弈。博弈論就是系統(tǒng)研究用上述方法定義的各種各樣的博弈問題,尋求各博弈方合理選擇策略的情況下博弈的解,也既是均衡。

      1.3博弈論的分類

      現(xiàn)實(shí)中各種博弈可以按照不同的辦法進(jìn)行分類。根據(jù)參與人的多少,可以將博弈分為兩人博弈和多人博弈;根據(jù)參與人是否合作,可以將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可以將博弈分為零和博弈、常和博弈和變和博弈。

      1.4納什均衡

      1.4.1納什均衡的定義

      納什均衡(Nash Equilibrium)[20]是一種策略組合,它能夠使得每個(gè)參與者的策略都是對(duì)其他參與者策略的最優(yōu)反應(yīng)。“最優(yōu)反應(yīng)”指的是該策略帶給采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能帶來的利益。博弈的目的,就是為了尋求這樣的一個(gè)最佳的策略組合。

      1.5 一些特殊的博弈模型

      1.5.1重復(fù)博弈模型

      重復(fù)博弈是目前人們了解的最為透徹的一類動(dòng)態(tài)博弈,參與人每一期都面對(duì)同樣的“階段博弈”或“選民博弈”,而且參與人的全部收益是每階段所得收益的加權(quán)平均。參與者基于對(duì)博弈過程的認(rèn)知,例如對(duì)過去行為的了解,對(duì)未來的預(yù)期和對(duì)當(dāng)前情況的觀察,在每一個(gè)階段的博弈中選擇自身的策略。這些策略可以是固定的,也可以隨其它參與者行動(dòng)的改變而變化,甚至可以是自適應(yīng)的。

      1.5.2潛在博弈模型

      潛在博弈是一般形式博弈中的一種特殊類型,存在函數(shù)u:SR當(dāng)單方面的背離發(fā)生時(shí),u的變化Δu將被反映到單方面背離博弈者的效用上。

      二、在無線通信系統(tǒng)資源分配問題中應(yīng)用博弈論的可行性分析

      隨著無線通信系統(tǒng)的飛速發(fā)展,許多概念和技術(shù)與現(xiàn)有系統(tǒng)相比都有很大的變化。通信系統(tǒng)將具有智能的資源管理,采用大量動(dòng)態(tài)的、分布式的、自適應(yīng)式的資源管理方式。

      三、基于博弈論的動(dòng)態(tài)頻譜接入方法

      如何利用博弈論方法對(duì)認(rèn)知無線電技術(shù)的研究進(jìn)行分析,其中的關(guān)鍵是如何將博弈論引入到相應(yīng)算法的設(shè)計(jì)和分析中,找到算法的納什均衡點(diǎn)。在開始具體的算法研究之前,需要將所研究的問題抽象成博弈論問題模型。

      3.1 分布式自適應(yīng)頻譜接入方法

      博弈論模型適用于分析認(rèn)知無線電系統(tǒng)各用戶競爭頻譜的分布式行為,各用戶根據(jù)自己獲得的信息單獨(dú)進(jìn)行決策。

      博弈最優(yōu)策略范文第3篇

      [關(guān)鍵詞]合作困境 博弈分析 現(xiàn)實(shí)對(duì)策

      中圖分類號(hào):D125?4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-1369(2007)2-0046-05

      石油是現(xiàn)代經(jīng)濟(jì)的血液,對(duì)于經(jīng)濟(jì)快速發(fā)展的中國和資源匱乏的日本具有重大的戰(zhàn)略意義。從“安大線”、“安納線”較量到東海海洋權(quán)益爭端,再到現(xiàn)在日趨浮現(xiàn)的在非洲石油輸出國的競爭,石油因素在兩國關(guān)系及其政治話語中已具有重要地位。鑒于中日兩國政治關(guān)系的脆弱性,以及國際能源環(huán)境變化的不確定性和全球化、區(qū)域化下的雙邊、多邊能源合作的快速發(fā)展,加強(qiáng)中日海外石油合作,對(duì)于發(fā)展面向21世紀(jì)的穩(wěn)定的中日關(guān)系具有重大的現(xiàn)實(shí)意義。

      本文采用博弈論的分析方法,通過對(duì)中日之間在海外石油市場(chǎng)上競爭態(tài)勢(shì)的分析,探討中日在海外石油上采取合作策略的制約困境與現(xiàn)實(shí)對(duì)策。

      制約困境的博弈分析

      1.博弈理論的一般說明博弈是假定為理者的個(gè)人、團(tuán)體或組織,面對(duì)一定的環(huán)境,在一定的約束條件下,依靠所掌握的信息,同時(shí)或先后,一次或多次,從各自可能的行為或策略中進(jìn)行選擇并實(shí)施,各自從中取得相應(yīng)結(jié)果或收益的過程。由于它強(qiáng)調(diào)理者之間相互影響的制衡關(guān)系,因此在全球化不斷發(fā)展,國家間聯(lián)系不斷增多的情況下,博弈及其研究理論日益被用來描述、研究國家間日趨復(fù)雜的相互依存關(guān)系。鑒于國際社會(huì)天然的無政府狀態(tài)與國家不懈的自助努力,因此在博弈理論中,非合作博弈又成為現(xiàn)代博弈論研究的重點(diǎn)。

      按照博弈理論的一般分類,根據(jù)行為者所占有的信息集的完全程度和行為的行動(dòng)順序,非合作博弈可分為:

      其中,完全信息靜態(tài)博弈是其他博弈分析的起點(diǎn),有著較為嚴(yán)格的條件假設(shè)--它要求追求利益最大化的理者掌握完全的信息集(即對(duì)博弈策略與利益有清楚的了解),并且在決策時(shí)不存在相互間的信息交換,而且一旦決策后就只能等待結(jié)果。因此,對(duì)于行為者來說,盡管此類博弈中占有完全的信息集,但是由于決策時(shí)信息交流的阻斷,導(dǎo)致行為者無法確定對(duì)方是否會(huì)采取“背德”行為使自己利益受損,以致為了實(shí)現(xiàn)自身利益的最大化而不得不采取自己的“最優(yōu)策略”,所以由此看來,在完全信息靜態(tài)博弈中,主導(dǎo)行為者最優(yōu)決策思維的并非是帕累托最優(yōu),而是風(fēng)險(xiǎn)上策均衡。其結(jié)果便是,行為者從自身利益最大化出發(fā),不約而同地采取了“坦白”策略,卻最終得到了“集體利益”最小化的“囚徒困境”。而在目前中日兩國的海外石油競爭中,此種情況卻大量存在。

      比如在中日在俄輸油管線的較量中,本來中俄議定的“安大線”全長只有2400公里,造價(jià)只有20~25美元(其中俄方17億,可從中方獲得50%的貸款),且所經(jīng)地區(qū)自然環(huán)境優(yōu)越,便與施工養(yǎng)護(hù)。假如日本在此問題上合作,共擔(dān)建設(shè)費(fèi)用和管理成本,共享由此獲得的石油收益,那么兩國各自在投資上必然小于20~25美元。但是,由于日本擔(dān)心中國在俄的輸油管建設(shè)威脅其“太平洋石油管線”“戰(zhàn)略計(jì)劃”,所以在“安大線”即將開工之際,日本便提出了從西伯利亞地區(qū)安加爾斯克至海參崴地區(qū)納霍德卡的“安納線”計(jì)劃。該線不僅全長3 765公里,造價(jià)50億美元(全部由日本承擔(dān),而且日本還需再追加10億美元助俄管道建設(shè)),而且所經(jīng)地區(qū)有1100公里的地震區(qū),施工養(yǎng)護(hù)條件惡劣。此后,中日兩國展開了激烈的競爭,其結(jié)果便是俄羅斯改建“泰納線”(從泰舍特至納霍德卡),日本不僅要為此方案提供50億美元貸款,中國亦愿意向該工程陸續(xù)投放120億美元的貸款,而且還讓俄羅斯給中日兩國附加上了“安全保障”。所以與先前的“安大線”相比,可見其代價(jià)之巨大。

      但是,值得注意的是,完全信息靜態(tài)博弈的理論假設(shè)之一是行為者在決策時(shí)不發(fā)生任何的信息交換。可從現(xiàn)實(shí)來看,中日之間在多邊與雙邊層次上存在著不同程度、不同形式的對(duì)話交流,比如在多邊層次上,中日兩國可通過聯(lián)合國、亞太經(jīng)合組織、東盟論壇、東亞峰會(huì)等場(chǎng)合進(jìn)行對(duì)話交流;在雙邊層次上,中日之間可借助中日戰(zhàn)略對(duì)話和東海問題磋商等會(huì)議進(jìn)行信息交換和對(duì)話磋商,所以可以認(rèn)為,當(dāng)中日兩國的決策者在進(jìn)行策略選擇時(shí),可以從多種渠道了解對(duì)方的策略意圖--從目前來看,實(shí)現(xiàn)石油供應(yīng)源的多樣化,穩(wěn)定石油來源等已成為中日兩國各自對(duì)對(duì)方能源戰(zhàn)略的基本認(rèn)知,而世界石油的儲(chǔ)量、價(jià)格、交易、運(yùn)輸?shù)刃畔⒏莾蓢寄苷莆盏墓残畔ⅰK赃@不得不令人發(fā)問:中日兩國為何在具備信息交流的情況下,還不能突破困擾兩國的“囚徒困境”?

      要回答這問題,完全信息靜態(tài)博弈由于其嚴(yán)格的條件限定,已不能擔(dān)此重任,而需借助于條件限定較為放寬的完全信息動(dòng)態(tài)博弈。在完全信息動(dòng)態(tài)博弈中,行為者追求利益最大化的本性與掌握完全信息集的要求并未改變,但是允許行為者在做出策略選擇時(shí)有先后順序,后行動(dòng)者可以根據(jù)先行動(dòng)者的行為信息做出自己的策略選擇,從而實(shí)現(xiàn)一定程度的信息交流,因此比較適合用于分析中日兩國在海外石油博弈中所遇到的“囚徒困境”。

      實(shí)際上,假如采用“大歷史觀”的審視問題視角,從技術(shù)角度看待事物之間的相互聯(lián)系與歷史脈絡(luò),將中日兩國在海外石油上的博弈放人中日兩國“雙重崛起”(即中國的和平發(fā)展與日本謀求政治大國的訴求)的背景下,將中日“雙重崛起”下的國家戰(zhàn)略性博弈與其他次國家層面或超國家層面的各類博弈總計(jì)為G,將中日在海外石油市場(chǎng)上的博弈記為g,那么在g與G之間便因石油本身在現(xiàn)代社會(huì)政治話語中所具有的戰(zhàn)略性意義,不僅自然聯(lián)系起來,形成一個(gè)簡化的次數(shù)為2的“有限次重復(fù)博弈”,而且使石油在g中得益在G中的作用直接體現(xiàn)出來,使構(gòu)建得益函數(shù)UG=UG(ug)成為可能。

      在有限次重復(fù)博弈中,在每次重復(fù)博弈之前,以前博弈的結(jié)果各行為者都能觀察到,成為下次博弈中行為者行動(dòng)的參考依據(jù),所以在有限次重復(fù)博弈中,行為者不能只考慮某個(gè)階段的得益,而需顧及前次博弈的得益對(duì)后次博弈的影響以及最后的總得益。因此對(duì)于中日兩國間由g與G構(gòu)成的有限次重復(fù)博弈,中日雙方不僅要考慮g的得益,還要考慮g的得益對(duì)G的影響以及最后的總得益。由于是有限次數(shù)重復(fù),所以可以借助“逆向歸納法”對(duì)此作具體的博弈分析。

      2.具體的博弈分析

      首先,進(jìn)行條件假設(shè)。由于石油作為一次性能源的不可再生性,其探明儲(chǔ)量與產(chǎn)量在特定時(shí)期,技術(shù)發(fā)展既定的情況下是有限的,所以石油資

      源人類活動(dòng)約束已呈現(xiàn)出“存量約束”的形式。所以可假定在只有中日兩國的封閉系統(tǒng)中,海外石油資源存量為X,中國對(duì)外石油的依賴度為d,那么中國就需要從外進(jìn)口石油量為dX,假如中國能實(shí)現(xiàn)這一進(jìn)口量,那么日本獲取海外石油量為(1-d)X。由此根據(jù)基數(shù)效用理論假定出中國在g中的得益為ugl=AdX-BP,日本在g中的得益為ug2=C(1-d)X-DP(其中A、B,C、D分別為中日在g中的得益系數(shù),在一定的技術(shù)條件下A、B,C、D恒定,但是,從現(xiàn)實(shí)來看,在一定技術(shù)條件下,日本的技術(shù)水平在常態(tài)分布上高于中國,所以A

      其次,用逆向歸納法對(duì)上述假設(shè)進(jìn)行具體分析。由于中日之間政治互信度比較低,在中日之間雙重崛起的背景下,一方面中國政府由于日本對(duì)歷史問題的虛無主義態(tài)度,對(duì)華關(guān)系的定位(目前日本將中日關(guān)系定性為“協(xié)調(diào)與共存”、“競爭與摩擦”混在的關(guān)系)以及近來日本對(duì)周邊的一些舉動(dòng)等,擔(dān)心日本走向政治大國后的政策走向;另一方面,日本政府面對(duì)中國快速的和平發(fā)展和自己過去所經(jīng)歷的“喪失的十年”,心理上難以調(diào)適并擔(dān)心發(fā)展起來的中國危及自身的戰(zhàn)略利益,特別是日本作為目前國際體系的既得利益者,其固有的保守心態(tài)是它尤其擔(dān)心作為后發(fā)國家的中國縮小與它的差距,從而改變現(xiàn)有利益布局,所以在中日兩國的博弈中,日本政府的最優(yōu)策略便是使U1'

      求解導(dǎo)數(shù)R∞=U1’,可得U1’=Ad{1+[E(b1)/(1+r1)]}①,同理可得U2'=C(-d){l+[E(b2)/(1+r2)]}②(這里“一”表示中日兩國間的負(fù)相關(guān)關(guān)系,比較時(shí)取其絕對(duì)值),比較①與②,可以發(fā)現(xiàn),由于從2003-2006年間,中國經(jīng)濟(jì)的r1一直保持高位運(yùn)行,分別是10.O%、10.1%、10.4%、10.7%,日本經(jīng)濟(jì)的r2則為1.4%、2.6%、0.8%、2.8%,所以1,(1+r1)必然小于1/(1+b)。而在E(h)函數(shù)上,由于日本在2001年的能耗強(qiáng)度為0.91,而同期中國的能耗強(qiáng)度卻為8.45,換句話講,就是同等能耗,日本將有更多的產(chǎn)出,因而也就對(duì)生更大的影響,即E(h1)

      究其原因,癥結(jié)就在于未能將納什均衡貫徹于動(dòng)態(tài)博弈的各個(gè)階段,實(shí)現(xiàn)子博弈精煉納什均衡。按照子博弈精煉納什均衡的條件要求,行為者的最優(yōu)策略必須貫徹于博弈的各個(gè)階段,以便在博弈的各個(gè)階段實(shí)現(xiàn)納什均衡。而在上述分析中,δ與E等系數(shù)借助影響單位X增益而作用于G博弈在日本政府的最優(yōu)策略中得到了體現(xiàn),盡管借此可實(shí)現(xiàn)策略選擇在G博弈中的納什均衡,但是卻忽視了最優(yōu)策略在g博弈中的貫徹,因而也就未能在g博弈中實(shí)現(xiàn)納什均衡。所以對(duì)于日本政府來說,將最優(yōu)策略進(jìn)一步貫徹于g博弈中以便在g博弈也實(shí)現(xiàn)納什均衡,就成為其必然的策略選擇。從上述表達(dá)式來看,U1

      實(shí)際上,日本政府選擇阻擾或干擾中國海外油源拓展的對(duì)抗策略,就是這一策略考量的直接體現(xiàn)。因?yàn)樵谫N現(xiàn)系數(shù)存在的情況下,盡管阻擾或干擾中國海外油源的拓展的舉動(dòng)并不能必然帶給日本單位x的增益,但是由于r1>r2,帶來δ1

      自己在既得利益分布中的地位。而對(duì)中國來說,情況亦是如此,只能采取“針鋒相對(duì)”的策略,不斷拓展自己穩(wěn)定的海外油源(這在客觀上起到了阻擾或干擾日本海外油源拓展的作用),才能保證自己的損失總小于日方。由此可以看出,雙方的對(duì)抗策略借助對(duì)d的影響將納什均衡貫徹到了博弈中,從而實(shí)現(xiàn)了在整個(gè)次數(shù)為2的有限性重復(fù)博弈中的子博弈精煉納什均衡。由此也就可以理解為何在海外石油市場(chǎng)上,中日之間不斷出現(xiàn)拓展、干擾、再拓展、再干擾……局面的原因。

      最后,經(jīng)過上述分析,基本可以得出如下結(jié)論:

      (1)雙方缺乏政治互信,才使得雙方不斷追求相對(duì)得益,奉行自我利益占優(yōu)的納什均衡策略。

      (2)減弱d的影響,緩解相互制約的負(fù)相關(guān)關(guān)系,既是雙方貫徹最優(yōu)策略,在博弈的兩個(gè)階段實(shí)現(xiàn)納什均衡的著力點(diǎn),也是雙方實(shí)現(xiàn)子博弈精煉納什均衡后的客觀結(jié)果。

      (3)油價(jià)因素在上述條件下的博弈中并不發(fā)揮主要作用。換言之,高油價(jià)并不必然導(dǎo)致合作產(chǎn)生,有時(shí)高油價(jià)還會(huì)導(dǎo)致對(duì)穩(wěn)定油源的進(jìn)一步爭奪。

      現(xiàn)實(shí)對(duì)策:訂立基于互信的政治契約

      1.訂立基于互信的政治契約的必要性

      基于上述分析,可以看出,中日兩國缺乏政治互信是導(dǎo)致兩國不斷追求相對(duì)利益,奉行自我利益占優(yōu)的納什均衡策略的主要原因。按照新現(xiàn)實(shí)主義的看法,感到不安全的國家總關(guān)心收益如何分配,它們并不注重參與者兩方是否都收益,而只關(guān)心誰多得益。如果收益分配不均,得益的國家總想要削弱對(duì)方以改變自己在利益分配中處于不利地位,即使利益分配的雙方有獲得絕對(duì)收益這種愿望,但都害怕對(duì)方的實(shí)力增強(qiáng)對(duì)自己有威脅,所以合作起來就不成功。

      因此,要實(shí)現(xiàn)中日在海外石油上的合作,就必須首先在雙方之間訂立基于互信的政治契約,消除因?qū)?duì)方不信任而產(chǎn)生的不安全感以及由此引發(fā)的對(duì)相對(duì)收益的追求。而一旦這種政治契約得以訂立,那么按照新制度經(jīng)濟(jì)學(xué)的判斷,將促進(jìn)雙方實(shí)現(xiàn)“記憶編碼”,使其參與的博弈轉(zhuǎn)變成“制度支持的完美記憶”(institution-assisted perfectrecall)博弈,從而大大提高信息交換的效率,穩(wěn)定雙方在博弈中的行動(dòng)策略與心理預(yù)期,進(jìn)而緩解雙方因?qū)Ψ秸呖赡艹霈F(xiàn)的突變性而產(chǎn)生的不安全感,降低談判中的“討價(jià)還價(jià)”成本,推動(dòng)合作進(jìn)程的快速發(fā)展。

      在這一點(diǎn)上,法德和解給與了歷史的佐證。在1963年,法德兩國簽署了《法德友好條約》。其意義不僅在于標(biāo)志著法德雙方和解的開始,更在于它還是法德之間基于互信訂立的一種政治契約,使得雙方從此可以秉信釋疑,開誠布公地探討地區(qū)合作事宜,攜手推動(dòng)歐洲一體化的發(fā)展。

      2.訂立基于互信的政治契約的著力點(diǎn)

      任何政治契約的訂立,都是緣于對(duì)利益的關(guān)注,也都以利益為訂立契約的著力點(diǎn),所以中日之間訂立基于互信的政治契約,也必須以兩國利益為著力點(diǎn)。

      根據(jù)上述困境分析,減弱d的影響,緩解相互制約的負(fù)相關(guān)關(guān)系是雙方在整個(gè)有限性博弈中貫徹最優(yōu)策略,實(shí)現(xiàn)各自利益占優(yōu)的著力點(diǎn):日本政府借此緩解中日之間相互制約的負(fù)相關(guān)關(guān)系的策略是對(duì)抗,即阻撓或干擾中國海外油源的拓展,導(dǎo)致中國也不得不采取針鋒相對(duì)的策略,最終形成了雙方追求各自利益占優(yōu)的子博弈精煉納什均衡。

      實(shí)際上,在當(dāng)今世界,保證穩(wěn)定的油源,緩解相互制約的負(fù)相關(guān)關(guān)系一直有兩條思路:一是直接拓展油源,保證有穩(wěn)定的石油供給,上述中日博弈也就是在這方面展開;二是尋找替代能源,發(fā)展節(jié)能技術(shù)。如果說前者在中日博弈中證明其占優(yōu)策略為對(duì)抗的話,那么第二種則要在合作中實(shí)現(xiàn)自我利益最優(yōu)。所以只要中日雙方轉(zhuǎn)換思維,加強(qiáng)雙方在替代能源、節(jié)能技術(shù)上的合作,那么就可以規(guī)避在前者中面臨的納什均衡,在合作中實(shí)現(xiàn)各自利益的最優(yōu)。因此,中日雙方訂立基于互信的政治契約,其著力點(diǎn)就可以放在尋找替代能源,發(fā)展節(jié)能技術(shù)上。首先在“節(jié)流”上培養(yǎng)雙方的信任度,隨后在一定程度時(shí)將此信任度“外溢”至“開源”領(lǐng)域,從而實(shí)現(xiàn)雙方“記憶的編碼”,緩解雙方在此領(lǐng)域的擔(dān)心與焦慮,進(jìn)而達(dá)到訂立互信政治契約的目的,最后消除雙方的不安全感,使雙方摒棄對(duì)相對(duì)收益的追求,在“開源”領(lǐng)域?qū)崿F(xiàn)合作的最優(yōu)收益。

      而且從現(xiàn)實(shí)來看,此種著力點(diǎn)也有其存在的客觀現(xiàn)實(shí)性:

      第一,中國有尋找替代能源,發(fā)展節(jié)能技術(shù)的積極愿望。“節(jié)能優(yōu)先”已成為中國可持續(xù)能源戰(zhàn)略的重要組成部分。

      第二,日本有著較為發(fā)達(dá)的開發(fā)替代能源、發(fā)展節(jié)能技術(shù)的科技水平。比如2005年9月,日本與印度簽署的兩國在能源領(lǐng)域進(jìn)行綜合性合作的共同聲明,已堪稱能源合作的典范。

      博弈最優(yōu)策略范文第4篇

      【關(guān)鍵詞】傾銷 反傾銷 博弈分析

      一、前言

      隨著經(jīng)濟(jì)全球化和貿(mào)易自由化的不斷發(fā)展,進(jìn)口關(guān)稅、配額和出口補(bǔ)貼等貿(mào)易保護(hù)手段作為保護(hù)本國經(jīng)濟(jì)的一種手段,其作用越來越弱。反傾銷作為一種被世界貿(mào)易組織所允許的合法而有效的手段,被越來越多的國家所采用。改革開放以來,中國對(duì)外貿(mào)易迅速發(fā)展,但隨之而來的是國外反傾銷調(diào)查的迅速增加。根據(jù)WTO統(tǒng)計(jì),截止至2012年12月,我國所遭受反傾銷調(diào)查數(shù)量為885件,是全球遭受反傾銷調(diào)查最多的國家。世界各國對(duì)我國頻繁實(shí)施的反傾銷訴訟已經(jīng)嚴(yán)重阻礙了我國對(duì)外貿(mào)易的健康發(fā)展。

      傾銷是指以低于成本的價(jià)格將一國商品銷售到另外一國市場(chǎng)的行為。WTO反傾銷協(xié)議規(guī)定,如果一項(xiàng)產(chǎn)品從一國出口到另一國的出口價(jià)格低于在出口國國內(nèi)消費(fèi)的正常貿(mào)易過程中的同類產(chǎn)品的可比價(jià)格,則該產(chǎn)品被認(rèn)為是傾銷產(chǎn)品。反傾銷指進(jìn)口國當(dāng)局依法向?qū)M(jìn)口國產(chǎn)業(yè)造成損害的傾銷行為采取征收反傾銷稅等措施,以抵消損害后果的法律行為,這是一種被世界各國普遍認(rèn)可的限制進(jìn)口手段。

      目前,國外對(duì)傾銷與反傾銷的博弈研究既有理論研究,又有實(shí)證分析。理論研究主要集中在完全信息條件下雙寡頭靜態(tài)博弈,如Brander、Krugman、Spencer等。Prusa、Tharakan等則對(duì)反傾銷進(jìn)行了實(shí)證分析,并從博弈角度論述了反傾銷法作為指導(dǎo)局中雙方博弈的規(guī)則尚有不完善的地方需要修訂。國內(nèi)運(yùn)用博弈論分析傾銷與反傾銷問題的尚不多見,張維迎和馬捷從產(chǎn)權(quán)角度研究了產(chǎn)權(quán)對(duì)傾銷問題的影響,楊仕輝就外國對(duì)華反傾銷的逆向選擇作了實(shí)證分析,楊仕輝和張娟通過構(gòu)建不完全信息條件下的傾銷與反傾銷動(dòng)態(tài)博弈模型對(duì)反傾銷效應(yīng)進(jìn)行了理論推導(dǎo)。本文在參考國內(nèi)外文獻(xiàn)的基礎(chǔ)上,運(yùn)用博弈論為分析工具,建立了傾銷與反傾銷的博弈模型,對(duì)傾銷與反傾銷中出現(xiàn)的問題進(jìn)行分析。

      二、傾銷與反傾銷的博弈論分析

      (一)傾銷與反傾銷的完全信息博弈分析

      假定國外企業(yè)不進(jìn)行傾銷而國內(nèi)企業(yè)不進(jìn)行反傾銷訴訟,其效用分別為u1 和u2;國外企業(yè)進(jìn)行傾銷,傾銷成本為c1,同時(shí)國內(nèi)企業(yè)不進(jìn)行反傾銷時(shí)國外企業(yè)進(jìn)行傾銷的利潤為m;國內(nèi)企業(yè)進(jìn)行反傾銷,反傾銷成本為c2。通常m>c1,m>c2。博弈矩陣如圖1。

      當(dāng)國外企業(yè)傾銷時(shí),如果國內(nèi)企業(yè)進(jìn)行反傾銷,國內(nèi)企業(yè)的效用為u2-c2;如果國內(nèi)企業(yè)不進(jìn)行反傾銷,國內(nèi)企業(yè)的效用為u2-m,由于u2-c2>u2-m,國內(nèi)企業(yè)的最優(yōu)策略是進(jìn)行反傾銷。當(dāng)國外企業(yè)不傾銷時(shí),如果國內(nèi)企業(yè)進(jìn)行反傾銷,國內(nèi)企業(yè)的效用為u2-c2;如果國內(nèi)企業(yè)不進(jìn)行反傾銷,國內(nèi)企業(yè)的效用為u2,由于u2-c2

      如果一個(gè)人采取混合戰(zhàn)略,其對(duì)手不能準(zhǔn)確地猜出他實(shí)際上會(huì)選擇的戰(zhàn)略。假定國外企業(yè)進(jìn)行傾銷的概率為p,不傾銷的概率為1-p;國內(nèi)企業(yè)進(jìn)行反傾銷的概率為q,不進(jìn)行反傾銷的概率為1-q。

      (二)傾銷與反傾銷的不完全信息博弈分析

      假設(shè)進(jìn)行傾銷與反傾銷博弈的參與人仍是國外企業(yè)和國內(nèi)企業(yè),他們追求利潤最大化。但信息是不完全的,潛在國外企業(yè)決定是否對(duì)某國進(jìn)行傾銷,國內(nèi)企業(yè)并不知道國外企業(yè)的成本函數(shù)。假定國外企業(yè)有兩個(gè)可能的類型:低成本或高成本;國外企業(yè)是低成本時(shí),實(shí)施低價(jià)策略不會(huì)導(dǎo)致國內(nèi)企業(yè)反傾銷的成功,而高成本時(shí)國外企業(yè)的低價(jià)策略會(huì)導(dǎo)致國內(nèi)企業(yè)反傾銷的成功。兩種成本情況下的支付矩陣如圖2所示。

      國內(nèi)企業(yè)在博弈開始時(shí)只知道國外企業(yè)是高成本的概率為p,低成本的概率為1-p。無論國外企業(yè)是低成本還是高成本,出口到某國的選擇都有低價(jià)格和高價(jià)格。博弈的第一階段,當(dāng)國外企業(yè)選擇低價(jià)策略,國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷;當(dāng)國外企業(yè)選擇高價(jià)格,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷。博弈的第二階段,國內(nèi)企業(yè)是否對(duì)國外企業(yè)的價(jià)格策略實(shí)施反傾銷,依賴于國內(nèi)企業(yè)對(duì)國外企業(yè)成本的判斷,如果國外企業(yè)是低成本的時(shí)候,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷,當(dāng)國外是高成本,選擇低價(jià)格的時(shí)候,國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷;反之,則不反傾銷。國內(nèi)企業(yè)是否進(jìn)行反傾銷,依賴于他對(duì)國外企業(yè)成本的判斷。高成本國外企業(yè)如果選擇價(jià)格a21時(shí),會(huì)招致國內(nèi)企業(yè)的反傾銷,因此,高成本企業(yè)可能會(huì)選擇價(jià)格a11或a12,以避免招致國內(nèi)企業(yè)的反傾銷。在觀測(cè)到國外企業(yè)的第一階段的價(jià)格選擇后,國內(nèi)企業(yè)會(huì)修正對(duì)國外企業(yè)的成本函數(shù)的先驗(yàn)概率p。如果國內(nèi)企業(yè)觀測(cè)到國外企業(yè)選擇低價(jià)格a21,就可以推斷國外企業(yè)一定是高成本,采取反傾銷就是最優(yōu)選擇。國內(nèi)企業(yè)看到國外企業(yè)選擇低價(jià)策略,可以估計(jì)國外企業(yè)在低價(jià)條件下低成本和高成本的概率, 即P(c1∣p1)和P(c2∣p1)。

      假設(shè)p=0.5,低成本條件下選擇低價(jià)格策略的概率大于高成本條件下選擇低價(jià)格的概率,即a1>a2,可以得出P(c1∣p1)>P(c2∣p1)。如果國內(nèi)企業(yè)作出這樣的估計(jì),就不會(huì)對(duì)國外企業(yè)進(jìn)行反傾銷了,反之,則選擇進(jìn)行反傾銷。如圖3,博弈方國外企業(yè)選擇了低價(jià)策略,這個(gè)低價(jià)策略可能來自兩種不同的成本類型。博弈方國內(nèi)企業(yè)在決策點(diǎn)有兩種選擇,即反傾銷和不反傾銷。如果國外企業(yè)是低成本類型,即沒有傾銷行為,國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷,因?yàn)閎11b32。如果國內(nèi)企業(yè)估計(jì)A 是高成本類型的,他會(huì)選擇進(jìn)行不反傾銷,但是國內(nèi)企業(yè)估計(jì)錯(cuò)誤,那他會(huì)選擇不進(jìn)行反傾銷,而事實(shí)上卻遭受了傾銷,這樣給貿(mào)易雙方都帶來了一定的損失。

      三、結(jié)論

      近些年,我國在外貿(mào)出口取得巨大成就的同時(shí),面臨嚴(yán)重的反傾銷危機(jī),中國企業(yè)在面對(duì)反傾銷調(diào)查時(shí),大都采取消極避戰(zhàn)的態(tài)度,助長了國外對(duì)華反傾銷的氣焰。從博弈的角度來看,主要是因?yàn)槲覈髽I(yè)還沒有積極參與國際市場(chǎng)的博弈過程,不能通過主動(dòng)介入改變被動(dòng)局面。要改變這種局面,必須積極參與博弈,并利用可置信威脅改變對(duì)方的博弈路徑,以獲取利潤最大化。同時(shí),在企業(yè)選擇價(jià)格策略時(shí),要從長遠(yuǎn)利益出發(fā),注意進(jìn)口國對(duì)自己價(jià)格策略的反應(yīng),盡量不給進(jìn)口國一個(gè)低價(jià)傾銷的印象,以免使自己陷入反傾銷的訴訟中。

      參考文獻(xiàn)

      [1]張維迎,馬捷.惡性競爭的產(chǎn)權(quán)基礎(chǔ)[J].經(jīng)濟(jì)研究,1999(06).

      [2]楊仕輝.反傾銷博弈與逆向選擇[J].世界經(jīng)濟(jì),2000(01).

      [3]楊仕輝,張娟.不完全信息條件下傾銷與反傾銷動(dòng)態(tài)博弈[J].中國管理科學(xué),2000(03).

      博弈最優(yōu)策略范文第5篇

      【關(guān)鍵詞】博弈論;非合作博弈;納什均衡;應(yīng)用

      文章編號(hào):ISSN1006―656X(2013)12-0043-01

      一、博弈論的概述

      博弈論(game theory),又稱對(duì)策論,是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題,也就是一些個(gè)人或組織,面對(duì)特定的環(huán)境條件,在一定的規(guī)則約束下,同時(shí)或先后,一次或多次,從各自的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過程。

      一個(gè)完整的博弈一般包含幾個(gè)要素:參與者,行動(dòng),策略,結(jié)果,均衡等。參與者、行動(dòng)和結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的是使用博弈規(guī)則來決定均衡。但是,博弈的行動(dòng)不等同于博弈的策略,博弈的結(jié)果不等同于博弈的均衡。根據(jù)參與人的數(shù)量,可分為二人博弈和多人博弈;根據(jù)參與人是否合作,可分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,可分為零和博弈、常和博弈和變和博弈。

      博弈論對(duì)我們的經(jīng)濟(jì)生活有重要意義,人們之間決策行為相互影響的例子有很多:從國家角度出發(fā),在國際貿(mào)易中合理運(yùn)用博弈論可使本國和其他國家都受益,取得雙贏效果;從個(gè)人角度出發(fā),在生活中合理運(yùn)用博弈論可使自己選擇最優(yōu)策略,減少不必要的成本開支。

      二、非合作博弈――納什均衡

      非合作博弈是指不允許存在有約束力協(xié)議的博弈。完全信息靜態(tài)博弈屬于非合作博弈,該博弈中,每個(gè)博弈方的策略都是針對(duì)其他博弈方策略或策略組合的最佳對(duì)策,具有這種性質(zhì)的策略組合,正是非合作博弈理論中最重要的一個(gè)概念“納什均衡”。

      用表示一個(gè)博弈,如果有個(gè)博弈方,每個(gè)博弈方的全部可選策略的集合稱為“策略空間”,用表示;表示博弈方的第個(gè)策略,其中可取有限個(gè)值(有限策略博弈),也可取無限個(gè)值(無限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函數(shù)。個(gè)博弈方的博弈常寫成。在博弈中,如果由各個(gè)博弈方的每一個(gè)策略組成的某個(gè)策略組合中,任一博弈方的策略,都是對(duì)其余博弈方策略組合的最佳對(duì)策,即

      ,對(duì)任意都成立,則稱為的一個(gè)“納什均衡”。

      納什均衡的求解,常采用得益矩陣法。在囚徒困境中,每個(gè)參與者都能猜出對(duì)方策略,稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征,體現(xiàn)了個(gè)人理性與集體理性的矛盾。兩寡頭企業(yè)選擇產(chǎn)量的博弈就是囚徒困境問題在經(jīng)濟(jì)學(xué)上的應(yīng)用。若兩企業(yè)聯(lián)合形成卡特爾,選擇壟斷利潤最大化的產(chǎn)量,每個(gè)企業(yè)都能得到更多利潤。但卡特爾協(xié)定不是納什均衡,給定對(duì)方遵守協(xié)議,每個(gè)企業(yè)都有增加產(chǎn)量的沖動(dòng),最后每個(gè)企業(yè)只能得到納什均衡產(chǎn)量的利潤,它嚴(yán)格小于卡特爾產(chǎn)量下的利潤。

      在某類博弈中,每個(gè)理性人都不能猜出對(duì)方的策略,參與人是以一定的概率選擇某種策略的,這樣的策略稱為混合策略,相應(yīng)的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關(guān)的例子有日常生活中的打撲克、劃拳等。

      三、治理河流污水排放的制度設(shè)計(jì)

      環(huán)境保護(hù),人人有責(zé),限制企業(yè)的污水排放符合社會(huì)各界的呼聲。檢查和制止排污是政府的職責(zé),對(duì)于以利潤最大化為目標(biāo)的企業(yè),其一直采取各種措施盡可能降低生產(chǎn)成本。政府和企業(yè)間的關(guān)系可用經(jīng)濟(jì)學(xué)中的監(jiān)督博弈來解釋。

      該博弈的參與者是政府和企業(yè),政府的策略選擇是檢查或不檢查,企業(yè)的策略選擇是排污或不排污。假設(shè)是企業(yè)治理污水(不排污)增加的生產(chǎn)成本,若排污,為自己多得的收益。是政府檢查所需成本。是政府對(duì)企業(yè)排污的罰款金額。是企業(yè)排污對(duì)社會(huì)利益的損害。假設(shè)且,即政府對(duì)排污企業(yè)采取重罰措施。對(duì)應(yīng)不同策略組合的得益矩陣可見下表。

      政府和企業(yè)的得益矩陣

      在以上假設(shè)條件下,政府和企業(yè)都猜不出對(duì)方會(huì)采取何種策略,因而不存在純策略納什均衡,只能求解混合策略納什均衡。如果假定條件不成立,通過劣策略剔除可得到占優(yōu)策略,即(檢查,不排污)或(不檢查,排污)為占優(yōu)均衡。

      在得益矩陣中,用表示政府檢查的概率,表示企業(yè)排污的概率。給定,政府檢查和不檢查的期望收益分別為:

      由,得。即如果企業(yè)排污概率小于,政府的最優(yōu)選擇是不檢查;如果大于,政府的最優(yōu)選擇是檢查;如果等于,政府隨機(jī)地選擇檢查或不檢查。

      政府的最終目標(biāo)是降低企業(yè)排污概率并保護(hù)環(huán)境。據(jù)的結(jié)果,有兩種措施:一是增大分母,即采取重罰措施,使企業(yè)平日不敢排污;二是減小分子,即降低檢查成本。現(xiàn)階段可行做法是設(shè)立舉報(bào)電話,避免政府盲目檢查,提高辦事效率。

      再者,給定,企業(yè)選擇排污和不排污的期望收益分別為:

      由得,即如果政府的檢查概率小于,企業(yè)的最優(yōu)選擇是排污。現(xiàn)實(shí)中,政府對(duì)排污的懲罰越重,企業(yè)因排污獲得的收益越低,企業(yè)的排污概率就越小。反之,企業(yè)的排污概率就越大。

      企業(yè)因排污獲得收益的大小,政府難以準(zhǔn)確把握。前面談到的企業(yè)都是以利潤最大化為目標(biāo)的企業(yè),適于民營企業(yè)。現(xiàn)實(shí)中大多排污者是國有企業(yè),這就涉及企業(yè)經(jīng)營的控制權(quán)收益問題。企業(yè)因排污獲得的生產(chǎn)成本降低部分可以很容易轉(zhuǎn)化為企業(yè)經(jīng)營者的控制權(quán)收益,這些收益包括獎(jiǎng)金、福利或者因企業(yè)效益上升而帶來的升遷機(jī)會(huì)。反過來,如果企業(yè)因?yàn)榕盼鄱芰P,經(jīng)營者并沒有控制權(quán)損失,因?yàn)榱P款由企業(yè)出,經(jīng)營者只是沒有控制權(quán)收益而已。

      四、小結(jié)

      本文以納什均衡為理論基礎(chǔ),分析了純策略納什均衡和混合策略納什均衡在經(jīng)濟(jì)生活中的應(yīng)用。但本文探討的只是博弈論中一個(gè)很小的方面,對(duì)均衡問題中的子博弈精煉納什均衡等沒有涉及到,但它們的應(yīng)用也很廣泛。在日常經(jīng)濟(jì)生活中,小到購物時(shí)的討價(jià)還價(jià),大到企業(yè)間的競爭與合作、國家間的傾銷與反傾銷等,都可歸結(jié)為博弈問題。

      參考文獻(xiàn):

      亚洲精品V天堂中文字幕| 亚洲熟妇无码AV在线播放| 亚洲AV无码一区二区三区DV| 久久亚洲色一区二区三区| 亚洲午夜无码AV毛片久久| 亚洲乱码国产一区网址| 亚洲精品第一国产综合境外资源| 成人精品国产亚洲欧洲| 国产午夜亚洲精品不卡免下载| MM1313亚洲精品无码久久| 老子影院午夜伦不卡亚洲| 亚洲福利精品电影在线观看| 九月婷婷亚洲综合在线| 亚洲成人一区二区| 精品亚洲成α人无码成α在线观看 | 亚洲深深色噜噜狠狠网站| 亚洲六月丁香婷婷综合| 亚洲日韩中文字幕无码一区| 亚洲国产AV一区二区三区四区| 爱爱帝国亚洲一区二区三区| 亚洲国产午夜中文字幕精品黄网站| 亚洲人成无码网WWW| 国产亚洲无线码一区二区| 亚洲欧洲一区二区| 亚洲第一网站免费视频| 亚洲精品午夜国产va久久| 亚洲狠狠婷婷综合久久| 亚洲成av人片不卡无码久久 | 亚洲视频在线观看不卡| 亚洲国产精品久久网午夜| 亚洲综合久久精品无码色欲| 亚洲AV无码之国产精品| 亚洲国产精品视频| 久久久久久a亚洲欧洲aⅴ| 久久精品国产亚洲AV无码娇色 | 亚洲精品无码aⅴ中文字幕蜜桃| 亚洲6080yy久久无码产自国产| 日韩亚洲人成网站| 国产亚洲精品无码拍拍拍色欲| 久久精品国产亚洲| 亚洲国产精品yw在线观看|