91免费高清无砖码区,韩国一级毛片在线高清免费 ,国产精品久久久亚洲

前言：想要寫出一篇令人眼前一亮的文章嗎？我們特意為您整理了5篇博弈最優(yōu)策略范文，相信會(huì)為您的寫作帶來幫助，發(fā)現(xiàn)更多的寫作思路和靈感。

博弈最優(yōu)策略

博弈最優(yōu)策略范文第1篇

[關(guān)鍵詞]公地悲劇；博弈論；內(nèi)生規(guī)則

[DOI]1013939/jcnkizgsc201529111

1968年英國哈丁教授（Garrett Hardin）在《The tragedy of the commons》一文中首先提出“公地悲劇”這一概念，它意味著“環(huán)境的退化會(huì)發(fā)生在任何時(shí)候，只要許多人共同使用一種稀缺資源”。本文把博弈論的概念和思想引入到“公地悲劇”這一現(xiàn)象中，致力于找出化解“公地悲劇”的方法。

1“公地悲劇”的博弈論模型

假設(shè)在由n個(gè)牧民共同擁有的草原上，每個(gè)牧民都養(yǎng)羊，根據(jù)世代多年放牧的傳統(tǒng)，他們都知道這片草原上羊的最優(yōu)的飼養(yǎng)數(shù)量，我們把這一數(shù)量設(shè)為Q1，那么每個(gè)牧民的最優(yōu)飼養(yǎng)量為Q1/n。由于草原是公共的，只要有利可圖，牧民養(yǎng)羊的飼養(yǎng)數(shù)量越多越好。假定每個(gè)牧民能獲得收益的飼養(yǎng)量不低于Q1/n，這樣，每個(gè)牧民羊的飼養(yǎng)數(shù)量有兩個(gè)可能，一是超額飼養(yǎng)，二是根據(jù)統(tǒng)一的指標(biāo)限額飼養(yǎng)。

為了使我們的分析更具有一般的普遍性，把草原上的n個(gè)牧民簡化為兩個(gè)典型性的代表A和B，A和B共同在這片草原上放牧，把羊的飼養(yǎng)量的確定過程看作是A和B相互之間的博弈，那么A和B就有兩個(gè)可選擇的策略，即超額或限額。在A、B選擇不同的策略的情況下，A、B會(huì)出現(xiàn)收益變化：①A超額、B限額，在市場(chǎng)均衡的情況下，A的飼養(yǎng)里比B的飼養(yǎng)量多，收益也多，A的收益為a，B的收益為b，則a>b；②B超額、A限額，A的收益為b，B的收益為a，同理，有a>b；③A、B都限額，總收益為T，達(dá)到社會(huì)最優(yōu)，A、B共享收益π，每人π/2，由公地放牧?xí)?dǎo)致非帕累托最優(yōu)，有π>a+b，④A、B都超額，那么A、B的收益均為τ/2，有τ

2博弈模型分析

首先，假定以上“公地悲劇”博弈模型是在完全信息的情況下進(jìn)行的，即A、B都知道對(duì)方的策略和收益；之后，將A和B的博弈分為同時(shí)博弈和序貫博弈兩種情形。下面將對(duì)以上兩種情形進(jìn)行敘述分析。

當(dāng)A和B同時(shí)博弈，對(duì)A來說，當(dāng)B采取限制飼養(yǎng)數(shù)量的策略時(shí)，A的收益a>π/2，A的最優(yōu)選擇是超額；當(dāng)B采取超額飼養(yǎng)策略時(shí)，A的收益b>τ/2；由以上分析可知對(duì)A不存在占優(yōu)策略，A所采取的策略需要根據(jù)B的策略進(jìn)行選擇。對(duì)B來說，當(dāng)A采取限額策略時(shí)，B的收益為a>π/2；當(dāng)A采取超額策略時(shí)，B的收益b>τ/2，B的最優(yōu)選擇是限額；同樣，B也不存在占優(yōu)策略，B所采取的策略需要根據(jù)A的策略進(jìn)行選擇。

由以上分析可知，在同時(shí)博弈的情形下，A、B之間有著兩個(gè)納什均衡，即（限額；超額）與（超額；限額）。因?yàn)橥瑫r(shí)博弈存在的階段性，納什均衡不具有唯一解，這說明在實(shí)際情況下A和B會(huì)面臨策略選擇上的困境，在這樣的情形下，為了實(shí)現(xiàn)自身利益的最大化，A和B均有可能以一定的概率選擇超額策略或限額策略。那么，我們假定A選擇限額策略的概率是r1，選擇超額策略的概率是1-r1；B選擇限額策略的概率是r2，選擇超額策略的概率是1-r2，那么，A的最優(yōu)化模型為：

VA=r1[[SX（]π[]2[SX）]r2+（1-r2）b]+（1-r1）[ar2+（1-r2）[SX（]τ[]2[SX）]]

求A在概率r1下的收益最大值Max[DD（X]r1[DD）]VA，有：[SX（]π[]2[SX）]r2+b（1-r2）-ar2-[SX（]τ[]2[SX）]（1-r2）=0，則，r2=[SX（]b-[SX（]τ[]2[SX）][]（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]>0

根據(jù)支付矩陣的對(duì)稱性，可推出：r1=r2=[SX（]b-[SX（]τ[]2[SX）][]（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]

綜上可知：r*1=r*2=[SX（]b-[SX（]τ[]2[SX）][]（1+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]為混合策略的納什均衡，這一均衡說明了當(dāng)A以概率r*1選擇限額策略時(shí)，A進(jìn)行策略選擇時(shí)沒有必要參考B的策略選擇來進(jìn)行，同樣的，B以概率r*2選擇限額策略時(shí)的策略選擇也不需要考慮A的策略選擇。

根據(jù)以上描述可得到以下結(jié)果：A、B選擇限額策略的聯(lián)合概率分布為：P（A=不超額；B=不超額）=r*1×r*2=[SX（]（b-[SX（]τ[]2[SX）]）2[][（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）]2[SX）]；A、B選擇超額飼養(yǎng)策略的概率分布為：P（A=超額；B=超額）=（1-r*1）（1-r*2）；A、B選擇相異策略的概率為：r*1（1-r*2）+r*2（1-r*1）=2η*（1-r*2）=2r*2（1-r*1）。A和B中只要有一人選擇了超額飼養(yǎng)策略，草原的飼養(yǎng)量將偏離帕累托最優(yōu)，出現(xiàn)“公地悲劇”現(xiàn)象，出現(xiàn)的概率為：P（A=超額；B=超額）+P（A=超額；B=不超額）+P（A=不超額；B=超額）=（1-r*1）（1-r*2）+2η*（1-r*2）；根據(jù)概率的相關(guān)知識(shí)，“公地悲劇”出現(xiàn)的概率也可表示為1-P（A=不超額；B=不超額）=1-r*1×r*2∈[0，1]。

把A和B兩個(gè)牧民決定羊的飼養(yǎng)數(shù)量的決策過程看作是一個(gè)博弈，根據(jù)以上計(jì)算可知，“公地悲劇”這一現(xiàn)象會(huì)以一定的概率出現(xiàn)在博弈的收益中，這樣，從博弈論的視角分析“公地悲劇”就有了可行性。

其次，A、B連續(xù)博弈。當(dāng)A和B兩個(gè)牧民中有一個(gè)人在某些方面優(yōu)于另一個(gè)人即具備先行者的優(yōu)勢(shì)時(shí)，那么先行者就有觀望和利用先行者優(yōu)勢(shì)兩種選擇，這時(shí)A、B之間的博弈不再是同時(shí)博弈而是連續(xù)博弈。這里假設(shè)在完全信息的情況下，A是先行者，A先行動(dòng)、B后行動(dòng)，收益矩陣和同時(shí)博弈的時(shí)候相同。

對(duì)A來說，A知道假如他選擇超額策略，由于b>[SX（]π[]2[SX）]，B的最優(yōu)策略為限額策略，那么，A將獲得a的收益，B獲得b；假如A選擇限額策略，那么B一定超額，那么A獲得收益b，B獲得a。當(dāng)A具有先行者優(yōu)勢(shì)時(shí)，A能夠先行動(dòng)，并獲得a的收益（a>b），所以無論如何A也會(huì)選擇超額策略，這時(shí)，博弈的均衡解釋（超額；限額）。這就表示在連續(xù)一次性的博弈過程中，A、B兩個(gè)牧民的羊的總的飼養(yǎng)數(shù)量將超過草原上的帕累托最優(yōu)數(shù)量，出現(xiàn)“公地悲劇”。

從上文中的分析可知，理論上，在一次博弈的情形下，不管是同時(shí)博弈還是連續(xù)博弈，“公地悲劇”都可能發(fā)生，但在實(shí)際情況下，因?yàn)轲B(yǎng)羊這個(gè)活動(dòng)是不間斷連續(xù)進(jìn)行下去的，那么草原上牧民之間養(yǎng)羊數(shù)量的決策過程就是重復(fù)博弈的過程。一旦存在重復(fù)博弈，牧民之間由于人際關(guān)系、文化等原因會(huì)形成一種相互牽制的情況，最終使草原上羊群的飼養(yǎng)數(shù)量限制在符合集體利益最大化的帕累托最優(yōu)數(shù)量上面。

3對(duì)策研究

由以上分析可知，A、B因?yàn)榇嬖赼-[SX（]π[]2[SX）]的超額收益而產(chǎn)生了超額飼養(yǎng)羊的投機(jī)心理。A和B都是理性人，都是自私的，都不愿意因?yàn)樽约合揞~而損失了額外的收益，更不愿意看到因?yàn)殡p方都超額而帶來的共同損失。當(dāng)不存在一個(gè)實(shí)際有效的機(jī)制來約束雙方行為時(shí)，為了能減少自身的損失，在博弈的過程中，博弈雙方會(huì)透露這樣的信息：如果在社會(huì)交換的過程中出現(xiàn)了違約者，則拒絕與他合作，而拒絕合作給違約者造成的損失大于他不違約的損失，這樣就形成了一種可信的、有效的威脅。A和B在牧羊博弈的過程當(dāng)中自主地限制羊的數(shù)量，使其形成一個(gè)內(nèi)生的規(guī)則。當(dāng)限額策略合理地解決了“公地悲劇”問題時(shí)，在接下來的重復(fù)博弈中，人們會(huì)將這一行為堅(jiān)持下去，就成為了一種制度，一種內(nèi)生的制度，“公地悲劇”便得到了解決，不再出現(xiàn)。

4結(jié)論

通過以上分析，當(dāng)牧民們?cè)谶x擇羊的飼養(yǎng)數(shù)量時(shí)，相互之間存在一種相互約束、制約機(jī)制，并且這一博弈是重復(fù)進(jìn)行時(shí)，那么，飼養(yǎng)羊數(shù)量的限額將成為一個(gè)內(nèi)生的博弈規(guī)則，它不需要借助外界或第三方的力量來保證實(shí)施便能自己起到約束雙方行為的作用，因而“公地悲劇”能夠依靠內(nèi)部的約束機(jī)制自發(fā)解決。

參考文獻(xiàn)：

博弈最優(yōu)策略范文第2篇

【關(guān)鍵詞】無線電博弈論納什均衡

一、博弈論的概述

1.1概念

博弈論（game theory）是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的理論[20]。也就是說，博弈論研究當(dāng)一個(gè)主體，譬如說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人（其他企業(yè)）的選擇的影響，而且反過來影響到其他人（其他企業(yè)）選擇時(shí)的決策問題和均衡問題。所以在這個(gè)意義上說，博弈論又稱為“對(duì)策論”。博弈論是一種使用嚴(yán)謹(jǐn)數(shù)學(xué)模型來解決現(xiàn)實(shí)中利害沖突的理論，由于沖突、合作、競爭等行為是現(xiàn)實(shí)中常見的現(xiàn)象，因此很多領(lǐng)域都能應(yīng)用博弈論，如軍事領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、政治外交等。

1.2博弈論模型簡介

博弈論自產(chǎn)生到發(fā)展至今已形成了較成熟的理論體系，它并不是經(jīng)濟(jì)學(xué)的一個(gè)分支，它是一種方法，應(yīng)用范圍不僅包括經(jīng)濟(jì)學(xué)，政治學(xué)、軍事、外交、國際關(guān)系、公共選擇，還有犯罪學(xué)等都涉及到博弈論。不過博弈論也具有自身的基本模型，可以對(duì)一個(gè)博弈過程用5個(gè)方面來描述，G={P，A，O，I，U}

① P（player）：博弈的參與方。

② A（action）：博弈方可選擇的全部行為或策略的集合

③ O（orders）：博弈的次序。

④ I（information）：博弈的信息。

⑤ U（utility）：博弈方的收益。

以上五個(gè)方面是定義一個(gè)博弈時(shí)必須首先設(shè)定的，確定了上述五個(gè)方面就是確定了一個(gè)博弈。博弈論就是系統(tǒng)研究用上述方法定義的各種各樣的博弈問題，尋求各博弈方合理選擇策略的情況下博弈的解，也既是均衡。

1.3博弈論的分類

現(xiàn)實(shí)中各種博弈可以按照不同的辦法進(jìn)行分類。根據(jù)參與人的多少，可以將博弈分為兩人博弈和多人博弈；根據(jù)參與人是否合作，可以將博弈分為合作博弈和非合作博弈；根據(jù)博弈結(jié)果的不同，又可以將博弈分為零和博弈、常和博弈和變和博弈。

1.4納什均衡

1.4.1納什均衡的定義

納什均衡（Nash Equilibrium）[20]是一種策略組合，它能夠使得每個(gè)參與者的策略都是對(duì)其他參與者策略的最優(yōu)反應(yīng)。“最優(yōu)反應(yīng)”指的是該策略帶給采用它的博弈方的利益或期望利益，大于或至少不小于其它任何策略能帶來的利益。博弈的目的，就是為了尋求這樣的一個(gè)最佳的策略組合。

1.5 一些特殊的博弈模型

1.5.1重復(fù)博弈模型

重復(fù)博弈是目前人們了解的最為透徹的一類動(dòng)態(tài)博弈，參與人每一期都面對(duì)同樣的“階段博弈”或“選民博弈”，而且參與人的全部收益是每階段所得收益的加權(quán)平均。參與者基于對(duì)博弈過程的認(rèn)知，例如對(duì)過去行為的了解，對(duì)未來的預(yù)期和對(duì)當(dāng)前情況的觀察，在每一個(gè)階段的博弈中選擇自身的策略。這些策略可以是固定的，也可以隨其它參與者行動(dòng)的改變而變化，甚至可以是自適應(yīng)的。

1.5.2潛在博弈模型

潛在博弈是一般形式博弈中的一種特殊類型，存在函數(shù)u：SR當(dāng)單方面的背離發(fā)生時(shí)，u的變化Δu將被反映到單方面背離博弈者的效用上。

二、在無線通信系統(tǒng)資源分配問題中應(yīng)用博弈論的可行性分析

隨著無線通信系統(tǒng)的飛速發(fā)展，許多概念和技術(shù)與現(xiàn)有系統(tǒng)相比都有很大的變化。通信系統(tǒng)將具有智能的資源管理，采用大量動(dòng)態(tài)的、分布式的、自適應(yīng)式的資源管理方式。

三、基于博弈論的動(dòng)態(tài)頻譜接入方法

如何利用博弈論方法對(duì)認(rèn)知無線電技術(shù)的研究進(jìn)行分析，其中的關(guān)鍵是如何將博弈論引入到相應(yīng)算法的設(shè)計(jì)和分析中，找到算法的納什均衡點(diǎn)。在開始具體的算法研究之前，需要將所研究的問題抽象成博弈論問題模型。

3.1 分布式自適應(yīng)頻譜接入方法

博弈論模型適用于分析認(rèn)知無線電系統(tǒng)各用戶競爭頻譜的分布式行為，各用戶根據(jù)自己獲得的信息單獨(dú)進(jìn)行決策。

博弈最優(yōu)策略范文第3篇

[關(guān)鍵詞]合作困境　博弈分析　現(xiàn)實(shí)對(duì)策

中圖分類號(hào)：D125?4　文獻(xiàn)標(biāo)識(shí)碼：A　文章編號(hào)：1007-1369(2007)2-0046-05

石油是現(xiàn)代經(jīng)濟(jì)的血液，對(duì)于經(jīng)濟(jì)快速發(fā)展的中國和資源匱乏的日本具有重大的戰(zhàn)略意義。從“安大線”、“安納線”較量到東海海洋權(quán)益爭端，再到現(xiàn)在日趨浮現(xiàn)的在非洲石油輸出國的競爭，石油因素在兩國關(guān)系及其政治話語中已具有重要地位。鑒于中日兩國政治關(guān)系的脆弱性，以及國際能源環(huán)境變化的不確定性和全球化、區(qū)域化下的雙邊、多邊能源合作的快速發(fā)展，加強(qiáng)中日海外石油合作，對(duì)于發(fā)展面向21世紀(jì)的穩(wěn)定的中日關(guān)系具有重大的現(xiàn)實(shí)意義。

本文采用博弈論的分析方法，通過對(duì)中日之間在海外石油市場(chǎng)上競爭態(tài)勢(shì)的分析，探討中日在海外石油上采取合作策略的制約困境與現(xiàn)實(shí)對(duì)策。

制約困境的博弈分析

1.博弈理論的一般說明博弈是假定為理者的個(gè)人、團(tuán)體或組織，面對(duì)一定的環(huán)境，在一定的約束條件下，依靠所掌握的信息，同時(shí)或先后，一次或多次，從各自可能的行為或策略中進(jìn)行選擇并實(shí)施，各自從中取得相應(yīng)結(jié)果或收益的過程。由于它強(qiáng)調(diào)理者之間相互影響的制衡關(guān)系，因此在全球化不斷發(fā)展，國家間聯(lián)系不斷增多的情況下，博弈及其研究理論日益被用來描述、研究國家間日趨復(fù)雜的相互依存關(guān)系。鑒于國際社會(huì)天然的無政府狀態(tài)與國家不懈的自助努力，因此在博弈理論中，非合作博弈又成為現(xiàn)代博弈論研究的重點(diǎn)。

按照博弈理論的一般分類，根據(jù)行為者所占有的信息集的完全程度和行為的行動(dòng)順序，非合作博弈可分為：

其中，完全信息靜態(tài)博弈是其他博弈分析的起點(diǎn)，有著較為嚴(yán)格的條件假設(shè)--它要求追求利益最大化的理者掌握完全的信息集(即對(duì)博弈策略與利益有清楚的了解)，并且在決策時(shí)不存在相互間的信息交換，而且一旦決策后就只能等待結(jié)果。因此，對(duì)于行為者來說，盡管此類博弈中占有完全的信息集，但是由于決策時(shí)信息交流的阻斷，導(dǎo)致行為者無法確定對(duì)方是否會(huì)采取“背德”行為使自己利益受損，以致為了實(shí)現(xiàn)自身利益的最大化而不得不采取自己的“最優(yōu)策略”，所以由此看來，在完全信息靜態(tài)博弈中，主導(dǎo)行為者最優(yōu)決策思維的并非是帕累托最優(yōu)，而是風(fēng)險(xiǎn)上策均衡。其結(jié)果便是，行為者從自身利益最大化出發(fā)，不約而同地采取了“坦白”策略，卻最終得到了“集體利益”最小化的“囚徒困境”。而在目前中日兩國的海外石油競爭中，此種情況卻大量存在。

比如在中日在俄輸油管線的較量中，本來中俄議定的“安大線”全長只有2400公里，造價(jià)只有20～25美元(其中俄方17億，可從中方獲得50％的貸款)，且所經(jīng)地區(qū)自然環(huán)境優(yōu)越，便與施工養(yǎng)護(hù)。假如日本在此問題上合作，共擔(dān)建設(shè)費(fèi)用和管理成本，共享由此獲得的石油收益，那么兩國各自在投資上必然小于20～25美元。但是，由于日本擔(dān)心中國在俄的輸油管建設(shè)威脅其“太平洋石油管線”“戰(zhàn)略計(jì)劃”，所以在“安大線”即將開工之際，日本便提出了從西伯利亞地區(qū)安加爾斯克至海參崴地區(qū)納霍德卡的“安納線”計(jì)劃。該線不僅全長3 765公里，造價(jià)50億美元(全部由日本承擔(dān)，而且日本還需再追加10億美元助俄管道建設(shè))，而且所經(jīng)地區(qū)有1100公里的地震區(qū)，施工養(yǎng)護(hù)條件惡劣。此后，中日兩國展開了激烈的競爭，其結(jié)果便是俄羅斯改建“泰納線”(從泰舍特至納霍德卡)，日本不僅要為此方案提供50億美元貸款，中國亦愿意向該工程陸續(xù)投放120億美元的貸款，而且還讓俄羅斯給中日兩國附加上了“安全保障”。所以與先前的“安大線”相比，可見其代價(jià)之巨大。

但是，值得注意的是，完全信息靜態(tài)博弈的理論假設(shè)之一是行為者在決策時(shí)不發(fā)生任何的信息交換。可從現(xiàn)實(shí)來看，中日之間在多邊與雙邊層次上存在著不同程度、不同形式的對(duì)話交流，比如在多邊層次上，中日兩國可通過聯(lián)合國、亞太經(jīng)合組織、東盟論壇、東亞峰會(huì)等場(chǎng)合進(jìn)行對(duì)話交流；在雙邊層次上，中日之間可借助中日戰(zhàn)略對(duì)話和東海問題磋商等會(huì)議進(jìn)行信息交換和對(duì)話磋商，所以可以認(rèn)為，當(dāng)中日兩國的決策者在進(jìn)行策略選擇時(shí)，可以從多種渠道了解對(duì)方的策略意圖--從目前來看，實(shí)現(xiàn)石油供應(yīng)源的多樣化，穩(wěn)定石油來源等已成為中日兩國各自對(duì)對(duì)方能源戰(zhàn)略的基本認(rèn)知，而世界石油的儲(chǔ)量、價(jià)格、交易、運(yùn)輸?shù)刃畔⒏莾蓢寄苷莆盏墓残畔ⅰＫ赃@不得不令人發(fā)問：中日兩國為何在具備信息交流的情況下，還不能突破困擾兩國的“囚徒困境”?

要回答這問題，完全信息靜態(tài)博弈由于其嚴(yán)格的條件限定，已不能擔(dān)此重任，而需借助于條件限定較為放寬的完全信息動(dòng)態(tài)博弈。在完全信息動(dòng)態(tài)博弈中，行為者追求利益最大化的本性與掌握完全信息集的要求并未改變，但是允許行為者在做出策略選擇時(shí)有先后順序，后行動(dòng)者可以根據(jù)先行動(dòng)者的行為信息做出自己的策略選擇，從而實(shí)現(xiàn)一定程度的信息交流，因此比較適合用于分析中日兩國在海外石油博弈中所遇到的“囚徒困境”。

實(shí)際上，假如采用“大歷史觀”的審視問題視角，從技術(shù)角度看待事物之間的相互聯(lián)系與歷史脈絡(luò)，將中日兩國在海外石油上的博弈放人中日兩國“雙重崛起”(即中國的和平發(fā)展與日本謀求政治大國的訴求)的背景下，將中日“雙重崛起”下的國家戰(zhàn)略性博弈與其他次國家層面或超國家層面的各類博弈總計(jì)為G，將中日在海外石油市場(chǎng)上的博弈記為g，那么在g與G之間便因石油本身在現(xiàn)代社會(huì)政治話語中所具有的戰(zhàn)略性意義，不僅自然聯(lián)系起來，形成一個(gè)簡化的次數(shù)為2的“有限次重復(fù)博弈”，而且使石油在g中得益在G中的作用直接體現(xiàn)出來，使構(gòu)建得益函數(shù)UG=UG(ug)成為可能。

在有限次重復(fù)博弈中，在每次重復(fù)博弈之前，以前博弈的結(jié)果各行為者都能觀察到，成為下次博弈中行為者行動(dòng)的參考依據(jù)，所以在有限次重復(fù)博弈中，行為者不能只考慮某個(gè)階段的得益，而需顧及前次博弈的得益對(duì)后次博弈的影響以及最后的總得益。因此對(duì)于中日兩國間由g與G構(gòu)成的有限次重復(fù)博弈，中日雙方不僅要考慮g的得益，還要考慮g的得益對(duì)G的影響以及最后的總得益。由于是有限次數(shù)重復(fù)，所以可以借助“逆向歸納法”對(duì)此作具體的博弈分析。

2.具體的博弈分析

首先，進(jìn)行條件假設(shè)。由于石油作為一次性能源的不可再生性，其探明儲(chǔ)量與產(chǎn)量在特定時(shí)期，技術(shù)發(fā)展既定的情況下是有限的，所以石油資

源人類活動(dòng)約束已呈現(xiàn)出“存量約束”的形式。所以可假定在只有中日兩國的封閉系統(tǒng)中，海外石油資源存量為X，中國對(duì)外石油的依賴度為d，那么中國就需要從外進(jìn)口石油量為dX，假如中國能實(shí)現(xiàn)這一進(jìn)口量，那么日本獲取海外石油量為(1-d)X。由此根據(jù)基數(shù)效用理論假定出中國在g中的得益為ugl=AdX-BP，日本在g中的得益為ug2=C(1-d)X-DP(其中A、B，C、D分別為中日在g中的得益系數(shù)，在一定的技術(shù)條件下A、B，C、D恒定，但是，從現(xiàn)實(shí)來看，在一定技術(shù)條件下，日本的技術(shù)水平在常態(tài)分布上高于中國，所以A

其次，用逆向歸納法對(duì)上述假設(shè)進(jìn)行具體分析。由于中日之間政治互信度比較低，在中日之間雙重崛起的背景下，一方面中國政府由于日本對(duì)歷史問題的虛無主義態(tài)度，對(duì)華關(guān)系的定位(目前日本將中日關(guān)系定性為“協(xié)調(diào)與共存”、“競爭與摩擦”混在的關(guān)系)以及近來日本對(duì)周邊的一些舉動(dòng)等，擔(dān)心日本走向政治大國后的政策走向；另一方面，日本政府面對(duì)中國快速的和平發(fā)展和自己過去所經(jīng)歷的“喪失的十年”，心理上難以調(diào)適并擔(dān)心發(fā)展起來的中國危及自身的戰(zhàn)略利益，特別是日本作為目前國際體系的既得利益者，其固有的保守心態(tài)是它尤其擔(dān)心作為后發(fā)國家的中國縮小與它的差距，從而改變現(xiàn)有利益布局，所以在中日兩國的博弈中，日本政府的最優(yōu)策略便是使U1'

求解導(dǎo)數(shù)R∞=U1’，可得U1’=Ad{1+[E(b1)/(1+r1)]}①，同理可得U2'=C(-d){l+[E(b2)/(1+r2)]}②(這里“一”表示中日兩國間的負(fù)相關(guān)關(guān)系，比較時(shí)取其絕對(duì)值)，比較①與②，可以發(fā)現(xiàn)，由于從2003-2006年間，中國經(jīng)濟(jì)的r1一直保持高位運(yùn)行，分別是10.O％、10.1％、10.4％、10.7％，日本經(jīng)濟(jì)的r2則為1.4％、2.6％、0.8％、2.8％，所以1，(1+r1)必然小于1/(1+b)。而在E(h)函數(shù)上，由于日本在2001年的能耗強(qiáng)度為0.91，而同期中國的能耗強(qiáng)度卻為8.45，換句話講，就是同等能耗，日本將有更多的產(chǎn)出，因而也就對(duì)生更大的影響，即E(h1)

究其原因，癥結(jié)就在于未能將納什均衡貫徹于動(dòng)態(tài)博弈的各個(gè)階段，實(shí)現(xiàn)子博弈精煉納什均衡。按照子博弈精煉納什均衡的條件要求，行為者的最優(yōu)策略必須貫徹于博弈的各個(gè)階段，以便在博弈的各個(gè)階段實(shí)現(xiàn)納什均衡。而在上述分析中，δ與E等系數(shù)借助影響單位X增益而作用于G博弈在日本政府的最優(yōu)策略中得到了體現(xiàn)，盡管借此可實(shí)現(xiàn)策略選擇在G博弈中的納什均衡，但是卻忽視了最優(yōu)策略在g博弈中的貫徹，因而也就未能在g博弈中實(shí)現(xiàn)納什均衡。所以對(duì)于日本政府來說，將最優(yōu)策略進(jìn)一步貫徹于g博弈中以便在g博弈也實(shí)現(xiàn)納什均衡，就成為其必然的策略選擇。從上述表達(dá)式來看，U1

實(shí)際上，日本政府選擇阻擾或干擾中國海外油源拓展的對(duì)抗策略，就是這一策略考量的直接體現(xiàn)。因?yàn)樵谫N現(xiàn)系數(shù)存在的情況下，盡管阻擾或干擾中國海外油源的拓展的舉動(dòng)并不能必然帶給日本單位x的增益，但是由于r1>r2，帶來δ1

自己在既得利益分布中的地位。而對(duì)中國來說，情況亦是如此，只能采取“針鋒相對(duì)”的策略，不斷拓展自己穩(wěn)定的海外油源(這在客觀上起到了阻擾或干擾日本海外油源拓展的作用)，才能保證自己的損失總小于日方。由此可以看出，雙方的對(duì)抗策略借助對(duì)d的影響將納什均衡貫徹到了博弈中，從而實(shí)現(xiàn)了在整個(gè)次數(shù)為2的有限性重復(fù)博弈中的子博弈精煉納什均衡。由此也就可以理解為何在海外石油市場(chǎng)上，中日之間不斷出現(xiàn)拓展、干擾、再拓展、再干擾……局面的原因。

最后，經(jīng)過上述分析，基本可以得出如下結(jié)論：

(1)雙方缺乏政治互信，才使得雙方不斷追求相對(duì)得益，奉行自我利益占優(yōu)的納什均衡策略。

(2)減弱d的影響，緩解相互制約的負(fù)相關(guān)關(guān)系，既是雙方貫徹最優(yōu)策略，在博弈的兩個(gè)階段實(shí)現(xiàn)納什均衡的著力點(diǎn)，也是雙方實(shí)現(xiàn)子博弈精煉納什均衡后的客觀結(jié)果。

(3)油價(jià)因素在上述條件下的博弈中并不發(fā)揮主要作用。換言之，高油價(jià)并不必然導(dǎo)致合作產(chǎn)生，有時(shí)高油價(jià)還會(huì)導(dǎo)致對(duì)穩(wěn)定油源的進(jìn)一步爭奪。

現(xiàn)實(shí)對(duì)策：訂立基于互信的政治契約

1.訂立基于互信的政治契約的必要性

基于上述分析，可以看出，中日兩國缺乏政治互信是導(dǎo)致兩國不斷追求相對(duì)利益，奉行自我利益占優(yōu)的納什均衡策略的主要原因。按照新現(xiàn)實(shí)主義的看法，感到不安全的國家總關(guān)心收益如何分配，它們并不注重參與者兩方是否都收益，而只關(guān)心誰多得益。如果收益分配不均，得益的國家總想要削弱對(duì)方以改變自己在利益分配中處于不利地位，即使利益分配的雙方有獲得絕對(duì)收益這種愿望，但都害怕對(duì)方的實(shí)力增強(qiáng)對(duì)自己有威脅，所以合作起來就不成功。

因此，要實(shí)現(xiàn)中日在海外石油上的合作，就必須首先在雙方之間訂立基于互信的政治契約，消除因?qū)?duì)方不信任而產(chǎn)生的不安全感以及由此引發(fā)的對(duì)相對(duì)收益的追求。而一旦這種政治契約得以訂立，那么按照新制度經(jīng)濟(jì)學(xué)的判斷，將促進(jìn)雙方實(shí)現(xiàn)“記憶編碼”，使其參與的博弈轉(zhuǎn)變成“制度支持的完美記憶”(institution-assisted perfectrecall)博弈，從而大大提高信息交換的效率，穩(wěn)定雙方在博弈中的行動(dòng)策略與心理預(yù)期，進(jìn)而緩解雙方因?qū)Ψ秸呖赡艹霈F(xiàn)的突變性而產(chǎn)生的不安全感，降低談判中的“討價(jià)還價(jià)”成本，推動(dòng)合作進(jìn)程的快速發(fā)展。

在這一點(diǎn)上，法德和解給與了歷史的佐證。在1963年，法德兩國簽署了《法德友好條約》。其意義不僅在于標(biāo)志著法德雙方和解的開始，更在于它還是法德之間基于互信訂立的一種政治契約，使得雙方從此可以秉信釋疑，開誠布公地探討地區(qū)合作事宜，攜手推動(dòng)歐洲一體化的發(fā)展。

2.訂立基于互信的政治契約的著力點(diǎn)

任何政治契約的訂立，都是緣于對(duì)利益的關(guān)注，也都以利益為訂立契約的著力點(diǎn)，所以中日之間訂立基于互信的政治契約，也必須以兩國利益為著力點(diǎn)。

根據(jù)上述困境分析，減弱d的影響，緩解相互制約的負(fù)相關(guān)關(guān)系是雙方在整個(gè)有限性博弈中貫徹最優(yōu)策略，實(shí)現(xiàn)各自利益占優(yōu)的著力點(diǎn)：日本政府借此緩解中日之間相互制約的負(fù)相關(guān)關(guān)系的策略是對(duì)抗，即阻撓或干擾中國海外油源的拓展，導(dǎo)致中國也不得不采取針鋒相對(duì)的策略，最終形成了雙方追求各自利益占優(yōu)的子博弈精煉納什均衡。

實(shí)際上，在當(dāng)今世界，保證穩(wěn)定的油源，緩解相互制約的負(fù)相關(guān)關(guān)系一直有兩條思路：一是直接拓展油源，保證有穩(wěn)定的石油供給，上述中日博弈也就是在這方面展開；二是尋找替代能源，發(fā)展節(jié)能技術(shù)。如果說前者在中日博弈中證明其占優(yōu)策略為對(duì)抗的話，那么第二種則要在合作中實(shí)現(xiàn)自我利益最優(yōu)。所以只要中日雙方轉(zhuǎn)換思維，加強(qiáng)雙方在替代能源、節(jié)能技術(shù)上的合作，那么就可以規(guī)避在前者中面臨的納什均衡，在合作中實(shí)現(xiàn)各自利益的最優(yōu)。因此，中日雙方訂立基于互信的政治契約，其著力點(diǎn)就可以放在尋找替代能源，發(fā)展節(jié)能技術(shù)上。首先在“節(jié)流”上培養(yǎng)雙方的信任度，隨后在一定程度時(shí)將此信任度“外溢”至“開源”領(lǐng)域，從而實(shí)現(xiàn)雙方“記憶的編碼”，緩解雙方在此領(lǐng)域的擔(dān)心與焦慮，進(jìn)而達(dá)到訂立互信政治契約的目的，最后消除雙方的不安全感，使雙方摒棄對(duì)相對(duì)收益的追求，在“開源”領(lǐng)域?qū)崿F(xiàn)合作的最優(yōu)收益。

而且從現(xiàn)實(shí)來看，此種著力點(diǎn)也有其存在的客觀現(xiàn)實(shí)性：

第一，中國有尋找替代能源，發(fā)展節(jié)能技術(shù)的積極愿望。“節(jié)能優(yōu)先”已成為中國可持續(xù)能源戰(zhàn)略的重要組成部分。

第二，日本有著較為發(fā)達(dá)的開發(fā)替代能源、發(fā)展節(jié)能技術(shù)的科技水平。比如2005年9月，日本與印度簽署的兩國在能源領(lǐng)域進(jìn)行綜合性合作的共同聲明，已堪稱能源合作的典范。

博弈最優(yōu)策略范文第4篇

【關(guān)鍵詞】傾銷反傾銷博弈分析

一、前言

隨著經(jīng)濟(jì)全球化和貿(mào)易自由化的不斷發(fā)展，進(jìn)口關(guān)稅、配額和出口補(bǔ)貼等貿(mào)易保護(hù)手段作為保護(hù)本國經(jīng)濟(jì)的一種手段，其作用越來越弱。反傾銷作為一種被世界貿(mào)易組織所允許的合法而有效的手段，被越來越多的國家所采用。改革開放以來，中國對(duì)外貿(mào)易迅速發(fā)展，但隨之而來的是國外反傾銷調(diào)查的迅速增加。根據(jù)WTO統(tǒng)計(jì)，截止至2012年12月，我國所遭受反傾銷調(diào)查數(shù)量為885件，是全球遭受反傾銷調(diào)查最多的國家。世界各國對(duì)我國頻繁實(shí)施的反傾銷訴訟已經(jīng)嚴(yán)重阻礙了我國對(duì)外貿(mào)易的健康發(fā)展。

傾銷是指以低于成本的價(jià)格將一國商品銷售到另外一國市場(chǎng)的行為。WTO反傾銷協(xié)議規(guī)定，如果一項(xiàng)產(chǎn)品從一國出口到另一國的出口價(jià)格低于在出口國國內(nèi)消費(fèi)的正常貿(mào)易過程中的同類產(chǎn)品的可比價(jià)格，則該產(chǎn)品被認(rèn)為是傾銷產(chǎn)品。反傾銷指進(jìn)口國當(dāng)局依法向?qū)M(jìn)口國產(chǎn)業(yè)造成損害的傾銷行為采取征收反傾銷稅等措施，以抵消損害后果的法律行為，這是一種被世界各國普遍認(rèn)可的限制進(jìn)口手段。

目前，國外對(duì)傾銷與反傾銷的博弈研究既有理論研究，又有實(shí)證分析。理論研究主要集中在完全信息條件下雙寡頭靜態(tài)博弈，如Brander、Krugman、Spencer等。Prusa、Tharakan等則對(duì)反傾銷進(jìn)行了實(shí)證分析，并從博弈角度論述了反傾銷法作為指導(dǎo)局中雙方博弈的規(guī)則尚有不完善的地方需要修訂。國內(nèi)運(yùn)用博弈論分析傾銷與反傾銷問題的尚不多見，張維迎和馬捷從產(chǎn)權(quán)角度研究了產(chǎn)權(quán)對(duì)傾銷問題的影響，楊仕輝就外國對(duì)華反傾銷的逆向選擇作了實(shí)證分析，楊仕輝和張娟通過構(gòu)建不完全信息條件下的傾銷與反傾銷動(dòng)態(tài)博弈模型對(duì)反傾銷效應(yīng)進(jìn)行了理論推導(dǎo)。本文在參考國內(nèi)外文獻(xiàn)的基礎(chǔ)上，運(yùn)用博弈論為分析工具，建立了傾銷與反傾銷的博弈模型，對(duì)傾銷與反傾銷中出現(xiàn)的問題進(jìn)行分析。

二、傾銷與反傾銷的博弈論分析

（一）傾銷與反傾銷的完全信息博弈分析

假定國外企業(yè)不進(jìn)行傾銷而國內(nèi)企業(yè)不進(jìn)行反傾銷訴訟，其效用分別為u1 和u2；國外企業(yè)進(jìn)行傾銷，傾銷成本為c1，同時(shí)國內(nèi)企業(yè)不進(jìn)行反傾銷時(shí)國外企業(yè)進(jìn)行傾銷的利潤為m；國內(nèi)企業(yè)進(jìn)行反傾銷，反傾銷成本為c2。通常m>c1，m>c2。博弈矩陣如圖1。

當(dāng)國外企業(yè)傾銷時(shí)，如果國內(nèi)企業(yè)進(jìn)行反傾銷，國內(nèi)企業(yè)的效用為u2-c2；如果國內(nèi)企業(yè)不進(jìn)行反傾銷，國內(nèi)企業(yè)的效用為u2-m，由于u2-c2>u2-m，國內(nèi)企業(yè)的最優(yōu)策略是進(jìn)行反傾銷。當(dāng)國外企業(yè)不傾銷時(shí)，如果國內(nèi)企業(yè)進(jìn)行反傾銷，國內(nèi)企業(yè)的效用為u2-c2；如果國內(nèi)企業(yè)不進(jìn)行反傾銷，國內(nèi)企業(yè)的效用為u2，由于u2-c2

如果一個(gè)人采取混合戰(zhàn)略，其對(duì)手不能準(zhǔn)確地猜出他實(shí)際上會(huì)選擇的戰(zhàn)略。假定國外企業(yè)進(jìn)行傾銷的概率為p，不傾銷的概率為1-p；國內(nèi)企業(yè)進(jìn)行反傾銷的概率為q，不進(jìn)行反傾銷的概率為1-q。

（二）傾銷與反傾銷的不完全信息博弈分析

假設(shè)進(jìn)行傾銷與反傾銷博弈的參與人仍是國外企業(yè)和國內(nèi)企業(yè)，他們追求利潤最大化。但信息是不完全的，潛在國外企業(yè)決定是否對(duì)某國進(jìn)行傾銷，國內(nèi)企業(yè)并不知道國外企業(yè)的成本函數(shù)。假定國外企業(yè)有兩個(gè)可能的類型：低成本或高成本；國外企業(yè)是低成本時(shí)，實(shí)施低價(jià)策略不會(huì)導(dǎo)致國內(nèi)企業(yè)反傾銷的成功，而高成本時(shí)國外企業(yè)的低價(jià)策略會(huì)導(dǎo)致國內(nèi)企業(yè)反傾銷的成功。兩種成本情況下的支付矩陣如圖2所示。

國內(nèi)企業(yè)在博弈開始時(shí)只知道國外企業(yè)是高成本的概率為p，低成本的概率為1-p。無論國外企業(yè)是低成本還是高成本，出口到某國的選擇都有低價(jià)格和高價(jià)格。博弈的第一階段，當(dāng)國外企業(yè)選擇低價(jià)策略，國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷；當(dāng)國外企業(yè)選擇高價(jià)格，國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷。博弈的第二階段，國內(nèi)企業(yè)是否對(duì)國外企業(yè)的價(jià)格策略實(shí)施反傾銷，依賴于國內(nèi)企業(yè)對(duì)國外企業(yè)成本的判斷，如果國外企業(yè)是低成本的時(shí)候，國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷，當(dāng)國外是高成本，選擇低價(jià)格的時(shí)候，國內(nèi)企業(yè)的最優(yōu)選擇是反傾銷；反之，則不反傾銷。國內(nèi)企業(yè)是否進(jìn)行反傾銷，依賴于他對(duì)國外企業(yè)成本的判斷。高成本國外企業(yè)如果選擇價(jià)格a21時(shí)，會(huì)招致國內(nèi)企業(yè)的反傾銷，因此，高成本企業(yè)可能會(huì)選擇價(jià)格a11或a12，以避免招致國內(nèi)企業(yè)的反傾銷。在觀測(cè)到國外企業(yè)的第一階段的價(jià)格選擇后，國內(nèi)企業(yè)會(huì)修正對(duì)國外企業(yè)的成本函數(shù)的先驗(yàn)概率p。如果國內(nèi)企業(yè)觀測(cè)到國外企業(yè)選擇低價(jià)格a21，就可以推斷國外企業(yè)一定是高成本，采取反傾銷就是最優(yōu)選擇。國內(nèi)企業(yè)看到國外企業(yè)選擇低價(jià)策略，可以估計(jì)國外企業(yè)在低價(jià)條件下低成本和高成本的概率，即P（c1∣p1）和P（c2∣p1）。

假設(shè)p=0.5，低成本條件下選擇低價(jià)格策略的概率大于高成本條件下選擇低價(jià)格的概率，即a1>a2，可以得出P（c1∣p1）>P（c2∣p1）。如果國內(nèi)企業(yè)作出這樣的估計(jì)，就不會(huì)對(duì)國外企業(yè)進(jìn)行反傾銷了，反之，則選擇進(jìn)行反傾銷。如圖3，博弈方國外企業(yè)選擇了低價(jià)策略，這個(gè)低價(jià)策略可能來自兩種不同的成本類型。博弈方國內(nèi)企業(yè)在決策點(diǎn)有兩種選擇，即反傾銷和不反傾銷。如果國外企業(yè)是低成本類型，即沒有傾銷行為，國內(nèi)企業(yè)的最優(yōu)選擇是不反傾銷，因?yàn)閎11b32。如果國內(nèi)企業(yè)估計(jì)A 是高成本類型的，他會(huì)選擇進(jìn)行不反傾銷，但是國內(nèi)企業(yè)估計(jì)錯(cuò)誤，那他會(huì)選擇不進(jìn)行反傾銷，而事實(shí)上卻遭受了傾銷，這樣給貿(mào)易雙方都帶來了一定的損失。

三、結(jié)論

近些年，我國在外貿(mào)出口取得巨大成就的同時(shí)，面臨嚴(yán)重的反傾銷危機(jī)，中國企業(yè)在面對(duì)反傾銷調(diào)查時(shí)，大都采取消極避戰(zhàn)的態(tài)度，助長了國外對(duì)華反傾銷的氣焰。從博弈的角度來看，主要是因?yàn)槲覈髽I(yè)還沒有積極參與國際市場(chǎng)的博弈過程，不能通過主動(dòng)介入改變被動(dòng)局面。要改變這種局面，必須積極參與博弈，并利用可置信威脅改變對(duì)方的博弈路徑，以獲取利潤最大化。同時(shí)，在企業(yè)選擇價(jià)格策略時(shí)，要從長遠(yuǎn)利益出發(fā)，注意進(jìn)口國對(duì)自己價(jià)格策略的反應(yīng)，盡量不給進(jìn)口國一個(gè)低價(jià)傾銷的印象，以免使自己陷入反傾銷的訴訟中。

參考文獻(xiàn)

[1]張維迎，馬捷.惡性競爭的產(chǎn)權(quán)基礎(chǔ)[J].經(jīng)濟(jì)研究，1999（06）.

[2]楊仕輝.反傾銷博弈與逆向選擇[J].世界經(jīng)濟(jì)，2000（01）.

[3]楊仕輝，張娟.不完全信息條件下傾銷與反傾銷動(dòng)態(tài)博弈[J].中國管理科學(xué)，2000（03）.

博弈最優(yōu)策略范文第5篇

【關(guān)鍵詞】博弈論；非合作博弈；納什均衡；應(yīng)用

文章編號(hào)：ISSN1006―656X（2013）12-0043-01

一、博弈論的概述

博弈論（game theory），又稱對(duì)策論，是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題，也就是一些個(gè)人或組織，面對(duì)特定的環(huán)境條件，在一定的規(guī)則約束下，同時(shí)或先后，一次或多次，從各自的行為或策略中進(jìn)行選擇并加以實(shí)施，各自取得相應(yīng)結(jié)果的過程。

一個(gè)完整的博弈一般包含幾個(gè)要素：參與者，行動(dòng)，策略，結(jié)果，均衡等。參與者、行動(dòng)和結(jié)果統(tǒng)稱為博弈規(guī)則，博弈分析的目的是使用博弈規(guī)則來決定均衡。但是，博弈的行動(dòng)不等同于博弈的策略，博弈的結(jié)果不等同于博弈的均衡。根據(jù)參與人的數(shù)量，可分為二人博弈和多人博弈；根據(jù)參與人是否合作，可分為合作博弈和非合作博弈；根據(jù)博弈結(jié)果的不同，可分為零和博弈、常和博弈和變和博弈。

博弈論對(duì)我們的經(jīng)濟(jì)生活有重要意義，人們之間決策行為相互影響的例子有很多：從國家角度出發(fā)，在國際貿(mào)易中合理運(yùn)用博弈論可使本國和其他國家都受益，取得雙贏效果；從個(gè)人角度出發(fā)，在生活中合理運(yùn)用博弈論可使自己選擇最優(yōu)策略，減少不必要的成本開支。

二、非合作博弈――納什均衡

非合作博弈是指不允許存在有約束力協(xié)議的博弈。完全信息靜態(tài)博弈屬于非合作博弈，該博弈中，每個(gè)博弈方的策略都是針對(duì)其他博弈方策略或策略組合的最佳對(duì)策，具有這種性質(zhì)的策略組合，正是非合作博弈理論中最重要的一個(gè)概念“納什均衡”。

用表示一個(gè)博弈，如果有個(gè)博弈方，每個(gè)博弈方的全部可選策略的集合稱為“策略空間”，用表示；表示博弈方的第個(gè)策略，其中可取有限個(gè)值（有限策略博弈），也可取無限個(gè)值（無限策略博弈）；博弈方的得益用表示，是各博弈方策略的多元函數(shù)。個(gè)博弈方的博弈常寫成。在博弈中，如果由各個(gè)博弈方的每一個(gè)策略組成的某個(gè)策略組合中，任一博弈方的策略，都是對(duì)其余博弈方策略組合的最佳對(duì)策，即

，對(duì)任意都成立，則稱為的一個(gè)“納什均衡”。

納什均衡的求解，常采用得益矩陣法。在囚徒困境中，每個(gè)參與者都能猜出對(duì)方策略，稱該納什均衡為純策略納什均衡。囚徒困境問題反映了非合作博弈的根本特征，體現(xiàn)了個(gè)人理性與集體理性的矛盾。兩寡頭企業(yè)選擇產(chǎn)量的博弈就是囚徒困境問題在經(jīng)濟(jì)學(xué)上的應(yīng)用。若兩企業(yè)聯(lián)合形成卡特爾，選擇壟斷利潤最大化的產(chǎn)量，每個(gè)企業(yè)都能得到更多利潤。但卡特爾協(xié)定不是納什均衡，給定對(duì)方遵守協(xié)議，每個(gè)企業(yè)都有增加產(chǎn)量的沖動(dòng)，最后每個(gè)企業(yè)只能得到納什均衡產(chǎn)量的利潤，它嚴(yán)格小于卡特爾產(chǎn)量下的利潤。

在某類博弈中，每個(gè)理性人都不能猜出對(duì)方的策略，參與人是以一定的概率選擇某種策略的，這樣的策略稱為混合策略，相應(yīng)的均衡稱為混合策略納什均衡。純策略是混合策略的特例。相關(guān)的例子有日常生活中的打撲克、劃拳等。

三、治理河流污水排放的制度設(shè)計(jì)

環(huán)境保護(hù)，人人有責(zé)，限制企業(yè)的污水排放符合社會(huì)各界的呼聲。檢查和制止排污是政府的職責(zé)，對(duì)于以利潤最大化為目標(biāo)的企業(yè)，其一直采取各種措施盡可能降低生產(chǎn)成本。政府和企業(yè)間的關(guān)系可用經(jīng)濟(jì)學(xué)中的監(jiān)督博弈來解釋。

該博弈的參與者是政府和企業(yè)，政府的策略選擇是檢查或不檢查，企業(yè)的策略選擇是排污或不排污。假設(shè)是企業(yè)治理污水（不排污）增加的生產(chǎn)成本，若排污，為自己多得的收益。是政府檢查所需成本。是政府對(duì)企業(yè)排污的罰款金額。是企業(yè)排污對(duì)社會(huì)利益的損害。假設(shè)且，即政府對(duì)排污企業(yè)采取重罰措施。對(duì)應(yīng)不同策略組合的得益矩陣可見下表。

政府和企業(yè)的得益矩陣

在以上假設(shè)條件下，政府和企業(yè)都猜不出對(duì)方會(huì)采取何種策略，因而不存在純策略納什均衡，只能求解混合策略納什均衡。如果假定條件不成立，通過劣策略剔除可得到占優(yōu)策略，即（檢查，不排污）或（不檢查，排污）為占優(yōu)均衡。

在得益矩陣中，用表示政府檢查的概率，表示企業(yè)排污的概率。給定，政府檢查和不檢查的期望收益分別為：

由，得。即如果企業(yè)排污概率小于，政府的最優(yōu)選擇是不檢查；如果大于，政府的最優(yōu)選擇是檢查；如果等于，政府隨機(jī)地選擇檢查或不檢查。

政府的最終目標(biāo)是降低企業(yè)排污概率并保護(hù)環(huán)境。據(jù)的結(jié)果，有兩種措施：一是增大分母，即采取重罰措施，使企業(yè)平日不敢排污；二是減小分子，即降低檢查成本。現(xiàn)階段可行做法是設(shè)立舉報(bào)電話，避免政府盲目檢查，提高辦事效率。

再者，給定，企業(yè)選擇排污和不排污的期望收益分別為：

由得，即如果政府的檢查概率小于，企業(yè)的最優(yōu)選擇是排污。現(xiàn)實(shí)中，政府對(duì)排污的懲罰越重，企業(yè)因排污獲得的收益越低，企業(yè)的排污概率就越小。反之，企業(yè)的排污概率就越大。

企業(yè)因排污獲得收益的大小，政府難以準(zhǔn)確把握。前面談到的企業(yè)都是以利潤最大化為目標(biāo)的企業(yè)，適于民營企業(yè)。現(xiàn)實(shí)中大多排污者是國有企業(yè)，這就涉及企業(yè)經(jīng)營的控制權(quán)收益問題。企業(yè)因排污獲得的生產(chǎn)成本降低部分可以很容易轉(zhuǎn)化為企業(yè)經(jīng)營者的控制權(quán)收益，這些收益包括獎(jiǎng)金、福利或者因企業(yè)效益上升而帶來的升遷機(jī)會(huì)。反過來，如果企業(yè)因?yàn)榕盼鄱芰P，經(jīng)營者并沒有控制權(quán)損失，因?yàn)榱P款由企業(yè)出，經(jīng)營者只是沒有控制權(quán)收益而已。

四、小結(jié)

本文以納什均衡為理論基礎(chǔ)，分析了純策略納什均衡和混合策略納什均衡在經(jīng)濟(jì)生活中的應(yīng)用。但本文探討的只是博弈論中一個(gè)很小的方面，對(duì)均衡問題中的子博弈精煉納什均衡等沒有涉及到，但它們的應(yīng)用也很廣泛。在日常經(jīng)濟(jì)生活中，小到購物時(shí)的討價(jià)還價(jià)，大到企業(yè)間的競爭與合作、國家間的傾銷與反傾銷等，都可歸結(jié)為博弈問題。

參考文獻(xiàn)：

博弈最優(yōu)策略

博弈最優(yōu)策略范文第1篇

博弈最優(yōu)策略范文第2篇

博弈最優(yōu)策略范文第3篇

博弈最優(yōu)策略范文第4篇

博弈最優(yōu)策略范文第5篇

相關(guān)推薦更多

熱門文章排行更多

相關(guān)期刊更多

邏輯學(xué)研究

管理工程學(xué)報(bào)

供應(yīng)鏈管理

精品文章排行更多