Gisulat ni: CB Garcia ug WI Zangwill

Ang mga propesor sa Management Science sa Booth School of Business (parehong retirado)

Gibag-o nga Agosto 18, 2018 gikan sa (Garcia ug Zangwill [8, 9]).

keywords: Teorya sa dula, suliran sa magbalantay sa bilanggoan, bayesian, mga posibilidad nga subjective

abstract: Von Neumann ug Morgenstern (VNM), gamit ang gilauman nga hypothesis sa utility, naghatag sukaranan nga pagporma sa problema sa teorya sa dula. Hinuon, sa niining puntoha, lisud nga masulbad ang pormulasyon nga wala gipahamtang ang dugang nga mga hunahuna. Kinahanglan nga hunahunaon ni Nash nga ang mga magdudula madunot aron ang kalagmitan sa magdudula Ang usa ka aksyon nga independente sa posibilidad nga magdala ang usa ka aksyon B. Sa kini nga papel atong gitangtang ang mga pangisip ni Nash, lakip ang usa ka hunahuna nga ang mga estratehiya sa mga magdudula mao ang sagad nga kahibalo, ug gihimong usa ka modelo nga hingpit nga katumbas sa kinatibuk-ang problema sa VNM. Ang dali namon nga natunaw nga pagmumula nagwagtang sa pipila sa mga napanag-iya nga mga kalisud sa pamaagi sa Nash, nga kanunay nga naghimo og magkasumpaki ug kontra-pugong nga mga sangputanan, sama pananglit, sa dilema sa bilanggoan, dula sa manok, parapox sa Newcomb, paghusay sa stag ug daghang uban pang mga dula. Pananglitan, pinaagi sa pagpaubos sa panagsama sa independensya sa independensya ni Nash sa dilema sa bilanggoan, gipakita sa among modelo nga ang mga magdudula nakakab-ot nga labing maayo nga bayad, ug aron makab-ot kana, dili nila kinahanglan nga magdula o mag-komunikasyon, apan ipatuman ang teyema sa Bayes, sa estilo sa (Harsanyi [10]; Kadane ug Larkey [11]). Ang among pamaagi gibahin ang posibilidad sa wanang sa duha nga katunga nga wanang o mga rehiyon, kansang paryente nga sukod nagdepende sa bayad. Karon, dili kinahanglan nga banabanaon ang posibilidad sa tukma, apan hibal-i lamang kung unsa ang rehiyon nga naa niini. Naghatag kini hinungdanon nga mga bentaha sama sa, kung ang usa ka rehiyon labi ka dako sa lain, kini dayon naghatag og daghang panan-aw kung giunsa ang pagdula sa dula. Ang among kinatibuk-ang solusyon, nga wala gikanselar, giingon sa kahulugan nga Aumann [1], naglangkob sa Nash equilibria ingon piho nga mga solusyon. Sukwahi sa gihubit nga mga solusyon sa Nash, ang among solusyon usa ka pares nga preskriptibo sa mga pangatarungan-nga gilauman nga mga estratehiya, nga naghatag usa ka bag-ong pundasyon alang sa teorya sa dula. Gipaabut namon ang among pamaagi sa kinatibuk-ang mga dula nga M-Pers, ingon nga among gihulagway sa dula nga rock-paper-gunting ug problema sa bar-uwak.

Katingbanan sa mga Resulta.

Karon among ipunting ang pila ka mga resulta, pinasukad sa mga detalye ug mga tin-aw nga pagbayad nga gihatag sa ubos. Kami nagtuo nga ang kini nga mga resulta nagpakita sa kantidad sa among pamaagi sa pagtudlo ug panukiduki tungod kay ang mga sangputanan kanunay nagpresentar sa bag-ong mga solusyon.

Dula sa koordinasyon: Ang panagway sa Nash sa kagawasan naglikay sa labing maayo nga pamaagi sa Bayesian nga atong gihimo. Alang sa gihatag nga bayad, idula ang una nga estratehiya kung nagtuo ka nga ang posibilidad sa kontra sa pagdula sa una nga pamaagi niini mao ang labing menos 1 / 3, lain ang magdula sa ikaduha nga estratehiya. Ang Nash wala maghatag mga panan-aw bahin kung kanus-a gamiton ang estratehiya. Ingon usab, kung ang pagbayad gibag-o, ang among pamaagi naghatag sa giusab nga mga kalagmitan sa kalagmitan. Gubat sa mga sekso: Duha ka partido magkalainlain kung diin sila kinahanglan moadto, apan dili gitugutan nga makig-istorya. Ang duha nga partido nakakuha og maayong bayad kung pareho silang moadto sa parehas nga kapilian, tungod kay parehas sila nga mag-uban. Ang usa ka gihatag nga partido makakuha og usa ka bonus kung silang duha moadto sa kapilian sa kana nga partido. Dili usab makakuha us aka maayong suweldo kung moadto sila sa lainlaing mga lugar. Gipasabut sa pagbayad nga gipresentar sa ubos, kinahanglan nga magdula ang player A sa gusto niini nga diskarte kung nagtuo kini nga ang ubang magdudula magpili usab sa gusto nga kapilian nga A nga adunay posibilidad nga labing menos 33%. Sa kasukwahi, naghatag si Nash og tulo nga equilibria nga wala’y panabot kung diin ang pagdula kung kanus-a ug wala’y pagtuki sa mga kalagmitan. Pagpares sa mga pennies: Duha ka magdudula, Bisan ug Talagsa, dungan nga nagpadayag sa usa ka sentimento. Kung ang mga pennies magkatugma, Bisan ang nagbantay sa duha nga mga pen; kung dili, gitago sa Odd ang duha ka mga pene. Ang talagsaon nga balanse sa Nash alang sa dula nga zero-sum alang sa duha nga mga magdudula nga magdula nga random. Gipasabut sa pagbayad sa ubos, Bisan kinahanglan magdula ulo kung nagtuo kini nga ang Odd magdula mga ulo nga adunay posibilidad nga labing menos 50%. Sa pikas bahin, ang mga Odd kinahanglan nga magdula mga ulo kung nagtuo nga Bisan ang magdula sa mga ulo nga adunay posibilidad nga kadaghanan sa 50%. Dula sa manok: Duha ka awto ang nag-agay padulong sa usag usa ug hapit na maigo ang head-on. Gisugyot ni Nash nga ang usa ka awto kinahanglan mag-agay ug ang usa diretso, apan naghatag gamay nga panabut kung diin kinahanglan magsalimo. Tungod sa mga pagbayad sa ubos, ang among pamaagi nagsugyot kanimo nga magbantay kung mituo ka nga ang kaatbang mag-swat nga adunay posibilidad nga kadaghanan sa 90%, adto dayon. Matikdi dinhi nga ang duha nga mga magdudula nag-swending (o pareho nga diretso) dili usa ka balanse nga Nash apan ang duha nga mga magdudula nag-swak (o pareho nga diretso) sa pagpaabut nga ang kaatbang diretso (o mag-swender) usa ka senaryo sa balanse. Ingon usab, kung ang pagbayad gibag-o, ang among pamaagi naghatag og na-update nga mga posibilidad. Lahi sa Arms: sa matag nasud sa una nga stockpiles armas aron dili kini maatake. Apan sama sa gipakita sa ilawom, ang pagkunhod sa mga pagbalik sa mga bukton nga nagkakusog, nagbukas sa higayon alang sa usa ka kasabotan sa kalinaw. Dili gipaila ni Nash ang oportunidad alang sa kasabutan sa kalinaw. Stag hunting: hunong sa stag kung motoo ka nga ang kaaway ang mangayam sa stag nga adunay posibilidad nga labing menos 50%, kung kinsa ang mangayam. (Ang putli nga Nash equilibria alang sa pareho nga mangayam sa stag, o alang sa duha nga mangayam sa liyenda). Ang suliran sa Newcomb: kung ang problema sa Newcomb ingon nga suliran sa bilanggoan, ang solusyon sa problema sa Newcomb mahimong moabut sa duha nga mga paagi: ingon nga ang dili-kooperatiba nga Nash equilibrium gamit ang dominasyon nga prinsipyo, o ingon usa ka solusyon sa kooperatiba nga gigamit ang gipaabut nga hypothesis sa utility. Ang dula nga rock-gun-gunting: Ang balanse nga Nash alang kanimo aron magdula sa usa ka 3 nga bahin nga mamatay sa tinuud. Ang makita nga usa ka bag-ong estratehiya alang sa kini nga karaan nga dula alang kanimo nga magdula og bato kung nagtuo ka nga ang imong kontra magdula papel nga adunay posibilidad nga kadaghanan sa 33% ug gunting nga adunay posibilidad nga labing menos 33%; pagdula papel kung nagtuo ka nga ang imong kontra magdula gunting nga adunay posibilidad nga kadaghanan sa 33% ug bato nga adunay posibilidad nga labing menos 33%; lain pa nga magdula gunting. (Ang among pamaagi mahimo’g matabangan ka kung moingon, ikaw adunay mga datos sa una nga mga dula sa imong kaatbang.) Ang dula sa bar-uwak adunay mga higala sa 3 A, B, ug C: Bisan kinsa nga moadto sa bar nga nag-inusara makakuha og wala - ang pagpabilin sa balay usa ka labi ka maayo nga pagpili. Kung ang duha nga mga higala moadto sa bar, kana mao ang labing kaayo nga kapilian. Kung ang tanan nga tulo moadto, ang bar gilabog sa tanan nga tulo. Ang Nash equilibria alang sa tanan nga magpabilin sa balay, o alang sa tanan nga magdula sa ilang una nga pamaagi nga adunay posibilidad nga managsama sa 33%. Apan kung adunay bisan unsang panabut sa imong mga higala ug matantes ang mga posibilidad sa Bayesian sa ilang batasan, makatabang ang among pamaagi.

Gipaabut usab namon ang among pamaagi sa dula sa M-person ug makakuha og parehas nga mga panabut. Pananglitan, gipakita namon ang kompleto nga solusyon alang sa kinatibuk-ang mga dula nga 2-tawo ug sa kinatibuk-ang mga dula nga 3 x 2 nga mga dula.

Ang Gilauman nga Utility Hypothesis.

Sa usa ka dula nga 2-Person, hatagan ang mga magdudula nga A ug B nga mga diskarte sa 2: A1 o A2 alang sa player A, ug B1 o B2 alang sa player B.

Ang sukaranan sa gipaabut nga teorya sa utility mao ang von Neumann - Morgenstern utility teorem (von Neumann ug Morgenstern [20]): himoa nga si Aij ug Bij ang magbayad sa mga magdudula A ug B sa tinuud kung ang magdudula nga A magdula Ai ug magdudula nga si B ang Bj, alang sa ako , j = 1 o 2. Ang gipaabut nga gamit sa hypothesis nag-ingon nga ang mga magdudula A ug B kinahanglan nga mapataas ang ilang gilauman nga pagbayad1:

diin ang pA (Ai ug Bj) mao ang posibilidad sa player A nga ang A nagdula Ai ug B nagdula sa Bj, ug ingon usab alang sa player B.

Mga Posibilidad sa Kondisyon[1].

Alang sa among pamaagi, kami pagtulo Sa hunahuna ni Nash nga ang mga kalagmitan sa mga magdudula managsama nga independente. Gitugotan niini ang among problema (1) nga mahimong labi ka kadaghanan ug makakuha dugang nga mga solusyon nga makatagbaw sa gipaabot nga gamit sa hypothesis.

Hatagan ang EP (A | Ai) ug EP (B | Bj) nga gipaabot nga bayad[2],[3] sa A ug B sa tinuud nga gihatag nga ang A nagdula Ai ug B nagdula Bj, alang sa i, j = 1, 2:

Magsugod kita pinaagi sa pagsulay elementarya nga "Bayesian" teorema sa mga dula nga nagpakita sa katumbas sa atong pamaagi sa paghimo sa VNM:

Ang teorema 1[5]. Ang mga problema (3) sa ubos katumbas sa mga problema (1)[6]:

Pagpamatuod. Pinaagi sa teyema ni Bayes,

Dayon,

Ang labing kadaghan[7] sa ekwasyon sa itaas mao ang pA (A1) = 1 (ie, estratehiya sa pagdula A1) kung EP (A | A1) ≥ EP (A | A2), o pA (A1) = 0 (ie, pamaagi sa pagdula A2) kung EP ( A | A1) EP (A | A2). Tungod niini, ang 3) naghupot alang sa player A. Ang usa ka susama nga argumento naghupot alang sa player BQED

Mga Regions sa VNM.

Tinoa ang mga rehiyon sa VNM nga A1 ug A2 nga mahimong mga convex polytopes:

Ingon sa gipakita sa ubos, Ang A kinahanglan nga magdula nga diskarte A1 kung gilauman nga ang B naa sa rehiyon A1. Kung dili, kinahanglan nga magdula ang A2. Ang linya sa balanse

gibulag ang kalagmitan sa kalagmitan sa duha nga mga rehiyon ug naghatag usa nga makita nga makatabang nga paagi sa pag-analisar sa kahimtang[8].

Kahinungdanon sa mga Rehiyon: Ang duha ka mga rehiyon hinungdanon nga praktikal, tungod kay dili kinahanglan matagna ang usa ka posibilidad nga sigurado, apan hibal-an kung hain sa duha nga mga rehiyon ang naa niini. Kanunay, makita nga ang una nga posibilidad nga lagmit nga naa sa usa ka rehiyon , ug pag-ila sa kana nga rehiyon mao ang igo nga kasayuran aron isugyot ang angay nga dula sa dula. Pananglitan, pananglitan ang rehiyon A1 labi ka dako kaysa sa lain, mao nga ang posibilidad lagmit nga naa sa rehiyon nga A1. Naghatag kini nakapadasig nga kasayuran nga ang magdudula sa A mahimo nga magdula A1.

Talagsaon alang sa B:

Ang mga rehiyon sa VNM nagsalig sa nauna nga pag-apod-apod sa mga posibilidad sa mga magdudula, nga sagad gitawag nga mga priors (Jaynes [13]; Harsanyi [10]; Kadane ug Larkey [11]), nga mao ang ekspresyon sa mga magdudula sa mga magdudula bahin sa posibilidad nga pag-apod-apod sa ang ilang kontra. [9]

Corollary 2. Gihatag (3), Usa ka estratehiya sa dula nga A1 kung ug kung gipaabut ra ang magdudula nga B ang anaa sa rehiyon sa VNM A1. Ingon pa, Usa ka pamaagi sa pagdula A2. Sa susama, ang estratehiya sa B nagdula sa B1 kung ug kung gipaabut ra ang player A nga maanaa sa VNM nga rehiyon B1. Ingon pa, B nagdula sa diskarte B2.

Pagpamatuod. EP (A | A1) ≥ EP (A | A2) kung ug kung A1 lamang1 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) kung ug mao ra kung (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Sa susama, EP (B | B1) ≥ EP (B | B2) kung ug kung ang B1 lang1 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) kung ug mao ra kung (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Gikan sa Theorem 1 ug Corollary 2, alang sa mga puntos sa mga rehiyon (5) ug (7), ang gilauman nga paggamit sa hypothesis, ie, ang mga rehiyon sa VNM nagpatin-aw sa kinatibuk-ang solusyon sa dula sa 2-Person[10].

Nash Equilibrium.

Kung ang mga kalagmitan sa mga magdudula managsama nga independente, ang mga VNM nga rehiyon dali nga:

Proposisyon 3. Pananglit usa ka Nash equilibrium (p (A1), p (B1)) naa sa rehiyon sa VNM Ai ug VNM nga rehiyon Bj, alang sa pipila i, j = 1, 2. Pagkahuman, ang magdudula A magdula sa estratehiya Ai ug ang magdudula nga B magdula nga diskarte

Gipasalig ni Bj.

Pagpamatuod. Ang problema sa balanse sa Nash mao ang problema (1), kung diin pA (Ai at Bj) = pB (Ai at Bj) = p (Ai) p (Bj), o problema (3), diin pA (Bj | Ai) = p (Bj ) ug pB (Ai | Bj) = p (Ai), alang sa i, j = 1, 2. Sa ingon, ang Corollary 2 naghupot, diin ang mga rehiyon sa VNM gihubit sa (8), alang sa pA (B1) = p (B1) ug pB (A1) = p (A1). QED

Hinumdomi nga ang mga ekwilyang ekwilibrium

bulag sa mga rehiyon sa VNM, sa ingon naghatag sang kinatibuk-ang solusyon sa bisan unsang dula. Ang parehas nga equilibrium equilibrium, kung diin ang pB (A1) = p (A1) ug pA (B1) = p (B1), nag-ani sa gisagol nga managsama nga Nash equilibrium11, ingon sa gipakita naton sa lamesa sa ubos.

Proposisyon 4. Gihatag sa bisan unsang dula A = [[A11, A12], [A21, A22]] ug B = [[B11, B12], [B21, B22]], ang Nash equilibria alang sa dula nakalkula gikan sa magamit nga laray sa Table 112.

Pagpamatuod. Matikdi nga (i, j) usa ka lunsay nga balanse sa Nash kung ug kung sgn (2i - 1) * (A11 - A21)> 0 ug sgn (2j - 1) * (B11 - B12)> 0, para sa ako, j = 0, 1. Gamit ang kini nga kamatuuran, alang sa matag laray sa Table 1, gilista namon ang tanan nga mga pares (i, j) nga puro nga Nash equilibria.

Sa katapusan, alang sa pares (a, b) nga gipasabut sa (9) nga usa ka sagol nga balanse sa Nash, kinahanglan naton ipakita lamang nga ang 0 <a <1 ug 0 <b <1. Apan timan-i nga alang sa mga laray nga 6, 7, 10 ug 11 sa Table 1, ang numumer ug denominator sa a, 1 - a, b o 1 - b pareho positibo o pareho negatibo; busa usa ka, 1 - a, b, 1 - b ang tanan labaw sa 0. QED

Panig-ingnan nga Iterated Dominance[13].

Pasagdi ang A = [[2, 2], [3, 1]] ug B = [[0, 1], [0, 2]]. Ang "Play A1 & B2" mao ang balanse sa Nash.

Proposisyon 5. Gihatag A = [[2, 2], [3, 1]] ug B = [[0, 1], [0, 2]], unya ang magdudula nga A magdula sa A1 ug ang magdudula nga B magdula sa B2.

Pagpamatuod. Ang rehiyon sa VNM A1 mao ang: pA (B2 | A2) ≥ 1 / 2, ug ang rehiyon sa VNM B2 mao: pB (A2 | B2) ≥ -1. Busa, ang magdudula B magdula sa B2. Nahibal-an usab sa Player A nga kini ang hinungdan, busa pA (B2 | A2) = 1. Tungod kay ang pA (B2 | A2) = Ang 1 usa ka punto sa rehiyon sa VNM A1, ang magdudula nga A adunay usa ka A1. QED

Panig-ingnan sa Koordinasyon.

Tugoti ang A = B = [[2, 0], [0, 1]]. Adunay mga punto sa balanse nga 3 Nash: "pagdula A1 & B1", "pagdula A2 & B2", ug "dula nga A1 (o B1) nga adunay posibilidad nga 1 / 3". Ang rehiyon sa VNM A1 mao: 2pA (B1 | A1) ≥ pA (B2 | A2) ug ang rehiyon sa VNM B1 mao ang: 2pB (A1 | B1) ≥ pB (A2 | B2). Pinaagi sa pag-analisar niining mga rehiyon sa VNM nga biswal, ang A ug B lagmit mopili sa mga pamaagi nga A1 ug B1.

Proposisyon 6. Gihatag A = B = [[2, 0], [0, 1]], kung ang mga probabilidad sa mga magdudula managsama nga independente, dayon dulaon ang una nga estratehiya kung nagtuo ka nga ang posibilidad sa kalaban sa pagdula sa una nga estratehiya niini labing menos 1 / Ang 3, lain ang nagdula sa ikaduhang pamaagi.

Pagpamatuod. Ang rehiyon sa VNM A1 mao ang: pA (B1) ≥ 1 / 3 ug VNM nga rehiyon B1 mao: pB (A1) ≥ 1 / 3. QED

Gubat sa Panig-ingnan sa Sekso.

Pasagdi ang A = [[3, 1], [1, 2]] ug B = [[2, 1], [1, 3]]. Adunay mga punto sa balanse nga 3 Nash: "pagdula sa A1 & B1", "pagdula A2 & B2", ug "dula nga A1 nga adunay posibilidad nga 2 / 3, pagdula sa B1 nga adunay posibilidad nga 1 / 3". Ang rehiyon sa VNM A1 mao: 2pA (B1 | A1) ≥ pA (B2 | A2) ug ang rehiyon sa VNM B1 mao ang: pB (A1 | B1) ≥ 2pB (A2 | B2). Usa nga labi pa nga mopili sa A1 ug ang B labi nga mopili sa B2.

Proposisyon 7. Gihatag A = [[3, 1], [1, 2]] ug B = [[2, 1], [1, 3]], kung ang mga kalagmitan sa mga magdudula managsama nga independente, nan: dulaon ang A1 kung pA (B1 ) ≥ 1 / 3, lain nga magdula A2; dulaon ang B1 kung pB (A1) ≥ 2 / 3, lain ang magdula sa B2.

Pagpamatuod. Ang rehiyon sa VNM A1 mao: pA (B1) ≥ 1 / 3 ug ang VNM nga rehiyon B1 mao: pB (A1) ≥ 2 / 3. QED

Panig-ingnan nga panig-ingnan sa Pennies.

Tugoti ang A = [[1, -1], [-1, 1]] ug B = [[-1, 1], [1, -1]]. Ang dula nga zero-sum adunay sinagol nga balanse sa Nash: "dula ang A1 nga adunay posibilidad nga 1 / 2, pagdula sa B1 nga adunay posibilidad nga 1 / 2".

Proposisyon 8. Gihatag A = [[1, -1], [-1, 1]] ug B = [[-1, 1], [1, -1]], kung ang mga kalagmitan sa mga magdudula managsama nga independente, dayon: dulaon ang A1 kung pA (B1) ≥ 1 / 2, lainon magdula A2; pagdula B1 kung pB (A1) Ang 1 / 2, lain magdula sa B2[14].

Pagpamatuod. Ang rehiyon sa VNM A1 mao: pA (B1) ≥ 1 / 2 ug VNM nga rehiyon B1 mao ang: pB (A1) 1 / 2. QED

Panig-ingnan sa Game sa Manok (Sugden [19]).

Pasagdi ang A = [[0, -1], [1, -10]] ug B = [[0, 1], [-1, -10]]. Ang Nash equilibria mao ang "play A1 (swerve) & B2 (deretso)", "play A2 (deretso) & B1 (swerve)" ug "play A1 (B1) nga adunay posibilidad nga 0.9".

Proposisyon 9. Sa dula sa manok, kung ang mga kalagmitan sa mga magdudula managsama nga independente, nan: pag-swend kung nagtuo ka nga ang kaatbang maggawas nga adunay posibilidad nga labing kadaghan nga 90%, lainon nga diretso.

Pagpamatuod. Ang rehiyon sa VNM A1 mao: pA (B1) + 11pA (B2) ≥ 2, o pA (B1) ≤ 9 / 10. Ingon usab, ang rehiyon sa VNM B1 mao: pB (A1) ≤ 9 / 10. QED

Timan-i nga kung ang imong kaatbang nagpakita labi ka kadasig (labing menos 90%) nga magdagan, nan kinahanglan nga diretso ka.

Ang pinalabi nga senaryo: Ang mga magdudula mas lagmit nga magtuyok kay sa pagdiretso.

Sitwasyon sa manok: Pananglit ang pA (B1) = pB (A1) = 0. Ang duha nga magdudula nagpaabut nga ang lain nga magdudula direkta. Parehas silang duha.

Senaryo sa katalagman: Pananglit ang pA (B1) = pB (A1) = 1. Ang duha nga mga magdudula naglaum nga ang lain nga magdudula mag-agay. Parehas silang diretso[15].

Ang senaryo sa nash equilibria: Pananglit ang pA (B1) = 1 - pB (A1), ug pB (A1) = 0 o 1. Ang magdudula nga nagpaabut nga ang uban nga magdudula diretso, ug ang magdudula nga gipaabut ang ubang magdudula moliko dayon.

Panig-ingnan sa Lumba sa Panudlo

Sa Proposisyon 9, hatagan ang A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], para sa x, y ≥ 0. Tugoti ang A1 o B1 nga "pangitaa ang kalinaw" ug ang A2 o B2 mahimong "atake sa nukleyar". Ang mga kantidad x ug y nagpasabut sa stockpile sa armas sa B ug A matag usa.

Gipangita sa nasud ang kalinaw kung ang posibilidad nga ang pag-atake sa nasud labi ka labi sa 1 / (9x + 1); kung dili ang Pag-atake. Ang probabilidad nga kurba pA (B1) = 1 / (9x + 1) mahulog dayon, sama pananglit, pA (B1) = 1 / 2 sa x = 1 / 9, apan sa wala madugay daghang mga flattens: B kinahanglan nga dali nga stockpile sa una, apan ingon ang kurba mga flattens, wala’y gamay nga kaayohan sa B alang sa stockpiling arm.

Ug parehas alang sa nasud B.

Sa katingbanan, ang matag nasud sa una nga stockpiles armas aron dili kini maatake. Apan ang paspas nga pagkunhod sa pagbalik sa mga stockpiling arm nga materyalisado, nagbukas sa usa ka higayon alang sa pagpangita sa usa ka kasabutan sa kalinaw.

Ingon paghulagway, hunahunaa ang gibanabana nga 2018 nga global nukleyar nga stockpile[16] sa Talaan 2.

Pinasukad sa pagbayad sa taas ug sa Table 2, ang usa ka makatarunganon nga North Korea kinahanglan nga mangayo usa ka kasabotan sa kalinaw sa Estados Unidos ug Russia.

Mga Skyrms [16]).

Pasagdi ang A = [[4, 1], [3, 2]] ug B = [[4, 3], [1, 2]]. Ang Nash equilibria mao ang "play A1 (Stag) & B1 (Stag)", "play A2 (Hare) & B2 (Hare)" ug "dula nga A1 (B1) nga adunay posibilidad nga 0.5".

Proposisyon 10. Sa hunta sa stag, kung ang mga kalagmitan sa mga magdudula managsama nga independente, unya: hunong nga stag kung mitoo ka nga ang kaaway ang mangayam sa stag nga adunay posibilidad nga labing menos 50%, kung kinsa ang mangayam.

Pagpamatuod. Ang rehiyon sa VNM A1 mao: 3pA (B1) + pA (B2) ≥ 2, o pA (B1) ≥ 1 / 2. Ingon usab, ang rehiyon sa VNM B1 mao: pB (A1) ≥ 1 / 2. QED

Dilemma sa Bilanggoan[17].

Tugoti ang A12 <A22 <A11 <A21, ug hatagan ang B katumbas sa transposyon sa A. Sukad A11 <A21 <A12, ang paggamit sa lagda nga pangagamhanan naghatag sa Nash equilibrium, nga mao ang solusyon nga dili kooperatiba nga "play A22 (kakulangan) ug B2 (depekto) ”. Apan tungod kay A2 <A22, mas maayo ang A ug B kung pareho nilang ipatugtog ang solusyon sa kooperatiba nga "play A11 (hilom) ug B1 (kahilom)".

Proposisyon 11. Sa dilemma sa bilanggoan, kung ang mga kalagmitan sa mga magdudula managsama nga independente, nan ang mga magdudula dili magdugtong[18].

Pagpamatuod. Hunahunaa ang wala nga bahin sa kilid sa rehiyon sa VNM A1:

(A11 - A12 - A21 + A22) pA(B1) + A12 - A22.

Kung A11 - A12 - A21 + A22 ≤ 0, nan (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Sa laing bahin, kung A11 - A12 - A21 + A22> 0, nan (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Sa ingon, alang sa bisan unsang nauna alang sa player A, ang rehiyon sa VNM A1 mao ang null set, busa kinahanglan nga magdula kini nga diskarte 2.

Sa susama, ang magdudula nga B kinahanglan magdula nga diskarte 2. QED

Ang Proposisyon 11 tin-aw nga nagpakita nga ang pangisip nga independensya nagpugong kanato sa dili kooperatiba nga solusyon.

Panig-ingnan sa Suliran sa Klasikal nga Prisoner.

Sa suliran sa klasikal nga bantay sa bilanggoan, ang A = [[-1, -3], [0, -2]] ug B = [[-1, 0], [-3, -2]].

Proposisyon 12. Sa suliran sa klasikal nga bantay sa bilanggoan, kung ang prayoridad sa mga magdudula mao: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3) ang mga magdudula magdula sa kooperatiba nga solusyon2.

Pagpamatuod. Ang rehiyon sa VNM A1 mao ang: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, ug ang rehiyon sa VNM B1 mao: pB (A1 | B1) pBB (A2 | Busa, alang sa gihatag nga mga nag-una, ang mga magdudula nga A ug B kinahanglan magdula nga solusyon sa kooperatiba. QED

Sa Proposisyon 12, timan-i ang taas nga bar nga gikinahanglan alang sa pagdula nga solusyon sa kooperatiba. Mas gusto sa mga magdudula nga magdula sa dili kooperatiba nga solusyon.

Usa ka Kahimtang diin Ang Pagpangita sa Nash Gikinahanglan nga Hunahunaon ang Dula sa kooperatiba nga pamaagi.

Tagda ang suliran sa prisohan diin ang A11 - A12 = A21 - A22, A21 = A11 + m ug A22 = A11 - M, diin ang m> 0 gamay ug M> 0 dako kaayo. Pananglitan, A = [[100, -3], [101, -2]]. Hinumdomi gikan sa Proposisyon 11 nga kung ang mga kalagmitan sa mga magdudula managsama nga independente, nan ang mga magdudula magdula nga dili magtinabangay.

Dayag nga, mahimo’g binuang alang sa mga magdudula nga dili usab gikonsiderar ang diskarte sa pagdula 1 sanglit kung ang magdudula magdula sa 2, ang higayon nga ang ubang magdudula usab magdula 2 magpatunghag hinungdanon nga pagkawala, busa ngano peligro kini. Tin-aw, ang pamaagi sa Nash napakyas nga hunahunaon ang pagdula sa kooperatiba nga solusyon bisan kung kini mao ang klaro nga solusyon nga dulaon - usa ka hinungdanon nga punto sa giingon, mga panaghisgot sa mga pagkahugno sa merkado sa mga kinatibuk-ang mga modelo sa balanse sa ekonomiya.

Sa pikas bahin, ingon sa gipakita sa sunod nga panukiduki, pinaagi sa pagpahunong sa pagsalig sa independensya, ang atong pamaagi magdula sa kooperatiba nga solusyon inay ang dili kooperatiba nga solusyon.

Ang itom nga linya mao ang linya sa pagkawalay hinungdan alang sa mga problema sa klasikal nga prisohan. Ang usa ka magdudula lagmit nga magdula estratehiya 2 tungod sa dili malamang nga posibilidad nga naa sa rehiyon alang sa pagdula pamaagi

1.

Ang berde nga linya mao ang linya sa pagkawalay hinungdan alang sa kini nga okasyon sa problema sa bilanggoan: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Dinhi, ang gidak-on sa probabilidad nga rehiyon alang sa estratehiya 1 hapit kana alang sa estratehiya 2. Ang among pamaagi mao ang pagtambag sa mga magdudula nga ikonsiderar ang estratehiya sa pagdula 1.

Proposisyon 13. Gihatagan ang dilema sa prisohan diin ang A11 - A12 = A21 - A22, A21 = A11 + m ug A22 = A11 - M, diin m> 0 gamay ug M> 0 daghan kaayo, ang mga magdudula A ug B ang magdula sa kooperatiba nga solusyon20.

  • Busa, ang mga magdudula dili magdula nga solusyon sa dili kooperatiba.
  • Karon, aron maabot ang solusyon sa kooperatiba, nadugangan ang mga panagsama, eg, nakatali nga pagkamakatarunganon, dili kompleto nga kasayuran (Aumann and Maschler [2]; Acevedo ug Krueger [4]; Daley Given A nga gipaabut nga managsama nga mga probabilidad sa pA (Ai ug Bj), Usa nga nagtapos nga Ang pA (A1 ug B1) kinahanglan nga duol sa 1.Kana tungod kay ang A ug B lagmit nga magdula sa estratehiya 1, diin ang ilang kabaylohan taas kaayo ug mga yunit nga dili kaayo taas.

Busa, ang pA (B1 | A1) = pA (A1 ug B1) / pA (A1) kinahanglan usab nga duol sa 1.

Ang usa usab nahinapos nga pA (A2 ug B2) pA (A2 ug B1) tungod kay ang B mao ang likelier sa pagdula nga diskarte 2 kung ang A mao ang pagdula nga diskarte 2. Mao nga pA (B2 | A2) = pA (A2 ug B2) / (pA (A2 ug B1) + pA (A2 ug B2)) 1 / 2. Ang usa ka panapos, gamit ang Fig. 1, nga ang B igo sa sulod sa VNM nga rehiyon A1. Sa susama, ang B modula pagdula 1. QED

Ang Newcomb's Paradox ingon usa ka Bersyon sa Dilemma sa Prisoner's.

Sa bantog nga kabalhinan sa Newcomb (Wolpert ug Benford [21]), adunay usa ka prediktor nga B, usa ka manlalaro A ug usa ka kahon X. Ang player nga A gihatagan sa pagpili sa pagkuha sa kahon X o ang kahon X dugang $ 1,000. Sa wala pa gihimo ni A ang pagpili niini, gitagna ni B kung unsa ang buhaton sa A, ug hapit na sigurado ang mga panagna ni B. Kung gitagna ni B nga ang A magkuha lamang sa kahon X, nan gibutang sa B ang $ 1,000,000 sa kahon X. Sa kini nga kaso, tungod kay ang kahon adunay usa ka $ 1,000,000, ang A makadawat $ 1,000,000 o $ 1,001,000 depende sa kung gipili sa usa ang kahon X o X dugang $ 1,000. Sa pikas bahin, kung ang B nagatagna nga A kuhaon ang kahon X dugang $ 1,000, nan ang B wala magbutang bisan unsa sa kahon X. Sa kini nga kaso, depende sa gusto niini, ang A makadawat usab sa $ 1,000 o wala.

Ang kabalhinan sa Newcomb mao nga ang duha nga hingpit nga rational nga pag-analisar naghatag mga nagkasumpaki nga mga tubag sa sulud sa pag-optimize sa player A: sa ilalum sa gipaabut nga gamit sa hypothesis, ang player A kinahanglan nga kuhaon lamang ang kahon X, tungod kay ang gipaabut nga pagbayad sa pagkuha sa X labi ka taas. Sa laing bahin, sa ilalum sa prinsipyo sa pagpatigbabaw, ang magdudula nga A kinahanglan nga magkuha kahon X dugang $ $ 1,000.

Ang kabalhinan mas nasabtan sa usa ka agianan sa (Wolpert ug Benford [21]): “… Si Newcomb nag-ingon nga kuhaon lang niya ang X; nganong makig-away sa usa ka sama sa Diyos? Bisan pa, miingon si Nozick, 'Sa hapit tanan, kini hingpit nga klaro ug klaro kung unsa ang kinahanglan buhaton. Ang kalisud mao nga kini nga mga tawo ingon og nagbahin sa managsama nga bahin sa problema, uban sa daghang mga numero nga naghunahuna nga ang nagsupak nga katunga yano ra. '… ”.

Gisulbad ni Wolpert ug Benford ang kabalhinan pinaagi sa pagpakita nga ang problema sa Newcomb sa tinuud nagrepresentar sa duha ka lainlaing mga dula nga adunay lainlaing mga sangputanan sa probabilista.

Niini nga seksyon, masulbad naton ang kabalhinan pinaagi sa pagpakita sa problema sa Newcomb ingon usa ka problema sa prisohan. Sa pagbuhat sa ingon, ang solusyon sa problema sa Newcomb mahimong moabut sa duha nga paagi: ingon ang solusyon nga dili kooperatiba (kuhaa ang kahon X plus $ 1,000) gamit ang prinsipyo sa pangibabaw, o ingon nga solusyon sa kooperatiba (kuhaa lamang ang kahon X) gamit ang gipaabut utility hypothesis.

Pananglit adunay usa ka adunahan nga benefactor nga nagsaad nga pondohan ang usa ka payoff matrix alang sa prediktor B, nga naghatag sa mosunud nga dula: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] ug B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Kung husto ang gitagna ni B, makuha kung unsa ang makuha sa player A. Apan kung ang B naghisgot sa sayup, nakakuha ang B $ 1,001,000 nga minus kung unsa ang A gets21.

Gikan sa Proposisyon 13, ang mga magdudula nga A ug B magtinabangay sa kini nga dula.

Kung sama ni Nash, masulbad sa player ang problema gamit ang sukaranan nga nagpatigbabaw, mao usab ang tagna. Ang managna nga magdudula ug magdudula mahimong anaa sa solusyon nga dili kooperatiba: magkuha X ug $ 1,000. Kung masulbad sa player ang problema gamit ang gilauman nga hypothesis sa utility, mao man usab ang prediktor, ug ang managna nga magdudula ug magdudula mahimong naa sa solusyon sa kooperatiba: kuhaa lamang ang X. Sa bisan unsang kaso, ang prediksyon sa tagna.

ug Sadowski [6]) o bag-ong mga pamaagi gihubit, pananglitan, tit-for-tat, correlated equilibria (Axelrod [3]; Aumann [1]).

Ang 21 Hinumdumi nga pinaagi sa pagpakita sa problema sa Newcomb ingon usa ka problema sa PD, ang taghatag gihatagan usa ka personal nga insentibo nga wala’y problema sa Newcomb.

piho. Sanglit gikan sa Proposisyon 13, ang mga magdudula dili magdula sa solusyon nga dili kooperatiba, nagkauyon kami sa Newcomb nga ang kooperasyon mao ang dayag nga diskarte nga himuon.

Hinumdumi sa Fig. 1, bisan pa, ang rehiyon alang sa kooperasyon ingon us aka gamay nga gamay kaysa sa alang sa dili kooperasyon. Kini dili katingad-an sa kanato kung ang mga tawo managbulag sa managsama kung unsang pamaagi ang pagatumanon.

Usa ka Kinalabasan sa Suliran sa Prisoner sa M-Persons.

Aron mas masabtan kung giunsa ang pagbungkag sa solusyon sa Nash sa kinatibuk-ang mga modelo sa balanse nga pang-ekonomiya, himua naton nga sulud ang suliran sa bilanggoan sa M-Persons, sa matag magdudula nga adunay 2 nga mga estratehiya, alang sa M 2.

Atong isaysay ang dula nga M-Person pinaagi sa mga binhing puno.

Ang Fig. 2 mao ang kantidad sa bayad sa bilanggo alang sa player A. Tree (2, 1) ang punoan nga punoan nga adunay player B (player 2) ingon ginikanan, ug player A (player 1) isip bata. Aron makuha ang bayad sa magdudula B, yano nga i-switch ang mga papel sa ginikanan ug anak ngadto sa Tree (1, 2). Hinumdumi nga alang sa pagkalisang sa bilanggoan, A12 <A22 <A11 <A21.

Sunod, hunahunaon nga Tree (M - 1, M - 2,…, 2, 1) nagpaila sa bayad sa magdudula sa usa ka (M - 1) -Personipikado, alang sa M 3. Paghimo sa player nga A's payoff Tree (M, M - 1,…, 2, 1) alang sa usa ka dula nga M-Person pinaagi sa pagtugot sa player nga A Tree (M - 1, M - 2,…, 2, 1) nga mahimong mga sub nga mga kahoy sa duha. mga sanga sa ginikanan player M.

Ang mga numerikal nga kantidad sa payoff sa tuo nga punoan sa kahoy nga gituohan nga lahi sa naa sa wala nga kahoy nga kahoy, basta ang relasyon nga A12 <A22 <A11 <A21 gipadayon bisan diin sa kahoy.

Sa katapusan, gihatag ang Tree (M, M - 1,…, 2, 1) alang sa player A, paghimo og Tree (1, M, M - 1,…, 3, 2) alang sa player B (player 2) pinaagi sa paghimo sa 1 nga labing taas ginikanan; Kahoy (1, 2, M, M - 1, ..., 4, 3) alang sa player 3 pinaagi sa paghimo sa 2 nga ikaduha nga labing taas nga ginikanan, ..., Tree (1, 2, 3, ..., M - 2, M, M - 1 ) alang sa player M - 1 pinaagi sa paghimo sa M - 2 nga ikatulo nga labing ubos nga bata, Tree (1, 2, 3, ..., M - 1, M) alang sa player M pinaagi sa paghimo sa M - 1 ang ikaduha nga labing ubos nga bata.

Nakompleto niini ang paghulagway sa mga pagbayad sa mga magdudula alang sa usa ka dula nga dilemma sa M-Person, nga ang matag magdudula nga adunay diskarte sa 2.

Ang teorema 14. Alang sa kantidad sa M-Person jailer, M Ang 2, nga gigamit ang prinsipyo sa pagpatigbabaw, ang solusyon sa Nash alang sa mga magdudula nga magdula nga diskarte 2.

Pagpamatuod. Nahibal-an na naton nga ang teorya naghupot alang sa M = 2. Ipaniwala pinaagi sa induction nga gihuptan sa teorem ang M - 1, alang sa M 3. Atong ipakita nga ang teorema naghupot alang sa M.

Gihatag nga Kahoy (M, M - 1,…, 2, 1) alang sa player A, hinumdomi nga pinaagi sa pagtukod, ang mga sub nga kahoy sa wala ug tuo nga mga sanga mga porma sa Kahoy (M - 1, M - 2,…, 2 , 1) alang sa player 1, Kahoy (M, M - 1,…, 2) alang sa player 2, Tree (2, M, M - 1,…, 4, 3) alang sa player 3,…, Tree (2,… , M - 2, M, M - 1) alang sa player M - 1. Kini nga mga punoan nga kahoy parehas alang sa mga magdudula 1, 2, ..., M - 1, gawas sa pagsulat sa mga node sa mga ginikanan. Hinumdumi nga ang estratehiya sa matag magdudula nga 2 nagpatigbabaw sa estratehiya nga 1 sa bisan unsang kondisyon. Pinaagi sa induction, ginamit ang baruganan nga nagpatigbabaw, ang mga magdudula nga 1 hangtod M - 1 magdula sa diskarte 2.

Tungod niini, gihatagan ang Tree (1, 2, ..., M - 1, M) alang sa magdudula nga M, kung ang M nagpatugtog sa 1, ang bayad sa magdudula M mao ang b (ang ikaduha nga labing tuo nga node sa kahoy) samtang kung ang M nagdula 2, ang bayad alang sa player M ang A22 (ang tuo nga buko nga kahoy). Pinaagi sa prinsipyo sa pagpatigbabaw, sanglit ang A12 <A22, ang magdudula sa M usab magdula nga diskarte 2. QED

Karon hunahunaa ang bisan unsang pagbayad sa tipo nga A11 labi ka dako sa bisan unsang pagbayad sa tipo nga A22; ug kana nga A21 = A11 + m, diin ang mga pagbayad sa A11 ug A21 naa sa mga kasikbit nga mga node.

Tin-aw, ang pamaagi sa Nash napakyas nga ikonsiderar ang pagdula sa kooperatiba nga solusyon nga "play strategies 1" bisan kung kini mao ang klaro nga solusyon sa pagdula.

Pagsunod sa induktibong argumento sa Theorem 14, mahimo usab naton tapuson nga, tungod kay ang mga sub nga mga kahoy sa wala ug tuo nga mga sanga gikan sa porma nga Kahoy (M - 1, M - 2,…, 2, 1) alang sa player 1, Kahoy ( M - 1, M - 2,…, 2) alang sa player 2, Tree (2, M, M - 1,…, 4, 3) alang sa player 3,…, Kahoy (2,…, M - 2, M, M - 1) alang sa player M - 1, pinaagi sa induction, gamit ang gilauman nga gamit sa hypothesis, ang mga magdudula nga 1 hangtod sa M - Ang 1 magdula sa estratehiya 1 diin ang bayad mao ang tipo nga A11.

Tungod niini, gihatagan ang Tree (1, 2, ..., M - 1, M) alang sa magdudula nga M, kung ang M nagpatugtog sa 1, ang bayad sa magdudula M usa (ang wala sa tuo nga node sa kahoy) samtang kung ang M nagdula 2, ang bayad sa player M mao A21 = A11 + m (ang ikaduha sa wala nga wala nga buko sa kahoy). Tungod kay A11 <A21, mahimo’g matintal ang player M sa pagdula nga diskarte 2. Apan ngano nga ang diskarte sa pagdula sa peligro nga 2 alang sa mga yunit nga labaw pa sa A11, kung mahimo kini magdala sa bayad nga matang sa A22, usa ka bayad nga labi ka gamay sa A11?

Pinaagi sa gipaabut nga gamit sa hypothesis, ang player M kinahanglan usab nga magdula nga diskarte 1.

Mga Pangkalahatang Mga Dula sa M-tawo.

Sa katapusan, among gi-generalize ang Theorem 1 alang sa mga kinatibuk-ang dula sa M-tawo.

Himoa nga adunay mga magdudula nga M, diin ang matag magdudula adunay usa ka posible nga mga pamaagi alang sa matag i = 1, 2,…, M. Gihatag ang diskarte vector (j1, j2,…, jM), hatagan ang bayad sa player nga ako Aij1j2… jM. Tugoti nga ang xi usa ka sinagol nga diskarte alang sa player i, ie, usa ka estratehiya xi kung diin Σj xij = 1, xij Ang 0, tanan nga j, ug hatagan ang x = (xi, xi) nga nagpasabut sa mga estratehiya sa tanan nga mga magdudula. Ang problema ni Nash:

diin ang EP (i | xi) mao ang gipaabut nga pagbayad sa player nga gihatag nako xi ug kung diin ang pagtumaw na labaw sa tanan jk ug tanan k.

Ang usa ka estratehiya x * usa ka balanse nga Nash kung ang xi * usa ka solusyon sa problema sa player sa taas, gihatagan xi *.

Alang sa among pamaagi, let pij1, j2,…, jM mahimong gilauman nga posibilidad nga player nga magdula sa jk, alang sa tanan nga jk ug tanan nga k. Ang Von Neumann – Morgenstern nga gipaabut nga teyorya sa utility nag-ingon nga ang katuyoan sa player i mao ang pagdaghan sa gipaabut nga bayad niini:

kung saan ang tagumtungod sa tanan jk ug tanan k.

Ihulagway

diin-nga nagdula j-i nagpasabut nga ang player k nagdula sa jk ug kung diin ang pagtumaw labaw sa tanan nga jk, alang sa tanan k i.

Ang teorema 15. Ang mga problema (13) sa ubos katumbas sa mga problema (11):

Pagpamatuod.. Pinaagi sa kahulugan

kung diin ang pagtumaw labaw sa tanan rk, alang sa bisan unsang k i.

Ang denominator sa (14) mao ang kalagmitan nga pi (nagdula ako ji). Busa,

Sanglit Σ pi (nagdula ko ji) = 1 ug pi (nagdula ko ji) Ang 0 alang sa tanan nga ji, nagsunud kini nga diskarte sa player sa pagdula [arg maxji EP (i | ako nagdula ji)]. QED

Ang usa ka pamaagi alang sa pagpangita sa labing kaayo nga pamaagi alang sa player ako mao ang mga musunud: Alang sa bisan unsang pares sa mga estratehiya alang sa manlalaro i, isulti ang estratehiya r ug estratehiya s, kalkulahin ang mga lugar sa mga punto diin ang gipaabut nga bayad sa kondisyon nga magdudula sa magdudula nga magdula bisan ang r o s managsama . Gipunting niini ang usa ka wala’y kalainan sa nawong nga nagbahin sa posibilidad nga adunay posibilidad nga kondisyon sa 2 VNM nga mga rehiyon. Ang usa ka rehiyon sa VNM may marka nga r tungod kay ang pamaagi sa pagpili mao ang r, ug ang uban pang rehiyon sa VNM adunay marka tungod kay ang estratehiya sa pagpili mao ang s.

Pagkahuman sa mga kalkulasyon sa ibabaw, ang matag rehiyon sa VNM adunay gimarkahan sa daghang mga higayon tungod kay adunay mga managsama nga pares sa mga estratehiya. Alang sa bisan unsang gihatag nga rehiyon sa VNM, pagkuha bisan unsang duha sa daghang mga label ug kuhaa ang usa sa mga niini pinasukad sa sulud sa pagkawalay hinungdan nga gibuhat sa pares nga mga label. Ang proseso matapos kung ang matag rehiyon sa VNM adunay usa ra ka label.

Mga Dula nga Pangkalahatang 2-tawo.

Hatagan ang mga manlalaro A adunay mga estratehiya Ai, i = 1, 2,… n1 ug player B adunay mga estratehiya Bj, j = 1, 2,… n2. Hunahuna nga ang mga kalagmitan sa mga magdudula managsama nga independente. Ang problema (13) mao:

Mao nga, ang mga rehiyon sa VNM gihubit sa mga polyeto nga mga convex:

Sama sa naobserbahan sa (16), ang pagpangita sa solusyon nga gitakda sa usa ka kinatibuk-ang dula sa 2-tawo diretso. Pananglitan, hunahunaa ang sobra sa duha ka libo ka tuig nga dula nga Rock-Paper-Scissors, kung diin ang balanse nga Nash: pagdula bisan unsang estratehiya nga adunay posibilidad nga 33%:

Ang estratehiya A1 o B1 (bato) nawala sa estratehiya A2 o B2 (papel) nawala sa estratehiya A3 o B3 (gunting) nawala sa bato.

Alang sa player A, sa kinatibuk-an naa kami, diin ang 0 pA (Bj) 1,

nga makunhoran ang

Ug parehas alang sa player B.

Ang makita nga usa ka bag-ong pamaagi alang sa karaan nga dula mao ang: play rock kung nagtuo ka nga ang imong kontra magdula papel nga adunay posibilidad nga kadaghanan sa 33% ug gunting nga adunay posibilidad nga labing menos 33%; pagdula papel kung nagtuo ka nga ang imong kontra magdula gunting nga adunay posibilidad nga kadaghanan sa 33% ug bato nga adunay posibilidad nga labing menos 33%; lain pa nga magdula scissors22.

Mga Dula sa 3-tawo diin Ang Matag Tawo Adunay Mga stratehiya sa 2.

I-apply naton ang Theorem 15 alang sa pagpangita sa solusyon nga gitakda sa dula sa usa ka tawo nga 3, diin ang matag magdudula nga A, B, ug C adunay mga diskarte sa 2 Ai, Bi, Ci, alang sa i = 1, 2.

Hunahuna nga ang mga kalagmitan sa mga magdudula managsama nga independente. Alang sa player A, ang equation (13) mao

ug parehas alang sa mga magdudula B ug C. Ang paggamit sa Theorem 15, ang solusyon gipasabut sa:

Atong gamiton ang labaw sa dula alang sa dula nga Bar-uwak[21]:

Kung ang magdudula naa sa balay, ang bayad niini mao ang 1; kung ang magdudula mag-inusara sa bar, ang bayad niini mao ang 0; kung ang magdudula naa sa bar kauban ang laing tawo, ang bayad niini mao ang 2; kung dili, ang bayad niini -1.

Kami adunay: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, busa ang rehiyon sa VNM A1 mao ang rehiyon -3pUM (B1) (C1) - 2 ≥ 1, o parehas nga rehiyon[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Ingon usab, ang rehiyon sa VNM B1 ang rehiyon pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) ug ang rehiyon sa VNM C1 mao ang rehiyon pC (B1) ≥ (1) / (2 - 1pC (A2)). Ang Nash equilibria mga p (A) = p (B) = p (C) = 3 ug p (A) = p (B) = p (C) = 1 / 1.

Pag-ila.

Gusto namon nga magpasalamat sa Al Roth ug Todd Davies alang sa ilang bililhon nga tambag ug giya sa pag-andam sa kini nga papel.

Mga footnote

[1] Alang sa kadali, gihimo namon ang sagad nga pagpatuo nga ang utility usa ka linear function sa payoff (Starmer [18]). Busa, ang pag-maximize sa gipaabut nga gamit sama sa pag-maximize sa gipaabut nga bayad.

[2] Ang among Bayesian nga pamaagi alang sa mga dula lahi sa una nga buluhaton sa Bayesian (pananglitan, Acevedo ug Krueger [4]; Aumann [1]; Daley ug Sadowski [6]; McKelvey ug Palfrey [12]; Quattrone ug Tversky [15]) sa ingon, dili sama sa uban nga mga pamaagi, ang among pamaagi tethers kondisyonal nga posibilidad nga dili managsama sa gipaabut nga hypothesis sa utility, nga kanunay nga natagbaw ang among solusyon.

[3] Giingon sa usa ka kritiko nga "dili makatarunganon nga mga magdudula dili ug dili angay hunahunaon ang mga posibilidad nga adunay kondisyon ... Hunahunaa ang usa ka ahente nga nahibal-an nga ang posibilidad nga mag-ulan p. Ang imong 'solusyon' ingon nga ang ahente kinahanglan mokuha sa payong kung umulan ug biyaan ang payong kung dili mag-ulan.
Ang teorem 1 nagpakita nga ang kanhing pagsaway wala kinahanglana. May kalabotan sa ulahi nga pagsaway, himoa nga ang EP (ahente | magdala usa ka payong) = p, ug EP (ahente | ayaw pagdala usa ka payong) = 1 - p. Ang among solusyon mahimo’g: magdala usa ka payong kung p ≥ 1 / 2; ayaw pagdala usa ka payong kung p ≤ 1 / 2.

[4] Ang mga kondisyon sa kalagmitan sa (2) wala makalapas sa prinsipyo sa Spohn [17]: "Ang bisan unsang igo nga modelo nga desisyon nga dili kinahanglan nga tin-aw o dili hingpit nga maglangkob sa bisan unsang subjective nga mga posibilidad alang sa mga aksyon ..." mga estratehiya, dili alang sa kaugalingon nga mga pamaagi.

[5] Kini nga teorema himuon sa usa alang sa mga dula sa M-person.

[6] Wala’y timailhan tali sa mga magdudula.

[7] Ang independyenteng variable nga pA (B1 | A1) ug pA (B2 | A2) giisip nga gihatag sa sulud sa pag-maximize, usa ka pagpasimple nga naglikay sa problema sa walay katapusan nga pagreparar (parehas sa pangisip ni Nash nga p (B1) gihatag alang sa player A sa pagporma sa iyang suliran nga sulud sa sulud).

[8] Inequality (5) mao ang (nadiskubrehan) nga solusyon sa problema (1) sa parehas nga paagi nga ang pormula sa quadratic mao ang solusyon sa usa ka kinatibuk-an nga sulud sa quadratic.

[9] Ang mga tigpasiugda sa magdudula mahimo’g magdepende sa bahin nga makita nga mga panghitabo nga random, sama sa panahon. Alang sa paggamit sa mga priors sa mga dula nga adunay dili kompleto nga kasayuran nga gipatugtog sa mga magdudula sa Bayesian, palihug tan-awa ang (Harsanyi [10]).

[10] Kini nga kinatibuk-ang solusyon naglangkob sa Nash equilibria ingon piho nga mga solusyon. Sukwahi sa gihubit nga mga solusyon sa Nash, ang among solusyon usa ka pares sa mga gihimong pangatarungan nga pangatarungan-gilauman nga mga pamaagi nga putli. Dugang pa, kung sa sayup, ang player A naa sa rehiyon sa VNM A1 ug nagdula sa A2, ang Corollary 2 nagsulti nga ang player A makakuha usa ka labing ubos nga gipaabut nga bayad.

[11] Makapaikag nga matikdan nga sa usa ka Nash sagol nga balanse, ang estratehiya sa usa ka magdudula nagdepende sa pagkahibalo sa pagpaandar sa ubang magdudula.

[12] Ang mga timaan sa Zero wala panumbalinga sa lamesa, tungod kay kini nga mga kaso nagdaot: ang usa ka magdudula dili makapili taliwala sa duha nga mga pamaagi niini. Ingon usab, makapaikag nga matikdan nga ang matag balanse sa Nash makita sa eksaktong upat ka laray.

[13] Ang sunod nga mga panig-ingnan sa 3 gipahiangay gikan sa (Davies [7]) sa usa ka paagi nga mahimo’g magsilbing pamaagi sa pedagyuikal alang sa mga estudyante sa teorya sa dula. Ang lamesa 1 mahimong gamiton aron dali nga makit-an ang Nash equilibria alang sa tanan nga mga ehemplo sa dula sa 2-tawo nga gihulagway dinhi.

[14] Ang mga aksyon sa A wala makaapekto sa pagpili sa mga aksyon B. Kini tungod kay ang gituohan ni A wala masaligan sa tinoohan ni B. Sa pikas bahin, kung ang mga gituohan gikorelahan, nan ang duha nga kalagmitan sa mga magdudula kinahanglan managsama nga 50%, kung dili, kung giingon nga ang mga posibilidad sa mga magdudula pareho> 50%, Nahibal-an sa usa nga ang B modula sa diskarte 2 (mga ikog), busa magdula nga diskarte 1 (ang mga ulo) dili mahimo nga usa ka husto nga reseta alang sa A. Kung ingon, ang posibilidad sa A mao ang> 50% ug ang kalagmitan sa B mao ang <50%, nahibal-an sa B nga ang A magdula sa mga ulo, busa ang pagdula sa mga ulo dili mahimo nga usa ka tama nga reseta alang sa A. Etc. ang talagsaon nga solusyon mao nga ang balanse nga Nash: pagdula nga random alang sa duha.

[15] Timan-i nga ang pA (B1) = pB (A1) = 0 o 1 usa ka senaryo sa balanse: ang duha nga mga magdudula mag-agaw (o managdiretso nga duha) kung ang duha nga magdudula magdahum nga ang lain nga magdudula diretso (o mag-swender). Sa kasukwahi, p (A1) = p (B1) = 0 o ang 1 dili usa ka balanse sa Nash: kung ang B moadto diretso (o mag-swender), A magalihok (o diretso).

[16] Mga Tinubdan: Arms Control Association, Federation of American Scientists, International Panel on Fissile Materials, US Department of Defense, US Department of State ug Stockholm International Peace Research Institute.

[17] Sukad sa orihinal nga papel sa Lunop ug Dresher, liboan ka mga artikulo ang gipatik bahin niini. Ang pagpangita sa Google Scholar alang sa "suliran sa prisohan" naghatag mga resulta sa 104,000 sama sa pagsulat niini. Palihug pagtugyan (Kuhn [14]).

[18] Busa, ang mga magdudula dili magdula sa solusyon sa kooperatiba.

[19] Kung ang imong kaatbang magdula nga dili random, ang imong una mahimo’g maimpluwensyahan sa nangaging mga dula sa imong kaatbang sa kini nga dula.

[20] Ang pormula mahimong ipaabut sa mga M-persona, alang sa M> 3.

[21] Kini nga dula gibase sa problema sa El Farol bar (Arthur [5]).

[22] Ang locus of indifference usa ka quadratic curve nga moagi sa mga puntos (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

mga pakisayran

[1] Aumann RJ (1974) Pagkahisgot ug Pagkakauyon sa Mga Randomized Strategies. Journal sa Mathematical Economics 1: 67-96

[2] Aumann RJ, Maschler M (1995) Gibalikbalik nga Mga Dula nga adunay Dili kasayuran nga Impormasyon. MIT Press, Cambridge London

[3] Axelrod R (1984) Ang Ebolusyon sa Pagtinabangay. Batakang mga Libro

[4] Acevedo M, Krueger JI (2005) Ebidensya sa Ebidensya sa Dilema nga Prisoner's. Ang American Journal of Psychology 118: 431-457

[5] Arthur WB (1994) Pangatarungan sa Induktibo ug Gibag-o nga Rationalidad. Repasuhan sa Ekonomiya sa Amerikano 84: 406-411

[6] Daley B, Sadowski P (2017) Maayong Hunahuna: Usa ka Resulta sa Pagrepresentar. Ang teoretikal nga Ekonomiya 12: 909-956 24 Kini nga dula gibase sa problema sa El Farol bar (Arthur [5]). 25 Ang locus of indifference usa ka quadratic curve nga moagi sa mga puntos (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Tinuud sa Utud sa Utok sa Diesies ug Game Game. Mubo nga mga Sulat

[8] Garcia CB, Zangwill WI (2017) Usa ka Bag-ong Paagi sa Gubat o Kalinaw. Nagtrabaho papel

[9] Garcia CB, Zangwill WI (2018) Pagdumala, Pagpaabut nga Utility ug ang Prisoner's Dilema. Nagtrabaho papel

[10] Harsanyi J (1967) Mga Dula Uban sa Dili kumpleto nga Impormasyon nga Gi-play sa "Bayesian" Mga Manlalaro I - III. J. Management Science 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Masayon ​​nga Posible nga Posible ug Teorya sa Mga Dula. Management Science 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Gidak-on nga Response nga Equilibria alang sa Mga normal nga Dula nga Pormula. Mga Dula ug Batasan sa Ekonomiya 10: 6-38

[13] Jaynes ET (1968) Nahauna nga mga Posibilidad. Mga Transaksyon sa IEEE sa Systems Science ug Cybernetics 4 (3): 227-241

[14] Kuhn S (2017) Bilanggoan sa Bilanggoan. Ang Stanford Encyclopedia of Philosophy

[15] Quattrone GA, Tversky A (1984) Causal Versus Diagnostic Contingencies: Sa Pagbulag sa Kaugalingon ug sa Vusion's Illusion. Journal of Personalidad ug Panitikang Sikolohiya 46: 237-248

[16] Mga Skyrms B (2004) Ang Stag Hunt ug ang Ebolusyon sa Social Structure. Cambridge University Press, Cambridge

[17] Spohn W (1977) Kung Asa Gibutang ni Luce ug Krantz ang Pag-ila sa Modelo nga Desisyon sa Savage. Erkenntnis 11: 113-134

[18] Starmer C (2000) Mga kaugmaran sa dili gilauman nga teorya sa utility: ang pagpangitag usa ka gihulagway nga teoryang gipili sa peligro. Ang dyurnal nga Panitikan sa Ekonomiya 38: 332-382

[19] Sugden R (2005) Ang Economics of Rights, Cooperation ug Welfare. Palgrave MacMillan, edisyon sa 2: 132

[20] Von Neumann J, Morgenstern O (1953) Teorya sa Mga Dula ug Pamatasan sa Ekonomiya. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) Ang Leksyon sa Newcomb's Paradox. Synthese 190: 1637-164