Scríofa ag: CB Garcia agus WI Zangwill

Ollúna Eolaíochta Bainistíochta ag Scoil Ghnó Booth (ar scor araon)

Athbhreithnithe 18 Lúnasa, 2018 ó (Garcia agus Zangwill [8, 9]).

Keywords: Teoiric cluiche, aincheist na bpríosúnach, dóchúlachtaí suibiachtúla

Abstract: Chuir Von Neumann agus Morgenstern (VNM), ag úsáid na hipitéise fóntais ionchais, foirmiú bunúsach na faidhbe teoirice cluiche. Go dtí seo, áfach, bhí sé deacair an ceapadh sin a réiteach gan toimhdí breise a fhorchur. B'éigean do Nash glacadh leis gur díchúpláladh na himreoirí ionas go raibh an dóchúlacht go mbeadh imreoir A ag déanamh gnímh neamhspleách ar an dóchúlacht go ndéanfadh imreoir B gníomh. Sa pháipéar seo cuirimid deireadh le toimhdí Nash, lena n-áirítear toimhde go bhfuil straitéisí na n-imreoirí ar eolas coiteann, agus go gcuirfidh siad samhail atá comhionann go hiomlán leis an bhfadhb ghinearálta VNM. Fágann ár bhfoirmiú so-insroichte go héasca cuid de na deacrachtaí bunúsacha le cur chuige Nash, rud a chruthaigh torthaí a bhí salach ar a chéile, mar shampla, ar aincheist an phríosúnaigh, an cluiche sicín, paradacsa Newcomb, an fiach stag agus go leor cluichí eile. Mar shampla, trí thoimhde neamhspleáchais fhrithpháirtigh Nash a dhíbirt i ndíospóid an phríosúnaigh, léiríonn ár samhail go bhfuil na himreoirí in ann íoc as an leibhéal is fearr a bhaint amach, agus chun é sin a bhaint amach, ní gá dóibh súgradh go comhoibríoch ná cumarsáid a dhéanamh, ach ní bhaineann siad ach teoirim Bayes, i stíl (Harsanyi [10]; Kadane agus Larkey [11]). Roinneann ár gcur chuige an spás dóchúlachta ina dhá leath-spás nó réigiún, a mbraitheann a méid coibhneasta ar na haisíocaíochtaí. Anois, ní gá an dóchúlacht a mheas go beacht, ach gan ach an réigiún ina bhfuil sé a dhearbhú. Soláthraíonn sé seo buntáistí suntasacha mar, má tá réigiún amháin i bhfad níos mó ná an ceann eile, tugann sé léargas substaintiúil láithreach ar conas an cluiche a imirt. Sa réiteach ginearálta atá againn, nach bhfuil comhghaolmhar leis, dar le Aumann [1], tá cothromaíocht Nash mar réitigh ar leith. I gcodarsnacht leis na réitigh tuairisciúla Nash, is é an réiteach atá againn ná péire déine ionchais réasúnacha i straitéisí íon, ag tabhairt bunús nua do theoiric an chluiche. Leathnaímid ár gcur chuige i leith cluichí ginearálta M-Person, mar a léirímid sa chluiche siosúr páipéar-carraige agus sa bhfadhb barrshaolaithe.

Achoimre ar na Torthaí.

Déanaimid achoimre anois ar roinnt torthaí, bunaithe ar na sonraí agus na híocaíochtaí dílse a chuirtear ar fáil thíos. Creidimid go léiríonn na torthaí seo luach ár gcur chuige don teagasc agus don taighde mar is minic a chuireann na torthaí réitigh nua i láthair.

Cluiche comhordaithe: The Nash assumption of independence misses the superior Bayesian approach we take. For the payoffs provided below, play the first strategy if you believe that the opponent’s probability of playing its first strategy is at least 1 / 3, else play the second strategy. Nash provides no insights about when to apply which strategy. Also, if the payoffs are changed, our approach provides revised probabilities. Battle of the sexes: Two parties differ on where they should go, but are not allowed to communicate. Both parties obtain a good payoff if they both go to the same choice, since at least they are both together. A given party will get a bonus if they both go to that party’s choice. Neither gets a good payoff if they go different places. Given the payoffs presented below, player A should play its desired strategy if it believes the other player will also select A’s desired choice with probability of at least 33%. In contrast, Nash provides three equilibria without any insight into which to play when and no analysis of the probabilities. Matching pennies: Two players, Even and Odd, simultaneously reveal a penny. If the pennies match, Even keeps both pennies; otherwise Odd keeps both pennies. The unique Nash equilibrium for this zero-sum game is for both players to play randomly. Given the payoffs below, Even should play heads if it believes that Odd will play heads with probability of at least 50%. On the other hand, Odd should play heads if it believes that Even will play heads with probability of at most 50%. Chicken game: Two cars are speeding towards each other and about to have a head-on crash. Nash suggests one car should swerve and the other go straight, but offers little insight into which should swerve. Given the payoffs below, our approach suggests you swerve if you believe that the opponent will swerve with probability of at most 90%, else go straight. Observe here that both players swerving (or both going straight) is not a Nash equilibrium but that both players swerving (or both going straight) in the expectation that the opponent will go straight (or swerve) is an equilibrium scenario. Also, if the payoffs are changed, our approach provides updated probabilities. Arms Race: each country initially stockpiles arms lest it be attacked. But as demonstrated below, diminishing returns on stockpiling arms materialize, opening an opportunity for a peace treaty. Nash does not identify the opportunity for the peace treaty. Stag hunt: hunt stag if you believe that the opponent will hunt stag with probability at least 50%, else hunt hare. (The pure Nash equilibria are for both to hunt stag, or for both to hunt hare). Newcomb’s problem: if Newcomb’s problem is posed as a prisoner’s dilemma, the solution to Newcomb’s problem can be arrived at in two ways: as the non-cooperative Nash equilibrium using the dominance principle, or as a cooperative solution using the expected utility hypothesis. Rock-paper-scissors game: The Nash equilibrium is for you to play a 3-sided die randomly. What appears to be a new strategy for this ancient game is for you to play rock if you believe that your opponent will play paper with probability of at most 33% and scissors with probability of at least 33%; to play paper if you believe that your opponent will play scissors with probability of at most 33% and rock with probability of at least 33%; else to play scissors. (Our approach can help you if say, you have data on your opponent’s previous plays of the game.) Bar-crowding game has 3 friends A, B, and C: Anyone who goes to the bar alone gets nothing – staying home is a better choice. If two friends go to the bar, that is the best option. If all three go, the bar throws all three out. The Nash equilibria are for all to stay home, or for all to play their first strategy with probability equal to 33%. But if you have any insight into your friends and can estimate the Bayesian probabilities of their behavior, our strategy can help.

Déanaimid ár gcur chuige i leith an chluiche M-duine a leathnú agus léargas comhchosúil a fháil. Mar shampla, taispeánann muid an réiteach iomlán do chluichí ginearálta duine 2 agus do dhaoine ginearálta 3 x cluichí straitéisí 2.

An Hipitéis Fóntais Ionchais.

I gcluiche 2-Duine, lig straitéisí 2 do na himreoirí: A1 nó A2 do imreoir A, agus B1 nó B2 do imreoir B.

Is é an bunús le haghaidh teoirice fóntais a bhfuiltear ag súil leis ná an teoirim von Neumann - teoirim fóntais Morgenstern (von Neumann agus Morgenstern [20]): lig Aij agus Bij a bheith ag íoc as imreoirí A agus B faoi seach má imríonn A player Ai agus imreoir B Bj, i gcás , j = 1 nó 2. Deir na hipitéisí fóntais a bhfuiltear ag súil leo go gcaithfidh imreoirí A agus B uasmhéadú a dhéanamh ar a n-íocshláinte ionchais:

más dóchúil gurb é pA (Ai agus Bj) imreoir A go n-imríonn A play Ai agus B Bj, agus mar an gcéanna do imreoir B.

Dóchúlachtaí Coinníollacha[1].

Chun ár gcur chuige, táimid titim Toimhde Nash go bhfuil dóchúlachtaí imreoirí neamhspleách ar a chéile. Ligeann sé seo dár bhfadhb (1) a bheith níos ginearálta agus níos mó réiteach a fháil a shásaíonn an hipitéis fóntais ionchais.

Lig do PE (A | Ai) agus do EP (B | Bj) na híocaíochtaí a bhfuiltear ag súil leo a dhéanamh[2],[3] de A agus B faoi seach mar gheall go imríonn A drámaí Ai agus B Bj, do i, j = 1, 2:

Lig dúinn tús a chur le cruthú teoirim “cluichí Bayesian” tosaigh cluichí a léiríonn coibhéis ár gcur chuige maidir le foirmiú VNM:

Teoirim 1[5]. Is ionann fadhbanna (3) thíos agus fadhbanna (1)[6]:

Cruthúnas. De réir theoirim na mBá,

Ansin,

An t-uasmhéid[7] is é an chothromóid thuas pA (A1) = 1 (ie, straitéis spraoi A1) má tá PE (A | A1) ≥ PE (A | A2), nó pA (A1) = 0 (ie, straitéis spraoi A2) má tá PE ( A1) PE (A | A2). Dá réir sin, (3) i seilbh imreoir A. Tá argóint den chineál céanna ann don imreoir BQED

Réigiúin VNM.

Sainmhínigh na réigiúin VNM A1 agus A2 le bheith mar na polatopaí dronnach:

Mar a thaispeántar thíos, ba cheart do A straitéis a imirt A1 má tá súil aige go mbeidh B sa réigiún A1. Seachas sin, ba chóir do AANUMX a imirt. An líne chothromaíochta

scarann ​​sé an spás dóchúlachta sa dá réigiún agus soláthraíonn sé modh amhairc cabhrach chun anailís a dhéanamh ar an staid[8].

Tábhacht na Réigiún: Tá an dá réigiún tábhachtach go praiticiúil, mar anois ní gá an dóchúlacht a mheas go beacht, ach ní gá ach an dá réigiún atá ann a mheas. Go minic, feictear gur dócha go mbeidh an dóchúlacht roimh ré i réigiún amháin , agus is leor-eolas é an réigiún sin a aithint chun súgradh cuí an chluiche a mholadh. Mar shampla, is dócha go bhfuil an réigiún A1 i bhfad níos mó ná an ceann eile, mar sin is dóchúil go mbeidh an dóchúlacht sa réigiún sin A1. Soláthraíonn sé seo eolas dochreidte gur dócha go seinnfidh imreoir A A1.

Go hanailíseach do B:

Tá na réigiúin VNM ag brath ar dháiltí dóchúlachta roimh ré na n-imreoirí, go minic ar a dtugtar an priors (Jaynes [13]; Harsanyi [10]; a chéile comhraic. [9]

Atoradh 2. Ós rud é (3), imríonn A straitéis A1 má tá sé ag súil le himreoir B a bheith i réigiún VNM A1. Eile, straitéis a imríonn A2. Ar an gcaoi chéanna, imríonn B straitéis B1 má tá sé ag súil go mbeidh imreoir A i réigiún VNM B1. Eile, imríonn B straitéis B2.

Cruthúnas. PE (A | A1) ≥ PE (A | A2) más rud é agus más rud é amháin más A11 pA (B1 | A1) + A12 pA (B2 | A1) X A21 pA (B1 | A2) + A22 pA (B2 | A2) más rud é (agus A11 - A12) pA (B1 | A1) + (A21 - A22) pA (A2 - A2) pA (B12 | A21) + A0 - AXNUMX ≥ XNUMX.

Mar an gcéanna, PE (B | B1) ≥ PE (B | B2) más rud é agus más rud é amháin más B11 pB (A1 | B1) + B21 pB (A2 | B1) X B12 pB (A1 | B2)

+ B22 pB (A2 | B2) más rud é (agus B11 - B21) pB (A1 | B1) + (B12 | B22) pB (B2 - B2) PB (A21 | B12) + B0 - BXNUMX ≥ XNUMX. QED

Ón Teoirim 1 agus Atoradh (2), do phointí sna réigiúin (5) agus (7), tá an hipitéis fóntais ionchais i seilbh, ie, sainmhíníonn na réigiúin VNM an réiteach ginearálta don chluiche 2-Person[10].

Comhionannas Nash.

Má tá dóchúlachtaí na n-imreoirí neamhspleách ar a chéile, déanann na réigiúin VNM iad seo a shimpliú:

Proposition 3. Abair go bhfuil cothromaíocht Nash (p (A1), p (B1)) i réigiún VNM Ai agus i réigiún VNM Bj faoi seach, i gcás roinnt i, j = 1, 2. Ansin, imreoidh imreoir A straitéis ina mbeidh Ai agus imreoir B ag imirt straitéise

Bj.

Cruthúnas. Is fadhb í fadhb chothromaíochta Nash (1), áit a bhfuil pA (Ai agus Bj) = pB (Ai agus Bj) = p (Ai) p (Bj), nó fadhb (3), áit a bhfuil pA (Bj | Ai) = p (Bj ) agus pB (Ai | Bj) = p (Ai), i gcás i, j = 1, 2. Dá bhrí sin, tá Atoradh 2 i seilbh, ina sainítear réigiúin VNM le (8), le haghaidh pA (B1) = p (B1) agus pB (A1) = p (A1). QED

Athghairm go bhfuil na cothromóidí cothromaíochta

na réigiúin VNM a dheighilt, rud a thabharfaidh an réiteach ginearálta ar aon chluiche. Tugann na cothromóidí cothromaíochta céanna, áit a dtagann pB (A1) = p (A1) agus pA (B1) = p (B1), an chothromaíocht mheasctha Nash, mar a léirítear sa tábla thíos.

Proposition 4. Mar gheall ar aon chluiche A = [[A11, A12], [A21, A22]] agus B = [[B11, B12], [B21, B22]], ríomhtar cothromaíocht Nash don chluiche ón tsraith infheidhme de Thábla 112.

Cruthúnas. Breathnaigh gur (i, j) cothromaíocht íon Nash más scn (2i - 1) * (A11 - A21)> (A0 - A2)> (1j - 11) * (B12 - B0)> (XXUMX - B0)> 1, le haghaidh i, j = 1, XNUMX. Ag baint úsáide as an bhfíric seo, le haghaidh gach rón i dTábla XNUMX, déanaimid liosta de na péirí (i, j) ar cothromóid íon Nash iad.

Ar deireadh, i gcás an phéire (a, b) atá sainithe ag (9) a bheith ina chothromaíocht mheasctha Nash, ní gá dúinn ach an 0 <a <1 agus an 0 <b <1 a thaispeáint. Ach tabhair faoi deara le haghaidh sraitheanna 6, 7, 10 agus 11 de Thábla 1, go bhfuil uimhreoir agus ainmneoir 1 - a, b nó 1 - b araon dearfach nó idir dhiúltach; mar sin, tá 1 - a, b, 1 - b níos mó ná 0. QED

Eiseofar Dominance Sampla[13].

Lig A = [[2, 2], [3, 1]] agus B = [[0, 1], [0, 2]]. Is é “Play A1 & B2” cothromaíocht Nash.

Proposition 5. Mar gheall ar A = [[2, 2], [3, 1]] agus B = [[0, 1], [0, 2]], Ansin imreoidh imreoir A A1 agus seinnfidh imreoir B B2.

Cruthúnas. Is é réigiún VNM A1: pA (B2 | A2) region 1 / 2, agus réigiún VNM B2 is ea: pB (A2 | B2) ≥ -1. Uaidh sin, seinnfidh imreoir B B2. Tá a fhios ag Imreoir A freisin gurb é seo an cás, mar sin, pA (B2 | A2) = 1. Ó pA (B2 | A2) = Is pointe é 1 i réigiún VNM A1, imreoir A play A1. QED

Comhordú Sampla.

Lig A = B = [[2, 0], [0, 1]]. Tá pointí cothromaíochta 3 Nash: “seinn A1 & B1”, “seinn A2 & B2”, agus “seinn A1 (nó B1) le dóchúlacht 1 / 3”. Is é réigiún VNM A1: 2pA (B1 | A1) region pA (B2 | A2) agus réigiún VNM B1: 2pB (A1 | B1) B pB (A2 | B2). Trí anailís a dhéanamh ar na réigiúin VNM seo ó thaobh amhairc de, is dócha go roghnóidh A agus B straitéisí A1 agus B1 faoi seach.

Proposition 6. Mar gheall ar A = B = [[2, 0], [0, 1]], má tá dóchúlachtaí na n-imreoirí neamhspleách go frithpháirteach, ansin déan an chéad straitéis má chreideann tú gurb é 1 / 3, eile an dara straitéis.

Cruthúnas. Is é réigiún VNM A1: pA (B1) region 1 / 3 agus réigiún VNM B1: pB (A1) ≥ 1 / 3. QED

Sampla Chath na nGnéis.

Lig A = [[3, 1], [1, 2]] agus B = [[2, 1], [1, 3]]. Tá pointí cothromaíochta 3 Nash: “imirt A1 & B1”, “seinn A2 & B2”, agus “seinn A1 le dóchúlacht 2 / 3, seinn B1 le dóchúlacht 1 / 3”. Is é réigiún VNM A1: 2pA (B1 | A1) region pA (B2 | A2) agus réigiún VNM B1: pB (A1 | B1) ≥ 2pB (A2 | B2). B'fhearr le AA A1 a roghnú agus B in áit B2 a roghnú.

Proposition 7. Mar gheall ar A = [[3, 1], [1, 2]] agus B = [[2, 1], [1, 3]], má tá dóchúlachtaí na n-imreoirí neamhspleách ar a chéile, ansin: imirt A1 má tá pA (B1 ) ≥ 1 / 3, eile a imirt A2; seinn B1 má pB (A1) ≥ 2 / 3, eile a imirt B2.

Cruthúnas. Is é réigiún VNM A1: pA (B1) region 1 / 3 agus réigiún VNM B1: pB (A1) ≥ 2 / 3. QED

Meaitseáil na gCeannaithe Sampla.

Lig A = [[1, -1], [-1, 1]] agus B = [[-1, 1], [1, -1]]. Tá cothromaíocht mheasctha Nash ag an gcluiche suim nialasach seo: “imirt A1 le dóchúlacht 1 / 2, imirt B1 le dóchúlacht 1 / 2”.

Proposition 8. Mar gheall ar A = [[1, -1], [-1, 1]] agus B = [[-1, 1], [1, -1]], má tá dóchúlachtaí na n-imreoirí neamhspleách ar a chéile, ansin: imirt A1 má tá pA (B1) ≥ 1 / 2, imirt A2 eile; seinn B1 más pB (A1) 1 / 2, eile imirt B2[14].

Cruthúnas. Is é an réigiún VNM A1: pA (B1) region réigiún 1 / 2 agus VNM B1: pB (A1) 1 / 2. QED

Sampla Cluiche Sicín (Sugden [19]).

Lig A = [[0, -1], [1, -10]] agus B = [[0, 1], [-1, -10]]. Is iad cothromaíocht Nash “imirt A1 (swerve) & B2 (dul díreach)”, “seinn A2 (dul díreach) & B1 (swerve)” agus “imirt A1 (B1) le dóchúlacht 0.9”.

Proposition 9. Sa chluiche sicín, má tá dóchúlachtaí na n-imreoirí neamhspleách go frithpháirteach, ansin: swerve má chreideann tú go mbeidh an comhraic ag swerve le dóchúlacht 90% ar a laghad, téigh díreach.

Cruthúnas. Is é réigiún VNM A1: pA (B1) + 11pA (B2) ≥ 2, nó pA (B1) ≤ 9 / 10. Mar an gcéanna, is é an réigiún VNM B1: pB (A1) ≤ 9 / 10. QED

Tabhair faoi deara, má thaispeánann do chéile comhraic díograis iomarcach (ar a laghad 90%), go gcaithfidh tú dul díreach.

An cás is fearr leat: Is dóchúla go mbeidh na himreoirí níos measa ná dul díreach.

Cás sicín: Cuir pA (B1) = pB (A1) = 0. Tá an bheirt imreoirí ag súil go rachaidh an t-imreoir eile díreach. Déanfaidh an bheirt acu swerve.

Cás tubaiste: Cuir pA (B1) = pB (A1) = 1. Tá an bheirt imreoirí ag súil go ndéanfaidh an t-imreoir eile swerve. Rachaidh an dá rud díreach[15].

Cás cothromaíochta Nash: Cuir pA (B1) = 1 - pB (A1), agus pB (A1) = 0 nó 1. Beidh an t-imreoir a bhfuil súil aige leis an imreoir eile dul díreach, agus beidh an t-imreoir a bhfuil súil aige leis an imreoir eile ag dul díreach.

Sampla Rás na nArmas.

I Proposition 9, lig A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], le haghaidh x, y ≥ 0. Lig do A1 nó do B1 “síocháin a lorg” agus is “ionsaí núicléach” a bheidh in A2 nó B2. Léiríonn na luachanna x agus y stoc-charn arm B agus A faoi seach.

Lorgaíonn Tír A síocháin má tá an dóchúlacht go bhfuil ionsaithe tíre B níos mó ná 1 / (9x + 1); ar shlí eile Ionsaithe. Titeann an cuar dóchúlachta pA (B1) = 1 / (9x + 1) go gasta, eg, pA (B1) = 1 / 2 ag x = 1 / 9, ach is beag a mhaolaíonn sé go luath: ní mór B a stoc-charnadh go tapa ar dtús, ach mar an cuar leathnaíonn sé, is beag tairbhe a bheidh ann do B chun airm a stoc-stocáil.

Agus mar an gcéanna do thír B.

Go hachomair, gach tír ag stocáil airm ar dtús le go dtógfaí ionsaí orthu. Ach tagann laghdú mór ar thuairisceáin ar airm stoc-stoc, ag oscailt deis chun conradh síochána a lorg.

Mar léiriú, smaoinigh ar an stoc-charn núicléach domhanda measta 2018[16] de Thábla 2.

Bunaithe ar na híocaíochtaí thuas agus ar Thábla 2, ba chóir go mbeadh an Chóiré Thuaidh ag iarraidh conradh síochána a lorg leis na Stáit Aontaithe agus leis an Rúis.

Skyrms [16]).

Lig A = [[4, 1], [3, 2]] agus B = [[4, 3], [1, 2]]. Is éard atá i gcothromaíocht Nash “imirt A1 (Stag) & B1 (Stag)”, “imirt A2 (Giorria) & B2 (Giorria)” agus “imirt A1 (B1) le dóchúlacht 0.5”.

Proposition 10. Sa fhiach stag, má tá dóchúlachtaí na n-imreoirí neamhspleách go frithpháirteach, ansin: fiaigh stag má chreideann tú go bhfiachfaidh an comhraic stag le dóchúlacht go bhfuil 50% ar a laghad ann, go seachnófar giorria.

Cruthúnas. Is é an réigiún VNM A1: 3pA (B1) + pA (B2) ≥ 2, nó pA (B1) ≥ 1 / 2. Mar an gcéanna, is é an réigiún VNM B1: pB (A1) ≥ 1 / 2. QED

Dilema na bPríosúnach[17].

Lig A12 <A22 <A11 <A21, agus lig B cothrom le haistriú A. Ó A11 <A21 agus A12 <A22, táirgeann an prionsabal ceannasachta cothromaíocht Nash, is é sin an tuaslagán neamh-chomhoibritheach “imirt A2 (locht) agus B2 (locht) ”. Ach ós rud é go bhfuil A22 <A11, A agus B níos fearr as má imríonn an bheirt acu an réiteach comhoibritheach “seinn A1 (tost) agus B1 (tost)”.

Proposition 11. I dtuairisc an phríosúnaigh, má tá dóchúlachtaí na n-imreoirí neamhspleách go frithpháirteach, ansin imríonn na himreoirí gan comhoibriú[18].

Cruthúnas. Smaoinigh ar thaobh na láimhe clé de réigiún VNM A1:

(A11 - A12 - A21 + A22) lchA(B1) + A12 - A22.

Má tá A11 - A12 - A21 + A22 ≤ 0, ansin (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Ar an taobh eile, má tá A11 - A12 - A21 + A22> 0, ansin (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Dá bhrí sin, le haghaidh aon roimh ré do imreoir A, is réigiún VNM A1 an tsraith neamhnithe, mar sin caithfidh sé straitéis 2 a imirt.

Mar an gcéanna, caithfidh imreoir B straitéis 2 a imirt. QED

Taispeánann Proposition 11 go soiléir go gcuireann an toimhde neamhspleáchais ar ár gcumas réiteach neamh-chomhoibritheach a bhaint amach.

Saincheist na bPríosúnach Clasaiceach Sampla.

I aincheist an phríosúnaigh chlasaicigh, A = [[-1, -3], [0, -2]] agus B = [[-1, 0], [-3, -2]].

Proposition 12. I dtuairisc an phríosúnaigh chlasaicigh, más iad príosúnaigh na n-imreoirí: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) N 3 / 2, ansin imreoidh na himreoirí an réiteach comhoibritheach19.

Cruthúnas. Is é réigiún VNM A1: pA (B1 | A1) A 2 / 2, agus is é réigiún VNM B3: pB (A2 | B1) + pB (A1 | B1) ≥ 2 / 2. Dá réir sin, i gcás na bpríomhphíobán a thugtar, caithfidh imreoirí A agus B an réiteach comhoibritheach a imirt. QED

Tabhair faoi deara sa bharra 12 an barra ard a theastaíonn chun an réiteach comhoibritheach a imirt. B'fhearr leis na himreoirí an réiteach neamh-chomhoibritheach a imirt.

Láthair Sa chás go dteipeann ar an Nash Approach an Straitéis Chomhoibrithe a Dhéanamh.

Smaoinigh ar aincheist an phríosúnaigh i gcás A11 - A12 = A21 - A22, A21 = A11 + m agus A22 = A11 - M, áit a bhfuil m> 0 beag agus M> 0 an-mhór. Mar shampla, A = [[100, -3], [101, -2]]. Athghairm ón Proposition 11 má bhíonn dóchúlachtaí na n-imreoirí neamhspleách ar a chéile, ansin imreoidh na himreoirí gan comhoibriú.

Ar ndóigh, bheadh ​​sé amaideach nach ndéanfadh na himreoirí fiú machnamh a dhéanamh ar straitéis a imirt 1 mar má imríonn imreoir 2, an seans go dtaispeánfadh an t-imreoir eile 2 go mór, agus mar sin ba chóir dó é a chur i mbaol. Is léir nach ndéanann an cur chuige Nash machnamh ar an réiteach comhoibritheach a imirt fiú nuair is é an réiteach soiléir súgartha - pointe an-tábhachtach, plé ar mhiondealuithe margaidh i samhlacha cothromaíochta eacnamaíocha ginearálta.

Ar an taobh eile, de réir mar a thaispeánann an chéad mholadh eile, tríd an toimhde a bhaineann le neamhspleáchas a dhiúltú, beidh an réiteach comhoibritheach againn seachas an réiteach neamh-chomhoibritheach.

Is é an líne dhubh an líne neamhshuim le haghaidh aincheist an phríosúnaigh chlasaicigh. Is dóchúla go n-imreoidh imreoir straitéis 2 mar gheall ar an dóchúlacht nach dócha go mbeidh sé sa réigiún le haghaidh straitéis imeartha

1.

Is é an líne ghlas an líne neamhshuim don chás seo de aincheist an phríosúnaigh: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Anseo, is é méid an réigiúin dóchúlachta le haghaidh straitéise 1 an méid is mó do straitéis 2. Is é an cur chuige atá againn ná comhairle a thabhairt do na himreoirí machnamh a dhéanamh ar straitéis 1 a imirt.

Proposition 13. Mar gheall ar aincheist príosúnaigh i gcás A11 - A12 = A21 - A22, A21 = A11 + m agus A22 = A11 - M, áit a bhfuil> 0 beag agus M> 0 an-mhór, imreoidh imreoirí A agus B an réiteach comhoibritheach20.

  • Dá bhrí sin, ní imreoidh na himreoirí an réiteach neamh-chomhoibríoch.
  • Faoi láthair, chun an réiteach comhoibritheach a bhaint amach, cuirtear toimhdí leis, eg, réasúnaíocht theoranta, faisnéis neamhiomlán (Aumann agus Maschler [2]; Acevedo agus Krueger [4]; Daley Mar gheall ar chomh-dhóchúlachtaí ionchasacha A (p) (Ai agus Bj), tá A mar fhocal scoir Caithfidh pA (A1 agus B1) a bheith gar do 1, mar gur dócha go n-imreoidh A agus B straitéis 1, áit a bhfuil a n-aisíocaíochtaí sách ard agus nach bhfuil ach m aonaid níos lú ná uasmhéid.

Dá bhrí sin, caithfidh pA (B1 | A1) = pA (A1 agus B1) / pA (A1) a bheith gar do 1 freisin.

Críochnaíonn A freisin an pA (A2 agus B2) pA (A2 agus B1) ós rud é go bhfuil sé an-chosúil le B straitéis 2 a imirt má tá A ag imirt straitéise 2. Dá bhrí sin pA (B2 | A2) = pA (A2 agus B2) / (pA (A2 agus B1) + pA (A2 agus B2)) 1 / 2. Críochnaíonn A, ag úsáid Fíor 1, go bhfuil B taobh istigh de réigiún VNM A1. Mar an gcéanna, beidh B ag imirt straitéise 1. QED

Paradacsa Newcomb mar Leagan de Dhíospóid na bPríosúnach.

I paradacsa cáiliúil Newcomb (Wolpert agus Benford [21]), tá réamhaithriseoir B, imreoir A agus bosca X. Tugtar rogha don imreoir A an bosca X nó an bosca X móide $ 1,000 a thógáil. Sula ndéanann A a roghnú, tuarann ​​B an méid a dhéanfaidh A, agus tá tuartha B beagnach cinnte. Má tá B ag tuar nach nglacfaidh A ach le bosca X, ansin cuireann B $ 1,000,000 i mbosca X. Sa chás seo, ós rud é go bhfuil $ 1,000,000 sa bhosca, gheobhaidh A $ 1,000,000 nó $ 1,001,000 ag brath ar A roghnaíonn A bosca X nó X móide $ 1,000. Ar an láimh eile, má tá B ag tuar go dtógfaidh A bosca X móide $ 1,000, ansin ní chuireann B aon rud i mbosca X. Sa chás seo, faigheann A $ 1,000 nó rud ar bith ag brath ar a rogha.

Is é paradacsa Newcomb ná go dtugann freagraí dhá réasúnacha freagraí contrártha ar fhadhb optamaithe imreoir A: faoi hipitéis na fóntais a bhfuiltear ag súil léi, níor chóir do imreoir A ach bosca X a ghlacadh, ós rud é go bhfuil an t-íocadh ionchais a bhaineann le glacadh X i bhfad níos airde. Ar an láimh eile, faoin bprionsabal ceannasachta, ba chóir go nglacfadh imreoir A bosca X móide $ 1,000.

Is fearr a thuigtear an paradacsa trí phasáiste isteach (Wolpert agus Benford [21]): “… Dúirt Newcomb nach dtógfadh sé ach X; cén fáth a bhfuiltear ag troid le bheith cosúil le Dia? Mar sin féin, dúirt Nozick, “Le beagnach gach duine, tá sé breá soiléir agus soiléir cad ba chóir a dhéanamh. Is é an deacracht atá ann ná go ndealraíonn sé go bhfuil na daoine seo ag roinnt go cothrom ar an bhfadhb, le líon mór ag smaoineamh go bhfuil an leath eile i bhfolach.

Réitíonn Wolpert agus Benford an paradacsa trí léiriú go léiríonn fadhb Newcomb dhá chluiche dhifriúla le torthaí dóchúla difriúla.

Sa chuid seo, réiteoimid an paradacsa trí fhadhb Newcomb a chur ina fhadhb. Agus é sin á dhéanamh, is féidir an réiteach ar fhadhb Newcomb a bhaint amach ar dhá bhealach: mar an réiteach neamh-chomhoibritheach (tóg bosca X móide $ 1,000) ag baint úsáide as prionsabal an cheannasachta, nó as an réiteach comhoibritheach (ná tóg ach bosca X) agus úsáid á baint as hipitéis fóntais.

Cuir i gcás go bhfuil tabhartais shaibhir ann a gheallfaidh maitrís aisíocaíochta a mhaoiniú le haghaidh réamhaithriseora B, ag tabhairt an chluiche seo a leanas: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] agus B = [$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Má thuigeann B i gceart, faigheann B an méid a fhaigheann imreoir A. Ach má tá B ag tuar go mícheart, faigheann B $ 1,001,000 lúide an rud a fhaigheann A.

Ón Tairiscint 13, imreoidh na himreoirí A agus B go comhoibríoch sa chluiche seo.

Más cosúil le Nash, réitíonn an t-imreoir an fhadhb ag úsáid an phrionsabail ceannasachta, mar sin déanann an tuar. Beidh réamhaithriseoir agus imreoir araon ag an réiteach neamh-chomhoibritheach: tóg X móide $ 1,000. Má réitíonn an t-imreoir an fhadhb ag úsáid na hipitéise fóntais ionchais, mar sin an réamhaithriseoir agus an réamhaithriseoir agus an t-imreoir a bheidh ag an réiteach comhoibritheach: ní thógfaidh sé ach X. I gceachtar cás, is é tuar an réamhaithriseora

agus Sadowski [6]) nó modhanna nua a bhfuil cur síos orthu, eg, cnag-le-tat, cothromaíocht chomhghaolmhar (Axelrod [3]; Aumann [1]).

21 Tabhair faoi deara, trí fhadhb Newcomb mar fhadhb PD a chur, go dtugtar dreasacht phearsanta don réamhaithriseoir atá as láthair i bhfadhb Newcomb.

cinnte. Ó ó Proposition 13, ní imreoidh na himreoirí an réiteach neamh-chomhoibritheach, aontaímid le Newcomb gurb é comhar an straitéis shoiléir atá le glacadh.

Nóta i bhFíor 1, áfach, tá an réigiún le haghaidh comhair níos lú ná an réigiún neamh-chomhoibrithe. Ní haon ionadh dúinn ansin má roinneann daoine go cothrom ar an straitéis atá le glacadh.

Ginearálú ar aincheist na bpríosúnach do dhaoine M.

Chun tuiscint níos fearr a fháil ar an dóigh a bhféadfadh réiteach Nash briseadh síos i múnlaí cothromaíochta eacnamaíche ginearálta, lig dúinn aincheist an phríosúnaigh a ghinearálú do M-Dhaoine, le straitéisí 2 ag gach imreoir, do M 2.

Lig dúinn cur síos a dhéanamh ar an gcluiche M-Duine trí chrainn dhénártha.

Is é Fíor 2 íoc as aincheist an phríosúnaigh le haghaidh imreoir A. Tree (2, 1) an crann dénártha le imreoir B (imreoir 2) mar thuismitheoir, agus imreoir A (imreoir 1) mar pháiste. Chun an t-íoc as do imreoir B a fháil, ní gá ach róil an tuismitheora agus an linbh a aistriú chuig Tree (1, 2). Chun cuimhne go bhfuil aincheist an phríosúnaigh, A12 <A22 <A11 <A21 <.

Ar Aghaidh, is dócha go seasann Crann (M-1, M - 2,…, 2, 1) le haisíoc an imreora le haghaidh cluiche (M - 1) - Duine, do M 3. Crann íoctha an imreora A (M, M - 1,…, 2, 1) a thógáil le haghaidh cluiche M-Duine trí ligean don imreoir A's Tree (M-1, M - 2,…, 2, 1) na fo-chrainn ar an dá cheann brainsí de mháthair-imreoir M.

Glactar leis go bhfuil luachanna uimhriúla an fhrith-chrainn ar an bhfo-chrann ceart difriúil ó na luachanna ar an bhfo-chrann clé, chomh fada agus a choinnítear an gaol A12 <A22 <A11 <A21 <aX sa chrann.

Ar deireadh, tugtar Crann (M, M - 1,…, 2, 1) do imreoir A, cruthaigh Crann (1, M, M - 1,…, 3, 2) le haghaidh imreoir B (2 imreoir) trí 1 a dhéanamh tuismitheoir; Crann (1, 2, M, M - 1,…, 4, 3) le haghaidh imreoir 3 trí 2 a dhéanamh mar an tuismitheoir is airde,…, Crann (1, 2, 3,…, M - 2, M, M - 1 ) le haghaidh imreoir M - 1 trí M - 2 a dhéanamh an tríú leanbh is ísle, Crann (1, 2, 3,…, M - 1, M) do imreoir M trí M - 1 a dhéanamh an dara leanbh is ísle.

Críochnaíonn sé seo an cur síos ar íocaíochtaí na n-imreoirí le haghaidh cluiche aincheist príosúnaigh M-Duine, agus straitéisí 2 ag gach imreoir.

Teoirim 14. I gcás aincheist an phríosúnaigh M-Duine, M 2, ag baint úsáide as an bprionsabal ceannasachta, is é réiteach Nash do straitéis na n-imreoirí le himirt ag 2.

Cruthúnas. Tá a fhios againn cheana féin go bhfuil an teoirim i seilbh M = 2. Glac leis, trí ionduchtú, go bhfuil an teoirim i seilbh M-1, do M 3. Lig dúinn a thaispeáint go bhfuil an teoirim i seilbh M.

Má thugtar Crann (M, M - 1,…, 2, 1) do imreoir A, cuimhnigh go bhfuil na fo-chrainn ar bhrainsí clé agus ar dheis den fhoirm Crann (M - 1, M - 2,…, 2 , 1) le haghaidh imreoir 1, Crann (M, M - 1,…, 2) le haghaidh imreoir 2, Crann (2, M, M - 1,…, 4, 3) le haghaidh imreoir 3,…, Tree (2,… , M - 2, M, M - 1) le haghaidh imreoir M - 1. Is ionann na fo-chrainn seo agus imreoirí 1, 2,…, M - 1, ach amháin an lipéadú ar nóid na dtuismitheoirí. Tabhair faoi deara gurb é 2, straitéis gach imreora, a straitéis 1 faoi aon choinníoll. Trí ionduchtú, ag úsáid an phrionsabail ceannasachta, imreoidh na himreoirí 1 go M - 1 straitéis 2.

Dá bhrí sin, tugtar Crann (1, 2,…, M - 1, M) do imreoir M, má imríonn M 1, is é b (an dara nód ceartaitheach den chrann M) ach má imríonn M 2, an payoff le haghaidh imreoir M tá A22 (an nód is treise sa chrann). De réir an phrionsabail ceannasachta, ós rud é go mbeidh A12 <A22, imreoidh M im straitéis 2. QED

Anois is dócha go bhfuil aon payoff den chineál A11 i bhfad níos mó ná aon payoff den chineál A22; agus go bhfuil A21 = A11 + m, ina bhfuil A11 agus A21 ina n-aiseanna in aice láimhe.

Is léir nach ndéanann an cur chuige Nash machnamh ar an réiteach comhoibritheach “straitéis súgartha 1” a imirt fiú nuair is é an réiteach soiléir le himirt.

Tar éis argóint ionduchtach Theorem 14, is féidir linn a thabhairt i gcrích freisin, ós rud é go bhfuil na fo-chrainn ar na brainsí clé agus ar dheis den fhoirm Crann (M-1, M - 2,…, 2, 1) le haghaidh imreoir 1, Tree ( M - 1, M - 2,…, 2) le haghaidh imreoir 2, Crann (2, M, M - 1,…, 4, 3) le haghaidh imreoir 3,…, Crann (2,…, M - 2, M, M - 1) le haghaidh imreoir M - 1, trí ionduchtú, ag baint úsáide as an hipitéis fóntais ionchais, imreoidh imreoirí 1 go M - 1 straitéis 1 áit a bhfuil an payoff den chineál A11.

Dá bhrí sin, tugtar Crann (1, 2,…, M - 1, M) d’imreoir M, má imríonn M 1, is é (an nód clé den chrann) an t-asbhaint le haghaidh imreoir M ach má imríonn M 2, an t-íoc as Is é imreoir M A21 = A11 + m (an dara nód is faide ar chlé den chrann). Ós rud é go bhfuil A11 <A21, is féidir imreoir M a bheith tempted a imirt straitéis 2. Ach cén fáth riosca 2 straitéis a imirt le haghaidh m aonaid níos mó ná A11, nuair a d'fhéadfadh sé mar thoradh ar payoff den chineál A22, payoff i bhfad níos lú ná A11?

De réir na hipitéise fóntais ionchais, caithfidh imreoir M straitéis 1 a imirt.

Cluichí Ginearálta M-Duine.

Ar deireadh, déantar Teoirim 1 a ghinearálú le haghaidh cluichí ginearálta M-duine.

Lig imreoirí M a bheith ann, i gcás go bhfuil straitéisí féideartha ag gach imreoir i ngach ceann i = 1, 2,…, M. Mar gheall ar veicteoir na straitéise (j1, j2,…, jM), lig don payoff don imreoir i be Aij1j2… JM. Lig do xi a bheith ina straitéis mheasctha d’imreoir i, ie straitéis xi áit Σj xij = 1, xij 0, gach j, agus lig x = (xi, xi) straitéisí do gach imreoir. Is é fadhb Nash:

i gcás inarb é PE (i | xi) an t-íoc amach ionchais i leith an imreora thug mé xi agus áit a bhfuil an tsuimiú go léir thar aon jk agus go léir k.

Is éard atá i straitéis x * ná cothromaíocht Nash má tá xi * ina réiteach ar fhadhb an imreora thuas, mar a thugtar xi *.

Chun ár gcur chuige, lig pij1, j2,…, jM an dóchúlacht go bhfuil imreoir ag súil go imríonn an t-imreoir k jk, do gach duine jk agus go léir k. Deir an teoiric fóntais a bhfuiltear ag súil léi ó Von Neumann-Morgenstern go bhfuil sé mar sprioc ag an imreoir an t-íoc as a bhfuiltear ag súil a uasmhéadú:

sa chás go bhfuil an tsuimiú go léir thar aon rud eile agus go léir k.

Sainmhínigh

i gcás -i imríonn j-i Ciallaíonn sé seo go n-imríonn an t-imreoir k jk agus go bhfuil an tsuimiú ar fad jk, do gach duine k i.

Teoirim 15. Is ionann fadhbanna (13) thíos agus fadhbanna (11):

Cruthúnas.. De réir sainmhínithe,

áit a bhfuil an tsuimiú thar an rk ar fad, i gcás aon k i.

Is é ainmneoir (14) an dóchúlacht pi (imríonn ji). Dá réir sin,

Ós rud é go Σ pi (imríonn mé ji) = 1 agus pi (i ji) 0 do gach ji, leanann sé go seinneann an t-imreoir straitéis [arg maxji EP (i | i play i ji)]. QED

Seo a leanas modh chun an straitéis is fearr a aimsiú le haghaidh imreoir i: Maidir le péire straitéisí le haghaidh imreora i, abair straitéis r agus straitéis s, ríomh lócas na bpointí ina bhfuil na haisíocaíochtaí a bhfuiltear ag súil leo coinníollach ar imreoir ag seinm r nó s cothrom leo . Sainmhíníonn sé seo dromchla neamhshuime a roinneann an spás dóchúlachta coinníollaí i réigiúin VNM 2. Tá réigiún VNM amháin lipéadaithe mar go bhfuil an straitéis roghnaithe r, agus tá an réigiún VNM eile lipéadaithe mar gurb é an rogha straitéise.

Tar éis na ríomhanna thuas, beidh gach réigiún VNM lipéadaithe chomh minic agus a bhíonn péirí straitéisí ar leith. Maidir le haon réigiún VNM ar leith, tóg dhá cheann ar bith de na lipéid iolracha agus cuir deireadh le ceann acu bunaithe ar dhromchla na neamhshuime a chruthaigh an dá lipéad seo. Críochnaíonn an próiseas nuair nach bhfuil ach aon lipéad ag gach réigiún VNM.

Cluichí Ginearálta 2-duine.

Bíodh straitéisí Ai, i = 1, 2 ag imreoir A,… Tá straitéisí Bj, j = 1, 1,… n2 ag n2 agus ag imreoir B. Glac leis go bhfuil dóchúlachtaí na n-imreoirí neamhspleách ar a chéile. Fadhb (13) ná:

Dá bhrí sin, sainmhínítear na réigiúin VNM le polytopes dronnach:

Mar is féidir a fheiceáil i (16), tá sé furasta teacht ar an réiteach a chuirtear ar chluiche ginearálta duine 2. Mar shampla, smaoinigh ar an gcluiche níos mó ná dhá mhíle bliain d'aois Páipéar-Siosúr, áit a bhfuil cothromaíocht Nash: imirt aon straitéis le dóchúlacht% 33:

Straitéis A1 nó B1 (an charraig) cailleann an straitéis Cailleann A2 nó B2 (páipéar) le straitéis a chailleann A3 nó B3 (siosúr) go carraig.

I gcás imreoir A, go ginearálta, tá 0 againn pA (Bj) 1,

a laghdaíonn go

Agus mar an gcéanna do imreoir B.

Is cosúil gur straitéis nua don chluiche ársa seo é: carraig a imirt má chreideann tú go seinmfidh do chéile comhraic páipéar le dóchúlacht go mbeidh 33% agus siosúr ar a laghad ann le dóchúlacht 33% ar a laghad; páipéar súgartha má chreideann tú go n-imreoidh do chéile comhraic siosúr le dóchúlacht go mbeidh 33% agus carraig ar a laghad ann le dóchúlacht 33% ar a laghad; eile scissors22 a imirt.

3-duine Cluichí Sa chás go bhfuil Straitéisí 2 ag gach duine.

Cuirimid Teoirim 15 i bhfeidhm chun an tuaslagán atá socraithe do chluiche duine 3 a fháil, áit a bhfuil straitéisí 2 ag gach imreoir A, B, C agus Ai, Bi, Ci, do i = 1, 2 faoi seach.

Glac leis go bhfuil dóchúlachtaí na n-imreoirí neamhspleách ar a chéile. I gcás imreoir A, is é cothromóid (13)

agus mar an gcéanna do imreoirí B agus C. Ag baint úsáide as Teoirim 15, sainmhínítear an tuaslagán trí:

A ligean ar úsáid a bhaint as an méid thuas le haghaidh an cluiche Bar-plódú[21]:

Má tá an t-imreoir sa bhaile, is é 1 a íocadh as; má tá an t-imreoir ina aonar ag an mbarra, is é 0 an t-airgead a íoctar as; má tá an t-imreoir ag an mbarra le duine eile, is é 2 a íocadh as; eile, is é a payoff -1.

Tá: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222; (C1) - 1 ≥ 3, nó an réigiún céanna[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Mar an gcéanna, is é réigiún VNM B1 an réigiún pB (A1) is (1 - 2pB (C1)) agus réigiún VNM C2 an réigiún pC (B3) ≥ (1 - 1pC (A1))) / (1 - 2pC (A1)). Is iad p (A) = p (B) = p (C) = 2 agus p (A) = p (B) = p (C) = 3 / 1 an chothromóid Nash.

Admháil.

Ba mhaith linn buíochas a ghabháil le Al Roth agus Todd Davies as a gcomhairle agus a dtreoir luachmhar agus an páipéar seo á ullmhú.

Nótaí nótaí

[1] Ar mhaithe le simplíocht, tuigimid go bhfuil an fhóntas ina fheidhm líneach den payoff (Starmer [18]). Dá réir sin, tá uasmhéadú á dhéanamh ar an bhfóntas a bhfuiltear ag súil leis mar an gcéanna leis an bhfuílleach ionchais.

[2] Ní hionann ár gcur chuige Bayesian do chluichí agus obair Bayesian roimhe seo (mar shampla, Acevedo agus Krueger [4]; Aumann [1]; Daley agus Sadowski [6]; McKelvey agus Palfrey [12]; Quattrone agus Tversky [15]) sa chaoi, murab ionann agus an cur chuige eile, go dtéann ár gcur chuige coinníollach dóchúlachta gan aon éideimhne leis an hipitéis fóntais ionchais, a shásaíonn ár réiteach i gcónaí.

[3] Deir léirmheastóir “nach ndéanann imreoirí réasúnacha dóchúlachtaí coinníollacha a bhreithniú agus nár cheart dóibh a bheith ag smaoineamh ... Samhlaigh gníomhaire a bhfuil a fhios aige gurb é an dóchúlacht go dtarlóidh báisteach ná p. Is cosúil gurb é do 'réiteach' ná gur chóir don ghníomhaire scáth a thógáil leis má tá báisteach ann agus an scáth a fhágáil mura ndéanann sé báisteach ”.
Léiríonn Teoirim 1 go bhfuil an t-iar-cháineadh gan údar. Maidir leis an gcáineadh deiridh sin, lig PE (gníomhaire | scáth a thabhairt) = p, agus PE (gníomhaire | ná tabhair scáth) = 1 - lch. Is é an réiteach a bheadh ​​againn ná: scáth fearthainne a thabhairt má p ≥ 1 / 2; ná tabhair scáth fearthainne má tá tú ≤ 1 / 2.

[4] Ní sháraíonn na dóchúlachtaí coinníollach (2) an prionsabal i Spohn [17]: “Ní féidir aon mhúnla suibiachtúil le haghaidh gníomhartha a bheith in aon samhail chinntitheach chainníochtúil go sainráite nó go hintuigthe…” Is dóchúlachtaí suibiachtúla iad dóchúlachtaí coinníollacha imreoir straitéisí, seachas a straitéisí féin.

[5] Déanfar an teoirim seo a ghinearálú go ceann do chluichí M-duine.

[6] Níl aon chomharthaíocht idir na himreoirí.

[7] Glactar leis na hathróga neamhspleácha pA (B1 | A1) agus pA (B2 | A2) sa bhfadhb uasmhéadaithe, simpliú a sheachnaíonn fadhb na cúise gan teorainn (cosúil le toimhde Nash go dtugtar p (B1) d’imreoir A i gcruthú a fhadhb uasmhéadaithe).

[8] Is éard atá i gceist le neamhionannas (5) an réiteach (aimsithe) ar an bhfadhb (1) sa tslí chéanna gurb é an fhoirmle chearnach an réiteach ar chothromóid ghinearálta chearnach.

[9] D’fhéadfadh sé go mbraithfeadh cliatháin an imreora ar imeachtaí randamacha atá inbhraite go páirteach, mar shampla an aimsir. Chun úsáid a bhaint as príosúnaigh i gcluichí le heolas neamhiomlán a sheinn imreoirí Bayesian, déan tagairt dóibh (Harsanyi [10]).

[10] Sa réiteach ginearálta seo tá cothromaíocht Nash mar réitigh ar leith. I gcodarsnacht leis na réitigh tuairisciúla Nash, is éard atá i gceist lenár dtuaslagán ná straitéisí dílse ionchasacha réasúnacha beirte. Thairis sin, má tá botún, tá imreoir A i réigiún VNM A1 agus drámaí A2, deir Atoradh 2 go bhfaighidh imreoir A payoff níos ísle ag súil leis.

[11] Tá sé suimiúil a thabhairt faoi deara go bhfuil straitéis imreora ag brath ar fheidhm íoc as an imreoir eile ag cothromaíocht mheasctha Nash.

[12] Déantar neamhshuim de na comharthaí nach bhfuil sa tábla, ós rud é go bhfuil na cásanna seo meathlaithe: níl ábalta imreoir a roghnú idir a dhá straitéis. Chomh maith leis sin, tá sé suimiúil a thabhairt faoi deara go bhfuil gach cothromaíocht Nash le feiceáil i gceithre shraith dhíreacha.

[13] Tá na chéad samplaí 3 eile oiriúnaithe ó (Davies [7]) ar bhealach a d'fhéadfadh a bheith ina theicníc oideolaíoch do dhaltaí i dteoiric chluiche. Is féidir tábla 1 a úsáid chun cothromaíocht Nash a fháil go tapa do na samplaí cluiche 2-duine ar bith a ndéantar cur síos orthu anseo.

[14] Ní dhéanann gníomhartha A tionchar ar rogha gníomhartha B. Tá sé seo toisc nach bhfuil creidimh A comhghaoil ​​le creidimh B. Ar an taobh eile, má tá na creidimh comhghaolmhar, ansin ní mór dóchúlachtaí an dá imreoir a bheith cothrom le 50%, ar shlí eile, más amhlaidh go bhfuil dóchúlachtaí na n-imreoirí araon> 50%, tá a fhios ag A go n-imreoidh B straitéis 2 (eireabaill), mar sin, an straitéis imirt 1 ní féidir le (cinn) a bheith ina n-oideas ceart le haghaidh A. Má deir, is é> dóchúlacht A ná gurb é dóchúlacht B ná <50%, tá a fhios ag B go mbeidh A ag imirt cinn, mar sin ní féidir le cinn imeartha a bheith ina n-oideas ceart do A. Etc. mar sin is é an réiteach uathúil an chothromaíocht Nash: imirt go randamach don dá rud.

[15] Tabhair faoi deara gur cás cothromaíochta é pA (B1) = pB (A1) = 0 nó 1: bíonn an dá imreoir (nó an bheirt acu ag dul díreach) má tá an dá imreoir ag súil go rachaidh an t-imreoir eile díreach (nó swerve). I gcodarsnacht leis sin, ní féidir le p (A1) = p (B1) = 0 nó 1 a bheith ina gcothromaíocht Nash: má théann B díreach (nó swerve), déanfaidh A (go díreach) sraonadh (nó dul díreach).

[16] Foinsí: Cumann Rialaithe na nArmas, Cónaidhm Eolaithe Mheiriceá, Painéal Idirnáisiúnta ar Ábhair Fissile, Roinn Cosanta na Stát Aontaithe, Roinn Stáit na Stát Aontaithe agus Institiúid Taighde Síochána Idirnáisiúnta Stócólm.

[17] Ó foilsíodh bunpháipéar Flood and Dresher, foilsíodh na mílte alt maidir leis. Tugann toradh Google Scholar ar “aincheist príosúnach” torthaí 104,000 mar thoradh ar an scríbhneoireacht seo. Tabhair do thoil (Kuhn [14]).

[18] Dá bhrí sin, ní imreoidh na himreoirí an réiteach comhoibritheach.

[19] Má imríonn do chéile comhraic neamh-randamach, is féidir go mbeidh tionchar ag drámaí roimhe seo an chluiche seo ar do chéile roimh ré.

[20] Is féidir an fhoirmle a shíneadh chuig M-daoine, le haghaidh M> 3.

[21] Tá an cluiche seo bunaithe ar fhadhb an bharra El Farol (Arthur [5]).

[22] Is é an lócas neamhshuim cuar cearnógach a théann trí na pointí (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

tagairtí

[1] Suibiachtúlacht agus Comhghaol Aumann RJ (1974) i Straitéisí Randamaithe. Iris na hEacnamaíochta Matamaitice 1: 67-96

[2] Aumann RJ, Maschler M (1995) Cluichí Arís agus Faisnéis Neamhiomlán. MIT Press, Cambridge London

[3] Axelrod R (1984) Éabhlóid an Chomhar. Leabhair Bhunúsacha

[4] Acevedo M, Krueger JI (2005) Réasúnaíocht Fianaiseach i nDíospóid na bPríosúnach. An Iris Shíceolaíochta Mheiriceá 118: 431-457

[5] Arthur WB (1994) Réasúnaíocht Ionduchtach agus Réasúnaíocht Theoranta. Athbhreithniú Eacnamaíoch Meiriceánach 84: 406-411

[6] Daley B, Sadowski P (2017) Smaoineamh draíochta: Toradh Ionadaíochta. Eacnamaíocht Theoiriciúil 12: 909-956 24 Tá an cluiche seo bunaithe ar fhadhb bharra El Farol (Arthur [5]). 25 Is é an lócas neamhshuim cuar cearnógach a théann trí na pointí (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Teoiric Fóntais Davies T (2004) agus Teoiric Cluiche. Nótaí Léachta

[8] Garcia SL, Wang Zangwill (2017) Cur Chuige Nua i leith Cogaidh nó Síochána. Páipéar oibre

[9] Garcia SL, Zangwill WI (2018) Ceannas, Fóntais Ionchais agus aincheist na bPríosúnach. Páipéar oibre

[10] Harsanyi J (1967) Cluichí Le Faisnéis Neamhiomlán Arna imirt ag “Bayesian” Rannpháirtithe I-III. J. Science Science 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Dóchúlacht shuibiachtúil agus Teoiric na gCluichí. Eolaíocht Bainistíochta 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Comhionannas Freagra Cainníochta do Ghnáthfhoirmeacha Foirm. Cluichí agus Iompar Eacnamaíochta 10: 6-38

[13] Jaynes ET (1968) Dóchúlachtaí roimh ré. Idirbhearta IEEE ar Eolaíocht Chórais agus Cybernetics 4 (3): 227-241

[14] Kuhn S (2017) Dilema na bPríosúnach. Eolaíocht Fealsúnachta Stanford

[15] Quattrone GA, Tversky A (1984) Cúinsí Éagsúla Diagnóiseacha Cúise: Ar Fhéin-mheabhlaireacht agus ar Mheon an Vótálaí. Journal of Pearsantacht agus Síceolaíocht Shóisialta 46: 237-248

[16] Skyrms B (2004) An Stag Hunt agus Éabhlóid an Struchtúir Shóisialta. Cambridge University Press, Cambridge

[17] Spohn W (1977) Sa chás go ndéanann Luce agus Krantz Samhail Chinneadh Savage a Ghinearálta. Erkenntnis 11: 113-134

[18] Starmer C (2000) Forbairtí i dteoiric neamhthuartha fóntais: fiach teoiriciúil de rogha faoi riosca a lorg. Iris Litríochta Eacnamaíochta 38: 332-382

[19] Sugden R (2005) Eacnamaíocht na gCeart, an Chomhar agus an Leasa. Palgrave MacMillan, eagrán 2: 132

[20] Von Neumann J, Morgenstern O (1953) Teoiric na gCluichí agus Iompraíocht Eacnamaíoch. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) Ceacht Paradox Newcomb. Synthese 190: 1637-164