Il Dilemma del Prigioniero e le strategie di negoziazione

Podcast: Play in new window | Download

Il Dilemma del Prigioniero è uno degli schemi di interazione più conosciuto della teoria dei giochi e le sue logiche sono dominanti in politica, in economia e nel sociale.

Due persone, sospettate di aver commesso un furto, vengono prelevate dalla polizia, portate in commissariato e interrogate in stanze separate. Ciascuna di loro ha la possibilità di confessare, denunciando l’altra, oppure di negare di aver commesso il fatto. Se un solo prigioniero confessasse, egli sarebbe libero, mentre l’altro sarebbe ritenuto colpevole e condannato a 6 mesi di prigione. Se entrambi negassero la propria colpevolezza, sarebbero condannati a 1 mese, e a 3 mesi se tutti e due confessassero. I possibili risultati sono rappresentati nella tabella sottostante, definita “matrice dei payoff”.

Tabella 1: Il dilemma del prigioniero. I numeri negativi rappresentano i mesi di detenzione.

Se fossimo il prigioniero A, e B avesse deciso di negare di aver commesso il furto, ci converrebbe confessare perchè otterremmo la libertà. Analogamente, se B confessasse, ci converrebbe comunque confessare, perché la condanna sarebbe di 3 mesi invece che di 6. Qualunque scelta di B, ci converrebbe confessare. Lo stesso ragionamento vale per B: anche a lui conviene sempre confessare.

Quindi l’unico equilibrio di questo gioco corrisponde alla scelta di entrambi i prigionieri di confessare e quindi di “tradire” il proprio complice, ottenendo come risultato 3 mesi di detenzione a testa. C’è un problema però: questo equilibrio non corrisponde ad una scelta efficiente. Se i prigionieri fossero in grado di coordinarsi e si accordassero per negare, potrebbero raggiungere un risultato migliore con solo 1 mese di detenzione ciascuno. Questa situazione paradossale è definita in teoria dei giochi il Dilemma del Prigioniero.

Il dilemma del prigioniero è ovunque

Un gran numero di processi politici, economici e sociali seguono un modello di interazione con le stesse caratteristiche del Dilemma del Prigioniero. Pensiamo ad esempio alla guerra fredda tra Stati Uniti e Russia nel secondo dopoguerra e immaginiamo una negoziazione in relazione agli armamenti nucleari. La scelta “confessare” e quindi tradire, corrisponde ad “installare un nuovo missile” e la strategia “negare” cioè cooperare, corrisponde a “non installarlo”. Se il mio nemico installa i missili avrò incentivo a farlo anche io per non rimanere indifeso, ma avrò incentivo a farlo anche se il nemico non lo fa, per guadagnare un vantaggio competitivo. Il risultato sarà il proliferare di armamenti nucleari anche se la migliore strategia per entrambi sarebbe quella di accordarsi per non installare neanche un missile. Non è un caso che in quegli anni i consulenti strategici più ascoltati dal governo americano fossero esperti di teoria dei giochi.

In ambito economico la schema del dilemma del prigioniero può essere applicato a tutti quei mercati caratterizzati da una competizione oligopolistica (pochi operatori che dominano): in questo caso il tradimento è la tendenza ad abbassare i prezzi al di sotto del livello che è stato implicitamente concordato dai principali operatori. Il Dilemma del Prigioniero spiega anche situazioni di cartello come l’OPEC, l’organizzazione dei paesi esportatori di petrolio: ogni paese ha un incentivo a produrre di più della quota assegnata, qualunque sia il comportamento, disciplinato o meno, degli altri paesi facenti parte del cartello.

Infine nel campo del sociale, tutte le situazioni di sfruttamento di beni comuni, comprese le risorse ambientali, hanno logiche assimilabili a quelle del Dilemma del Prigioniero: il singolo tende ad approfittarsi del bene collettivo per trarne un vantaggio personale, secondo un modello conosciuto come la tragedia dei beni comuni, da un celebre articolo dell’ecologo Garret Hardin (The Tragedy of the Commons). L’ambiente è un esempio classico: se tradisco e lo sfrutto posso ottenere un beneficio, a volte anche significativo, mentre creo un danno limitato alla collettività; ma se tutti si comportassero allo stesso modo i danni ambientali sarebbero disastrosi. Avete presente le riunioni di condominio in cui si discute perché qualche condomino utilizza gli spazi comuni a fini personali? La logica è la stessa.

Il dilemma del prigioniero riflette la tensione tra la razionalità dell’individuo, naturalmente portato ad essere egoista, e la razionalità di gruppo, rappresentata dal fatto che, se gli individui cooperano, riescono ad ottenere un risultato migliore.

“La libertà in un bene comune porta in rovina tutti.” (Garret Hardin)

I tornei di Axelrod

Il Dilemma del Prigioniero ha provocato numerosi dibattiti tra gli studiosi per stabilire quale sia il modo più corretto di “giocare” e trovare una soluzione efficiente alla tensione tra egoismo e necessità di cooperazione.

Uno degli aspetti chiave da considerare è la durata della relazione tra i giocatori (individui/imprese/governi): se la relazione è limitata ad un solo rapporto, come la situazione analizzata tra i due prigionieri catturati, la tendenza sarà quella di tradire. Tuttavia, nel mondo reale, le relazioni hanno in gran parte dei casi un carattere continuativo nel tempo: così è nei negoziati tra paesi, nelle relazioni commerciali tra aziende, fornitori e clienti e anche nei rapporti interpersonali. In questi casi ciascun giocatore nel valutare le sue scelte terrà conto di come la controparte si è comportata in passato e degli obiettivi futuri della relazione.

Robert Axelrod, professore di scienze politiche all’Università del Michigan, nel 1980 effettuò due esperimenti molto famosi per individuare la strategia migliore per giocare il Dilemma del Prigioniero in un contesto di rapporti continuativi. Axelrod organizzò due tornei invitando i maggiori esperti di teoria dei giochi, appartenenti a diverse discipline: matematica, psicologia, economia, sociologia e scienze politiche. Il gioco prevedeva che ciascun partecipante si sarebbe scontrato a turno con tutti gli altri secondo uno schema del Dilemma del Prigioniero ripetuto 200 volte: in ognuna delle 200 mosse, il punteggio per chi tradiva era rispettivamente di 5 punti e 1 punto se l’avversario cooperava o tradiva; se cooperava il punteggio era rispettivamente di 3 punti e 0 punti. C’era quindi la tentazione a tradire se l’avversario cooperava (5 punti) mentre la situazione di cooperazione congiunta era premiata (3 punti) rispetto a quella del tradimento congiunto (1 punto). La situazione peggiore era quella di chi cooperava se l’altro tradiva (0 punti) anche definita come “sucker’s payoff”.

Ciascun esperto doveva presentare un algoritmo di gioco che ad ogni mossa doveva scegliere se tradire o cooperare, tenendo conto delle giocate precedenti e dell’obiettivo di massimizzare il proprio punteggio.

In entrambi i tornei risultò vincente la strategia più semplice, quella presentata da Anatol Rapoport, professore di psicologia all’università di Toronto. TIT FOR TAT, in italiano “colpo su colpo”, è una strategia che prevede come prima mossa quella di cooperare e nelle mosse successive replicare la scelta precedente dell’avversario.

Nonostante la strategia TIT FOR TAT fosse ampiamente conosciuta in teoria dei giochi anche prima dei tornei di Axelrod, nessun altro partecipante riuscì ad escogitare una strategia più performante.

Le qualità di una strategia di negoziazione vincente

La strategia “colpo su colpo” ha delle caratteristiche ben definite che ne determinano la sua efficacia.

Innanzitutto non tradisce mai per prima, caratteristica che viene definita da Axelrod “niceness”. Le strategie che ottennero i risultati più alti in entrambi i tornei erano tutte “nice”: se una strategia nice incontra un’altra strategia nice, si instaura un equilibrio in cui i giocatori cooperano sempre in tutte le mosse, ottenendo un risultato elevato alla fine del gioco. Prima regola: essere sempre disposti a cooperare e non tradire mai per primi. Se infatti incontriamo una controparte nice si determinerà subito un equilibrio di cooperazione mutualmente soddisfacente.

Un aspetto determinante era come si comportavano le strategie di tipo nice quando incontravano una strategia “non nice”, che in qualche circostanza del gioco cercava di sfruttare la situazione a proprio favore tradendo quando l’altro giocatore cooperava. La strategia TIT FOR TAT ha due caratteristiche per gestire questo tipo di situazione.

Innanzitutto è provocabile (“provocability”), cioè tende immediatamente a punire con un tradimento se la controparte si è comportata male nella mossa precedente. La provocabilità è una caratteristica importante per disincentivare comportamenti scorretti da parte dell’altro giocatore che sa che sarà immediatamente punito se si comporterà male.

Ma TIT FOR TAT è anche disponibile a perdonare immediatamente (“forgiveness”): se la controparte dopo aver tradito torna a comportarsi bene, TIT FOR TAT ritorna immediatamente a cooperare. La disponibilità a perdonare è importante per evitare meccanismi di “escalation di rappresaglia” che porterebbero i giocatori a bloccarsi in una situazione di mutuo tradimento, dannoso per entrambi.

Una delle lezioni più evidenti che emerse dai tornei fu che le strategie “furbe”, che cercavano in qualche occasione di tradire la fiducia della controparte, non si rivelarono efficaci perché il tradimento innescava quasi sempre una sequenza di rappresaglie che danneggiava entrambe le controparti: a differenza di TIT FOR TAT infatti, non tutte le strategie nice erano disposte a perdonare.

Axelrod sottolinea che prima di effettuare ogni scelta occorra effettuare un’analisi di secondo e terzo livello: al primo livello un tradimento offre un vantaggio se l’altro giocatore coopera; al secondo livello si deve tener conto della reazione dell’avversario, che se è provocabile, potrebbe tradire a sua volta; al terzo livello si dovrebbe anche considerare l’entità della reazione dell’avversario che potrebbe essere più che proporzionale, non essendo in qualche caso disposto a perdonare.

Di conseguenza se un’azienda abbassa i prezzi per guadagnare quote di mercato, dovrebbe considerare le reazioni degli altri competitor. Qualche competitor potrebbe reagire abbassando i prezzi ancora di più, scatenando una guerra che potrebbe andare a discapito di tutti i player sul mercato.

La “trade war” e il “colpo su colpo”

Se ci pensiamo bene, anche la recente “trade war” tra Stati Uniti e Cina è un caso di interazione con uno schema del Dilemma del Prigioniero dove i giocatori stanno utilizzando una strategia “colpo su colpo”: i leader di entrambi i paesi si dichiarano disposti a collaborare (niceness); quando Trump ha introdotto nuove tariffe, la Cina ha risposto immediatamente con misure simili (provocability); questo però non ha impedito ad entrambe le parti di continuare a sedersi al tavolo per cercare di trovare una nuova cooperazione (forgiveness).Gli studi di Axelrod ci offrono delle indicazioni molto importanti per impostare in tutti i contesti una strategia di interazione efficace: dobbiamo essere gentili per instaurare da subito rapporti di collaborazione mutualmente favorevoli; dobbiamo farci rispettare per evitare di essere sfruttati; infine dobbiamo essere disposti a perdonare per evitare situazioni stile Guerra dei Roses che sono dannosi per tutti.

Bibliografia:

Axelrod, Robert. Effective Choice in the Prisoner’s Dilemma. Journal of Conflict Resolution, March 1980.

Axelrod, Robert. More Effective Choice in the Prisoner’s Dilemma. Journal of Conflict Resolution, September 1980.

Varian Hal R. Microeconomia. Cafoscarina, 1990.