Gefangenendilemma

Aus Wikiludia
Wechseln zu: Navigation, Suche

Das Gefangenendilemma ist ein klassisches Beispiel aus der Spieltheorie.

Zwei Schwerverbrecher wurden gefangen, jedoch kann die Staatsanwaltschaft ihnen nur eine geringere Straftat nachweisen (die mit nur 3 Jahren bestraft würde, statt mit 10 Jahren).

Die Staatsanwaltschaft bietet den Verbrechern folgende kronzeugenregelung an: Sagt einer von ihnen als Kronzeuge aus (A: Aussagen), so bekommt dieser keine Gefängnisstrafe; der andere kann jedoch dann der ganzen Tat überführt werden, und bekommt die volle Strafe von 10 Jahren. Die Gefangenen können sich absprechen, sie werden jedoch unabhängig voneinander nach ihrer Entscheidung befragt. Sagen beide Gefangenen gegeneinander aus, so wird ihnen der gute Wille angerechnet, und sie bekommen beide "nur" 8 Jahre.

Das Dilemma der Gefangenen sieht jetzt folgendermaßen aus:

Die beste Lösung für beide wäre, wenn keiner von ihnen aussagt (S: Schweigen); dann bekommen sie beide eine Strafe von 3 Jahren.

Jedoch steckt in diesem Verhalten ein großes Risiko: betrügt der eine Gefangene und sagt aus, so geht er leer aus, während der andere 10 Jahre bekommt; die egoistische Entscheidung wäre also zu betrügen (d.h. sich nicht an die Absprache zu halten).

Wenn sich hingegen die Gefangenen auf die höhere Strafe von 8 Jahren einigen, können sie davon ausgehen dass sich der andere an die Absprache halten wird: andernfalls würde dieser selbst 10 Jahre bekommen. Diese Situation, dass niemand aus egoistischen Gründen abweichen wird, bezeichnet man auch als Nash-Gleichgewicht.

Als Tabelle (Normalform) dargestellt sieht das folgendermaßen aus (S: Schweigen, A: Aussagen):

G2
S A
G1 S 3,3 10,0
A 0,10 8,8

Würde beispielsweise derjenige, der als einzige aussagt, nicht leer ausgehen, sondern beispielsweise von der Mafia mit dem Leben bedroht werden, so wird auch die Absprache "S,S" zu einem Nash-Gleichgewicht.

Siehe auch: Iteriertes Gefangenendilemma

Variante

Eine Variante des Gafangenendilemmas ist das sog. Lift-Dilemma.
Pay-off Matrix des Lift-Dilemmas

Spieler1/2 cooperate defect
cooperate A=(4,4) B=(0,10)
defect C=(10,0) D=(1,1)

Mathieu und Delahaye (c,d) untersuchen diese Variante des Gefangenendilemma bei der die Forderung (C+B)/2<A verletzt ist.Es sind zwei Ebenen von Kooperation möglich.

  • [c,c] führt zu 4 Punkten.
  • [c,d],[d,c] führen jeweils zu 5 Punkten.

Um die zweite Ebene der Kooperation zu erreichen, ist eine Abstimmung darüber nötig,wer zuerst kooperiert und dann defektiert. Delahaye und Mathieu geben einige Situationen an ,die durch das Lift-Dilemma beschrieben werden können:

Klavier spielen: Hans liebt es Klavier zu spielen. Sein Nachbar Klaus dagegen spielt gerne Schlagzeug. Dabei werden beide durch die Musik des anderen gestört werden. es gibt folgende Möglichkeiten:

  • [c,d]Hans spielt Klavier und Klaus ist still,dass bringt Hans 10 "Genusspunkte"
  • [d,c]Klaus spielt Schlagzeug und Hans ist still. Dass bringt Klaus 10 und Hans keinen "Genusspunke"
  • [d,d] Beide spielen Ihre Instrumente und werden jeweils durch den anderen gestört.Das bring für jeden je einen "Genusspunkt".
  • [c,c]Keiner spielt. Dass bringt 4 "Genusspunkte".


Zugriff auf eine unteilbare Sache, die periodisch verfügbar ist. Diese Situation ist eine Verallgemeinerung des vorherigen Beispiels.Zu kooperieren bedeutet den Versuch Zugriff zu erlangen, ohne dabei die Fairness bzw. Absprachen ausser Acht zu lassen. Zu defektieren bedeutet den Versuch, Zugriff ohne Rücksicht zu erlangen. Eine [d,c] Runde stellt dann das Unterordnen des zweiten Spielers unter die Dominanz des ersten dar. Bei Löwen ist es zu beobachten, dass sie nicht bis zum Tod gegeneinander kämpfen, sondern bis einer von den beiden aufgibt und sich dem anderen dadurch unterordnet. Es gewinnen beide, wobei, der Überlegene im Gegensatz zum Unterlegenen mehr gewinnt.
Erreichung einer solchen Kooperation:
Keine deterministische Strategie kann gegen sich selbst eine Ebene-2 Kooperation durchsetzen, denn eine Kommunikation zwischen den Gegnern über die reinen Spielzüge hinaus ist nicht möglich. Es müßte eine Verständigung darüber stattfinden, wer zuerst defektiert, also den Gegner ausbeutet. Zwei Instanzen einer deterministischen Strategie verhalten sich gegeneinander aber völlig identisch, also können sie nicht "außer Phase" geraten, d.h. eine deterministische Strategie spielt gegen sich selbst nie [c,d] oder [d,c]. Deshalb haben Delahaye und Mathieu das nichtdeterministische, probabilistische reason entwickelt, das folgende Strategie verfolgt:

  • Kooperiere mit Wahrscheinlichkeit pc=0,5669 und defektieren mit Wahrscheinlichkeit pd=0,43304 in der ersten Runde und nach jeder Runde, in der beide in Phase waren.
  • Danach entweder (d c d c d c...) oder (c d c d c d...), je nachdem, welchen Zug der Gegner als letztes gemacht hat.

Der Nachteil hierbei ist,dass es zwar gegen sich selbst die maximale Punktzahl ((B+C)/2=5) erreicht, allerdings z.b.gegen defect keine Chance hat.Eine Verbesserung bringt die Kombination von reason und tit-for-tat:
Verbesserung: reason-tit-for-tat:

  • Kooperiere mit Wahrscheinlichkeit pc=0,56696 und defectiere mit Wahrscheinlichkeit pd=0,43304 in der ersten Runde und nach jeder Runde, in der beide in Phase waren.
  • Danach spiele tit-for-tat.

Die Kooperationswahrscheinlichkeit pc=0,56696 leitet sich aus der Überlegung ab, dass eine Wahrscheinlichkeit von p=o,5 zwar am schnellsten zu der angestrebten Ebene-2 Kooperation führt, aber in den Runden, in denen die beiden Gegner "in Phase" sind, nur (A+D)/2=2,5 Punkte erreicht weden. Mit p=0,75 wären es zum Beispiel 0.75*4+0.25*1 Punkte. Der Wert pc=0,56696 ist das Resultat der Polynomoptimierung, dass beide entgegenstehenden Ziele ausdrückt:
-(1-2pc+2pc2)(pc(A-D)+D-(C+B)/2)/(2pc(1-pc)),
mit de vorliegenden Werten:
-(1-2pc+2pc2)(pc(3)-4)/(2pc(1-pc))
Der sich ergebende Wert von </sub>pc = 0,56696 weicht nur geringfügig von 0,5 ab. Für eine genaue Herleitung von pc siehe man Mathieu und Delahaya.

Meine Werkzeuge