Gemischte Strategie

Aus Wikiludia
Wechseln zu: Navigation, Suche


Definition: Gegeben ist ein Spiel in Normalform mit n Spielern {1, ..., n}, S = S1 x S2 x ... x Sn , ui : S R
Voraussetzung |Si | = mi endlich, dann ist Si = {si1, ..., simi } die Menge der reinen Strategien des Spielers i. Jede Wahrscheinlichkeitsverteilung über diese reinen Strategien ist eine gemischte Strategie:

Δ Si = Δ(Si) := {(p1i, ..., pmii ) Rmi : Σ pji = 1 & pji 0}


pji bzw. σij bezeichnet dabei die Wahrscheinlichkeit mit der sij gewählt wird. Im allgemeinen wird eine gemischte Strategie mit σi(p) = (p1i, ..., pmii) dargestellt. Falls für mindestens zwei j die Bedingung 0 < σij < 1 erfüllt ist, liegt eine echte gemischte Strategie vor.

Beispiel: Gegeben sei ein 2 Personenspiel mit folgender Auszahlungsmatrix:

Spieler 1 \ 2         Strategie 1                 Strategie 2        
        Strategie 1           1,   –1 –2,   2
        Strategie 2         –2,   2   3,   –3


Dieses Spiel scheint auf dem ersten Blick ein faires Spiel zu sein. Falls die möglichen Strategiekombinationen (1,1),(1,2),(2,1),(2,2) – in Klammern steht die jeweilige Strategie des jeweiligen Spielers - gleichhäufig auftreten, ist die Gewinnerwartung eines jeden Spielers gleich Null. Allerdings ist dieses Spiel nicht gerecht wie gleich aufgezeigt wird. Dabei geht man davon aus, dass beide Spieler jeweils eine gemischte Strategie wählen:

Spieler 1 wählt mit Wahrscheinlichkeit p die Strategie 1 und mit Wahrscheinlichkeit (1-p) die Strategie 2.
Spieler 2 verhält sich analog: Er wählt mir Wahrscheinlichkeit q die Strategie 1 und mit Wahrscheinlichkeit (1-q) die Strategie 2.
Daraus ergeben sich folgende zu erwartende Auszahlungen an die Spieler:

u1 = 8pq – 5p – 5q + 3                         u2 = – 8pq + 5p + 5q – 3

Wir erhalten die Nash-Gleichgewichte: p* = 5/8, q* = 5/8.

Falls Spieler 2 die Strategie q = q* = 5/8 wählt, kann Spieler 1 jede beliebige Strategie wählen. Durchschnittlich wird er auf lange Sicht gesehen mindestens pro Spiel einen Verlust von 1/8 hinnehmen müssen, denn:

u11(p*), σ2(q*)) = –1/8                     u21(p*), σ2(q*)) = 1/8


Definition: si Si ist beste Antwort auf s-i S-i, wenn:

ui(si, s-i) ui(si', s-i)   ∀si' Si = sup{ ui(si,s-i): si' Si} R   bi(s-i) := {si Si : si beste Antwort auf s-i} Si


Aber: Si kompakt und ui stetig   bi(si) Ø

Beispiel: Cournot-Oligopol: Gegeben: n Firmen mit gleichem Produkt. Zusammengefasst: b(s) := (b1(s-1), ..., bn(s-n)) S
s S, b: S S beste Antwort-Korrespondenz. Konkret:
Mit der Preisfunktion p(s) = P – (s1 + ... + sn), wobei si = Produktionsmenge des Unternehmen i und P den vorhandenen Marktpreis repräsentieren, ergibt sich die Gewinnfunktion ui(s) = p(s)si - csi mit Fixkosten c. Die Gewinnfunktion ist zu Maximieren:
ui(s) / si = 0       0 = P – c – Σj=1,j≠i(sj) – 2si               2si = P – c – Σj≠i(si)
Beste Antwort:   bi = ½ (P – c – Σj≠i(si))                     Maximum, da ui / 2si(bi) < 0


Satz: s* ist Nash-Gleichgewicht   ∀i {1,...,n}: si* bi(s-i)   s* b(s*)

Beweis: s* ist Nash - Gleichgewicht   ∀i ui(s*, s-i) ui(si, s-i) ∀i ui(s*, s-i) ui(si', s-i)
∀i {1,...,n}: si* bi(s-i)   ∀i   s* {si Si: ui(si, s-i) ui(si', s-i)} ∀i ui(s*, s-i) ui(si', s-i)
s* b(s*)   s* {s* Si: ui(s*, s-i) ui(si', s-i)} ∀i ui(s*, s-i) ui(si', s-i)

Beste Antwort in gemischten Strategien: Ein weiterer interessanter Aspekt, im Bezug auf die beste Antwort, ist in einem Spiel mit gemischten Strategien gegeben. Ein Spieler wählt eine gemischte Strategie als beste Antwort auf die gemischte Strategie der Anderen.
Die Gleichung

uii-i) Eσi(ui(si-i)) Σsi∈ Si ui(si-ii(si)

stellt den erwarteten Gewinn des Spielers i, bzgl. seiner Strategie σi und den anderen Strategien σ-i der Mitspieler dar.


Definition: Die beste Antwort in einer gemischten Strategie bi: Δ S-i Δ Si ist definiert durch:

bi-i) = {σi Δ Si: uii, σ-i) uii', σ-i)   ∀σi' Δ (Si)}

Für jedes σ-i Δ S-i, ist ui*i) = max{ui(si, σi): si Si}


Korollar: Falls die Bedingungen σi(si) > 0 und ui(si, σ-i) = ui*i) erfüllt sind folgt: σi bi-i)

Beweis: Angenommen die Bedingung ui(si, σ-i) = ui*-i) und σi(si) > 0 seien erfüllt, dann ergibt sich mit Σsi Si σi(si) = 1 und σi(si) 0 für jedes si Si: uii, σ-i) Σsi Si ui(si, σ-i) σi(si) = Σsi Si ui*-i) σi(si) = ui*-i) Σsi Si σi(si) = ui*-i). Andererseits muss für jede gemischte Strategie σi- gelten: uii-, σ-i) Σsi ∈ Si ui(si-i) σi-(si) Σsi ∈ Si ui*-i) σi-(si) = ui*i-). Aufgrund dessen folgt, falls die Bedingungen σi(si) > 0 und ui(si, σ-i) = ui*-i) erfüllt sind: uii, σ-i) = ui*-i) uii-, σ-i) für alle σi- Δ Si. Das wiederum Bedeutet das σi bi-i) ist.

Bemerkung: Dasselbe Ergebnis kann auch über einen Widerspruchsbeweis erzielt werden. Betrachte dazu die Strategie si* die zusätzlich die Bedingungen σi(si*) > 0 und ui(si*, σ-i) < ui*-i) erfüllt. Wähle weiter eine Strategie si- mit der Eigenschaft ui(si-, σ-i) = ui*-i). Dann folgt aufgrund von

uii, σ-i) = Σsi ∈ Si ui(si, σ-i) σi(si) = ui(si*, σ-i) σ i(si*) + Σsi≠si* ui(si, σ-i) σi(si)
ui(si*, σ-i) σi(si*) + Σsi≠si* ui*-i) σi(si) < ui*-i) σi(si*) + ui*-i) Σsi≠si* σi(si) =
= ui*-i)(σi(si*) + Σsi≠si* σi(si)) = ui*-i) = ui(si*, σ-i)

dass σi bi-i) ist.

Meine Werkzeuge