Gemischte Strategie
|
Δ Si = Δ(Si) := {(p1i, ..., pmii ) ∈ Rmi : Σ pji = 1 & pji ≥ 0} pji bzw. σij bezeichnet dabei die Wahrscheinlichkeit mit der sij gewählt wird. Im allgemeinen wird eine gemischte Strategie mit σi(p) = (p1i, ..., pmii) dargestellt. Falls für mindestens zwei j die Bedingung 0 < σij < 1 erfüllt ist, liegt eine echte gemischte Strategie vor. |
Beispiel: Gegeben sei ein 2 Personenspiel mit folgender Auszahlungsmatrix:
| Spieler 1 \ 2 | Strategie 1 | Strategie 2 |
| Strategie 1 | 1, –1 | –2, 2 |
| Strategie 2 | –2, 2 | 3, –3 |
Dieses Spiel scheint auf dem ersten Blick ein faires Spiel zu sein. Falls die möglichen Strategiekombinationen (1,1),(1,2),(2,1),(2,2) – in Klammern steht die jeweilige Strategie des jeweiligen Spielers - gleichhäufig auftreten, ist die Gewinnerwartung eines jeden Spielers gleich Null. Allerdings ist dieses Spiel nicht gerecht wie gleich aufgezeigt wird.
Dabei geht man davon aus, dass beide Spieler jeweils eine gemischte Strategie wählen:
Spieler 1 wählt mit Wahrscheinlichkeit p die Strategie 1 und mit Wahrscheinlichkeit (1-p) die Strategie 2.
Spieler 2 verhält sich analog: Er wählt mir Wahrscheinlichkeit q die Strategie 1 und mit Wahrscheinlichkeit (1-q) die Strategie 2.
Daraus ergeben sich folgende zu erwartende Auszahlungen an die Spieler:
u1 = 8pq – 5p – 5q + 3 u2 = – 8pq + 5p + 5q – 3
Wir erhalten die Nash-Gleichgewichte: p* = 5/8, q* = 5/8.
Falls Spieler 2 die Strategie q = q* = 5/8 wählt, kann Spieler 1 jede beliebige Strategie wählen. Durchschnittlich wird er auf lange Sicht gesehen mindestens pro Spiel einen Verlust von 1/8 hinnehmen müssen, denn:
u1(σ1(p*), σ2(q*)) = –1/8 u2(σ1(p*), σ2(q*)) = 1/8
|
ui(si, s-i) ≥ ui(si', s-i) ∀si' ∈ Si = sup{ ui(si,s-i): si' ∈ Si} ∈ R bi(s-i) := {si ∈ Si : si beste Antwort auf s-i} ⊂ Si Aber: Si kompakt und ui stetig ⇒ bi(si) ≠ Ø |
Beispiel: Cournot-Oligopol: Gegeben: n Firmen mit gleichem Produkt. Zusammengefasst:
b(s) := (b1(s-1), ..., bn(s-n)) ⊂ S
s ∈S, b: S → S beste Antwort-Korrespondenz. Konkret:
Mit der Preisfunktion p(s) = P – (s1 + ... + sn), wobei si = Produktionsmenge des Unternehmen i und P den vorhandenen Marktpreis repräsentieren, ergibt sich die Gewinnfunktion ui(s) = p(s)si - csi mit Fixkosten c.
Die Gewinnfunktion ist zu Maximieren:
∂ui(s) / ∂si = 0
⇒ 0 = P – c – Σj=1,j≠i(sj) – 2si
2si = P – c – Σj≠i(si)
Beste Antwort: bi = ½ (P – c – Σj≠i(si)) Maximum, da ∂ui / ∂2si(bi) < 0
|
|
Beweis:
s* ist Nash - Gleichgewicht ⇔ ∀i ui(s*, s-i) ≥ ui(si, s-i) ⇔ ∀i ui(s*, s-i) ≥ ui(si', s-i)
∀i ∈{1,...,n}: si* ∈ bi(s-i) ⇔ ∀i s* ∈ {si ∈ Si: ui(si, s-i) ≥ ui(si', s-i)} ⇔ ∀i ui(s*, s-i) ≥ ui(si', s-i)
s* ∈ b(s*) ⇔ s* ∈ {s* ∈ Si: ui(s*, s-i) ≥ ui(si', s-i)} ⇔ ∀i ui(s*, s-i) ≥ ui(si', s-i)
Beste Antwort in gemischten Strategien:
Ein weiterer interessanter Aspekt, im Bezug auf die beste Antwort, ist in einem Spiel mit gemischten Strategien gegeben. Ein Spieler wählt eine gemischte Strategie als beste Antwort auf die gemischte Strategie der Anderen.
Die Gleichung
stellt den erwarteten Gewinn des Spielers i, bzgl. seiner Strategie σi und den anderen Strategien σ-i der Mitspieler dar.
|
Für jedes σ-i ∈ Δ S-i, ist ui*(σi) = max{ui(si, σi): si ∈ Si} |
|
|
Beweis: Angenommen die Bedingung ui(si, σ-i) = ui*(σ-i) und σi(si) > 0 seien erfüllt, dann ergibt sich mit Σsi ∈ Si σi(si) = 1 und σi(si) ≥ 0 für jedes si ∈ Si: ui(σi, σ-i) ≡ Σsi ∈ Si ui(si, σ-i) σi(si) = Σsi ∈ Si ui*(σ-i) σi(si) = ui*(σ-i) Σsi ∈ Si σi(si) = ui*(σ-i). Andererseits muss für jede gemischte Strategie σi- gelten: ui(σi-, σ-i) ≡ Σsi ∈ Si ui(si,σ-i) σi-(si) ≤ Σsi ∈ Si ui*(σ-i) σi-(si) = ui*(σi-). Aufgrund dessen folgt, falls die Bedingungen σi(si) > 0 und ui(si, σ-i) = ui*(σ-i) erfüllt sind: ui(σi, σ-i) = ui*(σ-i) ≥ ui(σi-, σ-i) für alle σi- ∈ Δ Si. Das wiederum Bedeutet das σi ∈ bi(σ-i) ist.
Bemerkung: Dasselbe Ergebnis kann auch über einen Widerspruchsbeweis erzielt werden. Betrachte dazu die Strategie si* die zusätzlich die Bedingungen σi(si*) > 0 und ui(si*, σ-i) < ui*(σ-i) erfüllt. Wähle weiter eine Strategie si- mit der Eigenschaft ui(si-, σ-i) = ui*(σ-i). Dann folgt aufgrund von
ui(σi, σ-i) =
Σsi ∈ Si ui(si, σ-i) σi(si) = ui(si*, σ-i) σ i(si*) + Σsi≠si* ui(si, σ-i) σi(si)
≤
≤ ui(si*, σ-i) σi(si*) + Σsi≠si* ui*(σ-i) σi(si) <
ui*(σ-i) σi(si*) + ui*(σ-i) Σsi≠si* σi(si) =
= ui*(σ-i)(σi(si*) + Σsi≠si* σi(si)) = ui*(σ-i) = ui(si*, σ-i)
dass σi ∉ bi(σ-i) ist.