Analyse der Dynamik von Nullsummenspielen

Aus Wikiludia
Wechseln zu: Navigation, Suche

Wir betrachten ein evolutorisches Spiel mit dem Matrixspiel G\ als Basisspiel. G=(M,S,u)\ ist ein symmetrisches Zweipersonen-Nullsummenspiel mit


M=\left\{1,2\right\}; \quad S_1=S_2=\Delta=\left\{x\in\mathbb{R}^m:\sum^{m}_{i=1} {x_{i}} =1, \; x_{i} \geq 0\right\}; \quad u_1(x,y)=-u_1(y,x)=x^TAy, \quad x,y\in \Delta,

wobei die Auszahlungsmatrix A=(a_{ij})\in\mathbb{R}^{m\times m}\ eine nicht ausgeartete schiefsymmetrische Matrix ist, d.h. a_{ij}=-a_{ji} \ \forall i,j \in \left\{1,\ldots, m\right\}\ .
Es seien

 
x=x(t)=\left(x_1(t),\ldots, x_m(t)\right) \in \Delta, \quad y=y(t)=\left(y_1(t),\ldots, y_m(t)\right) \in \Delta

die Strategien von Spieler 1 bzw. 2. Die spieldynamische Differentialgleichung auf dem Raum \Delta \times \Delta\ aller Stragiepaare hat folgende Gestalt:

(1) \quad \ \dot{x}_i=x_i\left(e_i^TAy - x^TAy\right), \quad i=1,\ldots,m

\dot{y}_j=y_j\left(e_j^T(-A)x - y^T(-A)x\right), \quad j=1,\ldots,m

(vgl. Bimatrixspiel für n=m, \ B=-A\ ; siehe auch Replikatorgleichung).
Nach dem Minimax-Prinzip und dem Minimax-Theorem von John von Neumann existieren bei Nullsummenspielen stets Minimax-Strategien, d.h. Paare (p,q)\in \Delta \times \Delta\ mit folgender Optimalitätseigenschaft: Für alle (x,y)\in \Delta \times \Delta\ gilt

 
(2) \quad x^TAq \ \leq \ p^TAq \ \leq \ p^TAy

(die zweite Ungleichung ist äquivalent zur q^T(-A)p \ \geq \ y^T(-A)p\ ).
Um die Stabilität von (p,q)\ zu untersuchen, definieren wir auf \Delta\ die Funktionen

 
(3) \quad P(x):=\prod_{i=1}^m {x_i^{p_i}}, \quad Q(y):=\prod_{i=1}^m {y_i^{q_i}}

und den Begriff der Bewegungsinvariante.

Definition:
Die Funktion V(x,y), \ (x,y) \in \Delta \times \Delta\ ist eine Bewegungsinvariante von (1), falls für t \geq 0\

 
\frac{d}{dt} V\left(x(t),y(t)\right)=0

gilt, wobei \left(x(t),y(t)\right)\ die Lösung von (1) ist.

Satz
Falls (p,q)\ im Inneren von \Delta \times \Delta\ liegt, besitzt (p,q)\ genau dann die Eigenschaft (5), wenn V:=PQ\ eine Bewegungsinvariante von (4) ist. In diesem Fall ist (p,q)\ stabil, aber nicht asymptotisch stabil.

Beweis:

Aus der Definition (3) folgt:

(4) \quad \partial_t(logP)=\sum_{i=1}^m {p_i\frac{\dot{x}_i}{x_i}}=\sum_{i=1}^m {p_i\left(e_i^TAy - x^TAy\right)}=p^TAy - x^TAy

(5) \quad \partial_t(logQ)=\sum_{i=1}^m {q_i\frac{\dot{y}_i}{y_i}}=\sum_{i=1}^m {q_i\left(e_i^T(-A)x - y^T(-A)x\right)}=q^T(-A)x - y^T(-A)x.

Daraus folgt die Gleichung für \dot{V}\  :

 
\dot{V}=\partial_t(PQ)=\dot{P}Q + P\dot{Q}=P\partial_t(logP)Q + PQ\partial_t(logQ)=PQ(p^TAy - x^TAq).

Wenn V=PQ\ eine Bewegungsinvariante ist, gilt p^TAy = x^TAq\ , woraus (2) folgt. Wenn umgekehrt (p,q)\ ein Gleichgewichtspaar ist (was ja die Bedeutung von (2) ist), so folgt, dass Aq=(c,\ldots,c)\ gilt und daher


x^TAq=\sum_{i=1}^m {cx_i}=c

genauso wie


p^TAq=\sum_{i=1}^m {cp_i}=c

also p^TAq=x^TAq\ . Ähnlich gilt p^TAy=p^TAq\ , woraus wieder \dot{V}=0\ folgt.
Jede Bahn im Inneren von \Delta \times \Delta\ bleibt also auf einer konstanten Fläche von V\ und strebt nicht zum Rand hin. Daraus folgt, dass jede Bahn in einer gewissen Umgebung von (p,q)\ bleibt, also ist (p,q)\ stabil. Dagegen strebt die Bahn nicht zum Gleichgewichtspunkt (p,q)\ , falls T\rightarrow\infty\ , also ist (p,q)\ nicht asymptotisch stabil. Das gilt nur für die Zeitmittel


p=\lim_{T\rightarrow\infty} \frac{1}{T}\int_0^T {x(t)}dt, \quad q=\lim_{T\rightarrow\infty} \frac{1}{T}\int_0^T {y(t)}dt.

Meine Werkzeuge