Differenzialspiele

Aus Wikiludia
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Differenzialspiele

Einleitung

Die Modellierung wiederholter Interaktion durch wiederholte Spiele kann Situationen nicht gerecht werden, in denen Spieler über die Zeit Information hinzugewinnen oder sich ihre Handlungsmöglichkeiten ändern. So können wichtige Fragestellungen wie, z.B. Investitionsprobleme, nicht beantwortet werden. Ebensowenig ist es möglich die Auswirkungen von Lernen zu analysieren.

Spiele, in denen die Strategien der Spieler den Fortgang des Spiels über Differenzialgleichungen bestimmen, sind unter dem Begriff Differenzialspiele (differential games) bekannt. Die Theorie des Differentialspiele ist stark mit der Kontrolltheorie veknüpft.

Definitionen

Der dynamische Charakter des Spiels wird erfasst dadurch, dass die Spieler(aus Spielermenge I: = {1,2,...,N})über ein Zeitintervall \left[t_0,T\right] interagieren. Der Zeitpunkt T wird als (Planungs-)Horizont bezeichnet. Das zugehörige Differentialspiel wird mit

\Gamma_{\left[t_0,T\right]}

bezeichnet.

Eine Strategie(Kontrollvektor) für Spieler i ist gegeben durch u_i \in U_u \subset \mathbb{R}^n mit einer zugehörigen, reellwertige Funktion (Kontrollpfad)

u_{i}(\cdot):[t_0,T] \rightarrow U_i

Analog bezeichne u(t)i die Strategien der anderen Spieler. Die gesamten Kontrollpfade sollten einen sinnvollen Spielverlauf ergeben.

Unter einer Partie versteht man den N-Tupel

u(\cdot)=( u_1(\cdot),..,u_N(\cdot))

falls ein x(\cdot)(stetig, glatt) existiert, das eindeutige Lösung des Anfangswertproblems(s.U.) ist. x(\cdot) heißt 'Zustandstrajektorie' der Partie.

Das Optimierungsproblem des Differentialspiels Γ ist das Finden des optimalen Funktionals Ji:


\max_{u_i \in U_i}\{J_i = \int_{t_0}^T{L_i(t,x,u_1,..,u_N)dt+S_i(T,x(T))} \}

mit den Nebenbedingungen


\dot{x}=f(t,x,u_1,..,u_N), x(t_0)=x_0, x \in X \subseteq \mathbb{R}


Normalform

Ein gegebenes Differenzialspiel kann in eine äquivalente Normalform überführt werden. Sie ist durch ein 2N-Tupel beschrieben:

(\mathcal{F}_1,..,\mathcal{F}_N;\mathcal{J}_1,..,\mathcal{J}_N)

Hierbei steht \mathcal{F} für die Menge der Strategien in Rückkopplung φi(t,x(t)). Die Auszahlungen zu einer Strategie \phi_i \in \mathcal{F}_i sind durch

\mathcal{J}_i (\phi_1,..,\phi_N) = J_i(u^*_1(\cdot),..,u^*_N(\cdot)

definiert. Mit u^*_i(\cdot) = \phi_i(\cdot, x^{\phi}(\cdot)) und x^{\phi}(\cdot) Lösung der Differentialgleichung des Optimierungsproblems.

Hamiltonsches Spiel

Hamilton-Funktion

Hi(t,x,u1,..,uNi): = Li + μif

Mit dem Platzhalter \mu_i \in \mathbb{R}. Das Hamiltonsche Spiel stellt zu einem Zeitpunkt das zugehörige Normalformenspiel dar. Der Zusammenhang zwischen dem Nash-Gleichgewicht \phi^*_{ } (t,x) des Normalformenspiels (\mathcal{F}_1,..,\mathcal{F}_N;\mathcal{J}_1,..,\mathcal{J}_N) und dem Nash-Gleichgewicht des Hamiltonschen Spiels (H1,..,HN;U1..,UN)sei folgendermaßen gegeben:
Die Partie φ * (t,x) des Differenzialspiels ist zu jedem Zeitpunkt t, der keine Unstetigkeitsstelle darstellt, ein Nash-Gleichgewicht des Hamilonschen Spiels für x = x * (t) und μi = λi(t). Die Kozustands-Funktionen \lambda_1(\cdot) sind folgendermaßen gegeben:

\dot{\lambda_t}(t) = - \frac{\partial H^*_i}{\partial x}- \sum_{j \neq i}{\frac{\partial H^*_i}{\partial \mu_j}\frac{\partial \phi_i(t, x^*)}{\partial x}}
\lambda_i(T) = \frac{\partial S_i(T,x^*(T))}{\partial x}

mit \frac{\partial H^*_i}{\partial \cdot} = \frac{\partial H_i(t,x^*(t),\phi^*_1,..,\phi^*_N,\lambda_i(t))}{\partial \cdot}.

Eine Strategie \phi^*_{ }(t,x), welche obige Differentialgleichungen löst und sämtliche Bedingungen erfüllt, ist Nash-Gleichgewicht der Normalform (\mathcal{F}_1,..,\mathcal{F}_N;\mathcal{J}_1,..,\mathcal{J}_N).

Beispiel

Ein explitzites Beispiel für ein Differenzialspiel mit Überführung in ein Hamiltonsches Spiel ist im Artikel Kapitalismus-Spiel zu finden.

Ausblick

Historisch betrachtet hatten die Differentialspiele immer eine Starke Verbindung zur Kontrolltheorie, mathematischen Ökonomie und Operations Research. Erst durch den Nicht-Nullsummenfall rückten sie wieder in die Nähe der Spieltheorie. Sie stellen ein Werkzeug zur Modellierung von Spielen über einen Zeitraum dar. In der Regel lassen sie sich in Normalformenspiele bzw. Hamiltonsche Spiele überführen.

Quellen

[1] Fudenberg, Drew 2002 Game Theory. MIT Press, Cambridge
[2] Dockner, Engelbert 2000 Differential Games in Economics and Management Science. Forthcoming Cambridge University Press.
[3] Mehlmann, Alexander 2007 Strategische Spiele für Anfänger. Vieweg Verlag, Wiesbaden
[4] Mehlmann, Alexander 1988 Applied Differential Games. Plenum Press, New York
Meine Werkzeuge