Inspektionsspiele

Aus Wikiludia
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Definition

Ein Inspektionsspiel ist ein mathematisches Modell einer nicht-kooperativen Situation, in der ein Inspektor (Kontrolleur) darüber wacht, dass sich die Gegen-Partei, der sog. Inspizierte, an bestimmte Regeln hält. Der Inspektor versucht den Inspizierten von illegalem Verhalten abzuschrecken und versucht ein illegales Verhalten sofort aufzudecken. Das oberste Ziel für den Inspektor ist dabei ein legales Verhalten des Inspizierten.

Typische Beispiele für die Anwendung von Inspektionsspielen sind:

  • zufällige Kontrollen im Personennahverkehr
  • unangekündigte Kontrollen im Abrüstungsprozess von Waffen

Inspektionsspiele lassen sich nicht auf eine bestimmte Klasse von nichtkooperativen Zwei-Personen-Spielen festlegen, da verschiedenen Anwendungen zu unterschiedlich sind. Es gibt Spiele mit endlichen und solche mit überabzählbar vielen reinen Strategien eines der beiden oder beider Spieler, zeitunabhängige und zeitabhängige Spiele, bei letzteren rekursive und nicht-rekursive Spiele und vieles mehr. Im folgenden werden zuerst die Inspektionsspiele in seqentieller Form (zeitabhängig) und dannach in paralleler Form (Zeitunabhängig)behandelt.

Inspektionsspiel in sequenzieller Form

Es soll eine sequentielle Variante des Inspektionsspiels mit n Stufen und k Kontollen betrachtet werden. Dabei gelten folgende Annahmen:

  • Die Zeit ist diskret und in n Stufen aufgeteilt
  • Der Inspektor I führt  k\leq n Kontrollen durch
  • Der Inspizierte O hat höchstens eine illegale Aktion zur Verfügung, die er zu jedem n einsetzen kann.
  • O weiss zu jedem Zeitpkt. n, wieviele Kontrollen I noch einsetzen kann.(vollkommene und vollständige Informationen)

Es gibt dabei 2 Abbruchfälle:

1. I hat alle Kontrollen frühzeitig aufgebraucht
\RightarrowO verhält sich sofort illegal.
2. I kann noch so oft kontrollieren,wie es restliche Stufen gibt.
\RightarrowO verhält sich für die restlichen Stufen immer legal.

Zwei-stufige Variante

Hier ist das Spiel mit n = 2 und k = 1 grafisch dargestellt. Dabei gilt 0 < a < b < c < d:

Abb.1:zweistufiges Inspektionsspiel mit nur einer Kontrolle

Die Spieler kennen dabei immer nur die vergangenen Entscheidungen des Gegenspielers. Die zukünftige Wahl treffen sie also nur auf Grund der zurückliegenden Strategiekombinationen.Anders als bei einer speziellen Variante des Inspektionsspiels: Das sog. Führerschaft-Spiel (siehe unten),in dem der Inspektor die Möglichkeit hat seine zu wählende Strategie dem Inspizierten glaubhaft anzukündigen.

In obigem Beispiel mit nur 2 Zeiteinheiten und einer Kontrollmöglichkeit für den Inspektor, weiss man bereits nach n = 1 welche Auszahlungen am Ende stehen werden. Wenn z.B in n=1 , (\bar{K},l) gewählt wurde, hat der Inspektor I für die letzte Stufe noch seine Kontrollmöglichkeit, die er natürlich auch nutzen wird. Da der Inspizierte O vollständig darüber informiert ist, wird er sich folglich auch legal verhalten, so dass am Ende die Ausgabe (0,0) steht. Die anderen Auszahlungen nach Wahl in n = 1 sind in folgender Normalform Matrix dargestellt:

I/O l \bar{l}
K (-c,d) (-a,-b)
\bar{K} (0,0) (-c,d)


Lösung des simultanen Spiels

In obigem Beispiel existiert kein Nash-Gleichgewicht in reiner Strategie. Wir suchen also ein Gleichgewicht für eine Gemischte Strategie. Dabei seien P und Q die Strategiemengen, mit p \in P und q \in Q.I(p,q) und O(p,q) sind dann die Auszahlungsfunktionen für den Inspektor und den Inspezierenden. Das Paar (\tilde{p},\tilde{q}) ist ein Gleichgewicht des Spiels, wenn die Nashbedingungen

I(\tilde{p},\tilde{q}) \geq I(p,\tilde{q})\, \, \forall{p \in P}

O(\tilde{p},\tilde{q}) \geq O(\tilde{p},q)\, \, \forall{q \in Q}

erfüllt sind.

Da es sich in diesem Beispiel um eine zyklische Auszahlungsstruktur handelt, existiert nur ein Gleichgewicht in gemischter Strategie.Die Nash-Bedingungen sind dabei genau dann erfüllt, wenn beide Spieler ihre Wahl so setzen, dass der Gegenspieler jeweils indifferent zwischen seinen beiden Wahlmöglichkeiten ist. Folglich muss also gelten:

   \tilde{p}*d + (1-\tilde{p})*0 = -\tilde{p}*b + (1-\tilde{p})*d = \tilde{O}

 - \tilde{q}*c - (1-\tilde{q})*a = \tilde{q}*0 -(1-\tilde{q})*c=\tilde{I}

Daraus folgt:

\tilde{p}=\frac{d}{2d+b}

\tilde{q}=\frac{c-a}{2c-a},

mit den dazugehörigen Auszahlungen

\tilde{I}=I(\tilde{p},\tilde{q})=\frac{-c^2}{2c-a}

\tilde{O}=O(\tilde{p},\tilde{q})=\frac{d^2}{2d+b}

die ein Gleichgewicht des simultativen Spiels ergegen.


Führerschaftspiel als Nicht-simultanes Inspektionsspiel

In einem Führerschaftsspiel hat der Inspektor I die Möglichkeit dem Inspizierenden O glaubhaft anzukündigen, welche Strategie er verfolgen wird.Glaubhaft bedeutet dabei, dass der Inspizierende auch wirklich davon ausgeht, dass der Inspektor seine angekündigte Strategie einhält und seine Entscheidungen danach ausrichtet. Geht man dabei nur von reinen Strategiemöglichkeiten aus, ist klar zu erkennen, dass sich dabei ein Vorteil für den Inspektor I ergibt. Durch seine glaubhafte Ankündigung kann er bei einer der n Stufen sicher gehn, dass der Inspizierte den legalen Weg gehen wird.Der Inspektor muss sich daraufhin nur noch bei n-1 Stufen entscheiden,ob er kontrolliert oder nicht.
Für den zwei-Stufen-Fall (n=2) muss er seine Kontrolle für n=1 ankündigen, um damit den optimalen Nutzen (0,0) zu erlangen. Wenn er die Kontrolle für n=2 ankündigt, wird der Inspizierte O sich gleich anfangs illegal verhalten. Der Inspektor weiss natürlich ,dass sein Gegenspieler auf den Bluff reinfallen wird und wird in n=1 eine Kontrolle ansetzen.Damit ergibt sich die Auszahlung (-a,-b).

In einem Führerschaft-Spiel muss die Nash-Gleichgewicht Defnition abgewandelt werden: Nun seien die Strategiemengen P für den Inspektor (gleich geblieben) und \check{Q}:=\left\{\gamma|\gamma :P\rightarrow Q\right\} für den Inspizierenden. Das Paar (\check{p},\check{\gamma}) sind Nash-Gleichgewichte, wenn:

I(\check{p},\check{\gamma}) \geq I(p,\check{\gamma})\, \, \forall{p \in P}

O(\check{p},\check{\gamma}) \geq O(\check{p},\gamma)\, \, \forall{\gamma :P\rightarrow Q}

wobei O(\check{p},\gamma)=O(\check{p},\gamma(\check{p})) ist.


Inspektionsspiel in paralleler Form

Neben der sequentiellen Form existiert noch die parallele Form eines Inspektionsspiels. Dabei wird die zeitliche Dimension weggelassen und dem Inspizierten die Möglichkeit gegeben, seine illegalen Handlungen auf N verschiedene Orte zu verteilen. Dabei gelten folgende Annahmen:

  • Der Inspizierte O führt 0 \leq \|\bar{l}\| \leq N illegale Handlungen durch, die der auf N verschiedene Orte verteilen kann
  • Inspektor I führt k \leq N Kontrollen durch
  • O weiss wieviele Kontrollen ihn erwarten, aber nicht wo
  • O macht Verlustgeschäft, wenn er bereits einmal erwischt wird
  • Ziel von I ist das legale Verhalten von O

Hier ist das Spiel in Form eines Baumes graphisch dargestellt.Der Inspektor I und der Inspizierte O treffen ihre Entscheidungen für alle N Orte dabei gleichzeitig.Es gilt wieder: 0 < a < b < c < d:

Abb.2:paralleles Inspektionsspiel

Beispiel

Ein Unternehmer hat N Kleinunternehmen und könnte in allen N Unt. illegale Arbeiter beschäfftigen. Er weiss, dass ihn k Kontrollen erwarten, die I alle parallel duchführt. Wird er in einer Stelle mit den illegalen Arbeitern erwischt, verliert er seine Lizenz (-b).Stellt er illegale Arbeiter ein und wird nirgends erwischt, macht er zusätzlichen Gewinn von (+d). Bei legalem Verhalten entstehen keine zusäzlichen Gewinne oder Verluste.

Lösung für parallele Form

Da sich beide Parteien ohne Kenntnis der Wahl der Gegenspielers gleichzeitig entscheiden müssen, bieten sich keine Strategiemöglichkeiten. Vielmehr muss das Spiel mit der Wahrscheinlichkeitstheorie behandelt werden. Sei hierzu:

P als Gleichverteilung auf \Omega = \left\{1,...,N\right\}. Die Zufallsvariable S beschreibe die Kontrollen k von I und ZV R beschreibe die illegalen Handlungen\bar{l}.

mit

S:\left\{1,...N\right\} \mapsto \left\{K,\bar{K}\right\}, wobei P(S(i)=K)=\frac{k}{N} \forall i \in \left\{1,...,N\right\}

R:\left\{1,...N\right\} \mapsto \left\{l,\bar{l}\right\}, wobei P(R(i)=\bar{l})=\frac{\bar{l}}{N} \forall i \in \left\{1,...,N\right\}

ZV: \textbf{X=SxR}; \qquad  X:\left\{1,...N\right\} \mapsto \left\{(K,l),(K,\bar{l}),(\bar{K},l),(\bar{K},\bar{l})\right\}

und

P(X(i)=(K,l))=P(S(i)=K)*P(R(i)=l)=\frac{(k(N-\left|\bar{l}\right|)}{N^2}

P(X(i)=(K,\bar{l}))=P(S(i)=K)*P(R(i)=\left|\bar{l}\right|)=\frac{k\left|\bar{l}\right|)}{N^2}

P(X(i)=(\bar{K},l))=P(S(i)=\bar{K})*P(R(i)=l)=\frac{(N-k)(N-\left|\bar{l}\right|)}{N^2}

P(X(i)=(\bar{K},\bar{l}))=P(S(i)=\bar{K})*P(R(i)=\bar{l})=\frac{(N-k)\left|\bar{l}\right|)}{N^2}

Wahrscheinlichkeit für

 (K,l): \sum^{i=1}_{N}{P(X(i)=(K,l))}=\frac{(k(N-\left|\bar{l}\right|)}{N} \qquad \qquad  (K,\left|\bar{l}\right|):\sum^{i=1}_{N}{P(X(i)=(K,\left|\bar{l}\right|))}=\frac{k\left|\bar{l}\right|)}{N}
(\bar{K},l): \sum^{i=1}_{N}{P(X(i)=(\bar{K},l))}=\frac{(N-k)(N-\left|\bar{l}\right|)}{N} \qquad (\bar{K},\bar{l}):\sum^{i=1}_{N}{P(X(i)=((\bar{K},\bar{l}))}=\frac{(N-k)\left|\bar{l}\right|)}{N}

Daraus ergibt sich die zu erwartende Auszahlungsmatrix in Normalform:

I/O l \bar{l}
K \frac{(k(N- \left|\bar{l}\right|)}{N}(0,0) \frac{(k\left|\bar{l}\right|)}{N}(-a,-b)
\bar{K} \frac{(N-k)(N-\left|\bar{l}\right|)}{N}(0,0) \frac{(N-k)\left|\bar{l}\right|}{N}(-c,d)


Eine mögliche Fragestellung zu dieser Situation wäre z.B.:


Wieviele Kontrollen muss I dem O glaubhaft ankündigen, damit es sich für O nicht mehr lohnen würde einen einzigen illegalen Arbeiter einzustellen?


Es muss gelten:


\qquad \qquad  O(*,l)\geq O(*,\bar{l})

 \Leftrightarrow    0 \geq -b\frac{(k\left|\bar{l}\right|)}{N}+\frac{(N-k)\left|\bar{l}\right|}{N}d

\Leftrightarrow    0 \geq -bk + (N-k)d

\Leftrightarrow    k \geq \frac{Nd}{b+d}


Wenn der Inspektor also mehr als \frac{Nd}{b+d} Kontrollen ankündigt, würde ein risikoneutraler Inspizierter O von illegalen Handlungen ablassen.

Meine Werkzeuge