Matrice des gains

Un article de Wikipédia, l'encyclopédie libre.

La matrice des gains, matrice de paiement ou encore matrice des paiements (anglicismes issus de payoff matrix) est un moyen de représenter un jeu sous forme normale sous la forme d'un tableau indiquant les gains (ou paiements) associés à chaque action en fonction des actions de l'autre joueur.

Théoriquement, il est possible d'envisager des tableaux de n'importe quelle dimension, chaque dimension représentant un joueur. En pratique, seuls les tableaux en deux dimension sont aisément compréhensibles. Les matrices des paiements sont donc le plus souvent employés dans le cas de jeux à deux joueurs. Pour les mêmes raisons, elles ne sont employés que dans les jeux à un nombre raisonnable de stratégies.


[modifier] Définition

Pour un jeu à deux joueurs et à un nombre fini de stratégies, la matrice des paiements est un tableau de couples de réels à m1 lignes et m2 colonnes :

 \begin{bmatrix} a_{11} & a_{1 2} & \cdots & a_{1 m_2} \\  a_{12} & a_{2 2} & \cdots & a_{2 m_2} \\ \vdots & \vdots & \vdots & \vdots \\
\\ a_{m_1 1} & a_{m_1 2} & \cdots & a_{m_1 m_2} \end{bmatrix}

a_{i,j}=(G^l_{i,j},G^c_{i,j}) donne les gains Gc du joueur colonne et ceux Gl du joueur ligne si le joueur ligne choisit la stratégie i et le joueur colonne la stratégie j.

On peut remarquer que dans le cas général, les jeux n'ont pas à être symétriques (ce n'est le cas que si ai,j = aj,i), ni à présenter le même nombre de stratégies pour chaque joueur.

[modifier] Dilemme du prisonnier

Considérons le jeu connu sous le nom de dilemme du prisonnier. Les deux joueurs sont deux criminels, entendus en même temps, séparément l'un de l'autre et sans possibilité de communiquer à propos d'un crime commis en commun. Chaque prisonnier peut soit nier le crime (C, pour coopérer), soit plaider coupable et servir de témoin à charge contre son complice (D, pour dévier). Le résultat de chaque stratégie en nombre d'années de prison est comme suit :

(C) (D)
(c) 1,1 20,0
(d) 0,20 10,10

Le premier prisonnier (Ligne) peut donc choisir de coopérer ou de dévier. De même, le prisonnier colonne choisir entre coopérer et dévier. Si les deux coopèrent, ils écopent d'un an de prison chacun. S'ils dévient tous les deux, ils écopent de cinq ans chacun. Si Ligne coopère et que Colonne dévie, Colonne est libéré, et Ligne prend vingt ans de prison. Inversement, si Ligne dévie et Colonne coopère, Ligne est libre et Colonne en prend pour vingt ans.

[modifier] Stratégies mixtes

Pour représenter un jeu en stratégies mixtes, on utilise la même formalisation que précédemment en ajoutant, pour chaque stratégie, la probabilité qu'elle soit jouée par un joueur. Ces probabilité se notent usuellement sur une ligne supplémentaire au-dessus des stratégies du joueur colonne, et sur une colonne supplémentaire insérée avant les stratégies du joueur ligne.

Autres langues