Quelle est la relation entre le dilemme du prisonnier et l’équilibre de Nash ?

Quelle est la relation entre le dilemme du prisonnier et l'équilibre de Nash ?

Quelle est la relation entre le dilemme du prisonnier et l’équilibre de Nash ?

Introduction

Le dilemme du prisonnier est un concept bien connu en économie et en psychologie. Il décrit une situation où deux parties doivent décider entre coopérer ou trahir l’autre partie. Si les deux parties trahissent, elles reçoivent une peine maximale. Si les deux parties coopèrent, elles reçoivent une peine minimale. Si une partie trahit et l’autre coopère, la partie qui trahit reçoit une peine minimale et l’autre partie reçoit une peine maximale.

La notion d’équilibre de Nash a été développée par le mathématicien John Nash. Il s’agit d’une solution dans laquelle chaque partie a choisi la meilleure stratégie possible en fonction de la stratégie de l’autre partie. Dans cette solution, aucune partie ne peut améliorer son résultat en changeant unilatéralement de stratégie.

Le dilemme du prisonnier en détail

Imaginons deux prisonniers qui ont commis un crime ensemble. Ils sont interrogés séparément par la police et on leur donne le choix de coopérer (C) ou de trahir (T) leur complice. S’ils coopèrent, ils ne recevront qu’une peine légère en vertu de leur collaboration. Si les deux choisissent de trahir, ils recevront tous deux une peine plus lourde. Si l’un trahit et l’autre coopère, le tricheur sera libéré tandis que celui qui coopère recevra une lourde peine.

Le tableau suivant montre les résultats pour les deux prisonniers. Les chiffres correspondent aux années de prison qu’ils recevront.

Prisonnier B coopère (C)Prisonnier B trahit (T)
Prisonnier A coopère (C)A : 2 ans

B : 2 ans

A : 5 ans

B : 0 ans (libéré)

Prisonnier A trahit (T)A : 0 ans (libéré)

B : 5 ans

A : 3 ans

B : 3 ans

L’équilibre de Nash

Dans le dilemme du prisonnier, chaque prisonnier a deux options, coopérer ou trahir. Les résultats dépendent des choix de chacun. Pour déterminer l’équilibre de Nash, il faut trouver un résultat stable où aucune partie ne peut améliorer son résultat en changeant unilatéralement de stratégie.

Dans ce cas, l’équilibre de Nash se produit lorsque les deux prisonniers trahissent (T,T). Aucun ne peut améliorer sa situation en choisissant de coopérer (C) plutôt que de trahir (T), car cela le mettrait en danger de recevoir la peine la plus lourde.

Bien que cette situation ne soit pas optimale d’un point de vue social, elle est un équilibre stable dans la mesure où chacun atteint son objectif individuel d’obtenir la meilleure peine possible.

Relation avec le concept de Pareto Optimum

Le concept de Pareto Optimum est important dans cette situation. Il s’agit d’une situation dans laquelle aucune partie ne peut être améliorée sans que l’autre ne soit pire. Dans le dilemme du prisonnier, l’équilibre de Nash est un Pareto Optimum. Si une partie choisit de coopérer plutôt que de trahir, elle peut être pénalisée si l’autre partie trahit.

Reprenons les résultats dans le tableau

Si les deux prisonniers choisissent de coopérer (C,C), ils obtiennent tous deux la peine la plus légère (2 ans). Cependant, cette stratégie n’est pas un équilibre stable, car un prisonnier peut choisir de trahir (T) pour obtenir une peine plus légère (0 ans). Si l’un des prisonniers trahit, l’autre sera incité à faire de même, conformément à l’équilibre de Nash.

Si les deux prisonniers choisissent de trahir (T,T), ils obtiennent tous deux la peine la plus lourde (3 ans). C’est le résultat de l’équilibre de Nash.

Si l’un des prisonniers trahit (T,C ou C,T), la stratégie de trahir est avantageuse. Le prisonnier qui trahit bénéficie d’une peine plus légère (1 an), tandis que l’autre prisonnier reçoit la peine la plus lourde (5 ans).

FAQ

Qu’est-ce que le dilemme du prisonnier?

Le dilemme du prisonnier est un concept en économie et en psychologie qui décrit une situation où deux parties doivent décider entre coopérer ou trahir l’autre partie.

Qu’est-ce que l’équilibre de Nash?

L’équilibre de Nash est une solution dans laquelle chaque partie a choisi la meilleure stratégie possible en fonction de la stratégie de l’autre partie. Dans cette solution, aucune partie ne peut améliorer son résultat en changeant unilatéralement de stratégie.

Qu’est-ce que le Pareto Optimum?

Le Pareto Optimum est une situation où aucune partie ne peut être améliorée sans que l’autre ne soit pire.

Conclusion

Le dilemme du prisonnier et l’équilibre de Nash sont deux concepts importants en économie et en psychologie. Dans le dilemme du prisonnier, l’équilibre de Nash se produit lorsque les deux parties trahissent, ce qui est un Pareto Optimum. Bien que ce choix ne soit pas optimal sur le plan social, il est un équilibre stable dans lequel chaque partie atteint son objectif individuel.