Dans le jeu lui-même, les punitions (et les récompenses, le cas échéant) sont représentées par utilitaire Nombres. Les nombres positifs représentent de bons résultats, les nombres négatifs représentent de mauvais résultats et un résultat est meilleur qu'un autre si le nombre qui lui est associé est supérieur. (Faites cependant attention à la façon dont cela fonctionne pour les nombres négatifs, car -5, par exemple, est supérieur à -20!)
Dans le tableau ci-dessus, le premier nombre dans chaque case fait référence au résultat pour le joueur 1 et le deuxième nombre représente le résultat pour le joueur 2. Ces chiffres ne représentent qu'un des nombreux ensembles de chiffres qui correspondent à la configuration du dilemme des détenus.
Une fois qu'un jeu est défini, l'étape suivante de l'analyse du jeu consiste à évaluer les stratégies des joueurs et à essayer de comprendre comment les joueurs sont susceptibles de se comporter. Les économistes émettent quelques hypothèses lorsqu'ils analysent les jeux. Tout d'abord, ils supposent que les deux joueurs les gains à la fois pour eux-mêmes et pour l'autre joueur, et, deuxièmement, ils supposent que les deux joueurs cherchent à
rationnellement maximiser leur propre gain du jeu.Une approche initiale simple consiste à rechercher ce que l'on appelle stratégies dominantes- les stratégies les meilleures quelle que soit la stratégie choisie par l'autre joueur. Dans l'exemple ci-dessus, choisir d'avouer est une stratégie dominante pour les deux joueurs:
Étant donné que la confession est la meilleure pour les deux joueurs, il n'est pas surprenant que le résultat où les deux joueurs avouent soit un résultat d'équilibre du jeu. Cela dit, il est important d'être un peu plus précis avec notre définition.
Le concept d'un Équilibre de Nash a été codifié par le mathématicien et théoricien des jeux John Nash. Autrement dit, un équilibre de Nash est un ensemble de meilleures stratégies de réponse. Pour une partie à deux joueurs, un équilibre de Nash est un résultat où la stratégie du joueur 2 est la meilleure réponse à la stratégie du joueur 1 et la stratégie du joueur 1 est la meilleure réponse à la stratégie du joueur 2.
La recherche de l'équilibre de Nash via ce principe peut être illustrée dans le tableau des résultats. Dans cet exemple, les meilleures réponses du joueur 2 au joueur 1 sont entourées de vert. Si le joueur 1 avoue, la meilleure réponse du joueur 2 est d'avouer, puisque -6 est meilleur que -10. Si le joueur 1 ne se confesse pas, la meilleure réponse du joueur 2 est de confesser, puisque 0 est meilleur que -1. (Notez que ce raisonnement est très similaire au raisonnement utilisé pour identifier les stratégies dominantes.)
Les meilleures réponses du joueur 1 sont encerclées en bleu. Si le joueur 2 avoue, la meilleure réponse du joueur 1 est d'avouer, puisque -6 est meilleur que -10. Si le joueur 2 ne se confesse pas, la meilleure réponse du joueur 1 est de confesser, puisque 0 est meilleur que -1.
L'équilibre de Nash est le résultat où il y a à la fois un cercle vert et un cercle bleu car cela représente un ensemble de meilleures stratégies de réponse pour les deux joueurs. En général, il est possible d'avoir plusieurs équilibres de Nash ou aucun (du moins dans les stratégies pures décrites ici).
Vous avez peut-être remarqué que l'équilibre de Nash dans cet exemple semble sous-optimal d'une manière (en particulier, en ce qu'il n'est pas optimal de Pareto) car il est possible pour les deux joueurs d'obtenir -1 plutôt que -6. Ceci est un résultat naturel de l'interaction présente dans le jeu - en théorie, ne pas avouer serait un stratégie optimale pour le groupe collectivement, mais des incitations individuelles empêchent ce résultat atteint. Par exemple, si le joueur 1 pensait que le joueur 2 resterait silencieux, il serait incité à le ratifier plutôt qu'à rester silencieux, et vice versa.
Pour cette raison, un équilibre de Nash peut également être considéré comme un résultat où aucun joueur n'est incité à s'écarter unilatéralement (c'est-à-dire par lui-même) de la stratégie qui a conduit à ce résultat. Dans l'exemple ci-dessus, une fois que les joueurs ont choisi d'avouer, aucun des deux joueurs ne peut faire mieux en changeant d'avis par lui-même.