En el juego en sí, los castigos (y las recompensas, cuando corresponda) están representados por utilidad números. Los números positivos representan buenos resultados, los números negativos representan malos resultados y un resultado es mejor que otro si el número asociado es mayor. (¡Tenga cuidado, sin embargo, de cómo funciona esto para los números negativos, ya que -5, por ejemplo, es mayor que -20!)
En la tabla anterior, el primer número en cada cuadro se refiere al resultado para el jugador 1 y el segundo número representa el resultado para el jugador 2. Estos números representan solo uno de los muchos conjuntos de números que son consistentes con la configuración del dilema de los prisioneros.
Una vez que se define un juego, el siguiente paso para analizarlo es evaluar las estrategias de los jugadores y tratar de comprender cómo se comportarán los jugadores. Los economistas hacen algunas suposiciones cuando analizan los juegos; primero, suponen que ambos jugadores son conscientes de los pagos tanto para ellos como para el otro jugador, y, en segundo lugar, suponen que ambos jugadores están buscando a
racionalmente maximizar su propio beneficio del juego.Un enfoque inicial fácil es buscar lo que se llama estrategias dominantes- estrategias que son mejores independientemente de la estrategia que elija el otro jugador. En el ejemplo anterior, elegir confesar es una estrategia dominante para ambos jugadores:
Dado que confesar es lo mejor para ambos jugadores, no es sorprendente que el resultado donde ambos jugadores confiesan sea un resultado de equilibrio del juego. Dicho esto, es importante ser un poco más preciso con nuestra definición.
El concepto de un Equilibrio de Nash fue codificado por el matemático y teórico de juegos John Nash. En pocas palabras, un equilibrio de Nash es un conjunto de estrategias de mejor respuesta. Para un juego de dos jugadores, un equilibrio de Nash es un resultado en el que la estrategia del jugador 2 es la mejor respuesta a la estrategia del jugador 1 y la estrategia del jugador 1 es la mejor respuesta a la estrategia del jugador 2.
Encontrar el equilibrio de Nash a través de este principio puede ilustrarse en la tabla de resultados. En este ejemplo, las mejores respuestas del jugador 2 al jugador uno se encierran en verde. Si el jugador 1 confiesa, la mejor respuesta del jugador 2 es confesar, ya que -6 es mejor que -10. Si el jugador 1 no confiesa, la mejor respuesta del jugador 2 es confesar, ya que 0 es mejor que -1. (Tenga en cuenta que este razonamiento es muy similar al razonamiento utilizado para identificar estrategias dominantes).
Las mejores respuestas del jugador 1 están encerradas en un círculo azul. Si el jugador 2 confiesa, la mejor respuesta del jugador 1 es confesar, ya que -6 es mejor que -10. Si el jugador 2 no confiesa, la mejor respuesta del jugador 1 es confesar, ya que 0 es mejor que -1.
El equilibrio de Nash es el resultado donde hay un círculo verde y un círculo azul, ya que representa un conjunto de mejores estrategias de respuesta para ambos jugadores. En general, es posible tener múltiples equilibrios de Nash o ninguno (al menos en estrategias puras como se describe aquí).
Es posible que haya notado que el equilibrio de Nash en este ejemplo parece subóptimo de alguna manera (específicamente, en que no es óptimo de Pareto) ya que es posible que ambos jugadores obtengan -1 en lugar de -6. Este es un resultado natural de la interacción presente en el juego, en teoría, no confesar sería un estrategia óptima para el grupo colectivamente, pero los incentivos individuales evitan que este resultado sea logrado. Por ejemplo, si el jugador 1 pensara que el jugador 2 permanecería en silencio, tendría un incentivo para delatarlo en lugar de quedarse en silencio, y viceversa.
Por esta razón, un equilibrio de Nash también puede considerarse como un resultado en el que ningún jugador tiene un incentivo para desviarse unilateralmente (es decir, por sí mismo) de la estrategia que condujo a ese resultado. En el ejemplo anterior, una vez que los jugadores eligen confesar, ninguno de los jugadores puede hacerlo mejor cambiando de opinión por sí mismo.