Definición del equilibrio de Nash: supongamos que hay n jugadores participando en el juego, dadas las estrategias de otros jugadores, cada jugador elige su propia estrategia óptima (la estrategia óptima individual también puede depender de la de otras personas). estrategias), maximizando así la propia utilidad. Todas las estrategias de los jugadores constituyen un perfil de estrategia. El equilibrio de Nash se refiere a una combinación estratégica que consta de las estrategias óptimas de todos los participantes. Es decir, dadas las estrategias de otros, nadie tiene razones suficientes para romper este equilibrio. Caso clásico del equilibrio de Nash: el dilema del prisionero (En 1950, el matemático Tucker trabajó como profesor visitante en la Universidad de Stanford. Al dar una conferencia a unos psicólogos, contó la historia de dos prisioneros). Supongamos que hay dos ladrones A y B que conjuntamente Cometió un delito, fue capturado por la policía luego de ingresar de forma privada. La policía colocó a las dos personas en dos salas diferentes para interrogarlas. Para cada sospechoso, la política policial es: si un sospechoso confiesa el delito y entrega los bienes robados, entonces las pruebas son concluyentes y los dos son declarados culpables. Si el otro sospechoso también confiesa, ambos serán condenados a 8 años de prisión; si el otro sospechoso no confiesa pero niega, será condenado a 2 años adicionales por el delito de obstrucción a los asuntos oficiales (porque hay); (hay pruebas de que es culpable de años), y al confesor se le redujo la pena en 8 años y fue inmediatamente puesto en libertad. Si ambos niegan el delito, la policía no podrá condenarlos por robo por falta de pruebas, pero sí podrán ser condenados a un año de prisión cada uno por entrar en una casa particular. La tabla 2.2 muestra la matriz de pagos de este juego. Tabla 2.2 Juego del dilema del prisionero —————————————————————————— ┃ B ┃ B ┃ ————————┃————— — ————┃————————┃ ┃ Confesión┃ Negación┃ ————————┃————————┃————————┃ Una confesión┃ –8 , –8 ┃ 0, –10 ┃ ————————┃————————┃————————┃ Una negación ┃ –10, 0 ┃ –1, – 1 ┃ ————————┃————————┃————————┃ Respecto al caso, obviamente la mejor estrategia es que ambas partes lo nieguen, y el resultado es que todos son sentenciados solo a 1 año. Sin embargo, dado que los dos están aislados, en primer lugar, desde un punto de vista psicológico, ambas partes sospecharán que el otro se traicionará para protegerse y, en segundo lugar, según la teoría de Adam Smith, suponiendo que todos lo sean ". El "hombre económico racional" tomará decisiones basadas en su propio interés. Ambas personas tendrán este proceso de cálculo: si él confiesa y yo lo niego, tendré que ir a prisión por 10 años, y el tiempo máximo para confesar es de 8 años, si él niega, puedo salir libre y él saldrá; ir a prisión por 10 años. Considerando las circunstancias anteriores, independientemente de si confiesa o no, para mí es un buen negocio confesar. Ambos usarían sus cerebros de esta manera. Al final, ambos optaron por confesar y ambos fueron sentenciados a 8 años de prisión. Basado en la premisa del agente racional en economía, la elección de los dos prisioneros que es de su propio interés es confesar. La estrategia original que es beneficiosa para ambas partes no ocurrirá si no confiesan y ambos son liberados. De esta manera, ambos eligieron la estrategia de la confesión y fueron sentenciados a ocho años. El equilibrio de Nash cuestionó por primera vez el principio de la "mano invisible" de Adam Smith: según la teoría de Smith, en una economía de mercado, todo el mundo parte de un propósito de interés propio. , y eventualmente toda la sociedad logra efectos altruistas. Sin embargo, podemos derivar una paradoja del principio de la "mano invisible" del "equilibrio de Nash": a partir de un propósito egoísta, el resultado es dañar a los demás y no beneficiarlo a uno mismo. No es beneficioso para mí ni para los demás. Los libros que registran la vida de Nash incluyen: "El fantasma de Princeton" (también traducido como "Mente hermosa") Sylvia Nassa Veamos una introducción a la teoría del equilibrio de Nash: Premio Nobel de Economía de 1994. El ganador del premio es John Nash de la Universidad de Princeton en Estados Unidos. La razón por la que Nash ganó el Premio Nobel de Economía es por su contribución al campo del juego. Propuso la teoría del "Equilibrio de Nash" y el juego de mayor circulación. Teoría Una historia llamada "El dilema del prisionero": Se dice que un día, un hombre rico fue asesinado en su casa y le robaron su propiedad. Durante la investigación del caso, la policía capturó a dos sospechosos, Zhang San y Li Si. Los sacaron de su residencia y encontraron la propiedad desaparecida en la casa de la víctima, sin embargo, negaron haber matado a nadie y argumentaron que simplemente robaron algo, por lo que la policía aisló a las dos personas y las encerró en habitaciones diferentes para interrogarlas.
La policía dijo a Zhang San y Li Si respectivamente: "Dado que hay pruebas concluyentes de su delito de robo, puedo sentenciarlo a un año de prisión. Sin embargo, puedo hacer un trato con usted. Si confiesa el delito de asesinato". solo, solo lo haré. Te condenan a 3 meses de prisión, pero tu cómplice es condenado a 10 años de prisión. Si te niegas a confesar y eres denunciado por tus cómplices, serás condenado a 10 años de prisión, y él lo hará. ser sentenciado a sólo 3 meses de prisión. "Si ambos confiesan, ambos serán sentenciados a cinco años de prisión". ¿Qué deben hacer Zhang San y Li Si? Se enfrentan a un dilema: confesar o negar. Evidentemente la mejor estrategia es que ambas partes lo nieguen, y el resultado es que todos son condenados sólo a un año. Sin embargo, dado que dos personas no pueden confabularse en confesión cuando están aisladas, según la teoría de Adam Smith, todo el mundo es un "hombre económico racional" y tomará decisiones basadas en el interés propio. Ambas personas tendrán este tipo de proceso de cálculo: si él recluta y yo no recluto, él tendrá que ir a prisión por 10 años y el reclutamiento solo duró 5 años, por lo que es un buen negocio reclutar. ; si yo recluto, él también reclutará, y tendrá que ir a prisión por 5 años, si no me recluta, yo solo cumpliré 3 meses de prisión, pero él irá a prisión por 10 años. es un buen negocio. Considerando las situaciones anteriores, lo reclute o no, es un buen negocio para mí. Ambos usarían sus cerebros de esta manera. Al final, ambos decidieron suicidarse. Como resultado, ambos fueron sentenciados a 5 años de prisión. No aparecerán la estrategia (negación) y el resultado (condena a un año de prisión) que originalmente fueron beneficiosos para ambas partes. Este es el famoso "dilema del prisionero". En realidad refleja un problema muy profundo, que es la contradicción entre racionalidad individual y racionalidad colectiva. De hecho, si ambos lo niegan y cada uno es sentenciado a 1 año, obviamente es mejor que ambos sean sentenciados a 5 años, pero en realidad no se puede hacer porque no cumple con los requisitos racionales del individuo. Como personas racionales, tanto Zhang San como Li Si pensarían que si lo niego y la otra parte confiesa, pueden ser sentenciados a 10 años de prisión. Las personas racionales no correrán ese riesgo. Sin embargo, tanto Zhang San como Li Si tomaron decisiones racionales. Ambos fueron sentenciados a 5 años y el resultado óptimo de 1 año no apareció. En otras palabras, es una elección racional para cada individuo, pero es irracional para todo el grupo. Esto es contrario a la conclusión de la economía tradicional. La economía tradicional cree que hay una "mano invisible" en la economía de mercado, y el resultado de su regulación es que las elecciones racionales de todos traerán en última instancia el mayor beneficio para todo el colectivo. De hecho, al igual que el dilema del prisionero, esta mano invisible perderá su efecto cuando solo haya unas pocas personas participando en la elección, porque en este momento, el proceso de toma de decisiones de las personas considerará las ideas de otros participantes, al igual que los juegos de azar y Al igual que cuando se juega al ajedrez, esto no es exactamente lo mismo que la competencia perfecta cuando el número de compradores y vendedores es enorme y se necesita un nuevo conjunto de ideas para la investigación. En el ejemplo anterior, notamos un resultado no óptimo, es decir, ambos eligieron la estrategia de confesión y fueron sentenciados a 5 años. Este resultado se llama "equilibrio de Nash", también llamado equilibrio no cooperativo. El concepto más básico de la teoría de juegos es el "equilibrio de Nash". Cuando se trata de teoría de juegos, el más famoso del que habla la gente es el "equilibrio de Nash". El equilibrio de Nash se refiere a una combinación estratégica que consta de las estrategias óptimas de todos los participantes, es decir, dadas las estrategias de los demás, ningún participante tiene la iniciativa de elegir otras estrategias para lograr su propio bien, de modo que. nadie tiene el incentivo para alterar este equilibrio. Por supuesto, aunque el "equilibrio de Nash" consiste en la estrategia óptima de una sola persona, eso no significa que sea un resultado óptimo general. Como se mencionó anteriormente, en el caso del conflicto entre la racionalidad individual y la racionalidad colectiva, el resultado final causado por la búsqueda de un comportamiento egoísta por parte de todos es un "equilibrio de Nash", que también es un resultado desfavorable para todos. En este sentido, la paradoja propuesta por el "Equilibrio de Nash" en realidad sacude los cimientos de la economía occidental. Al mismo tiempo, también nos recuerda que la cooperación es una "estrategia de interés propio" beneficiosa. De hecho, si los dos prisioneros mencionados anteriormente pudieran confabularse y cooperar, entonces definitivamente optarían por negar ambas cosas y serían sentenciados a solo un año por el delito de robo. Por supuesto, fue con esto en mente que la policía los aisló para su examen. y conoció los hechos. La verdad, el resultado más beneficioso de la cooperación para los prisioneros, no se produjo. El "equilibrio de Nash" describe un equilibrio de juego no cooperativo. En realidad, las situaciones no cooperativas son más comunes que las cooperativas. Por lo tanto, el "equilibrio de Nash" es un desarrollo importante de la teoría de juegos cooperativos de von Neumann y Morgenstern, e incluso se puede decir que es una revolución.
Hoy en día, el equilibrio de Nash se utiliza ampliamente en la investigación en diversos campos, especialmente en el análisis institucional. Podemos utilizarlo para sacar una conclusión muy importante: para que un acuerdo institucional (sistema) sea eficaz, debe ser un equilibrio de Nash. De lo contrario, este acuerdo institucional no podrá establecerse. (Según el libro “Teoría Clásica del Premio Nobel de Economía”)
Adoptalo