Principal » negocio » Cómo la estrategia de la teoría de juegos mejora la toma de decisiones

Cómo la estrategia de la teoría de juegos mejora la toma de decisiones

La teoría de juegos, el estudio de la toma de decisiones estratégicas, reúne disciplinas dispares como las matemáticas, la psicología y la filosofía. La teoría de juegos fue inventada por John von Neumann y Oskar Morgenstern en 1944 y ha recorrido un largo camino desde entonces. La importancia de la teoría de juegos para el análisis moderno y la toma de decisiones se puede medir por el hecho de que desde 1970, hasta 12 economistas y científicos líderes han recibido el Premio Nobel de Ciencias Económicas por sus contribuciones a la teoría de juegos.

La teoría de juegos se aplica en varios campos, incluidos los negocios, las finanzas, la economía, las ciencias políticas y la psicología. Comprender las estrategias de la teoría de juegos, tanto las populares como algunas de las estratagemas relativamente menos conocidas, es importante para mejorar las habilidades de razonamiento y toma de decisiones en un mundo complejo.

El dilema del prisionero

Una de las estrategias de teoría de juegos más populares y básicas es el dilema del prisionero. Este concepto explora la estrategia de toma de decisiones tomada por dos individuos que, actuando en su propio interés individual, terminan con peores resultados que si hubieran cooperado entre sí en primer lugar.

En el dilema del prisionero, dos sospechosos detenidos por un delito están recluidos en habitaciones separadas y no pueden comunicarse entre sí. El fiscal informa tanto al sospechoso 1 como al sospechoso 2 individualmente que si confiesa y testifica en contra del otro, puede salir en libertad, pero si no coopera y el otro sospechoso lo hace, será sentenciado a tres años de prisión. Si ambos confiesan, recibirán una condena de dos años, y si ninguno confiesa, serán condenados a un año de prisión.

Si bien la cooperación es la mejor estrategia para los dos sospechosos, cuando se enfrentan a un dilema de este tipo, la investigación muestra que la mayoría de las personas racionales prefieren confesarse y testificar contra la otra persona que quedarse en silencio y arriesgarse a que la otra parte confiese.

(Para lecturas relacionadas, ver: El dilema del prisionero en los negocios y la economía ).

Estrategias de teoría de juegos

El dilema del prisionero sienta las bases para estrategias avanzadas de teoría de juegos, entre las cuales las populares incluyen:

Peniques a juego

Este es un juego de suma cero que involucra a dos jugadores (llamándolos Jugador A y Jugador B) que colocan simultáneamente un centavo en la mesa, y la recompensa depende de si los centavos coinciden. Si ambos centavos son cara o cruz, el jugador A gana y se queda con el centavo del jugador B. Si no coinciden, el jugador B gana y se queda con el centavo del jugador A.

Punto muerto

Este es un escenario de dilema social como el dilema del prisionero en que dos jugadores pueden cooperar o desertar (es decir, no cooperar). En un punto muerto, si el jugador A y el jugador B cooperan, cada uno obtiene un pago de 1, y si ambos desertan, cada uno obtiene un pago de 2. Pero si el jugador A coopera y el jugador B falla, entonces A obtiene un pago de 0 y B obtiene un pago de 3. En el diagrama de pago a continuación, el primer número en las celdas (a) a (d) representa el pago del jugador A, y el segundo número es el del jugador B:

Matriz de pago de punto muerto		Jugador B	Jugador B
		Cooperar	Defecto
Jugador A	Cooperar	(a) 1, 1	(b) 0, 3
	Defecto	(c) 3, 0	(d) 2, 2

El punto muerto difiere del dilema del prisionero en que la acción de mayor beneficio mutuo (es decir, ambos defectos) es también la estrategia dominante. Una estrategia dominante para un jugador se define como aquella que produce la recompensa más alta de cualquier estrategia disponible, independientemente de las estrategias empleadas por los otros jugadores.

Un ejemplo comúnmente citado de punto muerto es el de dos potencias nucleares que intentan llegar a un acuerdo para eliminar sus arsenales de bombas nucleares. En este caso, la cooperación implica adherirse al acuerdo, mientras que la deserción significa renunciar secretamente al acuerdo y retener el arsenal nuclear. El mejor resultado para cualquiera de las naciones, desafortunadamente, es incumplir el acuerdo y retener la opción nuclear, mientras que la otra nación elimina su arsenal, ya que esto le dará a la primera una gran ventaja oculta sobre la segunda si alguna vez estalla la guerra entre los dos. La segunda mejor opción es que ambos abandonen o no cooperen, ya que esto conserva su condición de potencias nucleares.

Competencia Cournot

Este modelo también es conceptualmente similar al dilema del prisionero y lleva el nombre del matemático francés Augustin Cournot, quien lo introdujo en 1838. La aplicación más común del modelo de Cournot es la descripción de un duopolio o dos productores principales en un mercado.

Por ejemplo, suponga que las empresas A y B producen un producto idéntico y pueden producir cantidades altas o bajas. Si ambos cooperan y acuerdan producir a niveles bajos, la oferta limitada se traducirá en un precio alto para el producto en el mercado y ganancias sustanciales para ambas compañías. Por otro lado, si desertan y producen a niveles altos, el mercado se verá afectado y dará como resultado un precio bajo para el producto y, en consecuencia, menores ganancias para ambos. Pero si uno coopera (es decir, produce a niveles bajos) y los otros defectos (es decir, produce subrepticiamente a niveles altos), entonces el primero simplemente alcanza el punto de equilibrio, mientras que el segundo obtiene un beneficio mayor que si ambos cooperan.

Se muestra la matriz de pagos para las empresas A y B (las cifras representan ganancias en millones de dólares). Por lo tanto, si A coopera y produce a niveles bajos mientras que B produce defectos y produce a niveles altos, la recompensa es como se muestra en la celda (b): punto de equilibrio para la compañía A y $ 7 millones en ganancias para la compañía B.

Matriz de pago de Cournot		Empresa B	Empresa B
		Cooperar	Defecto
Empresa A	Cooperar	(a) 4, 4	(b) 0, 7
	Defecto	(c) 7, 0	(d) 2, 2

Coordinación

En coordinación, los jugadores obtienen mayores ganancias cuando seleccionan el mismo curso de acción.

Como ejemplo, considere dos gigantes de la tecnología que están decidiendo entre la introducción de una nueva tecnología radical en los chips de memoria que podrían generarles cientos de millones en ganancias, o una versión revisada de una tecnología más antigua que los generaría mucho menos. Si solo una compañía decide seguir adelante con la nueva tecnología, la tasa de adopción por parte de los consumidores sería significativamente menor y, como resultado, ganaría menos que si ambas compañías decidieran el mismo curso de acción. La matriz de pagos se muestra a continuación (las cifras representan ganancias en millones de dólares).

Por lo tanto, si ambas compañías deciden introducir la nueva tecnología, ganarían $ 600 millones cada una, mientras que la introducción de una versión revisada de la tecnología anterior les ganaría $ 300 millones cada una, como se muestra en la celda (d). Pero si la Compañía A decide solo introducir la nueva tecnología, solo ganaría $ 150 millones, a pesar de que la Compañía B ganaría $ 0 (presumiblemente porque los consumidores pueden no estar dispuestos a pagar por su tecnología ahora obsoleta). En este caso, tiene sentido que ambas compañías trabajen juntas y no solas.

Matriz de Coordinación de Playoffs		Empresa B	Empresa B
		Nueva tecnología	Tecnología antigua
Empresa A	Nueva tecnología	(a) 600, 600	(b) 0, 150
	Tecnología antigua	(c) 150, 0	(d) 300, 300

Juego de ciempiés

Este es un juego de forma extensa en el que dos jugadores alternativamente tienen la oportunidad de tomar la mayor parte de un alijo de dinero que aumenta lentamente. El juego de ciempiés es secuencial ya que los jugadores hacen sus movimientos uno tras otro en lugar de simultáneamente; cada jugador también conoce las estrategias elegidas por los jugadores que jugaron antes que ellos. El juego concluye tan pronto como un jugador toma el alijo, con ese jugador obteniendo la porción más grande y el otro jugador obteniendo la porción más pequeña.

Como ejemplo, suponga que el jugador A va primero y tiene que decidir si debe "tomar" o "pasar" el alijo, que actualmente asciende a $ 2. Si él toma, entonces A y B obtienen $ 1 cada uno, pero si A pasa, la decisión de tomar o pasar ahora debe ser tomada por el Jugador B. Si B toma, ella recibe $ 3 (es decir, el alijo anterior de $ 2 + $ 1) y A recibe $ 0. Pero si B pasa, A ahora decide si tomar o pasar, y así sucesivamente. Si ambos jugadores siempre eligen pasar, cada uno recibe una recompensa de $ 100 al final del juego.

El objetivo del juego es que si A y B cooperan y continúan pasando hasta el final del juego, obtienen el pago máximo de $ 100 cada uno. Pero si desconfían del otro jugador y esperan que "tomen" en la primera oportunidad, el equilibrio de Nash predice que los jugadores tomarán el reclamo más bajo posible ($ 1 en este caso). Sin embargo, los estudios experimentales han demostrado que este comportamiento "racional" (como lo predice la teoría de juegos) rara vez se exhibe en la vida real. Esto no es intuitivamente sorprendente dado el pequeño tamaño del pago inicial en relación con el final. El comportamiento similar de los sujetos experimentales también se ha exhibido en el dilema del viajero.

Dilema del viajero

Este juego de suma no nula, en el que ambos jugadores intentan maximizar su propio pago sin tener en cuenta al otro, fue ideado por el economista Kaushik Basu en 1994. Por ejemplo, en el dilema del viajero, una aerolínea acepta pagar a dos viajeros una indemnización por daños a artículos idénticos. Sin embargo, a los dos viajeros se les requiere por separado estimar el valor del artículo, con un mínimo de $ 2 y un máximo de $ 100. Si ambos escriben el mismo valor, la aerolínea reembolsará a cada uno de ellos esa cantidad. Pero si los valores difieren, la aerolínea les pagará el valor más bajo, con un bono de $ 2 para el viajero que anotó este valor más bajo y una multa de $ 2 para el viajero que anotó el valor más alto.

El nivel de equilibrio de Nash, basado en la inducción hacia atrás, es de $ 2 en este escenario. Pero como en el juego del ciempiés, los experimentos de laboratorio demuestran consistentemente que la mayoría de los participantes, ingenuamente o de otra manera, eligen un número mucho más alto que $ 2.

El dilema del viajero se puede aplicar para analizar una variedad de situaciones de la vida real. El proceso de inducción hacia atrás, por ejemplo, puede ayudar a explicar cómo dos empresas involucradas en una competencia despiadada pueden reducir constantemente los precios de los productos en un intento por ganar participación de mercado, lo que puede provocar que incurran en pérdidas cada vez mayores en el proceso.

Batalla de los sexos

Esta es otra forma del juego de coordinación descrito anteriormente, pero con algunas asimetrías de pago. Esencialmente involucra a una pareja tratando de coordinar su salida nocturna. Si bien habían acordado encontrarse en el juego de pelota (preferencia del hombre) o en una jugada (preferencia de la mujer), han olvidado lo que decidieron y, para complicar el problema, no pueden comunicarse entre sí. ¿A dónde deberían ir? La matriz de pagos se muestra a continuación con los números en las celdas que representan el grado relativo de disfrute del evento para la mujer y el hombre, respectivamente. Por ejemplo, la celda (a) representa la recompensa (en términos de niveles de disfrute) para la mujer y el hombre en la obra (ella lo disfruta mucho más que él). La celda (d) es la recompensa si ambos llegan al juego de pelota (él lo disfruta más que ella). La celda (c) representa la insatisfacción si ambos van no solo al lugar equivocado sino también al evento que menos disfrutan: la mujer al juego de pelota y el hombre al juego.

Matriz de pago de la Batalla de los sexos		Hombre	Hombre
		Jugar	Juego de pelota
Mujer	Jugar	(a) 6, 3	(b) 2, 2
	Juego de pelota	(c) 0, 0	(d) 3, 6

Juego de dictador

Este es un juego simple en el que el Jugador A debe decidir cómo dividir un premio en efectivo con el Jugador B, quien no tiene participación en la decisión del Jugador A. Si bien esta no es una estrategia de teoría de juegos per se, proporciona algunas ideas interesantes sobre el comportamiento de las personas. Los experimentos revelan que aproximadamente el 50% se queda con todo el dinero para ellos, el 5% lo divide por igual y el otro 45% le da al otro participante una participación menor. El juego del dictador está estrechamente relacionado con el juego del ultimátum, en el que el jugador A recibe una cantidad fija de dinero, parte del cual debe entregarse al jugador B, que puede aceptar o rechazar la cantidad dada. El problema es que si el segundo jugador rechaza la cantidad ofrecida, tanto A como B no obtienen nada. El dictador y los juegos de ultimátum ofrecen lecciones importantes para cuestiones como las donaciones caritativas y la filantropía.

Guerra de paz

Esta es una variación del dilema del prisionero en el que las decisiones de "cooperar o desertar" son reemplazadas por "paz o guerra". Una analogía podría ser dos compañías involucradas en una guerra de precios. Si ambos se abstienen de reducir los precios, disfrutan de una relativa prosperidad (celda a), pero una guerra de precios reduciría drásticamente los pagos (celda d). Sin embargo, si A participa en la reducción de precios (guerra) pero B no, A tendría una recompensa mayor de 4, ya que podría capturar una participación sustancial en el mercado, y este mayor volumen compensaría los precios más bajos del producto.

Matriz de pago de la guerra de paz		Empresa B	Empresa B
		Paz	Guerra
Empresa A	Paz	(a) 3, 3	(b) 0, 4
	Guerra	(c) 4, 0	(d) 1, 1

Dilema del voluntario

En el dilema del voluntario, alguien tiene que realizar una tarea o un trabajo por el bien común. El peor resultado posible se realiza si nadie es voluntario. Por ejemplo, considere una compañía donde el fraude contable es rampante pero la alta gerencia no lo sabe. Algunos empleados junior en el departamento de contabilidad son conscientes del fraude, pero dudan en informar a la alta gerencia porque esto provocaría que los empleados involucrados en el fraude sean despedidos y probablemente procesados.

Ser etiquetado como denunciante también puede tener algunas repercusiones en el futuro. Pero si nadie se ofrece como voluntario, el fraude a gran escala puede resultar en la bancarrota eventual de la compañía y la pérdida de los trabajos de todos.

La línea de fondo

La teoría de juegos se puede utilizar de manera muy efectiva como herramienta para la toma de decisiones, ya sea en un entorno económico, comercial o personal.

(Para lecturas relacionadas, ver: Teoría del juego: más allá de lo básico ).

Comparar cuentas de inversión Nombre del proveedor Descripción Divulgación del anunciante × Las ofertas que aparecen en esta tabla son de asociaciones de las cuales Investopedia recibe una compensación.

← ¿Cuánto deben asignar los clientes a la inversión de impacto?

¿Pueden los mercados emergentes esquivar un desastre emergente? →

Recomendado

Deja Tu Comentario