Precio de la anarquía

El precio de la anarquía (PoA)[1]​ es un concepto de la teoría de juegos que mide cómo la eficiencia de un sistema se degrada debido a la conducta egoísta de sus agentes. Se trata de una noción general que puede ampliarse a los diversos sistemas y a las diferentes nociones de eficiencia. Por ejemplo, considere el sistema de transporte de una ciudad y a los muchos agentes que tratan de pasar de una cierta localización inicial hasta un destino final. Sea la eficiencia en este caso el promedio de tiempo que un agente tarda para llegar a su destino. En la solución «centralizada», una autoridad central puede decirle a cada agente qué camino tomar con el fin de reducir al mínimo el tiempo de viaje promedio. En la versión "descentralizada", cada agente elige su propio camino. El precio de la anarquía mide la relación entre el tiempo de viaje promedio en los dos casos.

Por lo general, el sistema se modela como un juego y la eficiencia es una función de los resultados (por ejemplo retardo máximo en una red, congestión en el sistema de transporte, el bienestar social en una subasta, ...). Diferentes conceptos de equilibrio se pueden utilizar para modelar el comportamiento egoísta de los agentes, entre los cuales el más común es el equilibrio de Nash. Diferentes refinamientos del equilibrio de Nash conducen a variaciones de la noción de precio de la anarquía como: Precio de la Anarquía puro (por equilibrios determinista), Precio de la Anarquía mixto (por azar equilibrios), Precio de la Anarquía Bayes-Nash (para los juegos con información incompleta), ... Otros conceptos, excepto los equilibrios de Nash, conducen a las variaciones del concepto, ya que el precio de hundimiento.[2]

El término de precio de la anarquía fue utilizado por primera vez por Koutsoupias y Papadimitriou,[1]​ pero la idea de medir la ineficacia de equilibrio es más antigua.[3]​ El concepto en su forma actual fue diseñado para ser el análogo de la "relación de aproximación», en un algoritmo de aproximación o de la "relación de competencia" en un algoritmo en línea . Esto es en el contexto de la tendencia actual de análisis de los juegos que usan lentes algorítmicos ( teoría de juegos algorítmica ).

Definición Formal

editar

Podemos definir un subconjunto   a ser el conjunto de estrategias en equilibrio (por ejemplo, el conjunto de equilibrios de Nash ). El precio de la anarquía se define como la relación entre el "peor equilibrio" y la solución 'centralizado' óptimo:

 

Siguiendo la convención en los algoritmos de aproximación, si la función de la eficiencia de la medida es, en lugar de un "bienestar" queremos "maximizar", una 'función de coste'   queremos 'minimizar' (retardo en una red, por ejemplo) que utilizamos:

 

Un concepto relacionado es el de la estabilidad de precios (punto de venta), que mide la relación entre el "mejor equilibrio" y la solución 'centralizado' óptimo:

 

o en el caso de funciones de coste:

 

Sabemos que   por definición. Se espera que la pérdida en la eficiencia debido a las limitaciones de teoría de juegos está en algún lugar entre el 'punto de venta Pos y PoA.

Ejemplos

editar

Dilema del prisionero

editar

Considere el juego 2x2 llamado dilema del prisionero, dado por la siguiente matriz de pagos:

Cooperate Defect
Cooperate 1, 1 7, 0
Defect 0, 7 5, 5

y sea la función de costos   Ahora, la función de coste mínimo sería cuando ambos jugadores cooperan y el costo resultante es  , Sin embargo, el único equilibrio de Nash se produce cuando tanto el costo defecto de tal situación es   por lo que el precio de la anarquía de este juego será  .

Referencias

editar
  1. a b E. Koutsoupias, C. H. Papadimitriou Worst-case equilibria Archivado el 13 de marzo de 2016 en Wayback Machine., STACS 99
  2. M. Goemans, V. Mirrokni, A. Vetta, Sink equilibria and convergence, FOCS 05
  3. P. Dubey. Inefficiency of Nash equilibria. Math. Operat. Res., 11(1):1–8, 1986

Bibliografía Adicional

editar