Omnia Año 24, No. 1 (enero-abril, 2018) pp. 147 - 163 Universidad del Zulia. ISSN: 1315-8856

Depósito legal pp 199502ZU2628


Análisis y consideraciones técnicas en teoría de juegos y condición de equilibrio


Prudencia Medina Monterrosa*, León Arango ** Elida Alzamora Taborda***


Resumen


La teoría de juegos es una herramienta que permite examinar el com- portamiento estratégico de los participantes, a partir de sus tres característi- cas básicas: Reglas, Estrategias y recompensas o resultados, los integrantes del juego actúan precisamente motivados por la maximización de sus utilida- des, y supone que los adversarios son racionales, se toma en cuenta el com- portamiento esperado del otro, se considera el reconocimiento mutuo de la interdependencia. Su aplicación en el mundo real se manifiesta en situacio- nes en las que, al igual que en los juegos, el resultado de una acción depende de la decisión o conjunto de decisiones que cada participante toma en el transcurso de un determinado lapso. El objetivo del presente ensayo es anali- zar el enfoque del estándar mínimo seguro como principios operativos que so- porta algunas decisiones institucionales y estatales relacionadas con el desa- rrollo sostenible a través del modelo del dilema del prisionero y el modelo Hal- cón o Paloma de la teoría de juegos, estableciendo en ambos casos la condi- ción de equilibrio de John Nash desarrollado en la misma teoría, realizando un análisis económico en cuanto a la incertidumbre que involucra la destruc- ción irreversible de recursos ambientales no cuantificables en el presente pero si se evidencian su impacto en el futuro.

Palabras clave: Teoría de juegos, enfoque estándar mínimo, equilibrio.


El criterio final de esta línea de razonamiento es que cada jugador debe jugar de tal manera que minimice su perdida máxima siempre que el resultado de su elección no sea aprovechado por su oponente para me- jorar su posición. Esto se conoce criterio mínimax es un criterio están- dar que propone la teoría de juegos para elegir sus estrategias, este crite- rio dice que se seleccione la mejor estrategia aun cuando la elección fuera anunciada al oponente antes de que el oponente eligiera su estrategia. En términos de la matriz de pago, implica que el jugador A debe elegir aquella estrategia cuyo pago mínimo sea mayor, mientras que el jugador B debe elegir aquella estrategia cuyo pago máximo al jugador A sea el me- nor. Este criterio identifica la estrategia maximin para el jugador A y la estrategia mínimax para el jugador B.

Ahora bien, cuando al seleccionar cada estrategia en la matriz de pago el elemento es el mismo tanto para el jugador A como para el jugador B se dice que hay un punto de silla, el hecho de que un juego posea un punto de silla es esencial para determinar cómo se debe jugar. A causa de dicho punto, ningún jugador puede aprovechar la estrategia de su opo- nente para mejorar su propia posición, ningún jugador tiene motivos para considerar un cambio de estrategias, para quedar con ventajas respecto a su oponente, o para evitar que su oponente tenga ventajas. Entonces esta es una solución estable (llamada también solución de equilibrio) y cada ju- gador debe, exclusivamente emplear sus respectivas estrategias maximin y mínimax, cuando un juego no tiene el punto de silla el análisis es más es- tructurado, porque hay que aplicar estrategias mixtas en donde se asigna a cada jugador una distribución de probabilidad sobre su conjunto de es- trategias originales o puras (Hillier y Lieberman, 2002).

Ambientes de decisión: el análisis de decisión implica el uso de un proceso racional para seleccionar la mejor entre varias alternati- vas. La bondad de una alternativa seleccionada depende de la calidad de los datos utilizados para describir la situación de decisión. Desde este punto de vista, un proceso de toma de decisiones cae en una de tres categorías:

  1. Toma de decisiones bajo Incertidumbre en la que se conocen los da- tos de forma determinística.

  2. Toma de decisiones bajo riesgo en la que los datos se describen me- diante distribución de probabilidad.


  3. Toma de decisiones bajo incertidumbre en la que no es posible asig- nar a los datos pesos relativos que represente su grado de relevan- cia en el proceso de decisión.

De hecho bajo certidumbre los datos están bien definidos y bajo in- certidumbre los datos son ambiguos, así la toma de decisiones bajo ries- go representan los datos a la mitad de camino (Taha, 2005).


Enfoque del estándar mínimo seguro y desarrollo sostenible


En la búsqueda de un equilibrio ambiental se ha cuestionado mu- chas veces si todas las actividades económicas que dañan el medio am- biente benefician o compensan en la misma magnitud a los que sufren las consecuencias de estas actividades, la discusión sería en torno al daño ecológico de los recursos no renovables y de los daños irreversibles. El pro- blema radica en que son precisamente los países en vías de desarrollo al ser menos poderosos y no tener políticas bien definidas en cuanto a soste- nibilidad y sustentabilidad a nivel nacional, los que sufren las consecuen- cias de los daños ocasionados con este crecimiento económico.

De acuerdo con Medina (2015), la comisión Brudtland (WCED 1987), estableció la definición más disfundida de desarrollo sostenible progreso que satisface las necesidades del presente sin comprometer la capacidad de las generaciones futuras para satisfacer sus propias necesidades es claro que esta definición toca dos aspectos importantes sobre el desarrollo soste- nible, lo primero asegurar a lo largo del tiempo la permanencia en el mundo de las futuras generaciones y lo segundo esta relacionado con la capacidad de transferir una mejor calidad de vida de una generación a otra.

Para Solow (1991:3), la equidad en la distribución es el principio básico de la sostenibilidad referida a compartir bienestar entre personas de hoy y las del futuro. “Es la obligación para conducirnos nosotros mis- mos y dejar a la generación futura la opción de la capacidad de estar tam- bién como nosotros. La sostenibilidad es un mandato no para satisfacer- nos a nosotros mismos sino para el mejoramiento de nuestros sucesores”.

Existen diversas postura sobre el concepto de desarrollo sostenible y enfoques de cómo se podrían medir la sostenibilidad a través de sus respectivos indicadores, lo que se pretende es establecer si la distribu- ción económica va en la misma víaoa la par de la distribución ecológica, si una conlleva a la otra.

El Instituto de Recursos Mundiales (WRI), propone una metodolo- gía de contabilidad ambiental para poder explicar aquellos factores que la contabilidad económica tradicional no tiene en cuenta. Los estudios basados en estas contabilidades rechazan el tratamiento del producto interno bruto (PIB), como medida de beneficio generado por el agota- miento de los recursos naturales, porque este no refleja la utilización del capital natural, en las contabilidades ambientales, se revisa el Producto Interno Bruto como medida convencional para exponer el valor estimado del deterioro y agotamiento de los recursos naturales y por medio de esta


vía se desarrolle un sistema que refleje la ventaja social del desarrollo económico.

Uno de los principios operativos que soportan algunas decisiones institucionales y estatales relacionadas con el desarrollo sostenible es el enfoque del estándar mínimo seguro. Ciriaty Wantrup (1952) citado por Monsalve (2003), establece el concepto de estándar mínimo seguro (SMS), de la conservación, y este no es más que una regla de decisión por la cual el flujo de recursos de una zona crítica se mantendría a un nivel que hace posible reconstruir la reserva en el futuro.

Arias (2006), afirma: “Cuando es difícil cuantificar monetariamente los impactos ambientales o cuando existen incertidumbre sobre el daño de las acciones humanas sobre el ambiente y también sobre la irreversibilidad de estas acciones, la sociedad puede elegir no permitir que los recursos am- bientales (capacidad de asimilación de la contaminación, los bosques o po- blaciones de especies, entre otras) se reduzcan más allá de un estándar mí- nimo seguro. Sobrepasar este estándar mínimo seguro sólo estaría permiti- do si el costo de mantenerlo es intolerablemente alto” (Arias, 2006:22).

El principal problema que enfrenta el sistema de políticas ambien- tales, es la insuficiente información que existe en cuanto a las cifras otor- gadas por el sistema de cuentas económicas y ecológicas, estas son in- completas existen deficiencias metodológicas en la forma como se recopi- la y se lleva la base de datos, aunque este planteado como una manera de generar mayor equidad intergeneracional no es fácil aun con las políticas impositivas que de alguna manera vincula el sistema económico con el sistema ecológico.


Perspectiva metodológica


El método utilizado en el análisis de los resultados es el enfoque es- tándar mínimo seguro de la conservación, desarrollado desde la teoría de juegos. Que se modela a partir de la matriz de pagos definida en la teoría de juegos, con un tomador de decisiones que tiene dos alternativas explo- tar o conservar la naturaleza, esta a su vez como adversario tiene las op- ciones de agotar o no agotar los recursos. Cada una de las entradas de la matriz sugiere la perdida máxima que se obtendría; en el caso explotar- no agotar la perdida es nula, porque el recurso no se agota, en el caso ex- plotar- agotar el daño es irreversible la perdida es r porque el recurso se agota. En el caso de conservar los gastos de la conservación serán z.


Matriz de pago ambiental

Naturaleza

No agotar Agotar Máxima perdida

Tomador Explotar 0 r r

de Decisión Conservar z z z


El criterio mínimax, minimiza las máximas pérdidas posibles, para aplicarlo se establece, las máximas pérdidas posibles de cada estrategia para cada estado del ambiente, última columna, y luego se escoge dentro de estos datos el menor. Para este juego conservar es una mejor estrate- gia si los costos de la conservación son menores que las pérdidas del ago- tamiento (principio de precaución). El estándar mínimo seguro, cambia esta regla de decisión, ya que postula que debe conservarse a menos que los costos de hacerlo sean excesivamente altos. El cambio se justifica porque bajo el criterio de minimax se asume conocer las pérdidas con certeza, lo que regularmente es la fuente de la incertidumbre.

El criterio maximin se desconoce a priori el valor esperado del benefi- cio de los participantes, las acciones utilizadas en su aplicación suelen ser bastante conservadoras, ajustado más al principio de precaución, esta- blece que ante la incertidumbre generada por los efectos negativos de la acciones humanas sobre el ambiente y de los cambios ambientales sobre los humanos, donde en algunos casos son irreversibles, se ha recomenda- do que la sociedad debe tomar acciones antes que la incertidumbre sea re- suelta. Este será el criterio utilizado en el análisis de los resultados.

Se aplicará la matriz de pago del dilema del prisionero donde el to- mador de decisiones y la naturaleza serían los dos prisioneros y los esta- dos conservar y explotar o No agotado y agotado serian lealtad y traición respectivamente, las entradas en la matriz representan las ventajas que tendría cada uno siendo el menor valor la mejor decisión para cada uno.

Para el análisis con el modelo Halcón – Paloma se considera el tomador de decisiones y la naturaleza, donde cada uno puede asumir un comportamiento agresivo de lucha halcón, sería la posición explotar los recursos por parte del tomador de decisiones o agotar los recursos por parte de la naturaleza, o durante el enfrentamiento asumir una posición de pasiva de rendición Paloma, que sería la condición conservar por parte del tomador de decisiones y no agotar como respuesta de la naturaleza.

En ambos casos se hallará el equilibrio de Nash (1950), utilizando el criterio maximin


Resultados


Los resultados del análisis están dirigidos a demostrar el compor- tamiento del tomador de decisiones y de la naturaleza desde el enfoque del estándar mínimo seguro de la conservación, aplicando la matriz de pagos del dilema del prisionero la matriz halcón – paloma, para definir el equilibrio de Nash en ambos

Análisis de la matriz de pago ambiental dilema del prisionero


Matriz de pago ambiental

Naturaleza

No agotar

Agotar

Tomador

Conservar

2/2

10/1

de Decisión

Explotar

1/10

5/5

Fuente: Matriz de la matriz de pago ambiental equilibrio de Nash.


Al analizar al tomador de decisiones, suponiendo que los recursos naturales no se agotan y decide conservar obtendría menos beneficios que si explotara la naturaleza, al contrario si cree que la naturaleza agota sus recursos no importando los planes de sostenimiento que se hagan, explotar le genera más beneficios que conservar, por lo tanto no importa lo que haga la naturaleza, al tomador de decisiones le va mejor explotan- do los recursos naturales, esta es su estrategia dominante; Analizando el caso para la naturaleza que no es considerado un oponente pasivo, asu- miendo que el tomador realizará esfuerzos de conservación de la natura- leza, a esta le conviene agotar los recursos, de igual manera que si el to- mador de decisiones decidiera explotar los recursos a la naturaleza le conviene agotarlos esta es su estrategia dominante y sería el único equili- brio de Nash (1950), que existe donde el tomador de decisiones explota los recursos y la naturaleza los agota.


Equilibrio de Nash Matriz de pago ambiental

Naturaleza

No agotar Agotar Mínima pérdida

Tomador Conservar 2/2 10/1 1

de Decisión Explotar 1/10 5/5 5

Mínima pérdida 1 5 5

Fuente: Matriz de la matriz de pago ambiental equilibrio de Nash(1950).


Al establecer las mínimas pérdidas para ambos jugadores (el toma- dor de decisiones y la naturaleza) se observa que el equilibrio se encuen- tra con el criterio maximin al escoger la máxima de las mínimas pérdidas, que es la posición en la matriz donde ambos aplican su mejor estrategia. Se observa que los resultados más representativos de este análisis son:

Las acciones conservar la naturaleza por parte del tomador de deci- siones y No agotando los recursos como respuesta de la naturaleza, esta no es la decisión final porque prima el interés particular de cada agente del juego, primando la condición de juegos no cooperativos.

Así mismo podrían darse algunos acuerdos previos de sostenimien- to ambiental y preservación de la biodiversidad, estos no se mantendrían


y la naturaleza o el tomador de decisiones tarde o temprano responderían no respetando estos acuerdos. El equilibrio de Nash se obtiene cuando el tomador de decisiones y la naturaleza deciden la traición, teniendo un comportamiento egoísta de jugador al generar su propio beneficio, aun- que en la lealtad conservar – no agotar se generara el mejor beneficio para ambos.

El equilibrio de Nash se hubiera logrado aún si cada agente que in- terviene en el juego hubiera sabido con antelación la respuesta del otro, porque la decisión explotar resulta ser la elección optima del tomador de decisiones dada la elección de la naturaleza, y agotar resulta ser la deci- sión optima de la naturaleza dada la elección del tomador de decisiones.


Análisis de la matriz de pago ambiental: Halcón Paloma


Matriz de pago ambiental

Naturaleza

Agotar Halcón Paloma No agotar

Tomador Explotar Halcón

-1,-1

10,0

de Decisión Conservar Paloma

0,10

5,5

Fuente: Matriz de análisis modelo Halcón, Paloma.


Si el tomador de decisión enfrenta a la naturaleza de manera agresiva, explotando los recursos (halcón), esta se revela y su actuar es agresivo, agota los recursos (halcón) y ambos pierde, la mejor estra- tegia para el tomador de decisiones en este caso es retirarse, es decir conservar los recursos (paloma), porque si decide enfrentarla sus pér- didas serían mayores.

De igual manera, si el tomador de decisiones asume que la natu- raleza decide ser pasiva, no agotar los recursos (paloma) le conviene responderle de manera agresiva, explotando los recursos (Halcón), es la estrategia que le genera más ganancia. Si la naturaleza reacciona primero cuando sea agresiva, agotando los recursos (halcón) el toma- dor de decisiones debe responder de manera pasiva conservando los recursos (paloma) y viceversa, en este modelo existen dos equilibrios de Nash cuando ambos jugadores son respectivamente (paloma, hal- cón) o (halcón, paloma), que es la posición de máxima ganancia para ambos.

Se observa en la matriz de pago que la máxima perdida se obtiene cuando ambos deciden explotar – agotar porque por lo general los costos ocasionados por los daños que se ocasionan mutuamente, superan las ganancias, lo que a largo plazo no representa ningún beneficio.


Conclusiones


El equilibrio de Nash en los resultados de la matriz de pago del dile- ma del prisionero demuestra la condición mínima de racionalidad indivi- dual exigible en la interacción que se da al resolver una situación de con- flicto en este modelo, a pesar de que la menor perdida se establece en con- servar – no agotar, el equilibrio se obtiene en agotar-explotar.

De igual manera en la matriz de pago halcón-paloma se demuestra la condición mínima de racionalidad individual cuando la mejor opción para cada uno es respondiendo como paloma de manera pasiva, cuando el otro decide ser agresivo como el halcón, es donde se obtiene el máximo beneficio para ambos en otro caso las perdidas serían mayores para am- bos. Ante la incertidumbre para cuantificar los costos del impacto que genera el agotar un recurso, se recomienda un criterio conservador como el maximin que considera todas las perdidas mínimas y de esta selección la máxima posible, dado que no es posible saber con antelación el impac- to de los daños ambientales.

En los indicadores de sostenibilidad y los principios operativos que soportan las decisiones institucionales se considera la naturaleza como un oponente pasivo sin tener en cuenta el comportamiento vectorial que esta tiene, demostrado desde la perspectiva de la teoría de juegos del dile- ma del prisionero y el modelo halcón paloma, como son las reglas im- puestas para cada participante, las estrategias que pueden seguir cada jugado, la respuesta de adversario y la necesidad obtener el mejor resul- tado posible.


Referencias bibliográficas


Abramson Gillermo (2006). Introducción a la teoría de juegos. Instituto Balseiro y CONICET.http://fisica.cab.cnea.gov.ar/estadistica/abram son/notes/Introduccion-a los-juegos.pdf. 28 de marzo.

Bravo Raspeño, Juan (2006). Historia de las matemáticas: Teoría de Jue- gos recurso de internet disponible en http://issuu.com/rodolfocar- pio/docs/name7f8de4

Hillier, Frederick Lieberman, Gerald (2002). Métodos cuantitativos para administración: un enfoque de modelos y casos de estudio. McGra- w-Hill.

Medina, Prudencia (2015). Condición de equilibrio y enfoque mínimo en teoría de juego. Revista tlatemoani. España.

Monsalve, Sergio (2003). John Nash y la teoría de juegos. Universidad Na- cional de Colombia, Bogot´a. Lecturas Matematicas Volumen 24.

Monsalve, Sergio (2002). Teoría de Juegos: ¿Hacia dónde vamos? (60 años después de Von Neumann y Morgenstern). Revista de Economía, Ins- titucional No. 7 Universidad Externado de Colombia, Bogotá.


Nash, John (1950). Equilibrium points in n person games, Procedings from the National Academy of Sciences, USA 36:48–49.

Quiroga, José Manuel (2006). Agente de redes: Tipología y cooperación.

Trabajo de fin de carrera Universidad de Cataluña.www.bioversityin- ternational.org/ .../1466_11_Nota_Tecnica_3.pdf disponible en inter- net, consultado el 29-01-2013

Solow, Robert (1991). Crecimiento y equidad: Cómo hacer economía y ense- ñarla; Editorial Universitaria.

Taha, Hamdy (2012). Investigación de operaciones. Novena edición. Pear- son educación, México.

Torres, Ricard (2015). Equilibrio de Nash. Instituto Tecnológico Autónomo de México Maestría en Finanzas Economía Financiera (Eco-44105).

Von Neumann, John y Morgenstern, Oskar (1944). Theory of Games and Economic Behavior. Princeton, NJ: Princeton University Press.