Inducción hacia atrás

La Inducción hacia atrás es el proceso de razonar atrás en el tiempo, desde el final de un problema o situación, para determinar una secuencia de acciones óptimas. Se procede, en primer lugar tomando en cuenta la última vez que se llevó a cabo una decisión y se elige qué hacer en ese momento. Con esta información, se puede entonces determinar lo que debería hacer en la penúltima decisión. Este proceso continúa atrás hasta que se ha determinado la mejor acción para cada situación posible (es decir, para cada posible conjunto de información) en cada punto en el tiempo.

En el método matemático de optimización programación dinámica, la inducción atrás es uno de los principales métodos para resolver la ecuación de Bellman.[1][2]​ En la teoría de juegos, la inducción atrás es un método utilizado para calcular el equilibrio perfecto en subjuegos en los juegos secuenciales.[3]​ La única diferencia es que la optimización implica un solo tomador de decisiones , que elige lo que debe hacer en cada momento del tiempo, mientras que la teoría de juegos analiza cómo las decisiones de varios jugadores interactúan. Es decir, mediante la previsión de lo que el último jugador que elige va a hacer en esa situación, es posible determinar que va a hacer el penúltimo jugador en elegir, y así sucesivamente. En los campos relacionados con la planificación automática y la programación automatizada y demostración automática de teoremas, el método se llama búsqueda atrás o encadenamiento hacia atrás . En el ajedrez se llama ajedrez retrospectivo.

La inducción atrás se ha utilizado para resolver juegos desde que la teoría de juegos ha existido. John von Neumann y Oskar Morgenstern sugieren la solución de un juego de suma cero, juegos de dos personas por inducción atrás en su libro Teoría de Juegos y Comportamiento Económico (1944), el libro que estableció la teoría de juegos como un campo de estudio.[4][5]​ El concepto de inducción hacia atrás también está relacionado con el Premio Nobel de Economía Reinhard Selten, uno de los creadores del concepto de equilibrio perfecto en subjuegos, la noción de equilibrio de referencia para juegos secuenciales.

Ejemplos

Problema de decisión individual

Partimos de un individuo desempleado con capacidad para trabajar 10 años más (T=10). Imaginemos que cada año que se encuentra sin empleo, puede llegarle una buena oferta de trabajo remunerado con 100 euros, o una mala oferta de trabajo remunerada con 44 euros, exactamente con la misma probabilidad (50%). Si decide aceptar una de las 2 ofertas, permanecerá en ese trabajo durante 10 años. "¿Debería este individuo aceptar malas ofertas de trabajo?" Podemos responder a esta pregunta a través de la inducción hacia atrás.

  • En el año 10 (t=10), el valor de aceptar una buena oferta de trabajo es de 100 euros, y el de aceptar una mala oferta de trabajo es de 44 euros, si rechazamos las ofertas recibimos 0 euros. Por lo que si el individuo en el último período sigue sin empleo debe aceptar cualquier trabajo.
  • En el año 9 (t=9), el valor de aceptar una buena oferta de trabajo es de 200 euros, y el de aceptar una mala oferta de trabajo es de 88 euros (44*2). Si rechazamos una oferta de trabajo recibimos 0 euros, más el valor de esperar la próxima oferta de trabajo, 100 euros o 44 euros con 50% de probabilidad, valor esperado = 72 euros (0,5*(100+44)). Por lo que, independientemente de si la oferta es buena o mala debe aceptar esa oferta en vez de esperar otra mejor.
  • En el año 8 (t=8),el valor de aceptar una buena oferta de trabajo es de 300 euros, y el de aceptar una mala oferta de trabajo es de 132 euros (44*3). Si rechazamos una oferta de trabajo recibimos 0 euros, más el valor esperado de esperar una oferta de trabajo en el año 9. Como sabemos que las ofertas en el año 9 deben aceptarse, el valor esperado de esperar una oferta de trabajo en el año 9 será = 144 euros (0,5*(200+88)). Por lo que, en el año 8, es preferible esperar una nueva oferta de trabajo que aceptar una mala.

Como conclusión obtenemos que las ofertas malas solo se deberían aceptar si no se tiene empleo en los años 9 o 10, rechazándose hasta el año 8. Si pensamos que vamos a ocupar un puesto de trabajo durante varios años, deberíamos ser exigentes con las distintas ofertas.

Inducción hacia atrás en un problema de decisión secuencial

Ejemplo para entender el Equilibrio de Nash Perfecto en Subjuegos.
Ejemplo para entender el Equilibrio de Nash Perfecto en Subjuegos.

En la imagen anterior se muestra un ejemplo para un juego que posee un Equilibrio de Nash no perfecto y un equilibrio perfecto en subjuegos. Las estrategias para el jugador 1 vienen dadas por {L,R} mientras que el jugador 2 tiene la opción entre {K,U}.

Matriz de pagos que nos permite hallar los equilibrios del juego

Matriz de pagos que permite identificar un ejemplo de ENPS.
Matriz de pagos que permite identificar un ejemplo de ENPS.

Equilibrio perfecto en subjuegos {R(U1,K2)} Equilibrio de Nash no perfecto {L(U1,U2)} Para aplicar el algoritmo de inducción hacia atrás, comenzamos el análisis por los nodos finales (aquellas decisiones donde el juego acabaría). Los correspondientes al jugador 2. Si 2 tuviera que mover en el nodo izquierdo elegiría U1, puesto que (3 es mayor que 1). S i tuviese que mover en el nodo de la derecha elegiría K2 (1 es mayor que 0). Considerando ahora el único nodo "penúltimo" el del jugador 1, como este jugador sabe anticipar lo que hará el jugador 2 racional, 1 elegirá R ( 2 es mayor que 1).

Teniendo entonces 2 equilibrios, {R(U1,K2)} Equilibrio de Nash Perfecto en Subjuegos y {L(U1,U2)}Equilibrio de Nash no Perfecto.

Juego del Ultimátum

Considere el juego del ultimátum , donde un jugador propone dividir cierta cantidad de dinero con otro (suponemos que ambos jugadores son egoístas). El primer jugador (el proponente) sugiere una división entre los dos jugadores. El segundo jugador tiene la opción de aceptar la división o rechazarla. Si el segundo jugador acepta, ambos obtienen la cantidad sugerida por el proponente. Si es rechazado, ninguno recibe nada. Considere las acciones del segundo jugador dada cualquier propuesta arbitraria del primer jugador (que le da al segundo jugador más de cero). Como la única opción que tiene el segundo jugador en cada uno de estos puntos del juego es elegir entre algo y nada, uno puede esperar que el segundo acepte. Dado que el segundo aceptará todas las propuestas ofrecidas por el primero (que le dan al segundo nada), el primero debe proponer dar el segundo lo menos posible. Este es el único equilibrio perfecto en subjuegos del juego del ultimátum. (Sin embargo, el juego del ultimátum tiene muchos otros equilibrios de Nash que no son perfectos para el subjuego).

Juego del Ciempiés (versión reducida)

Representa una situación en la que es beneficioso para ambos jugadores continuar el juego, aun cuando uno de los jugadores quiera terminar hoy, si supiese que el otro está dispuesto a terminarlo mañana. Nuestro juego se desarrolla en 3 fases, en las cuales los jugadores deciden Continuar (C) o Terminar (T).

Mini juego del ciempiés
Mini juego del ciempiés
  • En primer lugar, situémonos en el final del juego donde el jugador 1 debe elegir entre Continuar con un (pago =2), o Terminar con (pago =3). Claramente elegirá Terminar.
  • En segundo lugar, el jugador 2( que sabe que el jugador 1 es racional) tiene que decidir entre Terminar con un (pago=4), o Continuar con (pago=3). Evidentemente elegirá Terminar.
  • Y por último, el jugador 1 debe elegir Terminar con un (pago=1), o Continuar con un (pago=0).Elegirá Terminar.

Equilibrio de Nash (T,T,T) Los pagos del nodo final del juego, (3,3) y (2,5), son ambos estrictamente mejores que la solución de equilibrio (1,1). Pero esos resultados no se pueden alcanzar, dado que el jugador 2 no continuará, por lo que el jugador 1 anticipándose decide Terminar el juego.

Aplicaciones

Aplicación de la inducción hacia atrás a los juegos de mesa

Hay juegos como las damas y el ajedrez que se caracterizan por ser juegos finitos con información perfecta. El poder aplicarles la inducción hacia atrás permite encontrar los resultados perfectos en subjuegos, esto tiene gran relevancia respecto a la búsqueda de buenas estrategias de juego. Si enfrentásemos a un jugador cualquiera, contra un ordenador capaz de aplicar el algoritmo de inducción hacia atrás a juegos tan complejos como el ajedrez o las damas, nuestro jugador saldría siempre perdedor. Puesto que, el ordenador sabría que estrategia jugar en cada momento del juego para alcanzar la victoria.

Inducción hacia atrás y entrada económica

Considere un juego dinámico en el cual los jugadores son 2 empresas, una empresa establecida en una industria y otra con posibilidad de ingresar en esa industria. La empresa establecida tiene el monopolio de la industria y no quiere perder participación en el mercado. Si la otra empresa decide no ingresar, la empresa ya establecida recibe un pago elevado (mantiene su monopolio) y la nueva ni pierde ni gana (su pago es cero). Si la nueva empresa decide ingresar, la empresa ya establecida puede "pelear" o "acomodar" a la nueva. Luchará bajando su precio, haciendo que la nueva empresa salga del negocio (e incurra en costes de salida, un beneficio negativo) y dañe sus propios beneficios. Si decide acomodar, perderá algunas de sus ventas, pero mantendrá un precio elevado y recibirá mayores ganancias que bajando su precio (pero menor que las ganancias del monopolio). Considere si la mejor respuesta del monopolista es adaptarse si la nueva empresa decide ingresar. Si el monopolista se acomoda, la mejor respuesta de la nueva empresa es ingresar (y obtener ganancias). Por lo tanto, el perfil de estrategias en el que entra la nueva y el monopolista se acomoda es un equilibrio de Nash consistente con la inducción hacia atrás. Sin embargo, si el monopolista pelea, la mejor respuesta de la nueva es no ingresar, y si la nueva no ingresa, no importa lo que el monopolista decida hacer. Por lo tanto, el perfil de estrategias en el que pelea el monopolista si entra la nueva, pero la nueva no entra también es un equilibrio de Nash. Sin embargo, si la nueva ingresara, la mejor respuesta del monopolista es acomodarse: la amenaza de enfrentamientos no es creíble. Este segundo equilibrio de Nash puede por lo tanto ser eliminado por inducción hacia atrás.

Paradoja del Ahorcado

Supongamos que a un prisionero se le dice que será ahorcado en algún momento entre el lunes y el viernes de la próxima semana. Sin embargo, el día exacto será una sorpresa (es decir, no sabrá la noche anterior que será ejecutado al día siguiente). El prisionero, interesado en burlar a su verdugo, intenta determinar qué día ocurrirá la ejecución. El razona que no puede ocurrir el viernes, ya que si no hubiera ocurrido antes del final del jueves, sabría que la ejecución sería el viernes. Por lo tanto, el puede eliminar el viernes como una posibilidad. Con el viernes eliminado, decide que no puede ocurrir el jueves, ya que si no hubiera ocurrido el miércoles, el sabría que tenía que ser el jueves. Por lo tanto, el puede eliminar el jueves. Este razonamiento continúa hasta que haya eliminado todas las posibilidades. El concluye que no será ahorcado la próxima semana. Para su sorpresa, le cuelgan el miércoles. Cometió el error de suponer que sabía de manera definitiva si el factor futuro desconocido que podría causar su ejecución podía razonar. Aquí el prisionero razona por inducción hacia atrás, pero parece llegar a una conclusión falsa. Sin embargo, tenga en cuenta que la descripción del problema supone que es posible sorprender a alguien que está realizando una inducción hacia atrás. La teoría matemática de la inducción hacia atrás no hace esta suposición, por lo que la paradoja no cuestiona los resultados de esta teoría.


Referencias

  1. Jerome Adda and Russell Cooper, "Dynamic Economics: Quantitative Methods and Applications", Section 3.2.1, page 28. MIT Press, 2003.
  2. Mario Miranda and Paul Fackler, "Applied Computational Economics and Finance", Section 7.3.1, page 164. MIT Press, 2002.
  3. Drew Fudenberg and Jean Tirole, "Game Theory", Section 3.5, page 92. MIT Press, 1991.
  4. John von Neumann and Oskar Morgenstern, "Theory of Games and Economic Behavior", Section 15.3.1. Princeton University Press. Third edition, 1953. (First edition, 1944.)
  5. Mathematics of Chess Archivado el 12 de noviembre de 2017 en Wayback Machine., webpage by John MacQuarrie.

Read other articles:

العلاقات الأمريكية الغرينادية الولايات المتحدة غرينادا   الولايات المتحدة   غرينادا تعديل مصدري - تعديل   العلاقات الأمريكية الغرينادية هي العلاقات الثنائية التي تجمع بين الولايات المتحدة وغرينادا.[1][2][3][4][5] مقارنة بين البلدين هذه مقارن�...

 

Milutin MilankovićBiographieNaissance 16 mai 1879DaljDécès 12 décembre 1958 (à 79 ans)BelgradeNom dans la langue maternelle Милутин МиланковићNationalité yougoslaveFormation Université technique de Vienne (jusqu'en 1902)Activités Mathématicien, astrophysicien, physicien, écrivain de science-fiction, géophysicien, ingénieur civil, ingénieur, écrivain, professeur, astronome, climatologueAutres informationsA travaillé pour Université de BelgradeMembre de Aca...

 

Miss Universe 2015Pia Wurtzbach Miss Universe 2015Tanggal20 Desember 2015TempatThe AXIS, Las Vegas, NevadaPembawa acaraSteve HarveyRoselyn Sánchez[1]Pengisi acaraCharlie PuthThe Band PerrySeal[2]PenyiaranFoxAzteca[3]Peserta80Finalis/Semifinalis15Tidak tampilEthiopiaGuamKazakhstanKenyaLithuaniaMesirSloveniaSri LankaSaint LuciaSwissTrinidad dan TobagoKepulauan Turks dan CaicosTampil kembaliDenmarkKepulauan CaymanMontenegroVietnamPemenangPia Wurtzbach...

Suburb of Copenhagen, Denmark For the airport occasionally referred to as Kastrup, see Copenhagen Airport. Kastrup (Danish pronunciation: [ˈkʰæˌstʁɔp]) is a suburb of Copenhagen, Denmark, on the east coast of Amager in Tårnby Municipality. It is the site of Copenhagen Airport. In Danish, the airport is often called Kastrup Lufthavn (Kastrup Airport) or Københavns Lufthavn, Kastrup (Copenhagen Airport, Kastrup). History Kastrup Works In 1749 Jacob Fortling obtained a royal lice...

 

イスラームにおける結婚(イスラームにおけるけっこん)とは、二者の間で行われる法的な契約である。新郎新婦は自身の自由な意思で結婚に同意する。口頭または紙面での規則に従った拘束的な契約は、イスラームの結婚で不可欠だと考えられており、新郎と新婦の権利と責任の概要を示している[1]。イスラームにおける離婚は様々な形をとることができ、個�...

 

Aiyub Abbas Bupati Pidie Jaya ke-2Masa jabatan3 Februari 2014 – 4 November 2023PresidenSusilo Bambang YudhoyonoJoko WidodoPendahuluM. Gade SalamPenggantiDr. H. Said Mulyadi, SE, M.Si Informasi pribadiLahir2 Mei 1969 (umur 54)Lhok Duek, Bandar Baru, Pidie Jaya, Aceh, IndonesiaKebangsaanIndonesiaPartai politikPartai Aceh (2007—)Afiliasi politiklainnyaGerindra (2013–2022)Suami/istriDarnawati M JamilAnakM. Nur SyahidiNurul HidayahFilza AufaFahril MubarakKarier militerPihak...

This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Thomas Patrick Coohill – news · newspapers · books · scholar · JSTOR (December 2010) (Learn how and when to remove this template message) Thomas P...

 

First Maharaja of the Sikh Empire (1780–1839) For other uses, see Ranjit Singh (disambiguation). Sher-e-Punjab redirects here. For the hockey team, see Sher-e-Punjab (field hockey team). For the radio station, see KRPI. For the Doordarshan television series, see Maharaja Ranjit Singh (TV series). Ranjit SinghMaharaja of PunjabMaharaja of LahoreSher-e-Punjab (Lion of Punjab)Sher-e-Hind (Lion of India)Sarkar-i-Wallah (Head of Government)[1]Sarkar Khalsaji (Respected Head of the Khalsa...

 

أوروآيز الكلاسيكي 2016 تفاصيل السباقسلسلة21. أوروآيز الكلاسيكيمنافسةطواف العالم للدراجات 2016 1.UWT‏التاريخ21 أغسطس 2016المسافات217٫7 كمالبلد ألمانيانقطة البدايةهامبورغنقطة النهايةهامبورغالفرق22عدد المتسابقين في البداية176عدد المتسابقين في النهاية144متوسط السرعة44٫363 كم/سالمن�...

Short story collection by Andrzej Sapkowski This article is about the short story collection. For the rock band, see The Last Wish (band). For the animated film, see Puss in Boots: The Last Wish. The Last Wish First edition coverAuthorAndrzej SapkowskiOriginal titleOstatnie życzenieTranslatorDanusia StokCountryPolandLanguagePolishSeriesThe WitcherRelease number1GenreFantasyPublisherSuperNowaPublication date1993Published in English2007Media typePrint (hardback & paperback)...

 

منتخب فنزويلا لكرة السلة فنزويلا التصنيف 20 (16 سبتمبر 2019)[1] انضم للاتحاد الدولي 1938 منطفة فيبا اتحاد الأمريكتين لكرة السلة المدرب نيستور غارسيا (كرة سلة)  اللقب La Vinotinto de las alturas البلد فنزويلا الألعاب الأولمبية المشاركة 1 الميداليات لا يوجد كأس العالم لكرة السلة المشارك�...

 

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

هذه المقالة بحاجة لصندوق معلومات. فضلًا ساعد في تحسين هذه المقالة بإضافة صندوق معلومات مخصص إليها. يجب أن يحمل الطيار الموجود في القيادة رتبة كابتن، ويجلس عادة في المقعد الأيسر. يمكن أن يكون الضابط الثاني في القيادة ضابطًا أول أو قائدًا آخر، وسيشغل المقعد الأيمن. يوجد استث�...

 

American restaurant company Darden Restaurants, Inc.Darden Restaurants logo (2009-present)Company typePublicTraded asNYSE: DRIS&P 500 componentIndustryRestaurantPredecessorGeneral Mills Restaurants(1970–1995)FounderWilliam DardenHeadquarters1000 Darden Center Drive Orlando, Florida 32837Number of locationsMore than 1,800[1]Area servedBrazil Canada Costa Rica El Salvador Mexico Panama United States (including Puerto Rico, Guam)Key peopleCynthia T. Jamison (chairman)Rick Card...

 

Uttam Galva Steel LtdCompany typePublicTraded asBSE: 513216NSE: UTTAMSTLIndustrySteelFounded1985FounderRajendra MiglaniHeadquartersKhopoli, Nagpur, Maharashtra, IndiaKey peopleSh.Rajendra Miglani Director & MDProductsCold Rolled steel , galvanized steel & colour coated producted.Revenue ₹44,963.8 million (US$540 million) (2009–2010)Net income ₹1,024.7 million (US$12 million) (2009–2010)Number of employees~18,000Websitewww.uttamgalva.com Uttam Galva Steels ...

Philosophical and political rights This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these messages) The examples and perspective in this article may not represent a worldwide view of the subject. You may improve this article, discuss the issue on the talk page, or create a new article, as appropriate. (August 2022) (Learn how and when to remove this message) The neutrality of this article is disputed. Relevant dis...

 

Heavy machine production business in Yekaterinburg, Russia For other uses, see Uralmash (disambiguation). Not to be confused with Uraltransmash. UralmashCompany typeJoint-stock companyIndustryMachineryFounded1933HeadquartersYekaterinburg, RussiaRevenue13,900,000,000 Russian ruble (2020) Net income−3,425,000,000 (2019) Number of employees2,057 (2020) ParentOMZWebsiteuralmash.ru T-34 tanks produced at Uralmash (1942) A bucket of one of the first Uralmash dragline excavators wit...

 

Marine invertebrates of the subphylum Anthozoa For other uses, see Coral (disambiguation). Not to be confused with Corral. CoralsTemporal range: 535–0 Ma PreꞒ Ꞓ O S D C P T J K Pg N A coral outcrop on the Great Barrier Reef, Australia Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Cnidaria Subphylum: AnthozoaEhrenberg, 1834 Subdivisions Octocorallia Helioporacea Alcyonacea Hexacorallia Scleractinia Antipatharia †Rugosa †Tabulata Corals are colonial marine...

William Paterson William Paterson (jurista) Nascimento 24 de Dezembro 1745Antrim, Irlanda Morte 9 de Setembro de 1806 (60 anos)Albany, Nova Iorque Sepultamento Albany Rural Cemetery Cidadania Estados Unidos Filho(a)(s) Cornelia Paterson Van Rensselaer Alma mater Universidade de Princeton Ocupação político, advogado, juiz Prêmios Membro da Academia Americana de Artes e Ciências Assinatura [edite no Wikidata] William Paterson (Antrim, 24 de dezembro de 1745 - Albany, 9 de setembro de ...

 

この記事には参考文献や外部リンクの一覧が含まれていますが、脚注による参照が不十分であるため、情報源が依然不明確です。 適切な位置に脚注を追加して、記事の信頼性向上にご協力ください。(2018年10月) 名古屋鉄道株式会社Nagoya Railroad Co.,Ltd. 名古屋鉄道本社が入居する名鉄バスターミナルビル種類 株式会社機関設計 監査役会設置会社[1]市場情報 東証�...