AlphaGo

AlphaGo es un programa informático de inteligencia artificial desarrollado por Google DeepMind para jugar al juego de mesa Go. En octubre de 2015 se convirtió en la primera máquina de Go en ganar a un jugador profesional sin emplear piedras de handicap en un tablero de 19x19.

Se enfrentó contra el jugador chino Fan Hui 2p en una serie de 5 partidas oficiales, las cuales AlphaGo ganó, seguidas por unas partidas informales que acabaron 3-2 a favor de la inteligencia artificial. En marzo de 2016, se enfrentó a uno de los mejores jugadores, Lee Sedol 9p. El 9 de marzo de 2016, AlphaGo ganó la primera partida de este enfrentamiento.[1][2]​ Hasta marzo del 2016, AlphaGo estaba clasificado como número dos del mundo en el ranking no oficial de Rémi Coulom, con un elo de 3611 hasta julio del 2016.[3]​ En reconocimiento por vencer a Lee Sedol, AlphaGo fue galardonado con un honorario 9-dan por la Asociación Coreana de Baduk.

En 2017, AlphaZero, del propio DeepMind, superó a la versión AlphaGo Zero y otros programas de ajedrez y Shōgi después de solo 24 horas de juego. Después de 4 horas de juegos adquirió un nivel superhumano.[4][5]

Hardware

AlphaGo se puso a prueba en hardware con varios números de CPU s y GPU s, que se ejecuta en modo asíncrono o distribuido. Dos segundos de tiempo de pensar se da a cada movimiento. El Elo resultante se enumera a continuación[6]

Configuración y rendimiento
Configuración Hilos de
búsqueda
N.º de CPU N.º de GPU Ranking de Elo
Asíncrono 40 48 1 2,151
Asíncrono 40 48 2 2,738
Asíncrono 40 48 4 2,850
Asíncrono 40 48 8 2,890
Distribuido 12 428 64 2,937
Distribuido 24 764 112 3,079
Distribuido 40 1,202 176 3,140
Distribuido 64 1,920 280 3,168
Configuración y fuerza[7]
Versiones Hardwares Elo Partidos
AlphaGo Fan 176 GPUs, distribuido 3.144 5:0 contra Fan Hui
AlphaGo Lee 48 TPUs, distribuido 3.739 4:1 contra Lee Sedol
AlphaGo Master Una sola máquina con 4 TPU v2 4.858 60:0 contra jugadores profesionales;

Cumbre del Futuro de Go

AlphaGo Zero Una sola máquina con 4 TPUs[8]​ v2 5.185[9] 100:0 contra AlphaGo Lee

89:11 contra AlphaGo Master

AlphaGo Zero

El equipo de AlphaGo publicó un artículo en la revista Nature el 19 de octubre de 2017, presentando AlphaGo Zero, una versión sin datos humanos y más sólida que cualquier otra versión humana anterior que derrotara al campeón.[9]​ Al jugar juegos contra sí mismo, AlphaGo Zero superó la fuerza de AlphaGo Lee en tres días al ganar 100 juegos a 0, alcanzó el nivel de AlphaGo Master en 21 días y superó todas las versiones anteriores en 40 días.[8]

Algoritmo

El algoritmo de AlphaGo utiliza una combinación de técnicas de aprendizaje automático y árbol de búsqueda, combinadas con una amplia formación, tanto desde el juego humano y como del ordenador. Utiliza árbol de búsqueda Monte Carlo, guiada por una «red de valor» y una «red de políticas», ambas implementadas mediante la tecnología de redes neuronales de aprendizaje profundo.[10][6]​ Una cantidad limitada de detección de características pre-procesamiento-juego específico se utiliza para generar las entradas a las redes neuronales.[6]

Las redes neuronales del sistema fueron inicialmente bootstrapeadas a partir de la experiencia de juego humano. AlphaGo fue entrenado inicialmente para imitar el juego humano, tratando de igualar los movimientos de los jugadores expertos de juegos históricos registrados, utilizando una base de datos de alrededor de 30 millones de movimientos. Una vez que había alcanzado un cierto grado de habilidad, era entrenado aún más al ser llamado a desempeñar un gran número de partidos contra otras instancias de sí mismo, usando aprendizaje por refuerzo para mejorar su juego.[10]

Estilo de juego

AlphaGo ha sido descrito por el jugador de 9-dan Myungwan Kim como jugar «contra un ser humano» en sus partidos contra Fan Hui.[11]​ El árbitro del partido, Toby Manning, ha descrito el estilo del programa como «conservador».[12]

Respuestas

AlphaGo ha sido aclamado como un hito en la investigación de la inteligencia artificial, como Go previamente ha sido considerado como un problema difícil en el aprendizaje de máquinas que se esperaba que este fuera del alcance de la tecnología de la época.[13][14]​ Toby Manning, el árbitro de AlphaGo contra Fan Hui y Hajin Lee, y el secretario general de la Federación Internacional de Go han dicho que en el futuro, los jugadores de Go contarán con la ayuda de las computadoras para aprender lo que han hecho mal en los juegos y mejorar sus habilidades.[15]

Sistemas similares

Facebook también ha estado trabajando en su propio sistema de juego de Go, el darkforest, el cual también se basa en la combinación de máquina de aprendizaje y búsqueda de árbol.[16]​ Aunque es un jugador fuerte contra otro programas de computadora de Go, hasta principios de 2016, todavía no había vencido a un jugador humano profesional.[17]​ Darkforest perdió contra CrazyStone y Zen y se estima que es de una similar resistencia a ellos.[18]

Ejemplo de juegos

AlphaGo (negro) v. Fan Hui, el Juego 4 (8 de octubre de 2015), AlphaGo ganó por abandono.[6]

Primeras 99 movidas (96 a 10)
Movidas 100-165.

Enfrentamiento

El encuentro
Partida no. Fecha Negras Blancas Resultado Movimientos
1 9 de marzo de 2016 Lee Sedol AlphaGo B+abandono 186
2 10 de marzo de 2016 AlphaGo Lee Sedol N+abandono 211
3 12 de marzo de 2016 Lee Sedol AlphaGo B+abandono 176
4 13 de marzo de 2016 AlphaGo Lee Sedol B+abandono 180
5 15 de marzo de 2016 Lee Sedol AlphaGo B+abandono 280
Resultado:
AlphaGo 4 – 1 Lee Sedol

Referencias

  1. «Google’s AI beats world Go champion in first of five matches - BBC News». BBC Online. Consultado el 9 de marzo de 2016. 
  2. «1 Enfrentamiento Youtube». Consultado el 8 de marzo de 2016. 
  3. http://www.goratings.org/ goratings.org
  4. «Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm». 
  5. «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours». 
  6. a b c d Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis et al.. «Mastering the game of Go with deep neural networks and tree search». Nature 529 (7587): 484-489. doi:10.1038/nature16961. 
  7. «【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解» (en chino). Sohu. 24 de mayo de 2017. Consultado el 1 de junio de 2017. 
  8. a b «AlphaGo Zero: Learning from scratch». DeepMind official website. 18 de octubre de 2017. Archivado desde el original el 19 de octubre de 2017. Consultado el 19 de octubre de 2017. 
  9. a b «Mastering the game of Go without human knowledge». Nature. 19 de octubre de 2017. Consultado el 19 de octubre de 2017. 
  10. a b Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J. «Temporal Difference Learning of Position Evaluation in the Game of Go». 
  11. David, Eric (1 de febrero de 2016). «Google’s AlphaGo "plays just like a human," says top ranked Go player». SiliconANGLE (en inglés estadounidense). Consultado el 3 de febrero de 2016. 
  12. Gibney, Elizabeth (27 de enero de 2016). «Google AI algorithm masters ancient game of Go». Nature News & Comment (en inglés). Consultado el 3 de febrero de 2016. 
  13. Connor, Steve (27 de enero de 2016). «A computer has beaten a professional at the world's most complex board game». The Independent (en inglés). Consultado el 28 de enero de 2016. 
  14. «Google's AI beats human champion at Go». CBC News (en inglés). 27 de enero de 2016. Consultado el 28 de enero de 2016. 
  15. Gibney, Elizabeth (2016). «Go players react to computer defeat». Nature (en inglés). doi:10.1038/nature.2016.19255. 
  16. Tian, Yuandong; Zhu, Yan (2015). «Better Computer Go Player with Neural Network and Long-term Prediction». arXiv:1511.06410v1  [cs.LG]. 
  17. HAL 90210 (28 de enero de 2016). «No Go: Facebook fails to spoil Google's big AI day». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 1 de febrero de 2016. 
  18. «Strachey Lecture - Dr Demis Hassabis on Livestream» (en inglés estadounidense). The New Livestream. Consultado el 28 de marzo de 2016. 

Véase también

Enlaces externos

Read other articles:

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Danish Rugby Union – news · newspapers · books · scholar · JSTOR (December 2017) (Learn how and when to remove this template message) Danish Rugby UnionDansk Rugby UnionSportRugby unionFounded1950 (1950)World Rugby affiliation1988FIRA affiliation1971 The D...

 

 

Species of rodent Yellow-bellied marmot Yellow-bellied marmot in Tuolumne Meadows, Yosemite National Park Conservation status Least Concern  (IUCN 3.1)[1] Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Mammalia Order: Rodentia Family: Sciuridae Genus: Marmota Subgenus: Marmota (Petromarmota) Species: M. flaviventris Binomial name Marmota flaviventris(Audubon & Bachman, 1841) Yellow-bellied Marmot range[1] The yellow-bellied ...

 

 

Pour les articles homonymes, voir Cheung. Maggie Cheung Maggie Cheung au Festival de Cannes 2007. Données clés Nom de naissance Cheung Man-yuk (Wade-Giles)張曼玉 (chinois traditionnel)Zhāng Mànyù (pinyin) Naissance 20 septembre 1964 (59 ans)Hong Kong Nationalité Hongkongaise Profession Actrice Films notables Police Story (série de films)Song of ExileAs Tears Go By Center Stage L'Auberge du dragon Green SnakeIrma VepIn the Mood for LoveHeroClean modifier Maggie Cheung (張曼�...

Unicameral legislature of the Cook Islands Parliament of the Cook Islands Te Marae Akarau Vānanga o te Kuki AiraniOfficial Emblem of the Parliament of the Cook Islands[1]TypeTypeUnicameral LeadershipSpeakerTai Tura, Cook Islands Party since 22 March 2021 Deputy SpeakerTingika Elikana, Cook Islands Party since 22 March 2021 Prime MinisterMark Brown, Cook Islands Party since 1 October 2020 Leader of the OppositionTina Browne, Democratic Party StructureSeats24Political g...

 

 

Radio station in Bethlehem, Pennsylvania WZZOBethlehem, PennsylvaniaBroadcast areaLehigh ValleyFrequency95.1 MHz (HD Radio)Branding95.1 ZZOProgrammingLanguage(s)EnglishFormatActive rockAffiliationsiHeartRadioPremiere NetworksOwnershipOwneriHeartMedia(iHM Licenses, LLC)Sister stationsWAEBWAEB-FMWSANHistoryFirst air dateFebruary 16, 1946 (1946-02-16) (as WGPA-FM)Former call signsWGPA-FM (1946–1973)WEZV (1973–1978)Technical information[1]Licensing authorityFCCFacility ...

 

 

Pour les articles homonymes, voir Menuet en fa majeur. Menuet en fa majeur KV 4 Mozart en 1763. Genre Menuet Musique Wolfgang Amadeus Mozart Effectif Clavecin Durée approximative environ une minute Dates de composition 11 mai 1762 à Salzbourg modifier  Le Menuet pour clavier en fa majeur, KV 4, est une brève pièce, composée par Wolfgang Amadeus Mozart à Salzbourg le 11 mai 1762, alors que Wolfgang n'avait que six ans. C'est la neuvième pièce de musique composée par Mozart....

Line of tower computers designed and manufactured by Apple Not to be confused with iMac G5, Power Mac G4, iMac G4, Power Mac G4 Cube, PowerBook G4, or iBook G4. Power Mac G5Apple Power Mac G5DeveloperApple Computer, Inc.Product familyPower MacintoshTypeDesktopRelease dateJune 23, 2003Introductory priceUS$1,999 (equivalent to $3,310 in 2023)DiscontinuedAugust 7, 2006CPU1.6 – 2.7 GHz PowerPC G5Single-processorDual-processors, single-coreDual-coreDual-processors, dual-corePredecessorPower ...

 

 

Chemical compound RetroprogesteroneClinical dataOther names9β,10α-Progesterone; 9β,10α-Pregn-4-ene-3,20-dioneDrug classProgestin; ProgestogenATC codeNoneIdentifiers IUPAC name (8S,9R,10S,13S,14S,17S)-17-acetyl-10,13-dimethyl-1,2,6,7,8,9,11,12,14,15,16,17-dodecahydrocyclopenta[a]phenanthren-3-one CAS Number2755-10-4PubChem CID92940ChemSpider83898UNIIR94ZS616JRECHA InfoCard100.018.553 Chemical and physical dataFormulaC21H30O2Molar mass314.469 g·mol−13D model (JSmol)Interactive image...

 

 

Anselmus dari CanterburyUskup Agung dari Canterbury Provinsi gerejawiCanterburyKeuskupanKeuskupan CanterburyTakhtaUskup Agung CanterburyAwal masa jabatantidak diketahuiMasa jabatan berakhir21 April 1109PendahuluLanfrancPenerusRalph d'EscuresImamatTahbisan uskup4 Desember 1093Informasi pribadiNama lahirAnselmo d'AostaLahir1033Aosta, Kerajaan BourgogneWafat21 April 1109(1109-04-21) (umur 75)Canterbury, Kent, InggrisMakamKatedral CanterburyDenominasiKatolik RomaOrang tuaGundulf de CandiaErm...

For other people named John Brunner, see John Brunner (disambiguation). British industrialist and politician (1842–1919) The Right Honourable SirJohn BrunnerBt DLJohn Brunner in 1885BornJohn Tomlinson Brunner8 February 1842 (1842-02-08)Everton, Liverpool, EnglandDied1 July 1919 (1919-08) (aged 77)Chertsey, Surrey, EnglandEducationSt. George's House, EvertonOccupation(s)Chemical industrialist, politicianTitleBaronetSpouses Salome Davies Jane Wyman ChildrenJohn Fowler Leece...

 

 

Chinese born-American actress and author (1919–2015) Jayne MeadowsMeadows in the 1940sBornJane Cotter(1919-09-27)September 27, 1919Wuchang District, Wuhan, ChinaDiedApril 26, 2015(2015-04-26) (aged 95)Encino, Los Angeles, California, U.S.Resting placeForest Lawn Memorial Park, Hollywood Hills, CaliforniaOccupation(s)Actress, authorYears active1941–2009Known forUndercurrentSong of the Thin ManDavid and BathshebaEnchantmentLady in the LakePolitical partyRepublicanSpouses Milt...

 

 

Malaria vaccine RTS,SVaccine descriptionTargetP. falciparum; to a lesser extent Hepatitis BVaccine typeProtein subunitClinical dataTrade namesMosquirixRoutes ofadministrationintramuscular injection (0.5 mL)[1]Legal statusLegal status In general: ℞ (Prescription only) A poster advertising trials of the RTS,S vaccine[2] RTS,S/AS01 (trade name Mosquirix) is a recombinant protein-based malaria vaccine. It is one of two malaria vaccines approved (the other is R21/M...

Measure of air pollutionAn annotated satellite photo showing smoke from wildfires in Greece, giving rise to an elevated AQI downwind Part of a series onPollutionAir pollution from a factory Air Air quality index Atmospheric dispersion modeling Chlorofluorocarbon Combustion Exhaust gas Haze Global dimming Global distillation Indoor air quality Ozone depletion Particulates Persistent organic pollutant Smog Soot Volatile organic compound Waste Biological Biological hazard Genetic Introduced spec...

 

 

County in Pennsylvania, United States Allegheny County redirects here. Not to be confused with Alleghany County. County in PennsylvaniaAllegheny CountyCountyAllegheny County Courthouse FlagSealLocation within the U.S. state of PennsylvaniaPennsylvania's location within the U.S.Coordinates: 40°26′08″N 80°01′28″W / 40.4356°N 80.0244°W / 40.4356; -80.0244Country United StatesState PennsylvaniaFoundedSeptember 24, 1788Named forAllegheny RiverSeatPitts...

 

 

American football player (born 1959) For other people named Lawrence Taylor, see Lawrence Taylor (disambiguation). American football player Lawrence TaylorTaylor in 2009No. 56Position:LinebackerPersonal informationBorn: (1959-02-04) February 4, 1959 (age 65)Williamsburg, Virginia, U.S.Height:6 ft 3 in (1.91 m)Weight:237 lb (108 kg)Career informationHigh school:Lafayette(Williamsburg, Virginia)College:North Carolina (1977–1980)NFL draft:1981 / Round: 1...

Zenit-3SL as a part of Land Launch program Land Launch refers to a service product of Sea Launch SA. There is no entity or company called Land Launch. Sea Launch created the Land Launch offering to address lighter satellites directly into geosynchronous orbit or into geosynchronous transfer orbit, while Sea Launch continues to address the heavy satellite launch market.[1] In 2002, Sea Launch created Land Launch with its Russian and Ukrainian partners. The Russian and Ukrainian partner...

 

 

Women's water poloat the Games of the XXX OlympiadTournament detailsHost country United KingdomCityLondonVenue(s)Water Polo ArenaDates30 July – 9 August 2012Teams8 (from 4 confederations)Competitors102Final positionsChampions United States (1st title)Runners-up SpainThird place AustraliaFourth place HungaryTournament statisticsMatches24Goals scored468 (19.5 per match)Multipleappearances4-time Olympian(s): 33-time Olympian(s): 6Multiplemedalists4-time meda...

 

 

Localizzazione della zona di Clarion-Clipperton. La zona di Clarion-Clipperton (CCZ), talvolta impropriamente chiamata zona di frattura di Clarion-Clipperton, è un'area del fondale dell'Oceano Pacifico amministrata dall'Autorità internazionale dei fondali marini (ISA) e balzata all'attenzione della comunità scientifica, e dell'opinione pubblica in generale, dopo che alcuni sondaggi hanno rivelato in essa la presenza di enormi giacimenti minerari, in particolare di noduli di manganese, il c...

1911 Cisleithanian legislative election ← 1907 June & July 1911 1919 (Austria) →1920 (Czechoslovakia) → All 516 seats in the Imperial Council259 seats needed for a majorityTurnout4,625,082 (80.20%)   First party Second party Third party   Leader Prince Louis Victor Adler Antonín Švehla Party CS SPÖ RSZML Alliance Christian Social Union Club of German Social Democrats Uniform Bohemian Club Leader since 1910 1 January 1889 1909 Leader's seat Ho...

 

 

Pour les articles homonymes, voir Saint-Léonard. Saint-Léonard La mairie. Blason Administration Pays France Région Hauts-de-France Département Pas-de-Calais Arrondissement Boulogne-sur-Mer Intercommunalité Communauté d'agglomération du Boulonnais Maire Mandat Gwénaëlle Loire 2020-2026 Code postal 62360 Code commune 62755 Démographie Gentilé Saint-Léonardois Populationmunicipale 3 338 hab. (2021 ) Densité 982 hab./km2 Géographie Coordonnées 50° 41′ 2...