LLaMA

LLaMA (Large Language Model Meta AI) est un grand modèle linguistique développé par Meta et rendu publiquement accessible[1]. Deux autres versions du modèle plus spécifiques, optimisées à partir de LLaMA, ont également été publiées par Meta : un agent conversationnel, appelé Llama Chat, et un assistant de programmation, Code Llama. D'autres modèles de langage comme Alpaca ont également vu le jour en entrainant les poids de Llama sur de nouvelles données[2].

Origine du nom

LLaMA est l'acronyme de Large Language Model Meta AI (Grand modèle de Language Meta IA en français). Cet acronyme est l'homographe du nom anglais (lui-même emprunté au quechua, via l'espagnol)[3] du lama, un camélidé sud-américain. Cette ressemblance est probablement souhaitée pour une meilleur mémorabilité.

De ce choix de nom est dérivé celui d'Alpaca, l'agent conversationnel basé sur LLaMA, car l'alpaga (alpaca en anglais) est un autre camélidé d'Amérique du Sud.

Version initiale

La version initiale a été publiée en février 2023, en quatre tailles différentes : 7, 13, 33 et 65 milliards de paramètres. À l'origine, seuls la méthodologie, l'architecture des modèles et les résultats expérimentaux furent publiés. Seuls certains chercheurs qui en ont fait la demande peuvent avoir accès au modèle[4].

Le 3 mars 2023, une semaine après la publication de la méthodologie et de l'architecture, un fichier torrent contenant l'intégralité du modèle est publié sur 4chan[5].

Llama 2

En juillet 2023, Meta publie une deuxième version, en trois tailles différentes cette fois: 7B[6], 13B[7] et 70B[8]. La version en 34B a été entrainé par Meta également mais dû à un manque de temps, ils n'ont pas pu publier ce modèle. L'architecture est sensiblement la même mais l'entrainement a été réalisé à partir d'un corpus environ 40% plus volumineux[9]. Cette-fois, Meta publie elle-même les paramètres dès la sortie du modèle.

Avec la publication de Llama 2, Meta publie Llama 2-Chat, une version de Llama optimisée pour les dialogues[9]. Trois versions du modèle sont disponibles: 7B, 13B et 70B.

Code Llama

Peu de temps après, en août 2023, Meta dévoile Code Llama et ses variations Code Llama Instruct et Code Llama Python[10]. Ces modèles sont basés sur Llama 2 et ajustés finement sur du code. Ils sont d'abord disponibles en open source en version 7B, 13B et 34B, puis le 29 janvier 2024 une version en 70B est également publiée[11].

Llama 3

Le 18 avril 2024, Meta lança Llama 3 en version 8 et 70 milliards de paramètres. Ces modèles furent pré-entraînés sur environ 15 000 trilliards de jetons de texte provenant de « sources disponibles publiquement »[12], les modèles d'instructions étant fine-tunés sur « des ensembles de données d'instructions disponibles publiquement, ainsi que sur plus de 10 millions d'exemples annotés par des humains ». Meta prévoit de sortir des modèles multimodaux, des modèles capables de converser dans plusieurs langues, et des modèles avec des fenêtres de contexte plus larges. Une version de 405 milliards de paramètres est annoncée à la mi-2024[13].

Deux sous-versions de Llama 3 sont ensuite lancées par Meta :

Avec cette dernière génération, Meta introduit deux modèles multimodaux : Llama 3.2 90B et 11B. Le groupe sort aussi deux premiers mini-modèles, 1B et 3B, destinés à être utilisés sur des terminaux légers (ordinateurs portables ordinaires et smartphones).

Poids ouverts plutôt qu'Open source

LLaMA se présente comme un modèle ouvert, mais ni le code d'entrainement ni les données d'entrainement ne le sont, ce qui fait préférer le terme de « poids ouverts »[18],[19]. Le dépôt contient le code source d'inférence et de la documentation (guide de l'utilisateur, guide de l'utilisateur responsable et model card) permettant une bonne utilisation du modèle. Utiliser LLaMA implique d'accepter les termes de la license de LLaMA qui notamment interdit certains cas d'utilisation du modèle[20]. En respectant les termes de la license, il est possible d'utiliser, de reproduire, de distribuer, de copier, de créer des œuvres dérivées et d'apporter des modifications aux différents composants de LLaMA mis à disposition, y compris pour une activité lucrative.

Tout comme tous les autres grands modèles linguistiques actuels (août 2024), il nécessite que ces paramètres (poids) soient stockés dans la mémoire vive, pour s'exécuter à une vitesse raisonnable, ce qui rend les grands modèles souvent inaccessibles pour des ordinateurs personnels. Certains services en ligne proposent de passer par leur serveur pour utiliser LLaMA.

Partenariat avec Reuters

Après l'annonce d'un partenariat entre Meta et Reuters pour l'utilisation des contenus de l'agence dans les chatbots Meta AI, basés sur Llama, il n'était pas clair si ces articles allaient intégrer le corpus de formation de Llama, ou seulement être utilisés comme sources (en direct) pour répondre à des requêtes spécifiques (actualité, politique, économie...)[21].

Notes et références

  1. (en) « Llama », sur Llama (consulté le )
  2. « Alpaca: A Strong, Replicable Instruction-Following Model », sur crfm.stanford.edu (consulté le )
  3. https://www.merriam-webster.com/dictionary/llama
  4. Antoine Messina, « LLaMA, le modèle de langage de Meta, a fuité », sur Siècle Digital, (consulté le )
  5. Mélicia Poitiers, « LLaMA, le dernier modèle d'IA générative de Meta, a été partagé illicitement sur Internet », Usine Digitale,‎ (lire en ligne, consulté le )
  6. « meta-llama/Llama-2-7b · Hugging Face », sur huggingface.co (consulté le )
  7. « meta-llama/Llama-2-13b · Hugging Face », sur huggingface.co (consulté le )
  8. « meta-llama/Llama-2-70b · Hugging Face », sur huggingface.co (consulté le )
  9. a et b Hugo Touvron, Louis Martin, Kevin Stone et Peter Albert, « Llama 2: Open Foundation and Fine-Tuned Chat Models », arXiv,‎ (DOI 10.48550/ARXIV.2307.09288, lire en ligne, consulté le )
  10. (en) « Introducing Code Llama, a state-of-the-art large language model for coding », sur ai.meta.com (consulté le )
  11. « Avec Code Llama 70B, Meta améliore la génération de code - Le Monde Informatique », sur LeMondeInformatique, (consulté le )
  12. (en) « LLaMa3 Model », (consulté le )
  13. (en-US) Armand Ruiz, « Meta releases new Llama 3.1 models, including highly anticipated 405B parameter variant », sur IBM Blog, (consulté le )
  14. « Meta sort Llama 3.1, un modèle d'IA gratuit encore plus puissant que ses concurrents », sur www.lesnumeriques.com, (consulté le )
  15. « Avec Llama 3.1, 405B, Meta dans la cour des LLM XXL - Le Monde Informatique », sur LeMondeInformatique, (consulté le )
  16. Victor Lafosse-Barthès, « Ce qu'il faut savoir sur Llama 3.2 », sur Ariel World, (consulté le )
  17. Célia Séramour, « Llama 3.2 : Meta pousse une mise à niveau majeure avec des versions multimodales et compactes », Usine-digitale.fr,‎ (lire en ligne)
  18. (en) « Meta’s LLaMa 2 license is not Open Source », sur opensource.org
  19. (en) « GitHub - facebookresearch/llama at llama_v1 », sur GitHub (consulté le )
  20. (en) « Download Llama », sur Llama (consulté le )
  21. « Intelligence artificielle: Meta signe un accord avec l’agence de presse Reuters », sur Le Figaro, (consulté le )

Voir aussi

Articles connexes

Liens externes

Read other articles:

Akbar Ali Penjabat Wali Kota PareparePetahanaMulai menjabat 31 Oktober 2023PresidenJoko WidodoGubernurBahtiar Baharuddin (Pj.) PendahuluTaufan PawePenggantiPetahana Informasi pribadiLahir(1975-04-02)2 April 1975 Sidenreng Rappang Sulawesi, IndonesiaKebangsaanIndonesiaPartai politikIndependenProfesiASNSunting kotak info • L • B Dr. Drs. Akbar Ali, A.P., M.Si. (lahir 2 April 1975) adalah seorang birokrat asal Indonesia kelahiran Tanrutedong, Sidenreng Rappang, Sulawesi Selatan...

 

 

Schéma présentant la diversité des espèces benthiques et notamment des organismes bioturbateurs (6) qui ont un impact sur le type et l'intensité du remaniement sédimentaire et de la bioirrigation (en). Les fourmis champignonnistes attistes cultivent un champignon symbiote. Elles transportent des feuilles découpées par leurs ouvrières sur des centaines de mètres. Dans la fourmilière, de minuscules ouvrières, les jardinières, fragmentent les morceaux de feuilles, les imprègne...

 

 

Untuk kata-kata Latin yang cabul atau kasar, lihat kecabulan bahasa Latin. Artikel ini membutuhkan rujukan tambahan agar kualitasnya dapat dipastikan. Mohon bantu kami mengembangkan artikel ini dengan cara menambahkan rujukan ke sumber tepercaya. Pernyataan tak bersumber bisa saja dipertentangkan dan dihapus.Cari sumber: Bahasa Latin Umum – berita · surat kabar · buku · cendekiawan · JSTOR (Oktober 2012) PemberitahuanTemplat ini mendeteksi bahwa artike...

French metaphysician (1886–1951) René Guénon (Abdalwahid Yahia)Portrait from 1925BornRené-Jean-Marie-Joseph Guénon(1886-11-15)15 November 1886Blois, Loir-et-Cher, FranceDied7 January 1951(1951-01-07) (aged 64)Cairo, EgyptEra20th-century philosophyRegionFrench philosophyIslamic philosophyHindu philosophySchoolOrientalism[1]Advaita VedantaSufismNondualismPlatonismTraditionalismMain interestsMetaphysicsSymbologyMythologyEsoterismGnosticismHistoryFreemasonryMathematicsSocial cr...

 

 

Coating that prevents sticking Food in a non-stick pan A non-stick surface is engineered to reduce the ability of other materials to stick to it. Non-stick cookware is a common application, where the non-stick coating allows food to brown without sticking to the pan. Non-stick is often used to refer to surfaces coated with polytetrafluoroethylene (PTFE), a well-known brand of which is Teflon. In the twenty-first century, other coatings have been marketed as non-stick, such as anodized alumini...

 

 

2023 single by TwiceSet Me FreeRemixes artworkSingle by Twicefrom the EP Ready to Be LanguageKoreanReleasedMarch 10, 2023Recorded2022[1]StudioJYP StudiosGenreDisco[2][3]Length3:02Label JYP Republic Composer(s) Melanie Fontana Lindgren Marty Maro Lyricist(s) Star Wars (Galactika) Jvde (Galactika) Producer(s)LindgrenTwice singles chronology Moonlight Sunrise (2023) Set Me Free (2023) Hare Hare (2023) Music videoSet Me Free on YouTube Set Me Free is a song recorded by So...

Lake in Kosovo Badovc LakeBadovc LakeShow map of KosovoBadovc LakeShow map of EuropeCoordinates42°37′24″N 21°14′28″E / 42.6234°N 21.2412°E / 42.6234; 21.2412Primary inflowsGračanka riverCatchment area109 km2 (42 sq mi)Basin countriesKosovoMax. length4.6 km (2.9 mi)Max. width0.8 km (0.50 mi)Surface area1.7 km2 (0.66 sq mi)Max. depth29 m (95 ft)Surface elevation655 m (2,149 ft)Islands...

 

 

NIEA logo The National Indian Education Association (NIEA) is the only national nonprofit exclusive to education issues for American Indian, Alaska Native, and Native Hawaiian people of the United States. History In March 1969, Sparlin Norwood, Cherokee, a teacher at Central Junior High School in Bartlesville, Oklahoma, organized a National Conference of Indian teachers at the Warm Springs Indian Reservation in Oregon, as part of his National Education Association position. In 1969, Rosemary ...

 

 

Cet article est une ébauche concernant le Kentucky. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Pour les articles homonymes, voir Calloway. Comté de CallowayCalloway County Palais de justice du comté de Calloway à Murray Administration Pays États-Unis État Kentucky Chef-lieu Murray Fondation Novembre 1822 Démographie Population 37 191 hab. (2010) Densité 37 hab./km2 Géographie Coordon...

Malaysian badminton player Badminton playerYew Cheng Hoe尤清和Personal informationBorn1943 (age 80–81)Penang, British Malaya[1] Medal record Men's badminton Representing  Malaysia Thomas Cup 1967 Jakarta Men's team Commonwealth Games 1966 Kingston Men's doubles 1966 Kingston Men's singles Asian Games 1966 Bangkok Men's team 1962 Jakarta Men's team Asian Championships 1962 Kuala Lumpur Men's team 1965 Lucknow Men's team 1962 Kuala Lumpur Men's singles Southeast Asian...

 

 

Ne doit pas être confondu avec Crespin. Crispin dans Recueil des modes de la cour de France par Nicolas Bonnart , circa 1678-1693 Crispin est un des plus célèbres personnages de théâtre des XVIIe et XVIIIe siècles. Personnage de l’ancienne comédie italienne apparu pour la première fois dans la pièce de Paul Scarron L’Écolier de Salamanque, Crispin, qui n’a rien de commun avec le poète ridicule de la satire latine, est de la famille de Scaramouche et il a dans le...

 

 

Israeli generalAvigdor Ben-GalNative nameאביגדור בן-גלBirth nameJanusz Ludwig GoldlustNickname(s)YanushBorn1936Łódź, Second Polish RepublicDiedFebruary 13, 2016IsraelAllegiance IsraelService/branch Israel Defense ForcesYears of service1956-1979Rank Aluf (Major General)Commands heldNorthern CommandBattles/wars1956 Suez CrisisSix-Day WarYom Kippur War Avigdor Yanush Ben-Gal (Hebrew: אביגדור בן-גל; 1936 – February 13, 2016; born Janusz Goldlust) was an Israel...

Temporary stadium in Deodoro, Rio de Janeiro, Brazil Deodoro StadiumAerial view of Deodoro StadiumLocationDeodoro Modern Pentathlon Park, Rio de Janeiro, Brazil Deodoro Stadium is a temporary stadium at Deodoro Modern Pentathlon Park in Rio de Janeiro, Brazil. The stadium hosted rugby sevens and modern pentathlon events during the 2016 Summer Olympics. The stadium served as the venue for the seven-a-side football at the 2016 Summer Paralympics.[1] The Deodoro Modern Pentathlon Park ho...

 

 

Campaign pledge by Barack Obama Sunlight before signing is an open government campaign pledge made during the Barack Obama 2008 presidential campaign to make non-emergency bills freely available online for a five-day public comment period prior to signing. The campaign promise is a reference to a quote by Supreme Court Justice Louis Brandeis that Sunlight is said to be the best of disinfectants.[1] The well-received initiative initially faced technical hurdles in its implementation an...

 

 

1961 Belgrade summit conference You can help expand this article with text translated from the corresponding article in Serbian. (May 2021) Click [show] for important translation instructions. View a machine-translated version of the Serbian article. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accurate, rather than simply copy-pasting machine-translate...

Sociological and legal term for disregard of race Part of a series onDiscrimination Forms Institutional Structural Statistical Taste-based Attributes Age Caste Class Dialect Disability Genetic Hair texture Height Language Looks Mental disorder Race / Ethnicity Skin color Scientific racism Rank Sex Sexual orientation Species Size Viewpoint Social Arophobia Acephobia Adultism Anti-albinism Anti-autism Anti-homelessness Anti-drug addicts Anti-intellectualism Anti-intersex Anti-left hand...

 

 

Upper house of the Myanmar legislature House of Nationalities အမျိုးသားလွှတ်တော်Amyotha HluttawTypeTypeUpper house of the Pyidaungsu Hluttaw Term limits5 years; can serve for three consecutive years upon reelectionHistoryFounded31 January 2011 (2011-01-31)Preceded byPeople's Assembly (1974–1988)LeadershipSpeakerVacant since 31 January 2021 Deputy SpeakerVacant since 31 January 2021 Seats224 MPsElectionsLast Amyotha Hluttaw election8 No...

 

 

Classe KiloProgetto 877 PaltusUn Classe Kilo in navigazione, 1987Descrizione generale TipoSSK Proprietà Voenno-morskoj flot Cantiere/ Amur Shipbuilding / Admiralty Shipyard / Sevmash Impostazione16 marzo 1980 Varo12 settembre 1980 Entrata in servizio31 dicembre 1980 Caratteristiche generaliDislocamentoin immersione: 3025 t Stazza lorda2325 tsl Lunghezza72,6 m Larghezza9,9 m Altezza6,6 m Profondità operativa250 m PropulsioneDiesel-Elettrica Velocitàin immersione:...

مستر أولمبيا 1967 شعار مستر أولمبياشعار مستر أولمبيا معلومات عامة فترة الانعقاد 27 - 29 سبتمبر 1967 مكان الانعقاد نيويورك،  الولايات المتحدة المنظم الاتحاد الدولي لكمال الأجسام واللياقة البدنية (IFBB) المنطقة  العالم ترتيب النسخة 3 الموقع الرسمي الموقع الرسمي لمحترفي اتحاد I...

 

 

Allyson FelixAllyson Felix nel 2016Nazionalità Stati Uniti Altezza168 cm Peso55 kg Atletica leggera SpecialitàVelocità Record 60 m 710 (indoor - 2012) 100 m 1089 (2012) 200 m 2169 (2012) 200 m 2259 (indoor - 2021) 400 m 4926 (2015) 400 m 5137 (indoor - 2010) 4×100 m 4082 (2012) 4×400 m 3'1685 (2021) 4×400 m mista 3'0934 (2019) CarrieraNazionale 2003- Stati Uniti Palmarès Competizione Ori Argenti Bronzi Giochi olimpici 7 3 1 Mondiali 14 3 3 Mondiali indoor 1 0 0 World Relays 0 1 0 ...