LoRA

LoRA (siglas de "adaptación de baixo rango", do inglés, Low-Rank Adaptation) é un método de axuste fino que conxela os pesos do modelo preadestrado e no seu lugar adestra pesos novos de dúas matrices con rango menor, reducindo considerablemente o número de parámetros a adestrar. Xeralmente, aplícase LoRA nas diferentes capas de atención dos transformadores, conxelando os pesos de cada capa, e substituíndoos pola súa correspondente descomposición nas dúas matrices de menos rango. Foi introducido no 2021, por investigadores de Microsoft, no artigo LoRA: Low-Rank Adaptation of Large Language-Models (LoRA: adaptación de baixo rango de grandes modelos de linguaxe), onde destacan os baixos tempos de execución e o bo funcionamento do modelo pese ao seu número reducido de parámetros.[1]

Arquitectura de LoRA
Funcionamento de LoRA. Adéstranse as matrices A e B, mentres que os pesos W quedan fixos. Arquitectura presentada no artigo orixinal.[1]

Arquitectura

LoRA é un método que se pode aplicar a calquera matriz dunha rede neural, aínda que deseñouse para incluírse nas capas de atención dos transformadores.[2] Dada unha matriz da rede, de dimensión , cos seus correspondentes pesos, , descomponse esta matriz en dúas de rango menor, e , , tales que .[3] Tense a igualdade se é igual ao rango da matriz ; se é menor, obtense unha aproximación de baixo rango.[4] Polo tanto, se o modelo orixinal era , o modelo aplicando LoRA será .[1]

En canto á inicialización destas novas matrices, a matriz inicialízase seguindo unha distribución normal de media cero, mentres que na matriz tódolos seus elementos comezan inicializados a cero.[1]

Vantaxes

Este método posúe moitas vantaxes con respecto a facer un axuste fino sobre o modelo orixinal.

  • O adestramento reduce o considerablemente uso do hardware, pois ao usar optimizadores específicos para o adaptador LoRA (matrices e ), e seren estes poucos parámetros a adestrar, non hai que gardar en memoria tantos datos, alén de non ter que facer tantas operacións.[1]
  • O tempo de adestramento é moito menor que adestrar só o modelo base, pois o número de parámetros, e por tanto, o número de operacións, para o axuste fino é considerablemente menor ao do modelo inicial.[1]
  • O desempeño dos modelos que se adestran con LoRA é semellante a facer axuste fino completo do modelo, sen usar este adaptador.[2]
  • O deseño permite fusionar as matrices que se adestran co modelo sen introducir latencia na inferencia.[1] Pola contra, se se carga o modelo e os pesos de LoRA por separado, esta latencia si que se pode atopar.[2]
  • Pódese fusionar con outros métodos de axuste fino, como o axuste por prefixo.[1]
  • Pódese utilizar un mesmo modelo preadestrado e utilizar distintos adaptadores LoRA para adestralo para diferentes tarefas, sen máis que cambiar as matrices e no proceso de axuste fino.[1]

Diferentes adaptadores

Unha das vantaxes comentadas é que se se queren crear varios modelos que resolvan diferentes problemas, pero que todos teñen algo en común, pódese partir dun modelo preadestrado, e utilizar distintos adaptadores LoRA. É dicir, o modelo preadestrado aprendeu unhas cousas e LoRA amplifica as características importantes para as tarefas específicas. Por tanto, con isto gáñase tempo de execución ao non ter que adestrar moitos modelos diferentes e poder partir sempre do mesmo modelo base só adestrando uns poucos parámetros.[1]

O cambio de adaptador LoRA conséguese sen máis que cambiando as matrices e no proceso de axuste fino. Estes adaptadores pódense gardar e cargar para utilizalos no momento que fagan falta, incluso poden mesturarse entre eles para sacar o maior proveito en determinados problemas, chegando a un compromiso entre tempo de adestramento e eficiencia na resolución do problema.[1]

Un exemplo de cando resulta útil utilizar varios adaptadores pode ser cando temos un modelo base que está adestrado para recoñecer a lingua inglesa. Ese sería o modelo preadestrado. A continuación, queremos adestralo para que saiba recoñecer francés e alemán. En vez de facer o procedemento normal de facerlle axuste fino ao modelo completo, creamos un adaptador LoRA para o francés e outro para o alemán. Deste xeito, no proceso de axuste fino, adéstranse os pesos dos diferentes adaptadores LoRA, e o modelo recoñecerá francés e alemán, sen que isto inflúa negativamente en como recoñecía o inglés (quitando os adaptadores tense o modelo inicial que recoñece só inglés, sen influencias do francés ou alemán).[5]

Rango óptimo

Un hiperparámetro a seleccionar cando se fai un axuste fino con LoRA é o rango das matrices. Para tarefas de procesamento de texto, un rango de 8 é adecuado, aínda que dependendo do problema a resolver, pódese probar con diferentes valores que se poidan axustar mellor, tales como 2, 4 ou 64.[1]

Nos problemas de visión por computador, estes rangos tamén poden ser axeitados, aínda que cumpre estudalo especificamente para o problema a resolver, xa que os experimentos que fixeron os seus creadores foron sobre o procesamento da linguaxe natural.[1]

Normalmente, é beneficioso aumentar o rango canto máis difire o que hai que aprender do que xa sabe o modelo preadestrado, pois o número de parámetros aumenta, dándolle máis flexibilidade ao modelo.[6]

Parámetro alfa

O modelo LoRA explicado ata agora é o modelo máis utilizado e simple. No modelo ampliado, a saída da multiplicación das matrices e reescálase polo termo , sendo alfa un número real que funciona como taxa de aprendizaxe. É dicir, o modelo resulta en .[7]

No modelo visto ata agora, utilizábase , polo que os pesos adestrados no axuste fino non se escalaban. Un valor de alfa maior que o rango indica que se lle quere dar máis importancia aos pesos adestrados de LoRA, pois o valor que obteñamos do axuste fino agrándase, ao estar multiplicado por un número maior que 1. Un valor de alfa menor que o rango daríalle máis importancia aos pesos do modelo base. En xeral, aconséllase tomar , aínda que dependendo do problema a resolver, cómpre probar diferentes valores deste hiperparámetro para ver cal é o máis axeitado á nosa casuística.[6]

Notas

  1. 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 Hu, Edward; Shen, Yelong; Wallis, Phillip; Allen-Zhu, Zeyuan; Li, Yuanzhi; Wang, Shean; Wang, Lu; Chen, Weizhu (16 de outubro do 2021). "LoRA: Low-Rank Adaptation of Large Language Models". arXiv (en inglés). arXiv:2106.09685. 
  2. 2,0 2,1 2,2 "LoRA". huggingface.co (en inglés). Consultado o 2024-08-27. 
  3. Hu, Edward (09-01-2024). "What is Low-Rank Adaptation (LoRA), explained by the inventor" (en inglés). Consultado o 27-08-2024. 
  4. Stansbury, Dustin (16-08-2020). "SVD and Data Compression Using Low-rank Matrix Approximation". The Clever Machine (en inglés). Consultado o 27-08-2024. 
  5. "LoRA". huggingface.co (en inglés). Consultado o 28-08-2024. 
  6. 6,0 6,1 "What rank (r) and alpha to use in LoRA in LLM fine-tuning?". Medium (en inglés). 7 de novembro do 2023. Consultado o 28-08-2024. 
  7. "LoRA: Low-Rank Adaptation from Scratch — Code and Theory". Medium (en inglés). 3 de agosto do 2023. Consultado o 28-08-2024. 

Véxase tamén

Outros artigos

Read other articles:

Perdana Menteri ZanzibarBekas jabatan politikBendera NegaraPenggantiTidak adaPejabat pertamaSheikh Muhammad Shamte HamadiPejabat terakhirShamsi Vuai NahodhaPelantikSultan (1961–1964)Presiden (1964–2010)Jabatan dimulai5 Juni 1961Jabatan berakhir9 November 2010 Berikut merupakan daftar Perdana Menteri Zanzibar. Menteri Kepala Nama Mulai Menjabat Akhir Jabatan Partai Geoffrey Charles Lawrence (pejabat) 23 Februari 1961 5 Juni 1961 non-partai Sheikh Muhammad Shamte Hamadi 5 Juni 1961 24 Juni ...

 

 

Town in Rakhine State, MyanmarBusidaung ဘူးသီးတောင်မြို့TownButhidaungButhidaung in 2016BusidaungLocation in Myanmar (Burma)Coordinates: 20°52′08″N 92°31′41″E / 20.8690°N 92.528°E / 20.8690; 92.528Country MyanmarDivision Rakhine State(Arakan)DistrictMaungdaw DistrictTownshipButhidaung TownshipPopulation (2021) • Total55,545[1] • Ethnicities93% Rohingya6% Rakhine<1% Others ...

 

 

Kejuaraan DuniaFormula Satu FIA 2007 Juara Dunia Pembalap: Kimi Räikkönen Juara Dunia Konstruktor: Ferrari Sebelum: 2006 Sesudah: 2008 Balapan menurut negaraBalapan menurut musimSeri pendukung: Seri GP2Piala Super Porsche Kimi Räikkönen, pemenang F1 Musim 2007. Lewis Hamilton, runner-up dengan 109 poin. Hamilton mencatatkan sembilan podium secara berturut-turut di musim debutnya, lebih banyak dari rookie yang lain di dalam sejarah ajang Formula Satu. Fernando Alonso, Juara Dunia ganda be...

كأس ملك إسبانيا 1907   تفاصيل الموسم كأس ملك إسبانيا  النسخة 5  البلد إسبانيا  التاريخ بداية:24 مارس 1907  البطل ريال مدريد  مباريات ملعوبة 11   عدد المشاركين 5   أهداف مسجلة 38   كأس ملك إسبانيا 1906  كأس ملك إسبانيا 1908  تعديل مصدري - تعديل   كأس ملك إسبانيا...

 

 

اضغط هنا للاطلاع على كيفية قراءة التصنيف قبيلة القلاموساوية المرتبة التصنيفية قبيلة  التصنيف العلمي النطاق: حقيقيات النوى المملكة: نباتات الفرقة العليا: نباتات الأرض القسم: نباتات وعائية الشعبة: حقيقيات الأوراق الشعيبة: بذريات العمارة: كاسيات البذور الطائفة: أحاديات ا...

 

 

Angelo Raffaele Nolè Nazionalità  Italia Altezza 177 cm Peso 70 kg Calcio Ruolo Attaccante, centrocampista Squadra  FC Francavilla Carriera Giovanili 1994-2001 Potenza Squadre di club1 2000-2007 Potenza162 (42)[1]2007-2008 Messina7 (0)2008-2009 Potenza28 (4)2009-2010 Rimini23 (8)[2]2010-2014 Ternana98 (20)[3]2014-2015 Bassano Virtus31 (10)[4]2015-2017 Reggiana41 (7)2017 Modena16 (3)2017-2018 Racing ...

Camponarayacomune Camponaraya – Veduta LocalizzazioneStato Spagna Comunità autonoma Castiglia e León Provincia León TerritorioCoordinate42°34′59.88″N 6°40′00.12″W / 42.5833°N 6.6667°W42.5833; -6.6667 (Camponaraya)Coordinate: 42°34′59.88″N 6°40′00.12″W / 42.5833°N 6.6667°W42.5833; -6.6667 (Camponaraya) Altitudine490 m s.l.m. Superficie29 km² Abitanti3 333 (2001) Densità114,93 ab./km² Altre inf...

 

 

Questa voce sull'argomento calciatori brasiliani è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Henan Nazionalità  Brasile Altezza 182 cm Peso 73 kg Calcio Ruolo Attaccante Squadra  Vitória-ES Carriera Squadre di club1 2005 União Barbarense? (?)2006-2008 Lugano? (?)2008 Bragantino? (?)2009 Hortolândia? (?)2010 Red Bull Brasil? (?)2011→  Atlético Paranaens...

 

 

Demographics of VenezuelaPopulation pyramid of Venezuela in 2020Population29,789,730 (2022 est.)Growth rate2.43% (2022 est.)Birth rate15.6 births/1,000 population (2022 est.)Death rate8.1 deaths/1,000 population (2022 est.)Life expectancy73.29 years • male70.12 years • female76.62 yearsFertility rate2.22 childrenInfant mortality rate17.72 deaths/1,000 live birthsNet migration rate13.88 migrant(s)/1,000 populationAge structure0–14 years25.73%15–64 years67.00%6...

Jurang Babi Yar di Kiev. Babi Yar (bahasa Rusia: Бабий Яр; Ukraina: Бабин Яр, Babyn Yar) adalah sebuah jurang di Kiev ibu kota Ukraina dan situs dari serangkaian pembantaian yang dilakukan oleh Nazi selama kampanye mereka terhadap Uni Soviet. Yang paling terkenal dan terbaik didokumentasikan dari pembantaian ini berlangsung pada 29-30 September 1941, di mana 33.771 orang Yahudi tewas dalam satu operasi. Keputusan untuk membunuh semua orang Yahudi di Kiev dibuat oleh gube...

 

 

Ne doit pas être confondu avec Banque Rothschild ou Rothschild & Cie. Groupe Edmond de Rothschild Création 1953 Dates clés 2010 : la Compagnie Financière Edmond de Rothschild devient le Groupe Edmond de Rothschild Fondateurs Edmond de Rothschild Personnages clés Ariane de Rothschild Forme juridique Société par actions Siège social Genève Suisse Direction Ariane de Rothschild (CEO)Cynthia Tobiano (vice-CEO) Activité Banque privéeGestion d'actifsImmobilierCapital-inves...

 

 

Danau Dendam Tak SudahDanau Dendam Tak Sudah pagi hari.Koordinat3°48′11″S 102°18′33″E / 3.802972°S 102.309222°E / -3.802972; 102.309222Koordinat: 3°48′11″S 102°18′33″E / 3.802972°S 102.309222°E / -3.802972; 102.309222Terletak di negaraIndonesiaArea permukaan67 hektareKepulauanSumatraPermukimanKota Bengkulu, BengkuluLihat peta yang diperkecilLihat peta yang diperbesar Danau Dendam Tak Sudah adalah sebuah danau yang terleta...

Deaf sign language of Mexico Albarradas Sign LanguageNative toMexicoRegionOaxacaNative speakerssome members of a community of 1,000Language familyvillage sign languageLanguage codesISO 639-3lscGlottologalba1273 Albarradas Sign Language is an indigenous village sign language of Mexico.[1] It arose approximately 150 years ago in the Zapotec villages of Santa Catarina Albarradas, San Antonio Albarradas and possibly one other nearby town, due to a high incidence of congenital deafnes...

 

 

C-1 Skimmer Role two/three-seat amphibianType of aircraft Manufacturer Colonial Aircraft Corporation Designer David Thurston First flight 1948 Primary user private owner pilots Number built 43 Variants Lake Buccaneer The Colonial Model C-1 Skimmer was an American small single-engined amphibian flying boat built by the Colonial Aircraft Corporation. It was the start of a line of very similar aircraft designed by David Thurston. Design and development In 1946 David Thurston established th...

 

 

Statuary in Washington D.C., United States United States historic placeAmerican Revolution StatuaryU.S. National Register of Historic PlacesD.C. Inventory of Historic Sites John Paul Jones MemorialLocationWashington, D.C.NRHP reference No.78000256[1]Significant datesAdded to NRHPJuly 14, 1978Designated DCIHSMarch 3, 1979 American Revolution Statuary is a group of fourteen statues in Washington, D.C., which honor men whose actions assisted the Thirteen Colonies in their ...

Title for a district governor in Turkey, Northern Cyprus, Lebanon and the Ottoman Empire Binbashi Ismet Pasha, who later became a Kaymakam, after returning from Yemen. Military ranks of the Ottoman Empire Officers Müşir Birindji ferik (Serdar) Ferik Mirliva Miralay Kaymakam Binbaşı Kol Aghassi Non-commissioned officers Çavuş vte Kaymakam, also known by many other romanizations, was a title used by various officials of the Ottoman Empire, including acting grand viziers, governors of prov...

 

 

New Zealand field hockey player Stacey Michelsen Michelsen (in black) and Naomi van AsPersonal informationBorn (1991-02-18) 18 February 1991 (age 33)Whangarei, New ZealandHeight 1.73 m (5 ft 8 in)Weight 66 kg (146 lb)Playing position MidfielderClub informationCurrent club NorthlandSenior careerYears Team2004– NorthlandNational teamYears Team Apps (Gls)2009–2021 New Zealand 254 (15) Medal record Representing  New Zealand Women's field hockey Commonwealth ...

 

 

里奥杜坎普Rio do Campo市镇里奥杜坎普在巴西的位置坐标:26°56′56″S 50°08′27″W / 26.9489°S 50.1408°W / -26.9489; -50.1408国家巴西州圣卡塔琳娜州面积 • 总计496.91 平方公里(191.86 平方英里)海拔570 公尺(1,870 英尺)人口(2007) • 總計6,043人 • 密度12.2人/平方公里(31.5人/平方英里) 里奥杜坎普(葡萄牙语:Rio do Campo)是...

Questa voce sull'argomento registi francesi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Roland Joffé Roland Joffé (Londra, 17 novembre 1945) è un regista inglese. Indice 1 Biografia 1.1 Origini 1.2 Carriera 2 Vita privata 3 Filmografia 3.1 Regista 3.1.1 Cinema 3.1.2 Televisione 3.2 Produttore 3.3 Sceneggiatore 4 Premi e riconoscimenti 4.1 Premio Oscar 4.1.1 Candidatura al miglior regista 4.2 Golden Globe 4.3 Festival di Cannes 4.4 British Acade...

 

 

State of Mexico This article is about the Mexican state. For its capital, see Colima (city). For other uses, see Colima (disambiguation). State in MexicoColima Cōlīma (Nahuatl)StateFree and Sovereign State of ColimaEstado Libre y Soberano de Colima (Spanish)Tlahtohcayotl Cōlīma (Nahuatl)View of a volcano from Comala Coat of armsMotto(s): El temple del brazo es vigor en la tierra(The spirit of the arm is force on earth)State of Colima within MexicoCoordinates (top): 19°06′N 103...