Pachetele din R sunt extensii ale limbajului de programare statistică R. Acestea conțin cod, date și documentație într-un format standardizat care poate fi instalat de utilizatorii R, de obicei printr-un depozit de software centralizat, cum ar fi CRAN (Comprensive R Archive Network).[1][2] Numărul mare de pachete disponibile pentru R și ușurința instalării și utilizării acestora au fost citate ca un factor major care conduce la adoptarea pe scară largă a limbajului în știința datelor.[3][4][5][6]
În comparație cu bibliotecile din alt limbaj de programare, pachetele din R trebuie să respecte o specificație relativ strictă.[3] Manualul Writing R Extensions[7] specifică o structură de registre standardizată pentru codul sursă, date, documentație și metadatele pachetelor din R, astfel ele pot fi instalate și încărcate folosind instrumentele de gestionare a pachetelor încorporate în R.[3] Pachetele distribuite pe CRAN trebuie să îndeplinească standarde suplimentare.[3][8] Potrivit lui John Chambers(d), în timp ce aceste cerințe „impun cerințe considerabile” dezvoltatorilor de pachete, ele îmbunătățesc capacitatea de utilizare și stabilitatea pe termen lung a pachetelor pentru utilizatorii finali.[3]
Pagina „Vizualizări de sarcini” (lista de subiecte) de pe site-ul web CRAN[16] enumeră o gamă largă de sarcini (în domenii precum finanțe, genetică, calcul de înaltă performanță, învățare automată, imagistica medicală, meta-analiză, științe sociale și statistici spațiale) pentru care sunt disponibile pachete în R. O altă modalitate de a răsfoi pachetele CRAN este oferită de Metacran,[17] care menține, de asemenea, liste cu pachetele prezentate, cele mai descărcate, în tendințe sau cele mai dependente de alte pachete.
Numărul de pachete CRAN a crescut exponențial în ultimii ani.[18] Deoarece fiecare depunere este revizuită manual de o echipă mică de menținători CRAN, mulți dintre care, potrivit dezvoltatorului principal R, Peter Dalgaard(d), „se apropie de vârsta de pensionare”, există îngrijorarea că acest sistem nu este sustenabil pe termen lung.[6] Creșterea CRAN a expus limitări ale infrastructurii sale de gestionare a dependențelor, în special faptul că presupune că dependențele se raportează întotdeauna la cea mai recentă versiune a unui pachet, ceea ce înseamnă că noile versiuni ale pachetelor CRAN trebuie să fie întotdeauna compatibile cu versiunea inversă[19] și că pachetele CRAN nu pot avea dependențe care nu sunt pe CRAN.[20] De asemenea, a dus la îngrijorări cu privire la scăderea calității pachetelor.[21]
MRAN și Manager de pachete Posit
Microsoft R Application Network (MRAN) este un omolog CRAN întreținut de Microsoft, care se bazează pe distribuția în aval(d) a companiei a R, Microsoft R Open(d) (în trecut, Revolution R Open).[22] Include, de asemenea, o arhivă de instantanee(d) CRAN zilnice, denumită „CRAN Time Machine (CRAN Mașina timpului)”, care permite utilizatorilor MRAN să ocolească limitările de versiuni ale dependențelor CRAN prin instalarea unui set fix de versiuni de pachete din R prin punctul de control al pachetului.[23][24] În ianuarie 2023, Microsoft a anunțat că MRAN este retras și site-urile și depozitele asociate au devenit indisponibile în iulie 2023.[25]
Managerul de pachete Posit (în trecut, RStudio Package Manager) este un instrument similar produs de dezvoltatorii RStudio(d) care, pe lângă instantaneele(d) CRAN, include o arhivă de pachete R din Bioconductor și pachete Python din Indexul pachetelor Python.[26] De asemenea, distribuie pachete executabileprecompilate pentru Linux (numai executabilele Windows și macOS sunt incluse pe CRAN).[27]
De exemplu pachetul BiocManager este un instrument convenabil pentru a instala și actualiza pachetele Bioconductor.
R-Forge,[29] este o platformă centrală pentru dezvoltarea colaborativă a pachetelor pentru R, a software-ului legat de R și a proiectelor. R-Forge găzduiește, de asemenea, multe pachete beta nepublicate și versiuni de dezvoltare ale pachetelor CRAN.
Pachete de bază și recomandate
R este distribuit cu cincisprezece „pachete de bază”: base, compiler, datasets, grDevices, graphics, grid, methods, parallel, splines, stats, stats4, tcltk, tools, translations și utils.[30]
În plus, există cincisprezece „pachete recomandate” de CRAN care sunt incluse cu distribuțiile binare ale lui R: KernSmooth, MASS, Matrix, boot, class, cluster, codetools, foreign, lattice, mgcv, nlme, nnet, rpart, spatial și survival.[30]
Alte pachete
Un grup de pachete numit Tidyverse(d), care poate fi considerat un „dialect al limbii R”, este din ce în ce mai popular în ecosistemul R. Grupul de pachete se străduiește să ofere o colecție coerentă de funcții pentru a face față sarcinilor comune ale științei datelor, inclusiv importarea, curățarea, transformarea și vizualizarea datelor (în special cu pachetul Ggplot2(d) ).
ape - analize filogenetice și evolutive
ade4 - analiza multivariată a datelor și afișare grafică
adegenet - explorarea datelor genetice și genomice
Geneland - simularee stocastică și inferența MCMC a structurii din datele genetice
kdetrees - metoda non-parametrică de identificare a potențialelor observații periferice în o colecție de arbori filogenetici
phangorn - analize filogenetice
phyloch -interfețe și instrumente grafice pentru date filogenetice
ggtree - vizualizarea și adnotarea arborilor filogenetici
Note
^Hornik, Kurt (). „Frequently Asked Questions on R”. The Comprehensive R Archive Network. 7.29: What is the difference between package and library?. Arhivat din original la . Accesat în .
^Wickham, Hadley; Bryan, Jennifer. „Introduction”. R Packages (ed. 2nd). Arhivat din original la . Accesat în .
^ abHornik, Kurt (). „Frequently Asked Questions on R”. The Comprehensive R Archive Network. 5.1: Which add-on packages exist for R?. Arhivat din original la . Accesat în .