Referentni genom (također poznat kao referentni sklop), eng. skr. GRCh38, je digitalna baza podataka sekvenci nukleinskih kiselina, koju su naučnici sastavili kao reprezentativan primjer skupa gena u jednom idealiziranom individualnom organizmu date vrste. Budući da su sastavljeni od sekvenciranja DNK od brojnih pojedinačnih donora, referentni genom ne predstavljaju tačan skup gena bilo kojeg pojedinačnog organizma. Umjesto toga, referenca pruža haploidni mozaik različitih sekvenci DNK svakog donora. Postoje referentni genomi za više vrsta virusa, bakterija, gljiva, biljki i životinja.
Naprimjer, ljudski referentni genom, GRCh38, iz Genome Reference Consortium izveden je od trinaest anonimnih volontera.[1]
Kako cijena sekvenciranja DNK pada, a pojavljuju se nove tehnologije sekvenciranja potpunog genoma, nastavlja se generirati više sekvenci genoma. Referentni genomi se obično koriste kao vodič na osnovu kojeg se grade novi genomi, što im omogućava da se sastave mnogo brže i jeftinije od početnog Projekta ljudskog genoma. Većina osoba sa celim sekvenciranim genomom, kao što je James D. Watson, imala je svoj genom sastavljen na ovaj način.[2][3] Za veći dio genoma, referenca pruža dobru aproksimaciju DNK bilo kojeg pojedinca. Ali u regijama sa velikom alelnom raznolikošću, kao što je glavni kompleks histokompatibilnosti kod ljudi i glavni urinarni proteinimiševa, referentni genom može se značajno razlikovati od drugih jedinki.[4][5][6] Poređenje između referentnog (build 36) i Watsonovog genoma otkrilo je razlike u 3,3 miliona jednonukleotidnih polimorfizama, dok se oko 1,4 posto njegove DNK uopće nije moglo uporediti s referentnim genomom.[2][7] Za regije za koje je poznato da postoje velike varijacije, uz referentni lokus sklapaju se i skupovi alternativnih lokusa.
Referentnim genomima može se pristupiti onlajn na nekoliko lokacija, koristeći namenske pretraživače kao što su Ensembl ili UCSC Genome Browser.[8]
Svojstva referentnih genoma
Mjere dužine
Dužina genoma može se mjeriti na više različitih načina.
Jednostavan način mjerenja dužine genoma je prebrojavanje broja parova baza u sklopu.[9]
Zlatni put je alternativna mjera dužine koja izostavlja suvišne regije kao što su haplotipovi i pseudoautosomne regije.[10][11] Obično se konstruira unošenjem informacija sekvenciranja slojeva preko fizičke mape, kako bi se kombinirale informacije o skeli. To je 'najbolja procjena' kako će genom izgledati i obično uključuje praznine, što ga čini dužim od tipskog sklopa baznog para.[12]
Ljudski referentni genom GRCh38 objavljen je iz Konzorcija referentnog genoma 17. decembra 2013..[13] Ova verzija je sadržavala oko 250 praznina, dok je prva imala otprilike 150.000 praznina.[1] GRCh38 sklop je zatvorio ili smanjio više od 100 praznina. Nanoporno sekvenciranje je donijelo zatvaranje 12 praznina u referentnom sklopu GRCh38, korištenjem ultra dugih očitavanja.[14]
Ljudski referentni genom izveden je od trinaest anonimnih dobrovoljaca iz Buffalo, New York. Donatori su regrutovani putem oglasa u The Buffalo News, u nedjelju, 23. marta 1997. Prvih deset volontera i deset volonterki pozvani su da zakažu sastanak sa genetičkim savjetnicima i donirati krv iz koje je izvučena DNK. Kao rezultat obrade uzoraka DNK, oko 80 % referentnog genoma dolazi od osam ljudi, a jedan muškarac, označen kao RP11, čini 66 posto od ukupnog broja. ABO sistem krvnih grupa razlikuje se među ljudima, ali ljudski referentni genom sadrži samo O alel, iako su ostali označeni).[1][7][15][16][17]
Ljudski referentni genom ima ograničenja zbog činjenice da se radi o "jednoj" različitoj sekvenci. Zbog toga je posebno nazvan kao "referenca". Glavna svrha kojoj je stavljen je kao indeks, ili lokator, za genetike karakteristike. Projekat 1000 genoma kreira bazu podataka koja će pružiti informacije o varijacijama u genomima u ljudskim populacijama.[18]
^Hurst J, Beynon RJ, Roberts SC, Wyatt TD (oktobar 2007). Urinary Lipocalins in Rodenta:is there a Generic Model?. Chemical Signals in Vertebrates 11. Springer New York. ISBN978-0-387-73944-1.