Dugolančane nekodirajuće RNK (duge ncRNK, lncRNK) su tip RNK, definiran kao transkripti s dužinama većim od 200 nukleotida, koje se ne prevode u protein.[2] Ova, donekle proizvoljna, granica razlikuje duge ncRNA od kratkolančanih nekodirajućih RNK kao što su mikroRNK (miRNK), muška interferirajuća RNK (siRNAs), Piwi-interaktivna RNK (piRNK), muška jedarna RNK (snoRNK) i druge kratkomolekulske RNK.[3]
Duge intervenirajuće /intergenskee nekodirajuće RNK (lincRNK) su sekvence lncRNA koje se ne preklapaju s genima koji kodiraju proteine.[4]
Rasprostranjenje
Jedna studija iz 2007. otkrila je da je samo petina transkripcija u ljudskom genomu povezana sa genima koji kodiraju proteine,[5] što ukazuje na najmanje četiri puta duže nekodirajuće od kodirajućih sekvenci RNK. Međutim, veliki projekti sekvenciranja komplementarne DNK (cDNK), kao što je FANTOM (Functional Annoation of Mammalian cDNA) otkrivaju složenost ove transkripcije.[6] Projekt FANTOM3 identificirao je ~ 35.000 nekodirajućih transkripata sa ~10.000 različitih lokusa koji nose mnoge prepise iRNK, uključujući 5 'zatvaranje, preradu i poli-adenilaciju, ali imaju malo ili nimalo otvorenih okvira čitanja (ORF).[6] Iako se bogatstvo dugolančanih ncRNK nije očekivalo, ovaj broj predstavlja konzervativnu, nižu procjenu, jer je izostavio mnoštvo pojedinačnih transkripata i nepoliadeniliranih transkripata (popločavanje niza pokazujući da je više od 40% nepoliadeniliranih transkripata).[7] Međutim, jednoznačno prepoznavanje ncRNK unutar ovih cDNK biblioteka predstavlja izazov, jer može biti teško razlikovati transkripte koji kodiraju proteine od nekodirajućih transkripata. U više studija sugerirano je da sjemenici,[8] i nervna tkiva imajuju najveću količinu dugih nekodirajućih RNK bilo kojeg tipa tkiva.[9] Korištenjem FANTOM5 identificirano je 27.919 ncRNK u različitim ljudskim izvorima.[10]
Kvantitativno, lncRNA imaju ~10 puta nižu zastupljenost od iRNK u populaciji ćelija,[11][12] što se objašnjava većom varijacijom nivoa ekspresije nivoa lncRNK gena u pojedinačnim ćelijama u odnosu na gene koji kodiraju proteine.[13] In general, the majority (~78%) of lncRNAs are characterized as tissue-specific, as opposed to only ~19% of mRNAs.[11] Pored veće specifičnosti tkiva, lncRNK karakteriše i veća specifičnost u razvojnom stadiju,[14] i specifičnost ćelijskog podtipa u heterogenim tkivima, poput ljudskog neokorteksa.[15] U 2018., sveobuhvatna integracija lncRNK iz postojećih baza podataka, objavljene literature i novih sklopova RNK na osnovu analize podataka RNK-seq, otkrila je da kod ljudi ima 270.044 transkripta lncRNA.[16]
U poređenju sa sisarima, relativno malo studija fokusiralo se na prevalenciju lncRNK u biljkama. Međutim, opsežna studija koja je uzela u obzir 37 viših biljnih vrsta i šest algi identificirala je ~200 000 nekodirajućih transkripata, koristeći pristup "in-silico",[17] koja je također uspostavila povezanu bazu podataka zelenog nekodiranja (GreeNC), spremište biljnih lncRNK.
Funkcije
Sekvenciranje širokog opsega biblioteka cDNK i nedavno transkriptomskosekvenciranje sledeće generacije ukazuju na to da kod sisara dugih nekodirajućik RNK ima desetak hiljada. Međutim, uprkos prikupljanju dokaza koji sugeriraju da će većina njih vjerovatno biti funkcionalna,[18][19] dokazano je da je samo relativno mali udio biološki relevantan. Od januara 2016., 294 LncRNA su funkcionalno označene u LncRNAdb-i (baza podataka koja opisuje LncRNK),[20][21] s tim da je većina njih (183 LncRNK) opisana na ljudima. Od juna 2018. godine, ukupno 1867 ljudskih lncRNK su sa eksperimentalnim dokazima nadgledane u zajednici u LncRNAWiki (platforma za javno uređivanje i otvoreni sadržaj, zasnovana na wikiju za nadgledanje ljudskih lncRNA u zajednici)[22] u pogledu funkcionalnih mehanizama i asocijacija bolesti, kojima se također može pristupiti na linku LncBookArhivirano 17. 1. 2020. na Wayback Machine.[16] Prema kuriranju funkcionalnih mehanizama lncRNK na osnovu literature, izvještava se da su opsežno uključene u regulaciju transkripcije.[16] Daljnja velika studija sekvenciranja pruža dokaze da se mnogi transkripti smatraju kao lncRNA zapravo mogu biti prevedeni u proteine.[23]
Organizacija genoma
U 2005. slika genom sisara opisan je kao brojna „žarišta“ transkripcije koja su odvojena dugim dijelovima intergenskog prostora.[6] Dok su duge ncRNK smještene i transkribirane unutar intergenskih sekvenci, većina se transkribira kao složene, isprepletene mreže preklapajućih smislenih i antisens transkripata, koji često uključuju kodirajuće gene za proteine,[5] što dovodi do složene hijerarhije preklapajućih izoformi.[24] > Genomske sekvence unutar ovih transkripcijskih fokusa često se dijele unutar niza različitih kodirajućih i nekodirajućih transkripata u smislu i antisens smjernica[25] Naprimjer, 3012 od 8961 cDNA-a prethodno označenih kao skraćene kodirajuće sekvence unutar FANTOM2, kasnije su označene kao prave ncRNK varijante kDNK-a, koje kodiraju proteine.[6] Iako obilje i očuvanost ovih isprepletenih aranžmana sugeriraju da imaju biološku važnost, složenost ovih žarišta onemogućava lahku procjenu.
Konzorcij GENCODE objedinio je i analizirao sveobuhvatan skup oznaka ljudskih lncRNK i njihovu genomsku organizaciju, modifikacije ćelijskih lokacija i profila ekspresije tkiva.[9] Njihova analiza ukazuje na to da ljudske lncRNK pokazuju pristranost prema dvoegzonskim transkriptima.[9]
Alati za identifikacuju dugolančanih nekodirajućih RNK
^Cheng J, Kapranov P, Drenkow J, Dike S, Brubaker S, Patel S, Long J, Stern D, Tammana H, Helt G, Sementchenko V, Piccolboni A, Bekiranov S, Bailey DK, Ganesh M, Ghosh S, Bell I, Gerhard DS, Gingeras TR (maj 2005). "Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution". Science. 308 (5725): 1149–1154. Bibcode:2005Sci...308.1149C. doi:10.1126/science.1108625. PMID15790807.
^Necsulea A, Soumillon M, Warnefors M, Liechti A, Daish T, Zeller U, Baker JC, Grützner F, Kaessmann H (januar 2014). "The evolution of lncRNA repertoires and expression patterns in tetrapods". Nature. 505 (7485): 635–640. Bibcode:2014Natur.505..635N. doi:10.1038/nature12943. PMID24463510.
^Hon CC, Ramilowski JA, Harshbarger J, Bertin N, Rackham OJ, Gough J, Denisenko E, Schmeier S, Poulsen TM, Severin J, Lizio M, Kawaji H, Kasukawa T, Itoh M, Burroughs AM, Noma S, Djebali S, Alam T, Medvedeva YA, Testa AC, Lipovich L, Yip CW, Abugessaisa I, Mendez M, Hasegawa A, Tang D, Lassmann T, Heutink P, Babina M, Wells CA, Kojima S, Nakamura Y, Suzuki H, Daub CO, de Hoon MJ, Arner E, Hayashizaki Y, Carninci P, Forrest AR (mart 2017). "An atlas of human long non-coding RNAs with accurate 5′ ends". Nature. 543 (7644): 199–204. Bibcode:2017Natur.543..199H. doi:10.1038/nature21374. PMC6857182. PMID28241135.
^Yan L, Yang M, Guo H, Yang L, Wu J, Li R, Liu P, Lian Y, Zheng X, Yan J, Huang J, Li M, Wu X, Wen L, Lao K, Li R, Qiao J, Tang F (septembar 2013). "Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells". Nature Structural & Molecular Biology. 20 (9): 1131–1139. doi:10.1038/nsmb.2660. PMID23934149.
^Wang G, Yin H, Li B, Yu C, Wang F, Xu X, Cao J, Bao Y, Wang L, Abbasi AA, Bajic VB, Ma L, Zhang Z (januar 2019). "Characterization and identification of long non-coding RNAs based on feature relationship". Bioinformatics. 41 (Database issue): D246–D251. doi:10.1093/bioinformatics/btz008. PMID30649200.
^Negri TD, Alves WA, Bugatti PH, Saito PT, Domingues DS, Paschoal AR (2019). "Pattern recognition analysis on long noncoding RNAs: a tool for prediction in plants". Briefings in Bioinformatics. 20 (2): 682–689. doi:10.1093/bib/bby034. PMID29697740.