Genoma umano

In una cellula (esclusi alcuni tipi particolari mancanti del nucleo, ed i gameti che hanno la metà del DNA nucleare) vi sono normalmente 23 coppie di cromosomi (46 in totale), ognuno dei quali contiene centinaia di geni separati da regioni intergeniche. Le regioni intergeniche possono contenere sequenze regolatrici e DNA non codificante.

Il genoma umano è la sequenza completa di nucleotidi che compone il patrimonio genetico dell'Homo sapiens, comprendente il DNA nucleare e il DNA mitocondriale.

Ha un corredo approssimativamente di 3,2 miliardi di paia di basi di DNA contenenti all'incirca 20 000 geni codificanti per proteine[1].

Il Progetto Genoma Umano ha identificato una sequenza di riferimento eucromatica, che è utilizzata a livello globale nelle scienze biomediche. Lo studio ha inoltre scoperto che il DNA non codificante assomma al 98,5%, più di quanto fosse stato previsto, e quindi solo circa l'1,5% della lunghezza totale del DNA si basa su sequenze codificanti.[2]

Caratteristiche

Una rappresentazione grafica del cariotipo umano femminile e maschile normale

Cromosomi

Il DNA nucleare umano si raggruppa in 24 tipi di cromosomi: 22 autosomi, più due cromosomi che determinano il sesso (cromosoma X e cromosoma Y). I cromosomi 1–22 sono numerati in ordine di lunghezza decrescente. Le cellule somatiche hanno due copie dei cromosomi 1–22 provenienti ognuna da un genitore, più un cromosoma X dalla madre e un cromosoma X o Y (rispettivamente nella femmina e nel maschio) dal padre, per un totale di 46 cromosomi distribuiti in 23 coppie, 22 di cromosomi omologhi (autosomi) e una di cromosomi sessuali (eterosomi).

Geni

È stata ipotizzata l'esistenza di circa 20.000 geni codificanti proteine. Il numero stimato di geni umani è stato ripetutamente abbassato dalle iniziali predizioni di 100.000 o più man mano che la qualità del sequenziamento genomico e dei metodi di predizione dei geni sono migliorati, e potrebbe scendere ulteriormente. Secondo una stima di Craig Venter (nel 2007) i geni sarebbero 23.224, mentre secondo Jim Kent (2007) sarebbero 20.433 codificanti e 5.871 non codificanti.

Sorprendentemente, il numero di geni umani sembra essere solo poco più del doppio rispetto a quello di organismi molto più semplici, come Caenorhabditis elegans e Drosophila melanogaster. In ogni caso, le cellule umane utilizzano massicciamente lo splicing alternativo per produrre un gran numero di proteine differenti da un singolo gene, e si pensa che il proteoma umano sia molto più grande di quello degli organismi summenzionati.

La maggior parte dei geni umani ha esoni multipli e degli introni, che sono frequentemente molto più lunghi degli esoni fiancheggianti.

I geni umani sono distribuiti in maniera non uniforme lungo i cromosomi. Ogni cromosoma contiene varie regioni ricche di geni e poveri di geni, che sembrano correlate con le bande cromosomiche e il contenuto in GC. Il significato di questa alternanza non casuale di densità genica non è ben compresa allo stato attuale della conoscenza scientifica.

In aggiunta ai geni codificanti proteine, il genoma umano contiene diverse migliaia di geni codificanti un RNA, incluso tRNA, RNA ribosomico e microRNA, oltre ad altri geni a RNA non codificanti.

Dimensione dei geni codificanti per proteine

La dimensione dei geni codificanti per proteine del genoma umano è estremamente variabile (Tabella 1). Per esempio, il gene per l'istone H1A (HIST1H1A) è relativamente corto e semplice, non avendo introni e producendo un RNA messaggero lungo 781 basi e codificando una proteina di 215 amminoacidi (648 basi di sequenza codificante). Il gene per la distrofina (DMD) è uno tra i più lunghi geni codificanti per proteina raggiungendo le 2200 migliaia di basi di lunghezza. Il gene per la titina (TTN) invece, è il gene codificante per proteina con la sequenza codificante più lunga (114.414 basi), con il più alto numero di esoni (363) e con l'esone singolo più lungo (17.106 basi).

Proteina Cromosoma Gene Lunghezza Esoni Lunghezza esoni Lunghezza introni Splicing alternativo
Proteina di suscettibilità al cancro della mammella tipo 2 13 BRCA2 84.193 27 11.386 72.807 no
Regolatore della conduttanza transmembrana della fibrosi cistica 7 CFTR 190.299 28 6.105 184.194
Citocromo b MT MTCYB 1.140 1 1.140 0 no
Distrofina X DMD 2.220.391 78 13.897 2.206.494
Gliceraldeide-3-fosfato deidrogenasi 12 GAPDH 3.971 9 1.493 2.478
Subunità beta dell'emoglobina 11 HBB 1.606 3 626 980 no
Istone H1A 6 HIST1H1A 781 1 781 0 no
Titina 2 TTN 281.435 363 109.224 172.211

Tabella 1. Esempi di geni umani codificanti per proteine. (Dati ricavati da: GeneBase 1.1[3] e banca dati National Center for Biotechnology Information Gene, Luglio 2017).

Un'analisi iniziale sui dati disponibili nel 2001, l'anno in cui è stata pubblicata per la prima volta la sequenza del genoma umano[2][4], stimava che la lunghezza media di un esone fosse di 145 basi (mediana: 122 basi), il numero medio di esoni fosse 8.8 (mediana: 7) e che in media una sequenza codificante codificasse 477 amminoacidi (mediana: 367 ; Tabella 21 in[2]). Da una recente analisi sistematica sui dati aggiornati del genoma umano[3], risulta che il più lungo gene umano per proteina è RBFOX1, lungo 2470 migliaia di basi. In tutto il genoma umano, considerando un gruppo revisionato di geni codificanti per proteine, i precedenti valori sono stati aggiornati ai seguenti: la lunghezza media di un gene per proteina è stimata essere di 66.577 basi (mediana: 26.288 basi); la lunghezza media di un esone è stimata essere di 309 basi (mediana: 133 basi), il numero medio di esoni è stimato essere 11 (mediana: 8) e una sequenza codificante in media per 553 amminoacidi (mediana: 425 amminoacidi; Tabelle 2 e 5[3]).

Sequenze regolatrici

Il genoma umano ha molte differenti sequenze regolatrici che sono cruciali nel controllare l'espressione del gene. Queste sono di solito brevi sequenze che appaiono in prossimità e all'interno dei geni. Una conoscenza sistematica di queste sequenze regolatrici e come agiscono assieme in una rete regolatrice genica sta cominciando solo ora a emergere dall'alta capacità di trattare informazioni attraverso gli studi di genomica comparata.

L'identificazione delle sequenze regolatrici si basa in parte sulla conservazione evoluzionistica. L'evento di divergenza evolutiva tra gli uomini e i topi, per esempio, ha avuto luogo 70–90 milioni di anni fa.[5] In questa maniera paragoni computerizzati di sequenze di geni che identificano sequenze non codificanti conservate daranno indicazione della loro importanza in compiti come la regolazione dei geni.[6]

Un altro approccio della genomica comparata per localizzare le sequenze regolatrici negli uomini consiste nel sequenziamento dei geni del pesce palla. Questi vertebrati hanno essenzialmente gli stessi geni e le stesse sequenze geniche regolatorie dell'uomo, ma con solo un ottavo di DNA “spazzatura”. La sequenza compatta del DNA del pesce palla rende molto più facile la localizzazione dei geni regolatori.[7]

Altro DNA

Le sequenze codificanti proteine (specificamente, codificanti esoni) comprendono meno dell'1,5% del genoma umano.[2]. A parte i geni e le sequenze regolatrici conosciute, il genoma umano contiene ampie regioni di DNA la cui funzione, se esiste, rimane ignota. Queste regioni comprendono di fatto la maggior parte, da alcuni stimata intorno al 97%, del genoma umano. Molta di essa comprende:

Elementi ripetuti

Trasposoni

Lo stesso argomento in dettaglio: Trasposoni.
  • Retrotrasposoni
    • Retrotrasposoni dotati di LTR
      • Ty1-copia
      • Ty3-gypsy
    • Retrotrasposoni non dotati di LTR
  • Trasposoni a DNA

Pseudogeni

Lo stesso argomento in dettaglio: Pseudogene.

Ciononostante, vi è ancora una grande quantità di sequenze che non cade all'interno di alcuna categoria nota.

Molte di queste sequenze potrebbero essere un artefatto evolutivo che non presenta alcun fine oggi, e queste regioni sono a volte indicate nel loro complesso come DNA spazzatura o junk DNA. Esiste, tuttavia, una varietà di prove emergenti che indicano come alcune sequenze all'interno di queste regioni possano funzionare in modi non ancora compresi. Recenti esperimenti con microarray hanno rivelato che una frazione sostanziale di DNA non-genico è di fatto trascritto in RNA,[8] che conduce all'ipotesi che i trascritti risultanti possano avere delle funzioni sconosciute. Inoltre, la conservazione evolutiva lungo i genomi dei Mammiferi di un numero di sequenze così alto da superare la porzione codificante proteine indica che molti, e forse la maggior parte, degli elementi funzionali del genoma rimangano ignoti.[9] Attualmente, nonostante queste eccitanti prospettive, gran parte del genoma umano non viene trascritto e non mostra avere una sequenza altamente conservata. La ricerca sull'informazione portata dalle vaste sequenze del genoma umano le cui funzioni rimangono sconosciute è tuttora una delle strade più importanti dell'indagine scientifica.

Variabilità

Molti degli studi sulla variabilità genetica umana si sono focalizzati sugli SNPs, single nucleotide polymorphisms, che sono sostituzioni di una singola base lungo un cromosoma. Diverse analisi stimano che uno SNP sia presente in media ogni 100 o ogni 1000 paia di basi nell'eucromatina del genoma umano, sebbene essi non si presentino con una densità uniforme. Di conseguenza è rispettato il detto comune che afferma che “tutti gli uomini sono geneticamente identici almeno al 99%”, anche se questo dovrebbe essere definito da molti genetisti. Una sfida collaborativa su larga scala per catalogare gli SNPs del genoma umano è stata intrapresa dall'International HapMap Project.

I loci genomici e la lunghezza di alcuni tipi di piccole sequenze ripetute sono altamente variabili da persona a persona, e questa caratteristica è alla base del DNA fingerprinting e delle tecnologie per i test di paternità basati sull'analisi del DNA. La porzione eterocromatica del genoma umano, che consta in totale di parecchie centinaia di milioni di paia di basi, è ritenuta essere abbastanza variabile all'interno della popolazione umana (è così ripetitiva e così lunga che non può essere sequenziata accuratamente con le attuali tecnologie). Questa regione non contiene geni e sembra improbabile che risulti qualche effetto fenotipico significativo dalle variazioni tipiche nelle ripetizioni o nell'eterocromatina.

Molte mutazioni genomiche grossolane nelle cellule germinali danno probabilmente embrioni non vitali; tuttavia, un certo numero di patologie umane è correlato ad anomalie genomiche su larga scala. La sindrome di Down, la sindrome di Turner e un numero di altre malattie sono il risultato della non-disgiunzione di interi cromosomi. Le cellule cancerose mostrano frequentemente aneuploidia dei cromosomi e dei bracci cromosomici, sebbene non sia ancora stata stabilita una relazione di causa ed effetto tra l'aneuploidia e il tumore.

In un articolo pubblicato nel 2006 su Nature[10], alcuni ricercatori avevano scoperto che la variazione del numero di copie (CNV) delle sequenze di DNA nell'uomo e in altri animali può essere considerevole. Delezioni, inserzioni, duplicazioni e varianti di più siti, indicate complessivamente come variazioni del numero di copie (CNVs) o polimorfismi del numero di copie (CNPs), sono state individuate in tutti gli uomini e animali esaminati.

Malattie genetiche

Lo stesso argomento in dettaglio: Malattie genetiche.

Queste condizioni sono causate dall'espressione anomala di uno o più geni che si associano a un fenotipo clinico. La malattia potrebbe essere causata da una mutazione genica, da un numero anomalo di cromosomi, da mutazioni nella ripetizione ed espansione di triplette. Il numero attuale di malattie genetiche riconosciute è all'incirca 4000, di cui la più comune è la fibrosi cistica.

Gli studi sulle malattie genetiche sono spesso svolti utilizzando la genetica di popolazione. Il trattamento viene effettuato da un medico-genetista specializzato in genetica clinica. I risultati del Progetto Genoma Umano probabilmente aumenteranno la disponibilità di test genetici per le relative malattie genetiche e alla fine potrebbero anche portare a miglioramenti nei protocolli di cura. I genitori possono essere sottoposti a esami per vagliare le loro condizioni ereditarie e per essere informati delle loro conseguenze, sulla probabilità che una certa malattia venga ereditata e su come evitarla o alleviarla nei loro figli.

Uno degli effetti maggiormente evidenti a livello di fenotipo umano deriva dal dosaggio genico, i cui effetti giocano un ruolo nelle malattie causate da duplicazioni, perdita o rottura dei cromosomi. Per esempio, un alto tasso di individui affetti dalla sindrome di Down, o trisomia 21 sono soggetti alla malattia di Alzheimer, un effetto che si pensa sia dovuto alla sovraespressione della proteina precursore dell'amiloide, una sostanza correlata all'Alzheimer il cui gene mappa sul cromosoma 21.[11] Viceversa, i pazienti affetti da sindrome di Down sono meno soggetti al tumore al seno: questo può essere probabilmente dovuto alla sovraespressione di un gene oncosoppressore.[12]

Evoluzione

Lo stesso argomento in dettaglio: Evoluzione umana.

Studi di genomica comparata sui genomi dei mammiferi suggeriscono che all'incirca il 5% del genoma umano si è conservato durante l'evoluzione a partire dalla divergenza avvenuta tra queste specie approssimativamente 200 milioni di anni fa. Questa porzione conservata contiene un'ampia maggioranza di geni e sequenze regolatrici. Intrigantemente, dal momento che geni e sequenze regolatrici rappresentano probabilmente meno del 2% del genoma, questo suggerisce che possano esserci più sequenze funzionali sconosciute che conosciute. Una frazione più piccola, ma comunque ampia, di geni umani sembra essere condivisa tra la maggior parte dei vertebrati analizzati.

Il genoma dello scimpanzé è per il 98.77% identico a quello umano. In media, un gene codificante una proteina in un uomo differisce dal suo ortologo nello scimpanzé per solo due sostituzioni aminoacidiche; quasi un terzo dei geni umani ha esattamente la stessa traduzione proteica dei loro ortologhi nello scimpanzé. Una grande differenza tra i due genomi è rappresentata dal cromosoma 2 umano, che è il prodotto della fusione dei cromosomi 12 e 13 dello scimpanzé.[13]

La specie umana ha subito una massiccia perdita di recettori olfattivi durante la sua recente evoluzione e ciò può spiegare perché il nostro senso dell'olfatto sia approssimativo rispetto a quello della maggioranza dei mammiferi. Prove evolutive suggeriscono che lo sviluppo della visione dei colori nell'uomo e in diversi altri primati possa aver ridotto il bisogno del senso dell'olfatto.[14]

Genoma mitocondriale

Il genoma mitocondriale umano è di grande interesse per i genetisti, dal momento che esso gioca indubbiamente un ruolo importante nelle malattie genetiche mitocondriali. Inoltre, esso è in grado di chiarificare alcuni punti “oscuri” dell'evoluzione umana; per esempio, l'analisi della variabilità del genoma mitocondriale umano ha portato a ipotizzare un recente comune antenato per tutti gli uomini lungo la linea di discendenza materna. (vedi Eva mitocondriale)

A causa della mancanza di un sistema di controllo degli errori di copiatura, il DNA mitocondriale (mtDNA) mostra un tasso maggiore di variazione rispetto al DNA nucleare. Questo aumento di circa 20 volte nel tasso di mutazione consente l'utilizzo del mtDNA come strumento per risalire con miglior accuratezza all'antenato materno. Studi del mtDNA nelle popolazioni hanno permesso di tracciare gli antichi flussi migratori, come la migrazione degli Indiani d’America dalla Siberia o dei Polinesiani dall'Asia sud-orientale. È stato inoltre utilizzato per dimostrare che c'è traccia del DNA dell'uomo di Neanderthal nel genoma dell'uomo europeo che condivide l'1-4% del genoma[15].

Brevettabilità e controversie

La brevettabilità del genoma umano pone un problema di bioetica, tanto per il diritto universale alla salute e i costi sanitari delle promettenti terapie geniche legate a questione di copyright, quanto per il divieto delle pratiche eugenetiche.

Esiste una giurisprudenza su questo argomento. La prima sentenza in merito è il pronunciamento del Dipartimento di Giustizia di Manhattan (marzo 2010) nel ricorso di appello fra la Ong American Civil Unione and Patents Foundation e la compagnia privata Myriad Genetics, detentrice dei brevetti sui geni Brca1 e Brca2, considerati mutageni e causa di tumore a seno e ovaie. Secondo il giudice, l'isolamento chimico di una sostanza già esistente in natura, la scoperta delle proprietà terapeutiche o la messa a punto di un protocollo di cura basato su tali elementi preesistenti alla terapia non sono sufficienti per la concessione di un brevetto, che si può ottenere per un gene modificato o per le terapie geniche derivanti dalla scoperte sul DNA, in ogni caso da un prodotto derivato e differente ottenuto da una trasformazione dell'elemento di partenza esistente in natura.

Note

  1. ^ International Human Genome Sequencing Consortium, Finishing the euchromatic sequence of the human genome., in Nature, vol. 431, n. 7011, 2004, pp. 931-45, PMID 15496913. Finishing the euchromatic sequence of the human genome : Article : Nature
  2. ^ a b c d International Human Genome Sequencing Consortium, Initial sequencing and analysis of the human genome., in Nature, vol. 409, n. 6822, 2001, pp. 860-921, PMID 11237011. Initial sequencing and analysis of the human genome : Article : Nature
  3. ^ a b c Piovesan A, Caracausi M e Antonaros F, Pelleri MC, Vitale L, GeneBase 1.1: a tool to summarize data from NCBI gene datasets and its application to an update of human gene statistics, in Database, vol. 2016, n. 0, 1º gennaio 2016, DOI:10.1093/database/baw153. URL consultato il 14 luglio 2017.
  4. ^ (EN) J. Craig Venter, Mark D. Adams e Eugene W. Myers, The Sequence of the Human Genome, in Science, vol. 291, n. 5507, 16 febbraio 2001, pp. 1304–1351, DOI:10.1126/science.1058040. URL consultato il 14 luglio 2017.
  5. ^ Nei M, Xu P, Glazko G, Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms., in Proc Natl Acad Sci U S A, vol. 98, n. 5, 2001, pp. 2497-502, PMID 11226267.
  6. ^ Loots G, Locksley R, Blankespoor C, Wang Z, Miller W, Rubin E, Frazer K, Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons., in Science, vol. 288, n. 5463, 2000, pp. 136-40, PMID 10753117. Summary Archiviato il 3 ottobre 2018 in Internet Archive.
  7. ^ (EN) Monique Meunier, Genoscope and Whitehead announce a high sequenze coverage of the Tetraodon nigroviridis genome, su cns.fr, Genoscope. URL consultato il 12 settembre 2006 (archiviato dall'url originale il 16 ottobre 2006).
  8. ^ …a tiling array with 5-nucleotide resolution that mapped transcription activity along 10 human chromosomes revealed that an average of 10% of the genome (compared to the 1 to 2% represented by bona fide exons) corresponds to polydenylated transcripts, of which more than half do not overlap with known gene locations. Claverie J, Fewer genes, more noncoding RNA., in Science, vol. 309, n. 5740, 2005, pp. 1529-30, PMID 1611064.
  9. ^ …the proportion of small (50-100 bp) segments in the mammalian genome that is under (purifying) selection can be estimated to be about 5%. This proportion is much higher than can be explained by protein-coding sequences alone, implying that the genome contains many additional features (such as untranslated regions, regulatry elements, non-protein-coding genes, and chromosal structural elements) under selection for biological function. Mouse Genome Sequencing Consortium, Initial sequencing and comparative analysis of the mouse genome., in Nature, vol. 420, n. 6915, 2002, pp. 520-62, PMID 12466850.
  10. ^ Global variation in copy number in the human genome : Article : Nature
  11. ^ Armstrong R, Cairns N, Myers D, Smith C, Lantos P, Rossor M, A comparison of beta-amyloid depositino in the medial temporal lobe in sporadic Alzheimer’s disease, Down’s sindrome and normal elderly brains., in Neurodegeneration, vol. 5, n. 1, 1996, pp. 35-41, PMID 8731380.
  12. ^ Kwak HI, Gustafson T, Metz RP, Laffin B, Schedin P, Porter WW, Inibition of breast cancer growth and invasion by single-minded 2s., in Carcinogenesis, epub, PMID 16840439.
  13. ^ Human chromosome 2 resulted from a fusion of two ancestral chromosomes that remained separate in the chimpanzee lineare The Chimpanzee Sequencing and Analysis Consortium, Initial sequenze of the chimpanzee genome and comparison with the human genome., in Nature, vol. 437, n. 7055, 2005, pp. 69-87, PMID 16136131.
    Large-scale sequencing of the chimpanzee genome is now imminent. Olson M, Varki A, Sequencing the chimpanzee genome: insights int human evolution and disease., in Nat Rev Genet, vol. 4, n. 1, 2003, pp. 20-8, PMID 12509750.
  14. ^ Our findings suggest that the deterioration of the olfactory repertoire occurred concomitant with the acquisition of full trichromatic color vision in primates. Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S, Loss of olfactory receptor genes coincides with the acquistino of full trichromatic vision in primates., in PloS Biol, vol. 2, n. 1, 2004, pp. E5, PMID 14737185.
  15. ^ "Ancient DNA set to rewrite human history"

Bibliografia

Voci correlate

Altri progetti

Collegamenti esterni

Controllo di autoritàNDL (ENJA01009113
  Portale Biologia: accedi alle voci di Wikipedia che trattano di Biologia