Verso la scoperta del genoma umano

Il sequenziamento del DNA è un processo che permette di decifrare l'ordine esatto delle basi nucleotidiche (adenina (A), citosina (C), guanina (G) e timina (T)) permettendo una digitalizzazione del dato genomico e abilitando l’analisi da un punto di vista computazionale. L’obbiettivo primario di questo processo consiste nella mappatura dei geni di diversi organismi, in particolare quello umano, per avanzare la conoscenza biologica analizzando la correlazione tra genotipo e fenotipo. 

Tuttavia, sequenziare interamente il genoma umano ha rappresentato una della più grandi sfide degli ultimi decenni e il suo completamento ha inaugurato un'era di scoperte senza precedenti nel campo della biologia e della medicina.

Il Progetto Genoma Umano

Il Progetto Genoma Umano (HGP), avviato nel 1990 con l'ambizione di sequenziare l'intero genoma umano, ha rappresentato una pietra miliare nell’analisi genomica. Frutto di una collaborazione internazionale, l'HGP si è prefissato di mappare tutti i circa 20.000-25.000 geni umani e di determinare la sequenza dei 3 miliardi di basi di DNA che compongono il genoma umano. La tecnologia di sequenziamento di Sanger, predominante durante gli anni dell'HGP, ha permesso di raggiungere un traguardo storico nel 2003: una bozza di alta qualità del genoma umano che copriva oltre il 92% dell'intero genoma, con un'accuratezza superiore al 99,99%. Questo risultato non solo ha segnato il completamento di uno degli obiettivi scientifici più ambiziosi del XX secolo, ma ha anche gettato le basi per decenni di ricerca futura, aprendo la strada a progressi significativi nella comprensione delle malattie genetiche e nello sviluppo di nuove terapie.

Nonostante l’enorme successo, la bozza di genoma umano pubblicata dall’HGP mancava di alcune regioni più complesse, tra cui i telomeri, regioni situate all’estremità dei cromosomi e caratterizzate da un’alta ripetitività, e i centromeri, regioni molto complesse e più centrali nel cromosoma. La causa di questa mancanza è dovuta principalmente alle limitazioni della tecnologia Sanger che non poteva garantire una sufficiente accuratezza di sequenziamento.

Nuove Tecnologie di Sequenziamento

Dopo l'HGP, il campo del sequenziamento del DNA ha visto rapidi progressi tecnologici. Da prima con le tecnologie di seconda generazione, anche conosciute come Next Generation Sequencing (NGS), si sono notevolmente ridotti i tempi e i costi di produzione di dati genomici, attraverso un approccio di sequenziamento in parallelo. Più recentemente invece il sequenziamento a singola molecola o di terza generazione, con tecnologie come PacBio e Oxford Nanopore, ha permesso di sequenziare direttamente il campione di DNA eliminando buona parte del preprocessing. Questi avanzamenti hanno migliorato notevolmente la capacità di sequenziare regioni del genoma precedentemente inaccessibili.

Da Telomero a Telomero

L’avanzamento tecnologico del processo di sequenziamento ha quindi incentivato la nascita del Telomere-to-Telomere (T2T) Consortium nel 2019, che si pose l’obbiettivo di colmare le lacune del HGP e raggiungere la completezza del genoma umano. Nel 2022, il T2T pubblica la prima versione completa del genoma, letteralmente da telomero a telomero. In particolare in questo lavoro viene prioritizzato il sequenziamento di quel 8% mancante e viene proposta una nuova sequenza di riferimento con 200 milioni di nuove basi, contenenti 1956 predizioni di geni. Questo traguardo rappresenta quindi il culmine del progetto nato nel 1990 e permette di velocizzare la scoperta di nuove correlazioni e di aumentare la precisione di diagnosi e terapie, oltre ad aprire le porte a una vastità di nuovi studi e applicazioni prima impensabili.

Benvenuti nell'Era Pangenomica!

L’evoluzione tecnologica del processo di sequenziamento ha contribuito all’abbattimento dei costi e dei tempi di produzione di dati genomici, influenzando la creazione di sequenze più accurate e complete. Questo, unito all’avanzamento in ambito computazionale delle tecniche di analisi, pone le basi per quella che nel 2023 è stata definita da Nature come l’Era Pangenomica. Data l’alta quantità e qualità di dati prodotti, è ora possibile non fermarci soltato all’analisi di un singolo genoma, ma cercare le correlazioni tra diversi individui e indagare la variabilità genetica di intere popolazioni. Tuttavia, data la non indifferente complessità nell’analisi di un singolo genoma, è facilmente deducibile la necessità di nuovi paradigmi per poter analizzare una popolazione di genomi.

In ciò si riflette l’obbiettivo di GenoGra che propone la prima piattaforma per l’analisi pangenomica. GenoGra abilita gli studi di popolazione grazie alla tecnologia basata su grafi genomici, che permettono di raccogliere un insieme di sequenze genomiche in un’unica rete di informazioni interconnesse, evidenziandone la variabilità genetica. Questo approccio permette all’analisi genomica di scalare parallelamente alla ingente produzione di dati generata dalle nuove tecnologie di sequenziamento e consente di migliorare l’accuratezza dell’analisi avvicinandoci sempre di più ad una medicina davvero personalizzata.

it_ITItalian