Gli scienziati del National Human Genome Research Institute (NHGRI), in collaborazione con gli esperti dell'Università della California Santa Cruz hanno ottenuto il primo assemblaggio completo del cromosoma X umano. "Questo risultato segna una nuova era nella ricerca genomica - dichiara Eric Green, direttore del NHGRI - la capacità di generare sequenze veramente complete di cromosomi e genomi è un'impresa tecnica che ci potrà aiutare a comprendere a fondo la funzione del genoma e l'uso delle informazioni genomiche nelle cure mediche". L'esperto spiega che il team è riuscito a raggiungere un livello di precisione senza precedenti, grazie a nuove tecnologie di sequenziamento che consentono letture "ultra-lunghe", come il sequenziamento dei nanopori, introdotta dallo stesso gruppo di ricerca nel 2018.

"Il genoma umano - spiega Adam Phillippy, del NHGRI - è incredibilmente lungo, costituito da circa sei miliardi di basi, per questo solitamente si tende a dividere il genoma in sezioni, che sono più facili da elaborare per le macchine di sequenziamento. Possiamo paragonare questa procedura alla realizzazione di un puzzle: le zone più piccole e ripetitive sono difficili da contestualizzare e da incastrare, è più semplice osservare la figura di insieme, ma finora i tratti dei cromosomi che avevamo erano troppo piccoli per restituire una prospettiva comprensibile". Il ricercatore aggiunge che le sequenze ricche di ripetizioni erano un tempo ritenute intrattabili, per via dell'assenza di indizi sul numero di ripetizioni o sul modo in cui potessero combinarsi.

Dei 24 cromosomi umani, il team ha completato la sequenza del cromosoma X, collegato a una serie di patologie, tra cui emofilia, malattia granulomatosa cronica e distrofia muscolare di Duchenne. "Il DNA umano - continua Miga - è composto da due serie diverse di cromosomi, che dipendono dall'eredità biologica dei genitori.

LO STUDIO

Per il nostro studio abbiamo sequenziato una cellula molto particolare in cui i cromosomi X erano identici, li abbiamo divisi il meno possibile e analizzati grazie a strumenti diversi, come il sequenziamento a nanopori e tecnologie sviluppate dalle aziende PacBio e Illumina, nonché mappature del genoma realizzate da BioNano Genomics". Phillippy e Miga hanno utilizzato queste metodologie per ottenere sequenze di DNA ultra lunghe e riassemblare poi le informazioni ottenute, raggiungendo livelli di continuità, completezza e accuratezza senza precedenti. "Per completare l'assemblaggio - osserva Phillippy - abbiamo dovuto risolvere manualmente diversi vuoti nella sequenza, che riguardava no principalmente il centromero, una regione di DNA ripetitivo che nel cromosoma X comprende 3,1 milioni di coppie di basi. Abbiamo identificato le varianti all'interno della sequenza di ripetizione che fungevano da marker, che sono state utilizzate poi per allineare le letture lunghe e collegarle insieme".

Il lavoro rientra nell'iniziativa del consorzio co-fondato da Phillippy e Miga Telomere-to-Telomere (T2T), che mira a generare una sequenza di riferimento completa dell'intero genoma umano entro il 2020. "Non sappiamo con precisione dove porteranno queste nuove scoperte - conclude Phillippy - ma siamo molto fiduciosi e soprattutto curiosi delle sfide future. La speranza è quella di riuscire a comprendere meglio come la struttura genomica possa influire sull'insorgere di malattie e patologie che ad oggi non riusciamo a capire appieno".

L'ESPERTO: "LA SCOPERTA AIUTERÀ A CAPIRE LE MALATTIE"

"Si tratta di un lavoro davvero interessante che ci aiuterà a comprendere meglio anche i meccanismi genetici che sono alla base di alcune malattie". Lo ha spiegato all'Agi Giuseppe Novelli, genetista dell'Università di Tor Vergata a proposito della ricerca, pubblicata oggi su Nature dai genetisti del National Human Genome Research Institute (NHGRI) che hanno annunciato di aver assemblato per la prima volta un intero cromosoma umano (il cromosoma X) da telomero a telomero, ovvero dall'inizio alla fine. "Si tratta - ha spiegato Novelli - di un lavoro certamente interessante che crea le condizioni per lo sviluppo di tecnologie innovative per il sequenziamento del DNA su larga scala. Leggere un genoma significa oggi avere la traduzione di quasi 7000 copie della Divina Commedia, tanta è la grande quantità di informazioni. Naturalmente in queste copie ogni tanto ci sono degli errori, dei buchi, che non erano coperti dai sistemi che abbiamo a disposizione.

Fino ad oggi infatti per leggere la grande quantità di informazioni contenute nel genoma- continua Novelli - dobbiamo fare a pezzi il DNA e dividerlo in segmenti e pezzettini diversi per poi metterli insieme come un puzzle. Naturalmente poi quando si va a rimettere insieme pezzi anche piccoli di un puzzle più grande, qualcosa si perde, rimane qualche buco e questi buchi ogni tanto creano dei problemi perché non ci consentono di avere informazioni che perdiamo". "Questa tecnica - spiega il genetista - potrebbe colmare i buchi che abbiamo attualmente nella sequenza cosiddetta di 'riferimento' che noi oggi utilizziamo quando leggiamo qualche pezzo di DNA per vedere se c'è una mutazione o qualcosa di diverso. Se la sequenza di riferimento - i gold standard - contiene dei buchi a volte abbiamo dei buchi anche noi oppure risultano letture incomplete o non precise".

"Questo metodo - aggiunge - fa parte di un più grande progetto che è quello di leggere dalla testa ai piedi un cromosoma intero che è appunto una molecola di DNA (ne abbiamo 22 coppie più X ed Y) che ha un suo inizio e una sua fine e con questo sistema è possibile adesso leggere interamente l'intera molecola di DNA". Adesso è da valutare "quanto tempo ci vorrà per farlo per tutti i cromosomi e se la tecnica riuscirà a sequenziare anche quelli come l'1, molto grande, e il 9 e altri ancora che hanno delle sequenze molto complesse e ripetute". Per quanto riguarda possibili applicazioni, conclude Novelli "mi viene da pensare ad esempio che alcune malattie cosiddette da sequenze instabili come la Distrofia miotonica la Corea di Huntington per le quali è molto importante leggere nel dettaglio le sequenze perchè sono fatte da ripetizioni di base tipo c t g c t g c t g ripetuto numerose volte e a volte abbiamo scoperto che all'interno di queste ripetizioni c'è una lettera o due lettere che possono fare la differenza e dare o meno una malattia".