L’internet del DNA

L’internet del DNA

Noah è un ragazzino di sei anni afflitto da un disordine che non ha ancora un nome. Quest’anno, i suoi medici hanno cominciato a trasmettere le sue informazioni genetiche su Internet per vedere se chiunque, ovunque nel mondo, soffre della sua stessa condizione.

Un riscontro potrebbe fare la differenza. Noah ha uno sviluppo ritardato, non è in grado di camminare autonomamente, parla solo alcune parole; e le sue condizioni stanno peggiorando. Le risonanze magnetiche mostrano un graduale rimpicciolimento del cervelletto. Il suo DNA è stato analizzato da genetisti del Children’s Hospital in Ontario. Da qualche parte nei milioni di As, Gs, Cs e Ts, si trova un errore, e magari un indizio per una cura. A meno che non si riesca a trovare un secondo giovane con gli stessi sintomi e un errore genetico simile, i medici non riescono a identificare quale errore nei geni di Noah è cruciale.

A gennaio, alcuni programmatori di Toronto hanno cominciato a testare un sistema per scambiare informazioni genetiche con altri ospedali.

A gennaio, alcuni programmatori di Toronto hanno cominciato a testare un sistema per scambiare informazioni genetiche con altri ospedali. Strutture del genere, che possono essere trovate anche in località quali Miami, Baltimora e Cambridge, nel Regno Unito, trattano anche bambini colpiti dai cosiddetti disordini Mendeliani, che sono provocati da una rara mutazione in un singolo gene. Il sistema, denominato MatchMaker Exchange, rappresenta qualcosa di nuovo: un sistema per automatizzare il confronto del DNA di persone malate in tutto il mondo.

Il problema è che il sequenziamento del DNA è staccato dal nostro più grande strumento di condivisione delle informazioni: Internet

Una delle persone dietro questo progetto è David Haussler, un esperto di bioinformatica dell’Università della California a Santa Cruz. Il problema che Haussler sta affrontando in questo momento è che il sequenziamento del DNA è fondamentalmente distaccato dal nostro più grande strumento di condivisione delle informazioni: Internet. Si tratta di una condizione alquanto sfavorevole se consideriamo che oltre 200,000 persone hanno già ottenuto il sequenziamento del proprio DNA, e che questo il loro numero è destinato a crescere di milioni nel giro dei prossimi anni. La prossima era della medicina dipende dai confronti su larga scala di questi genomi, un compito al quale, secondo Haussler, gli scienziati non sono preparati. “Posso utilizzare la mia carta di credito ovunque nel mondo, ma le informazioni biomediche sono semplicemente introvabili su internet”, dice. “È tutto incompleto e rinchiuso”. I genomi vengono spesso trasferiti su dischi rigidi e inviati tramite corriere.

La prossima era della medicina dipende dai confronti su larga scala di questi genomi

Haussler è uno dei fondatori e direttori tecnici della Global Alliance for Genomics and Health, un’organizzazione no profit formata nel 2013 che può essere paragonata alla W3C, l’organizzazione devota al corretto funzionamento della rete. Conosciuta anche con il suo acronimo sgraziato, GA4GH, ha raccolto un gran numero di seguaci, fra cui importanti società tecnologiche quali Google. I suoi prodotti finora includono protocolli, interfacce di applicazioni per programmazioni (API), e formati file migliorati per trasmettere il DNA in rete. I problemi reali che sta risolvendo non sono però di natura tecnica ma sociologica: gli scienziati sono riluttanti all’idea di condividere le proprie informazioni genetiche e, per via delle norme sulla privacy, condividere i genomi delle persone su Internet è legalmente rischioso .

Crescono però le pressioni per utilizzare questa tecnologia al fine di studiare contemporaneamente svariati genomi e confrontarli con le informazioni genetiche contenute nelle cartelle cliniche. Gli scienziati ritengono infatti che occorrerà mettere ordine in un milione di genomi o più per riuscire a risolvere casi – come quello di Noah – che potrebbero essere caratterizzati da una singola lettera sbagliata nel DNA, o scoprire la genetica dietro malattie comuni che riguardano complesse combinazioni di geni.

Ad oggi, nessun centro accademico ha accesso a un registro esteso di informazioni, né dispone dei requisiti economici per organizzarlo.

Al momento, nessun centro accademico ha accesso a un registro esteso di informazioni o dispone dei requisiti economici per riuscire ad organizzarlo. Haussler ed altri membri dell’alleanza scommettono che parte della soluzione si trovi in una rete di confronto diretto fra computer che permetta di unificare dati ampiamente dispersi. I loro standard, ad esempio, permetterebbero ad un ricercatore di inviare richieste ad altri ospedali, che potrebbero quindi scegliere quale livello di informazione condividere e con chi. Un controllo simile allevierebbe le preoccupazioni legate alla riservatezza dei dati. Aggiungendo un nuovo livello di complessità, le interfacce API potrebbero anche richiamare i database per eseguire calcoli – come riesaminare i genomi che conservano – e consegnare risposte.

Ho incontrato Haussler mentre era adagiato su una sdraio nella piscina di un hotel di San Diego. Eravamo entrambi in città per partecipare ad uno dei più importanti incontri annuali al mondo fra genetisti. In quell’occasione, mi ha detto di essere preoccupato che la genomica stesse allontanandosi dall’approccio “open” che aveva reso il progetto per il genoma tanto potente. Secondo lui, se i dati legati al genoma delle persone venissero resi più facilmente accessibili, la medicina potrebbe beneficiare dello stesso genere di effetto che ha spinto così tanti aspetti commerciali nella rete. In alternativa, queste informazioni vitali potrebbero finire accatastate in qualcosa di catastrofico come i registri ospedalieri negli Stati Uniti, la maggior parte dei quali non è abilitata per la condivisione di informazioni.

La quantità di informazioni sul genoma sta aumentando vertiginosamente.

Uno dei motivi per cui sollecitare un’azione rapida è che la quantità di informazioni sul genoma sta aumentando vertiginosamente. I laboratori più grandi possono ormai sequenziare i genomi umani con un grande livello di accuratezza e dettaglio a un ritmo di due persone all’ora (Il primo genoma ha richiesto 13 anni). Un calcolo approssimativo suggerisce che quest’anno le macchine per il sequenziamento del DNA potrebbero arrivare a produrre 85 petabyte di dati nel mondo, due volte tanto nel 2019, e via dicendo. A confronto, le copie maestro di tutti i film commercializzati da Netflix occupano 2.6 petabyte di memoria.

«Ecco una domanda tecnica», dice Adam Berrey, CEO di Curoverse, una startup di Boston che sta utilizzando gli standard dell’alleanza nello sviluppo del suo software open-source per ospedali. «Avete per le mani exabyte di dati in tutto il mondo che nessuno vuole spostare; Come si fa ad organizzarli tutti fra loro e allo stesso momento? La risposta è che invece di spostare i dati si spostano le domante. Nessuna industria segue un approccio simile. È un problema tremendamente complicato, ma con il potenziale per trasformare la vita umana».

Gli scienziati sono ampiamente coinvolti in quello che, di fatto, è un progetto volto alla documentazione di ciascuna variazione in ciascun genoma umano e all’identificazione delle conseguenze di queste differenze. Esseri umani individuali differiscono fra loro per quasi 3 milioni di posizioni del DNA, o una posizione ogni 1,000 lettere genetiche. La maggior parte di queste differenze non ha rilevanza, ma le restanti variazioni spiegano diversi aspetti importanti: disordini nel battito cardiaco di Noah, ad esempio, o una maggiore predisposizione a sviluppare il glaucoma.

«Il fattore limitante non è la tecnologia», dice Shaywitz, «è la disponibilità delle persone a condividerle».

Immaginate di contrarre un tumore. Un medico potrebbe ordinare un test del DNA per il vostro tumore, sapendo che ciascuna forma di cancro è stimolata da mutazioni specifiche. Se fosse possibile guardare all’esperienza di chiunque altro condividesse le particolari mutazioni del vostro tumore, oltre agli effetti dei farmaci assunti da ciascun paziente e alla durata della loro vita, quel medico potrebbe trovare il modo ideale per curarvi. La calamità che incombe sulla genomica è che gran parte di queste informazioni che potrebbero salvare la vita, per quanto siano già state raccolte, è inaccessibile. «Il fattore limitante non è la tecnologia», dice David Shaywitz, chief medical officer della DNAnexus, una società di bioniformatica che conserva diverse raccolte di dai sui geni. «È la disponibilità delle persone a condividerle».

L’estate scorsa, l’alleanza di Haussler ha lanciato un semplice motore di ricerca per il DNA di nome Beacon. Attualmente, Beacon cerca fra 20 database di genomi umani che sono stati precedentemente resi pubblici ed implementati nei protocolli dell’alleanza. Beacon offre esclusivamente risposte positive o negative a una sola tipologia di domanda. È possibile chiedere, ad esempio, «Nessuno dei genomi raccolti presenta una T nella posizione 1,502,301 del cromosoma 1?». «È davvero la domanda più semplice che ci sia: hai mai visto questa variante?», dice Haussler. «Nel caso in cui si trovasse qualcosa di nuovo, si cercherebbe sicuramente di scoprire se si tratta del primo paziente identificato al mondo con una caratteristica simile». Beacon è già in grado di accedere al DNA di migliaia di persone, fra cui le centinaia di genomi messi online da Google.

Uno dei cofondatori della Global Alliance, David Altshuler, è capo scienziato presso la Vertex Pharmaceuticals ed è stato fino a poco tempo fa il vice capo del MIT-Harvard Broad Institute, uno dei più grandi centri accademici negli Stati Uniti per il sequenziamento del DNA. Quando ho incontrato Altshuler nel suo ufficio all’interno del Broad Institute, la sua lavagna era ricoperta di diagrammi che mostravano le eredità genetiche nelle famiglie, oltre alla parola “Napster” scritta a grandi lettere blu – un riferimento al rivoluzionario servizio di condivisione della musica degli anni ’90.

Altshuler ha le sue ragioni per voler connettere enormi quantità di informazioni genetiche. In qualità di ricercatore accademico, ha dato alla caccia alle cause genetiche di alcune fra le malattie più comuni, quali il diabete. Il suo lavoro è il risultato di un confronto fra il DNA di persone affette e quello di persone sane, nel tentativo di identificare le differenze più comuni. Dopo aver esaurito in questo modo un’innumerevole quantità di finanziamenti, i genetisti si sono resi conto che non avrebbero trovato tanto facilmente una risposta, un comune “gene del diabete”, o un gene “della depressione”. Si è scoperto che le malattie comuni non sono provocate a colpo sicuro da un unico difetto. Piuttosto, gli scienziati hanno appreso che la predisposizione di ciascuna persona è determinata da una combinazione di centinaia, o persino decine di migliaia, di rare variazioni nel codice del DNA.

Questa scoperta ha provocato un gigantesco “mal di testa statistico”. Lo scorso luglio, in un rapporto formulato da 300 autori, il Broad Institute ha esaminato i geni di 36,989 persone affette da schizofrenia. Sebbene la schizofrenia sia altamente ereditabile, le 108 regioni identificate dagli scienziati nei geni spiegavano solamente una piccola percentuale di rischio per una persona. Altshuler ritiene che grandi studi sul genoma continuino ad essere un valido sistema per “spezzare” queste malattie, ma crede che per riuscirvi occorreranno milioni di genomi.

«Assisteremo ad un enorme cambiamento nel modo di fare scienza», dice Arthur Toga

Tirando le somme, la condivisione di dati non è più ottimale, sia che i ricercatori stiano cercando di risolvere le cause di malattie comuni, che quelle di malattie estremamente rare. «Assisteremo ad un enorme cambiamento nel modo di fare scienza», dice Arthur Toga, un ricercatore alla guida di un consorzio che studia la scienza dell’Alzheimer presso la University of Southern California. «Non è possibile ottenere i propri risultati con appena 10,000 pazienti – ne serviranno molti di più. Gli scienziati condivideranno le proprie informazioni perché sarà loro necessario».

La privacy è un ostacolo alla condivisione. I dati sul DNA delle persone è protetto perché permette di identificarle

Ovviamente, la privacy è un ostacolo alla condivisione. I dati sul DNA delle persone è protetto perché permette di identificarle, come un’impronta digitale – anche le cartelle cliniche sono private. Alcuni paesi non permettono di esportare le informazioni personali ai fini della ricerca. Haussler ritiene però che una rete peer-to-peer diretto possa superare alcune di queste preoccupazioni, visto che le informazioni non si muoverebbero e l’accesso a queste potrebbe essere monitorato. Oltre la metà degli abitanti europei e statunitensi si dicono favorevoli all’idea di condividere i propri genomi, ed alcuni ricercatori ritengono che le forme di consenso dovrebbero essere dinamiche – un po’ come i controlli della privacy su Facebook – e permettere liberamente a ciascun individuo di decidere in qualunque momento cosa condividere e cosa proteggere. “I nostri membri vogliono poter decidere, ma non sono poi tanto preoccupati per la privacy. Sono malati”, dice Sharon Terry, capo della Genetic Alliance, una grande organizzazione per la difesa dei pazienti.

Il rischio di sbagliare qualcosa nella condivisione dei dati può mettere in crisi la rivoluzione genomica.

Il rischio di sbagliare qualcosa nella condivisione dei dati può mettere in crisi la rivoluzione genomica. Alcuni ricercatori sostengono di aver già identificato i primi segnali di questa crisi. Kym Boycott, capo del team di ricerca che ha sequenziato il genoma di Noah, racconta che quando il gruppo ha adottato il sequenziamento come strumento di ricerca nel 2010, il successo è stato immediato. Nel corso di due anni, fra il 2011 e il 2013, una rete di genetisti canadesi ha svelato le precise cause molecolari di 146 condizioni, risolvendo il 55 percento dei casi rimasti senza una diagnosi.

Sempre secondo Boycott, però, il tasso di successo pare essere in diminuzione. Ora restano solamente i casi più complicati, come quello di Noah, e le soluzioni si trovano la metà delle volte rispetto alla norma. «Non abbiamo più due pazienti con gli stessi sintomi. È per questo che abbiamo bisogno di condividere e scambiare le informazioni», dice. «Abbiamo bisogno di più pazienti e di una condivisione sistematica per riuscire a risollevare il tasso di successo». Verso la fine di gennaio, quando ho chiesto se MatchMaker Exchange avesse già portato ad un accoppiamento, mi ha spiegato che sarebbero potute occorrere ancora alcune settimane prima che il sistema diventasse pienamente operativo. Per quanto riguarda Noah, invece, mi ha detto «Stiamo ancora aspettando di metterlo in sesto. È importante per questo ometto».

(MO)