«Il DNA è come un programma per computer, ma molto, molto più avanzato di qualsiasi altro programma mai creato.»
(Bill Gates)
Il DNA è una lunga molecola filamentosa, raggomitolata nel nucleo delle cellule. Contiene le informazioni che occorrono per la costruzione degli esseri viventi, dunque una specie di manuale, i cui “capitoli” sono detti cromosomi e i “paragrafi” geni. Con il supporto di questa molecola estremamente stabile, molto più affidabile di qualunque altro supporto ottico o magnetico per memorizzare dati, la natura ha trovato un modo infallibile per conservare informazioni.
La vita si basa sull’utilizzo e sul mantenimento di una memoria genetica, ereditata dalla generazione precedente, che permette, oltre di vivere e riprodursi, anche di trasmettere tale eredità alla generazione successiva.
E se, nel mondo dei big data, le molecole di DNA diventassero un modo più sostenibile per conservare i dati digitali?
Un solo milligrammo di DNA sarebbe sufficiente per memorizzare il testo di tutti i libri della più grande biblioteca del mondo, e avanzerebbe spazio. Come termine di confronto, un grammo di DNA può contenere fino a 700 TB di dati, che corrispondono a 14.000 dischi Blu-ray da 50 GB, oppure ad oltre 200 hard disk da 3 TB.
I ricercatori dell’Università di Washington e Microsoft Research hanno sviluppato un sistema completamente automatizzato per scrivere, archiviare e leggere i dati codificati nel DNA. Diverse aziende, tra cui Microsoft e Twist Bioscience, stanno lavorando per migliorare la tecnologia di archiviazione del DNA. Già nel 2017, ad esempio, il gruppo di Church ad Harvard ha adottato la tecnologia di modifica del DNA CRISPR per registrare immagini di una mano umana nel genoma di E. coli, che sono state lette con una precisione superiore al 90%.
I ricercatori del Technion-Israel Institute of Technology di Haifa e del Centro interdisciplinare (IDC) di Herzliya, invece, hanno dimostrato di poter memorizzare informazioni con una densità superiore a 10 petabyte (un petabyte è un milione di gigabyte) in un singolo grammo di DNA migliorando significativamente il processo di scrittura. Per capire l’entità potremmo dire che consente di archiviare tutte le informazioni memorizzate su YouTube nel volume di un singolo cucchiaino di DNA.
Al termine del 2021, l’Istituto Italiano della Tecnologia (IIT), ha coordinato un progetto denominato DNA-Fairylight, guidato da Roman Krahne e da Denis Garoli dell’Iit, a cui partecipa un team internazionale di scienziati, e finanziato dall’Unione Europea, 3.1 milioni di euro per i prossimi tre anni.
DNA-Fairylight aspira a unire le tecnologie di sintesi e sequenziamento del DNA con le proprietà ottiche dei nano-materiali: in questo modo, gli scienziati contano di ottenere sequenze di DNA integrate da nano-luci colorate, che permetteranno processi di lettura e scrittura dei dati più veloci e sistemi di codifica più efficienti. Si basa, in sostanza, sulla sintesi di molecole di DNA a partire dai dati digitali che devono essere archiviati, in cui il codice binario (formato da 0 e 1) viene convertito nel codice delle quattro lettere del DNA (A, C, G, T – ovvero Adenina, Citosina, Guanina e Timina, elementi chimici di cui è composto). Quando si desidera tornare ai dati digitali, le molecole organiche vengono lette, codificate e trasformate di nuovo in informazioni digitali.
Negli ultimi dieci anni si sono fatti molti passi in avanti in questo campo: è migliorata sia la scalabilità e la praticità nell’archiviazione, oltre all’ottimizzazione degli algoritmi per la codifica e il recupero dei dati. Tuttavia, l’archiviazione dei dati del DNA richiede ancora costi elevati e la velocità di lettura e scrittura del DNA è ancora troppo lenta, per poter competere con l’archiviazione elettronica: se per leggere i dati della memoria NAND basta un millisecondo, per estrarre i dati dal DNA servono ore.
Il risultato a cui aspira il DNA-Fairylight è appunto questo: utilizzando nano-particelle colorate e integrate in una sequenza di DNA, gli scienziati contano di scrivere, leggere e decodificare le informazioni presenti in modo più veloce, compatto ed efficiente.
Sfruttare il DNA significa, quindi, poter contare su un supporto di memorizzazione di dati ad alta densità, che può essere usato per innovare la tecnologia del biorilevamento, della bioregistrazione e naturalmente per provare a mandare in pensione le unità di storage tradizionali, con una durata nel tempo quasi illimitata.