giovedì 24 gennaio 2013

Archiviare sul DNA audio, testi e video.

Siamo sempre stati in un certo qual modo abbastanza certi che il digitale e il biologico non potessero fondersi. E' una convinzione così radicata in noi che la notizia apparsa qualche giorno fa, secono cui una equipe di ricercatori dell'EMBL (Nick Goldman e Ewan Birney) hanno archiviati in una minuscola fialetta di DNA i 154 sonetti di Shakespeare, lascia alquanto basiti. Sonetti shakespeariani e 20 secondi del famoso discorso di Martin Luther King, per la precisione. Il progetto è stato pubblicato sulla rivista Nature con il titolo Towards practical, high-capacity, low-maintenance information storage in synthesized DNA
Logicamente, a pensarci, non fa una piega: il DNA non è altro che un trasmettitore di informazioni; testi e audio sono informazioni; perché il DNA non può trasmetterli? 
Più difficle, per noi menti comuni, è capire come ciò sia stato possibile. La risposta è: sviluppando un codice che ovvi i problemi di scrittura e la lettura del DNA che spesso comportano errori, specialmente in presenza di ripetizioni delle lettere del DNA. 
Spiega Birney. 
“Così abbiamo pensato: rompiamo il codice in un sacco di frammenti sovrapposti da entrambe le parti, con informazioni di indicizzazione che mostrano dove si trova ogni frammento nel codice generale, e creiamo uno schema di codifica che non consente ripetizioni. In questo modo, per fallire si dovrebbe avere lo stesso errore su quattro diversi frammenti, evento davvero raro."
Ovvero, il file audio è stato memorizzato come file MP3 e i sonetti come testo ASCII. L'informazione digitale è codificata con bit (punto a, barra blu dell'immagine) e viene convertita in base 3, utilizzando un codice che sostituisce ogni byte con cinque o sei cifre in base 3, detto trit (punto b, barra rossa). Il risultato viene convertito in DNA (punto c, barra verde) sostituendo ciascun trit con uno dei tre nucleotidi che differiscono a quello precedentemente utilizzato (guanina, adenina, timina, citosina), così che non vengano generati molecole (polimeri) identici.
E' così possibile produrre un gran numero di segmenti di 100 basi che si si sovrappongono uno all'altro per 75 basi, ripetendo più volte l'informazione (punto d). L'accoppiamento con segmenti in cui i dati archiviati sono codificati in ordine inverso da una ulteriore garanzia di correttezza della codifica (barra viola). A questo punto vengono aggiunti i codici di indicizzazione (barre gialle) che permettono la decodificazione e ricostruzione dell'intero file.

I dati così memorizzati possono essere recuperati con il sequenziamento del DNA e la ricostruzione dei file originali. 
L'utilizzo futuro di questa nuova tecnica è prevedibile da chiunque. Il tempo necessario per il recupero successivo dei file è, per ora, di due settimane, non poco ma nemmeno molto se si pensa che siamo alla nascita di un nuovo modo rivoluzionario di archiviare informazioni.

Trascrivere informazioni sul DNA non è cosa nuova. Già George Church della Harvard Medical School e il suo team hanno memorizzato sotto forma di DNA parte del libro ReGenesis dello stesso Church (circa 53400 parole) sul tema della "biologia sintetica", 11 immagini in formato di JPG ed un piccolo programma in Javascript. L'esperimento è stato pubblicato dalla rivista Science Magazine

Fonte: Le Scienze
Per una spiegazione più approfondita del DNA e del Sistema Binario, leggete l'articolo di MegaLab Il futuro dell'archiviazione è nel DNA

Nessun commento:

Posta un commento