Dalla struttura della vita alle frontiere della tecnologia fino a giungere ad una oggi inimmaginabile quantità di dati necessaria a supportare anche la più evolutaintelligenza artificiale, questa è la nuova sfida di Microsoft. La nuova sfida nasce dalla constatazione che la necessità globale di archiviazione dati raddoppia ogni anno, basta pensare semplicemente alla quantità di dati archiviati necessaria a far funzionare le performanti ricerche di Google, funzionalitàche fanno intuire gli sviluppi del Web Semantico.

Così è sempre più difficile poter contenere la mole di informazioni necessaria alla nostra vita oggi.

Per questo Microsoft sta pensando di rifarsi alla più antica "struttura vivente" per realizzare una archiviazione dati efficiente in grado per tenere il passo alla crescita di archiviazione e di evitare unaapocalisse nella gestione dei dati.

L'idea di Microsoft

Microsoft sta procedendo ad acquistare milioni di filamenti di DNA, le strutture che memorizzano le informazioni della vita, esplorando le strade per archiviare in modo sorprendente qualsiasi tipo di informazione in quelle strutture. Dal punto di vista teorico il ragionamento ha molti fondamenti.La sequenza del DNA si compone di parole composte da 4 valori (A, C, G, T) che possono realizzare una unica unitàdi memorizzazione che può assumere 15 valori.

Solitamente oggi la tecnologia si basa su un sistema binario in cui ogni unità di memorizzazione è a due valori.

È un po' come passare dalla rappresentazione binaria dei numeri alla esadecimale, molto più efficiente, Infatti in rappresentazione numericadecimalela quantità quindici è data da15 (2 unità di memorizzazione), in binariola stessa quantità è rappresentata da 1111 (quattro unità di rappresentazione), mentre in esadecimalela rappresentazione è semplicemente F (una unità di memorizzazione).

Lo spazio occupato da una tale rappresentazione nella struttura del DNA occupa 2.2-2.6Ångstrom in larghezza e 3.3Ångstrom in lunghezza. Così il DNA può contenere informazioni pari ad un miliardo di terabytes in un solo grammo.

Altro aspetto di rilievo è la persistenza dell'informazione nel tempo, noi riusciamo a rilevare un DNA dopo 2.000 anni, tempo ben maggiore della durata della memorizzazione dei dati sui nostri attuali hard disk, anche se nuove tecnologie si stanno affacciando per avere una durata dell'informazione su supporti diversi pari alla vita stessa del nostro Universo.

Il problema è solo dei costi?

Il problema che immediatamente si pone oggi è il costo dell'utilizzo del DNA. La start up statunitense rilevata da Microsoft dichiaraun costo di 10 centesimi per ogni sequenza di DNA customizzata. In ogni caso anche l'accesso ai dati allo stato attuale è costoso, anche sesi spera di ottenere costi molto più accessibili nel futuro visto il trend perché, in pochi anni, si è andati dal costo dello human genome project,circa 3 miliardi di dollari nei suoi tredici anni di sviluppo, ai costiattuali di una stessa operazione, circa mille dollari.

Microsoft ha dichiarato che già ad oggi tutti i dati archiviati nelle strutture sono stati poi letti correttamente, infatti anche nella cura del cancro sappiamo ricorrere a riprogrammazioni del DNA.

ComunqueDoug Carmean, il partner Microsoft che ha lavorato sulla tecnologia, ha dichiarato che "Siamo ancora lontani anni da un prodotto commercialmente fattibile, ma con i nostri primi test con Twist dimostriamo che in futuro saremo in grado di aumentare notevolmente la densità e la durata della memorizzazione dei dati,"