il computer vivente calcolo molecolare e...

13
MONDO DIGITALE •n.1 - marzo 2010 Biology and computer science — life and computation — are related. I am confident that at their interface great discoveries await those who seek them.Leonard Adleman 1. TRA INFORMATICA E BIOLOGIA S e il ‘900 è stato il secolo della fisica e dell’informatica, il 2000 promette di es- sere il secolo dell’informatica e della biolo- gia (o più in generale delle scienze della vi- ta). È infatti in atto una convergenza tra queste due discipline che vede da un lato l’informatica offrire alla biologia strumenti per gestire e analizzare la crescente massa di dati prodotti grazie a tecnologie come i sequenziatori di DNA o i microarrays, che permettono di verificare e confrontare il li- vello di espressione di migliaia di geni, dal- l’altro la biologia offrire all’informatica me- tafore e strumenti per nuovi paradigmi di calcolo, come le reti neurali, gli algoritmi genetici, ormai ben noti e sviluppati anche in senso applicativo, o il calcolo molecolare basato sul DNA, sulle cellule, sui batteri. Questo articolo si propone di introdurre le principali linee di ricerca e le prospettive del calcolo molecolare, a partire dalle prime idee di Feynman [10] e dalla loro prima con- cretizzazione effettiva, con l’esperimento di Adleman, ampiamente descritto nel terzo paragrafo. Una discussione sulle difficoltà presentate dall’approccio di Adleman è poi il punto di partenza per presentare gli svi- luppi più recenti, che puntano a progettare automi a stati finiti costituiti da una singola molecola in grado ad esempio di rilevare lo stato di salute delle cellule in cui vengono collocati, o ad usare cellule (viventi o artifi- ciali) o colonie di batteri per elaborare informazione in modo controllato. 2. VERSO IL CALCOLO MOLECOLARE Alla fine degli anni ’50 del secolo scorso, quando i computer occupavano ancora inte- re stanze, il fisico Richard Feynman già intui- L’hardware dei calcolatori attuali è basato su circuiti elettronici le cui dimen- sioni si sono rapidamente ridotte, seguendo la “legge di Moore”, ma que- sto trend si scontra ormai con limiti fisici che sembra molto difficile supera- re, mantenendo lo stesso paradigma di computazione. Per questo si stan- no studiando e sperimentando modelli alternativi, in cui il supporto fisico per il calcolo non è più il silicio, ma sono biomolecole, cellule, batteri, con una ricerca interdisciplinare che coinvolge informatici, matematici, biologi, e anche medici, per le possibili applicazioni alla nanomedicina. Giancarlo Mauri IL COMPUTER VIVENTE CALCOLO MOLECOLARE E CELLULARE 3 3.1

Upload: others

Post on 28-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

“Biology and computer science — life andcomputation — are related. I am confidentthat at their interface great discoveries awaitthose who seek them.”

Leonard Adleman

1. TRA INFORMATICAE BIOLOGIA

S e il ‘900 è stato il secolo della fisica edell’informatica, il 2000 promette di es-

sere il secolo dell’informatica e della biolo-gia (o più in generale delle scienze della vi-ta). È infatti in atto una convergenza traqueste due discipline che vede da un latol’informatica offrire alla biologia strumentiper gestire e analizzare la crescente massadi dati prodotti grazie a tecnologie come isequenziatori di DNA o i microarrays, chepermettono di verificare e confrontare il li-vello di espressione di migliaia di geni, dal-l’altro la biologia offrire all’informatica me-tafore e strumenti per nuovi paradigmi dicalcolo, come le reti neurali, gli algoritmigenetici, ormai ben noti e sviluppati anche

in senso applicativo, o il calcolo molecolarebasato sul DNA, sulle cellule, sui batteri.Questo articolo si propone di introdurre leprincipali linee di ricerca e le prospettivedel calcolo molecolare, a partire dalle primeidee di Feynman [10] e dalla loro prima con-cretizzazione effettiva, con l’esperimento diAdleman, ampiamente descritto nel terzoparagrafo. Una discussione sulle difficoltàpresentate dall’approccio di Adleman è poiil punto di partenza per presentare gli svi-luppi più recenti, che puntano a progettareautomi a stati finiti costituiti da una singolamolecola in grado ad esempio di rilevare lostato di salute delle cellule in cui vengonocollocati, o ad usare cellule (viventi o artifi-ciali) o colonie di batteri per elaborareinformazione in modo controllato.

2. VERSO IL CALCOLOMOLECOLARE

Alla fine degli anni ’50 del secolo scorso,quando i computer occupavano ancora inte-re stanze, il fisico Richard Feynman già intui-

L’hardware dei calcolatori attuali è basato su circuiti elettronici le cui dimen-

sioni si sono rapidamente ridotte, seguendo la “legge di Moore”, ma que-

sto trend si scontra ormai con limiti fisici che sembramolto difficile supera-

re,mantenendo lo stesso paradigmadi computazione. Per questo si stan-

no studiando e sperimentando modelli alternativi, in cui il supporto fisico

per il calcolo non è più il silicio, ma sono biomolecole, cellule, batteri, con

una ricerca interdisciplinare che coinvolge informatici, matematici, biologi,

e anchemedici, per le possibili applicazioni alla nanomedicina.

Giancarlo Mauri

IL COMPUTER VIVENTECALCOLO MOLECOLAREE CELLULARE

3

3.1

0

va le potenzialità dei sistemi biologici comemanipolatori d’informazione su scala mole-colare, e prefigurava la costruzione di com-puter sub-microscopici, basati su cellule vi-venti e complessi molecolari:“Le cellule sono straordinariamente piccole,ma sono molto attive: trasformano varie so-stanze, si spostano, si agitano e fanno altrecose meravigliose, tutte su una scala moltopiccola. Ma anche, memorizzano e usanoinformazione. Si consideri la possibilità cheanche noi riusciamo a realizzare un oggettomolto piccolo che faccia ciò che vogliamo –che possiamo costruire un dispositivo cheoperi a quel livello!” [10].L’idea di un computer molecolare viene ri-presa da Vaintsvaig e Liberman nel 1973[26], e ulteriormente sviluppata da Conrad,che svolge ricerche approfondite sulla pos-

sibilità di elaborare informazioni conmacro-molecole, come le proteine [7].Un significativo passo avanti, anche se soloteorico, è dovuto a Tom Head, che nel1987definisce i sistemi di accoppiamento (spli-cing systems), un modello matematico cheformalizza l’azione degli enzimi di restrizio-ne sul DNA (riquadro 1) in termini di opera-zioni su linguaggi formali [14].Un enzima di restrizione è una proteina chetaglia una doppia elica di DNA in corrispon-denza di particolari sottosequenze, specifi-che per ogni enzima.Per esempio, i due enzimi TaqI e SciNI taglia-no il DNA in corrispondenza, rispettivamen-te, delle sottosequenze:

5'TCGA3' e 5'GCGC3'3'AGCT5' 3'CGCG5'

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

4

RIQUADRO 1 - La struttura del DNAIl DNA è il depositario dell’informazione genetica nelle cellule viventi, ed è costituito da due filamenti che corrono parallelamente, for-mando una struttura spaziale a doppia elica. Ciascun filamento è una sequenza di nucleotidi di quattro diversi tipi, ciascuno dei qua-li è formato da uno zucchero (desossiribosio) cui sono legati un gruppo fosfato e una base azotata. Ogni nucleotide ha due estremitàlibere, indicate rispettivamente con 3' e 5' (corrispondono al terzo e al quinto dei cinque atomi di carbonio del desossiribosio) che gliconsentono di legarsi ad altri nucleotidi (3' si lega con 5'), formando in tal modo la struttura portante centrale (backbone) del fila-mento. I nucleotidi differiscono l’uno dall’altro solo per la base azotata, che può essere adenina, guanina, citosina o timina (indicaterispettivamente con le lettere A, G, C e T). Una sequenza singola di DNA può quindi essere vista come una parola su un alfabeto diquattro lettere {A,C,G,T}, orientata per convenzione da 5' a 3'.Una proprietà fondamentale dei nucleotidi è la complementarità di Watson-Crick: A è complementare a T, G è complementare a C, e due catene singole diDNA con orientamento opposto si legano tra loro grazie a legami a idrogenotra basi complementari. In questo modo, formano una doppia elica stabile,con le catene di desossiribosio all’esterno e le coppie di basi legate all’interno(Figura A). Per esempio, la sequenza 5' –GGGGGAA–3' si legherà con5'–TTCCCCC–3' , formando la doppia elica

5' – GGGGGAA – 3'3' – CCCCCTT – 5'

Sulle sequenze di DNA si possono eseguire diverse operazioni di modifica,attraverso l’azione di specifici enzimi. Le operazioni più interessanti per leapplicazioni al calcolo sono:Sintesi di una specifica sequenza.Annealing (accoppiamento): due sequenze singole complementari si lega-no, formando una doppia elica.Melting: una doppia elica si scinde nelle due sequenze componenti (peresempio, per riscaldamento).Amplificazione conPCR: permettedi produrrepiù copiedi unasequenzadata.Separazione di sequenze sulla base della loro lunghezza.Estrazione delle sequenze che contengono (o non contengono) una datasottosequenza.Taglio: grazie agli enzimi di restrizione, è possibile tagliare sequenze doppiedi DNA in corrispondenza di particolari siti, detti siti di restrizione; ogni enzi-ma riconosce univocamente un sito specifico, in cui opera il taglio.L’RNA è un’altra molecola fondamentale per i processi cellulari, e in particolare ha la funzione di rendere disponibile l’informazionecodificata nel DNA per sintetizzare proteine. Rispetto al DNA, si presenta in catene singole il cui scheletro è formato da molecole diribosio anziché di desossiribosio, cui si legano le basi A, C, G, mentre la timina (T) è sostituita dall’uracile (U).

A - Struttura della doppia elica del DNA

Se consideriamo le due sequenze doppie:

5'CCCCCTCGACCCCC3'3'GGGGGAGCTGGGGG5'e5'AAAAAGCGCAAAAA3'3'TTTTTCGCGTTTTT5'

queste verranno tagliate dagli enzimi, produ-cendo quattro nuove sequenze, con gli estre-mi non allineati:

5'CCCCCT CGACCCCC3' 5'AAAAAG CGCAAAAA3'3'GGGGGAGC TGGGGG5' 3'TTTTTCGC GTTTTT5'

Si noti che le due basi libere della prima se-quenza (G e C) sono complementari alle basilibere dell’ultima (C e G), e lo stesso accadeper la seconda e la terza sequenza. La ag-giunta di ligasi, l’enzima che induce la forma-zione di legami tra basi complementari, aquesto punto può dare come risultato la for-mazione di due sequenze con le parti scam-biate, rispetto a quelle di partenza:

5' CCCCCTCGCAAAAA3'5'AAAAAGCGACCCCC3'3' GGGGGAGCGTTTTT5'3'TTTTTCGCTGGGGG5'

Questo meccanismo di ricombinazione delDNA è alla base delle biotecnologie, perchéconsente di modificare il materiale geneticoin modo controllato.Dalpuntodi vistadell’informaticapossiamo leg-gerlo in un altro modo: ogni sequenza di DNArappresenta dati codificati con un alfabeto diquattro lettere, e l’azionediunenzimadi restri-zione corrisponde ad una operazione effettua-tasuquesti dati. Partendodaquestebasi,Headha sviluppato unmodello formale di computa-zioneche, agrandi linee, funzionacomesegue:1. si assegnanoun insieme inizialeD0 di parolesull’alfabeto di quattro lettere Σ = {A, T, G, C},che rappresentano i dati di ingresso, e un in-sieme di operazioni di ricombinazione dellaforma a#b$c#d, dove anche a, b, c, d sono pa-role suΣ;2. si applicano le regole in questo modo: seD0 contiene le parole w1abw2 e v1cdv2, l’ope-razione a#b$c#d le taglia e le ricombina, pro-ducendo le parole w1adv2 e v1cbw2;3. si ottiene così un nuovo insieme D1 su cuisi ripete il procedimento, e così via, fino ad

ottenere un insiemeDk che non può più esse-re trasformato.Scegliendo opportunamente i dati iniziali e leregole di trasformazione, è possibile definiresistemi di splicing equivalenti come potenzacomputazionale a macchine che stanno ai di-versi livelli di potenza nella gerarchia dei mo-delli di computazione tradizionali, dagli auto-mi a stati finiti alle macchine di Turing [14].Fin qui abbiamo idee interessanti, e risultatiteorici promettenti per quanto riguarda lapossibilità di usare sequenze di DNAper codi-ficare informazioni ed enzimi per simularecomputazioni, mamanca ancora una prova direalizzabilità pratica, che arriverà solo con l’e-sperimento di Leonard Adleman nel 1994 [1].

3. L’ESPERIMENTO DI ADLEMAN

È noto che i problemi di elaborazione del-l’informazione possono essere classificati inbase alla loro “complessità computaziona-le”, cioè alla quantità di risorse (tipicamentetempo di calcolo) necessarie per risolverli, infunzione della dimensione dei dati di input. Iproblemi NP-completi (riquadro 2) sono tra i

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

5

0

0

0

1

RIQUADRO 2 - Problemi P, NP e NP-completiUn problema di elaborazione dati è detto di tipo P (Polinomiale) se può es-sere risolto con un algoritmo il cui “tempo di esecuzione” cresce al più co-me un polinomio di grado k fissato rispetto al numero n di bit necessari percodificare l’input. I problemi in P sono considerati “feasible”, o effettiva-mente risolubili, nel senso che anche per dati di dimensioni notevoli il ri-sultato può essere ottenuto in tempi ragionevoli, mentre problemi non inP, pur teoricamente risolubili in modo algoritmico, non lo sono in pratica,dato che per input di dimensioni realistiche trovare una soluzione esattarichiederebbe tempi di calcolo che raggiungono rapidamente i miliardi dianni (e poco importa la potenza della macchina utilizzata).Tra i problemi che le nostre conoscenze attuali non ci consentono di collo-care in P (algoritmi polinomiali per questi problemi non sono stati trovatifinora, ma potrebbero essere trovati in futuro), hanno particolare impor-tanza i problemi NP. Un problema appartiene alla classe NP (PolinomialeNon-deterministico) se esiste un algoritmo che permette in tempo polino-miale di verificare se una particolare soluzione, scelta (magari da un indo-vino) tra un numero di soluzioni possibili che cresce in modo esponenzialeè effettivamente una soluzione.La classe NP contiene molti problemi di grande interesse applicativo, come il“problema del commesso viaggiatore” o il “problema dello zaino”, e rappre-senta il limite della nostra capacità di risolvere in pratica problemi algoritmici.Ovviamente P è incluso in NP; resta da stabilire se vale anche il viceversa, ov-vero se le due classi coincidono: questo è noto comeproblema “P = NP ?”, edè il più importante problema aperto nell’informatica teorica.Purtroppo oltre quarant’anni di ricerche hanno portato alla convinzione ge-neralizzata, anche se non alla dimostrazione, che valga invece P ≠ NP, cioèche ci siano problemi in NP non risolubili in tempo polinomiale, come i pro-blemi NP-completi, che sono i più difficili tra i problemi in NP.

0

più difficili e tra questi Adleman ha scelto ilProblema del Cammino Hamiltoniano Diretto(DHPP), analogo al Problema del CommessoViaggiatore (TSP):

Nel lavoro pubblicato su Science [1], Adlemanmostra comesia possibile risolvere unapicco-la istanza di DHPP, rappresentata dal grafo

nella figura 1, manipolando in laboratoriomo-lecole di DNA.L’idea di base è semplice: si tratta di codifica-re opportunamente i dati con biomolecole(DNA in questo esperimento, ma potrebberoessere anche RNA o proteine) anziché con se-quenze di cifre binarie, e manipolare questemolecole usando tecniche comunemente di-sponibili nei laboratori di biologiamolecolare,così da simulare operazioni che selezionanola soluzione del problema, se esiste.L’algoritmo molecolare di Adlemann si svi-luppa nei seguenti passi:1. Codifica del grafo.Un vertice n viene codificato con una sequen-za c(n) di 20 nucleotidi, indicati con le lettereA, C, G, T, generata casualmente. Per esem-pio, possiamo porre:

c(1) = AATTGTGCGAAATTCCGGAAc(2) = CCGTTAAGGCTATAAGGGTA

Un arco da n am, che indicheremo con (n,m),viene codificato con una sequenza c(n, m) di20 nucleotidi ottenuta concatenando la se-condametà di c(n) con la primametà di c(m).Nel nostro esempio avremo:

c(1, 2) = AATTCCGGAACCGTTAAGGC

Nella figura 2 è illustrata graficamente la co-difica del grafo di figura 1, usando colori di-versi per rappresentare le codifiche dei verti-ci, suddivise in due metà, e le conseguenticodifiche degli archi.2. Generazione di percorsi sul grafo.50pmol (circa3.1013molecole) di ciascunadel-le sequenze codificanti gli archi vengonomes-se in soluzione con la stessa quantità di se-quenze complementari alle codifiche dei verti-ci, in condizioni di reazione. In tal modo, ognivertice “aggancia” due archi in parte comple-mentari a ciascuna delle sue due metà, e cosìvia, formando per ligasi molecole doppie cherappresentano cammini orientati nel grafo.Nella figura 3 sono rappresentati un camminononhamiltoniano e unohamiltoniano.3. Amplificazione dei cammini che inizianocon il nodo P e terminano nel nodo A.Usando la tecnica PCR (Polimerase ChainReaction – vedi Nomenclatura), i camminiche iniziano con P e terminano con A vengo-

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

6

dato un grafo orientato G con due vertici specifici“Partenza” (P) e “Arrivo” (A), stabilire se in essoesiste un camminohamiltoniano, cioè un cammi-no da P ad A che passa una ed una sola volta perciascuno degli altri vertici.

FIGURA 2La codifica del grafo nell’esperimento di Adleman

FIGURA 1Il grafo dell’esperimento di Adleman

3

1 0

6

5

4

2

A

P

no enormemente amplificati, così da renderetrascurabile la percentuale degli altri cammi-ni presenti in soluzione.4. Selezione dei cammini che passano esat-tamente per sette vertici.Questi cammini sono formati da 140 nucleo-tidi, e possono essere selezionati immergen-do la soluzione ottenuta al passo precedentein un gel di agarosio sottoposto ad un campoelettrico. La diversa velocità di spostamentoconsente di isolare le molecole il cui pesomolecolare corrisponde a 140 nucleotidi, eli-minando le più corte e le più lunghe.5. Selezione dei percorsi che passano per nvertici differenti.Questo passo si basa sulla purificazione peraffinità: con questa tecnica si comincia a sele-zionare le sequenze che contengono peresempio, il vertice 2, e si continua la selezionesui frammenti rimasti ripetendo il procedimen-to per tutti i vertici del grafo. In questomodo siè sicuri che il risultato finale sarà costituito daisoli frammenti che contengono una e una solavolta le sequenze codificanti ogni vertice.6. Lettura del risultato.Ancora con PCR, si amplificano le eventualimolecole rimaste, che codificano camminihamiltoniani nel grafo.

4. I LIMITI DEL CALCOLOBASATO SUL DNA

La caratteristica principale del processo dicalcolo sopra descritto è il suo altissimo pa-rallelismo: la costruzione dei cammini nelgrafo (passo 2), che è il passo di calcolo veroe proprio, è ottenuta attraverso un numero direazioni chimiche dell’ordine del numero dimolecole di DNA presenti, che avvengono inparallelo, come se fossero realizzate da al-trettanti processori. La velocità effettiva è dicirca 1.2 × 1018 operazioni al secondo, cioè ol-tre un milione di volte superiore a quella deipiù potenti supercomputer. Altri notevoli van-taggi teorici rispetto ai dispositivi elettronicitradizionali sono l’efficienza energetica, datoche un Joule basta per 2 · 1019 operazioni con-tro 109, e l’altissima densità di informazione,pari a circa 1 bit per nanometro cubo, mentrei dispositivi di memorizzazione attuali arriva-no a 1 bit per 1010 nm3. Ma queste sono, ap-punto, valutazioni teoriche, ricavate sulla ba-

se della soluzione di una istanza molto sem-plice di DHPP. In realtà, l’approccio di Adle-man presenta molti limiti, sia teorici che pra-tici, e le difficoltà da superare prima di arriva-re a sfruttare in pratica e su problemi signifi-cativi i principi dimostrati da Adleman sonoancoramoltissime.I problemi teorici riguardano anzitutto la ver-satilità dei computer basati sul DNA e la lorocapacità di trattare efficientemente un’ampiavarietà di problemi computazionali. Infatti laprocedura sopra descritta non corrisponde adunmodello di calcolo generale,ma è specificaper DHPP. Le domande che un informaticoteorico si pone a questo punto sono due:1. Il modello di calcolo basato sul DNA è com-putazionalmente completo nel senso chequalunque funzione computabile può esserecalcolata attraverso manipolazioni del DNA?2. Esiste un sistema di calcolo universale ba-sato sul DNA, cioè un sistema che, data la co-difica di una qualunque funzione computabi-le (in altre parole, un programma) sia in gra-do di calcolarla (cioè di eseguire il program-ma) per qualunque argomento?Una prima generalizzazione è stata propostada Lipton [17], che ha definito un modello for-male di calcolomolecolare applicabile a tutti iproblemi NP-completi. Il principale contributodi Lipton consiste in un metodo uniforme percodificare sequenze binarie arbitrarie con se-quenze di DNA e in una sorta di linguaggio diprogrammazioneper computermolecolari ba-sato sulle operazioni merge (mettere nellastessa soluzionemolecole che codificano datidiversi), separate (separare molecole checontengonoonon contengonoparticolari sot-

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

7

0

0

0

1

FIGURA 3Esempi di camminigenerati

0

tosequenze), detect (leggere l’output verifi-cando quali molecole sono presenti nella so-luzione finale). Sono poi stati proposti altrimodelli teorici di calcolo basato sul DNA e nesono state studiate le proprietà e la potenzacomputazionale, mostrando che diversi insie-mi di bio-operazioni raggiungono la potenzadellemacchine di Turing. Questi risultati (oltreai risultati di Head [14] già citati) provano checomputer molecolari “general purpose” sonoin linea di principio realizzabili.I problemi pratici riguardano soprattutto lascalabilità dell’approccio e la sua precisione.Infatti il procedimento funzionaperché l’istan-za di DHPP considerata è molto piccola. Peristanzedi dimensioni significative per le appli-cazioni la situazione è ben diversa. Per esem-pio, si è stimato che per un grafo con 200 no-di, per rappresentare tutti i possibili camminioccorrerebbe un numero di molecole di DNAla cuimassa supererebbequella della terra: lacrescita esponenziale non perdona!Inoltre, le reazioni chimiche che realizzano lacomputazione, oltre ad essere sensibili al-l’ambiente (temperatura, acidità), presentanoun certo margine di errore che, se pur ridotto,deve essere preso in considerazione. Visti inumeri in gioco (213 – 214 molecole già peristanzemolto semplici), unapercentuale di unerrore su un milione si traduce in un numerototale di errori tra i dieci e i cento milioni! I ri-schi di errore aumentano all’aumentare dellalunghezza delle sequenze di codifica, perchésequenzemolto lunghepotrebbero conteneresottosequenze tra loro complementari, che silegano tra loro rendendo così inutilizzabile lamolecola ai fini del calcolo (è l’equivalente deldefault di un processore), come nell’esempioriportato nella figura 4.

Per questo motivo è importante realizzare li-brerie di sequenze di DNA progettate inmododa ridurre questo rischio, al cui interno sce-gliere le sequenze di codifica [9].Infine, anche se il passo di calcolo vero e pro-prio, il passo 2, avviene in tempo brevissimograzie al parallelismo, tutte le operazioni col-laterali, per la codifica dei dati, il loro inseri-mento (che significa mettere molecole diDNA in soluzione in una provetta), la letturadei risultati sono molto lente, con tempi del-l’ordine della settimana, e non sembra si pos-sano significativamente migliorare, anche sesono stati fatti tentativi per automatizzare lecomputazioni molecolari usando, per esem-pio, la microfluidica.Sempre per superare queste difficoltà, si èsperimentato l’uso di molecole alternative alDNA, come l’RNA (acido ribonucleico) o leproteine, che hannomaggior flessibilità strut-turale e funzionale, oppure si sono fatti espe-rimenti col DNAbloccato su una superficie an-ziché in soluzione, senza però arrivare a risul-tati decisivi.Una descrizione dettagliata dell’esperimentodi Adleman è stata pubblicata suMondo Digi-tale nel 2006 [18]. Per una trattazione ap-profondita del calcolo basato sul DNA ci sipuò riferire al libro di Amos [2] o alla rassegnadi Lila Kari [15].

5. OLTRE L’ESPERIMENTODI ADLEMAN

Ovviamente la ricerca successiva ha portato anotevolimiglioramenti rispetto all’esperimen-to di Adleman, che hanno consentito di tratta-re con successo problemi più sofisticati, comeuna istanza del problema 3-SAT con 20 varia-bili, o la rottura del sistema crittografico DES.Tuttavia è opinione comune tra i ricercatoriche non sono i problemi NP-completi il terre-no su cui il calcolo basato sul DNA può com-petere con la tecnologia basata sul silicio:“È stupido tentare di predire il futuro della tec-nologia, ma può essere che l’applicazioneidealedel calcolobasato sulDNAnonsia la so-luzione di grandi problemi NP completi” [20].Ciò non significa che sia tutto da buttare. Alcontrario, pur con tutti i suoi limiti, l’esperi-mento di Adleman ha rappresentato un fortis-simo stimolo per la ricerca sul calcolo moleco-

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

8

FIGURA 4Auto-accoppiamento di una sequenza singola di DNA

lare, ed ha aperto prospettive interessanti so-prattutto in connessione con le nanoscienze,fornendo un punto di vista computazionale sumolti loro aspetti, tra cui l’autoassemblaggiodellenanostrutture, e con labiologiae lamedi-cina, con potenziali applicazioni al progetto difarmaci intelligenti. Gli orizzonti della ricercasul calcolo molecolare si sono così enorme-mente allargati, dando origine ad una nuovadisciplina a cavallo tra matematica, informati-ca, biologiaenanoscienzechepuntaacapire ilruolo dell’informazione e della sua manipola-zione nei processi naturali: ruolo che, ripren-dendouna ideaavanzatadaZuseeFredkinnel1960, potrebbe essere ancor più fondamenta-le di quello dellamateria e dell’energia. La tesidi ZuseeFredkin sostenevache l’interouniver-so è un qualche tipo di dispositivo computa-zionale, una sorta di gigantesco automa cellu-lare che continuamente aggiorna le sue rego-le; più recentemente, si è ipotizzato che l’uni-verso sia un computer quantistico che calcolase stesso e il suo comportamento.In questi scenari, l’attenzione non è tanto sulcalcolo, quanto sulla capacità di controllo a li-vello molecolare. La programmazione mole-colare si propone di definire unametodologiadi programmazione sistematica per controlla-re le reazioni chimiche tra biomolecole, inmo-do da poter costruire nanostrutture biochimi-che progettate a tavolino.

6. NANOMACCHINE BASATESUL DNA

Il DNA, grazie alla specificità delle interazionitra nucleotidi complementari, è il materialeideale per queste costruzioni, e le interazionitra sequenze corte di DNA possono esserecontrollate in modo affidabile attraverso laprogettazione della sequenza di basi. Nell’ul-timo decennio, gli esperimenti di costruzionedi nanostrutture e nanomacchine basate sulDNA sono stati numerosissimi; una interes-sante rassegna è riportata in [5].Uno dei più attivi ricercatori in questo settoreèNedSeeman, chenel suo laboratorio ha sin-tetizzato straordinarie strutture di DNA au-toassemblate comecubi, ottaedri troncati, cri-stalli bi- e tri-dimensionali di DNA [25]. Altri ri-cercatori hanno realizzato triangoli di Sierpin-ski [23], o nanostrutture complesse in grado

di eseguire calcoli come il conteggio di strin-ghebinarie o lo XORbit a bit [19]. Unmodopersfruttare questro controllo architetturalestraordinariamente preciso è l’uso di modellidi DNA autoassemblati per posizionare mole-cole funzionali. Si possono così realizzare cir-cuiti elettronici molecolari, dispositivi ottici ereti enzimatiche.Una immediataestensionedi queste ricercheèil passaggiodastrutturediDNAstaticheamac-chine,o“nanobots”, ingradodimuoversi. IlDNAèmenoadattoper la costruzionedi struttureat-tive rispetto alle proteine o all’RNA, che hannounamaggiore versatilità strutturalee catalitica.Lamaggior ricchezzadi interazioni e legami chesipossono instaurare inunamolecoladiRNAri-spetto al DNA, in cui il legame nettamente pre-valenteèquellodovutoalla complementaritàdiWatsoneCrick, permette la formazionedi com-plesse strutture bi- e tri-dimensionali. Attual-mente i biochimici non sono in grado di con-trollarequeste interazioni finoadottenerestrut-ture tridimensionali programmate. Si usaquin-di il DNAperché la semplicità della sua struttu-raedelle interazioni ci permettedi controllarnemeglio l’assemblaggio.Lenanostruttureattivepiù semplici sono inter-ruttori o molecole che possono essere fattepassaredall’unaall’altradiduediverseconfor-mazioni. Le “pinzette” realizzate dal gruppo diYurke sono un interessante esempio di nano-strutturadiquesto tipo.Sonocostituitedadue“braccia” di DNA in doppia sequenza, unite dauna “cerniera” flessibile in sequenza singola.La pinzetta può assumere una configurazionechiusa ed una aperta, e il passaggio dall’unaall’altra viene ottenuto attraverso due diversemolecole di DNA, corrispondenti rispettiva-mente ai comandi “apri” e “chiudi”.Altri esperimenti hanno riguardato la costru-zione di circuiti logici basati sul DNA, o di ribo-zimi (sonomolecole di RNA in grado di cataliz-zare reazioni che modificano altre molecole, oanche il ribozima stesso) che possono essereusati per eseguire operazioni logichee sempli-ci computazioni [22], oppuremotori molecola-ri e “nanobots” che simuovono lungopercorsiautoassemblati, e si procurano l’energia ne-cessaria catalizzando reazioni chimiche [5].Inqueste strutture, il passaggiodaunaconfor-mazione all’altra viene indotto da cambiamen-ti di temperatura o di acidità, o dal legame con

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

9

0

0

0

1

0

una molecola di segnalazione, in genere unasequenza singola di DNA. Un possibile utilizzoè quindi come sensori molecolari, in grado dimisurare grado di acidità, temperatura, pre-senza o assenza di piccole molecole o di pro-teine direttamente all’interno della cellula, da-to che il DNA è un supporto computazionaleovviamente biocompatibile. Questo apre, an-che se non a breve termine, una nicchia appli-cativa legata allamedicina che nonpuòesserecerto coperta da chip al silicio, con la possibi-lità di eseguirediagnosi, di controllaredisposi-tivi terapeutici, di trasportare farmaci, di atti-vareunprocessocheporti allamorteprogram-mata della cellula nel caso questa risulti irri-mediabilmente danneggiata.Lavorando in questa direzione, il gruppo diEhud Shapiro ha realizzato un automa a statifiniti costituito da biomolecole [5]. Grazie aduna serie di regoledi transizione, realizzate at-traverso enzimi che tagliano e ricombinano ilDNA, lamacchina cambia il proprio stato inter-no in funzionedello stato corrente, rappresen-tato da unamolecola di DNA, e dell’input, rap-presentato dalla presenza o meno di partico-lari molecole di mRNA, fino a raggiungere unostato finale, in corrispondenza del quale rila-scia un output, pure rappresentato da unadoppia elica di DNA. L’mRNA (RNAmessagge-ro) è la molecola di collegamento tra un gene,codificato nel DNA, e la proteina corrispon-dente: in particolari condizioni, il gene “siesprime”, producendo l’mRNA, cheasuavoltaesce dal nucleo e viene “tradotto” in proteinadai ribosomi, sulla base di un codice precisoche fa corrispondere ad ogni sequenza di trenucleotidi uno dei venti aminoacidi che costi-tuiscono le proteine. Malattie come i tumoridipendono da alterazioni di questo meccani-smocheportanoaprodurreproteine “sbaglia-te”, o a non produrre proteine essenziali. Unautoma come quello sopra descritto potrebberilevare e segnalare all’esterno queste altera-zioni, e anche cercare di correggerle. L’obietti-vo a lungo termine è quindi la realizzazione dimacchinemolecolari da usare come “sentinel-le” all’interno dell’organismo, in grado di rico-noscere cellule o tessuti danneggiati, e all’oc-correnza di rilasciare molecole per ripararli. Siaprono così importanti prospettive in terminidi terapie innovative e personalizzate e sintesidi farmaci “intelligenti”.

7. CALCOLARE CON LE CELLULE

Quanto sono realistiche queste prospettive?Per rispondere a questa domanda dobbiamotornare all’inizio, alla visione di Feynman: lacellula come sistema di elaborazione del-l’informazione. Il punto è che gli esperimentisopra ricordati sono stati effettuati in vitro,quindi in un ambiente assolutamente control-lato e in presenza solo dellemolecole coinvol-te nell’esperimento. Una volta inserite in unacellula, le nanomacchine si troverebbero in unambiente molto più complesso, in cui avven-gono in parallelo migliaia di processi biochi-mici che interferiscono e si influenzano l’unl’altro all’interno di complesse reti regolato-rie. Occorre allora capire come funzionanoqueste reti regolatorie e trovare strumenti perimbrigliarle e piegarle ai nostri scopi, sia dicalcolo che di controllo: il calcolo cellulare[12] ha l’obiettivo di “imbrigliare” i processiche avvengono nelle e tra le cellule viventi.Qui l’informatica si interseca da un lato con labiologia sistemica [11], che cerca di compren-deregli organismibiologici come reti di intera-zioni, dall’altro con la biologia sintetica [3],che ha comeobiettivo l’ingegnerizzazione e lacostruzione di sistemi biologici artificiali.Una prima linea di ricerca che emerge da que-ste considerazioni riguarda lo studio dei mec-canismi cellulari per astrarne e formalizzarnegli aspetti significativi dal punto di vista algo-ritmico e di controllo dei processi concorrenti:il numero di processi concorrenti che una cel-lula è in grado di gestire al suo interno è digran lunga superiore a quelli gestiti da unqualunque sistema operativo!I sistemi a membrane [21], proposti da Geor-ge Paun nel 1998, sonomodelli di calcolo pa-rallelo e distribuito definiti a partire dallastruttura e dal funzionamento delle cellule vi-venti, e dalmodo in cui queste si organizzanoin tessuti o in strutture di ordine superiore.Una cellula è costituita anzitutto da unamembrana, che la separa dall’ambienteesterno, che contiene molecole di vario ge-nere ed altre membrane, e così via. Questastruttura gerarchica a compartimenti è laprincipale caratteristica delle cellule che vie-ne astratta nei sistemi a membrane. Perquanto riguarda gli aspetti dinamici, di evo-luzione delle cellule, all’interno di ogni mem-brana avvengono reazioni chimiche che ne

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

10

modificano il contenuto; inoltre alcunemole-cole possono attraversare le membrane,muovendosi verso l’esterno o verso l’interno,realizzando in tal modo una forma di comuni-cazione dell’informazione, e si possono for-mare nuove membrane, mentre membraneesistenti possono dissolversi o duplicarsi pergemmazione.Astraendo questa struttura, definiamo un si-stema a membrane generico come una strut-tura gerarchica di regioni o compartimenti,delimitati da membrane individuate univoca-mente da una etichetta, e contenuti in unamembrana esterna, chiamatapelle, che sepa-ra il sistema dall’ambiente esterno. Ognimembrana contiene un multiinsieme di og-getti che evolvono in base a regole di evolu-zione applicate non deterministicamente econ massimo parallelismo. Gli oggetti posso-no essere anche spostati da una regione allaregione immediatamente più esterna (out) oad una delle regioni interne (in). Le regolehanno quindi la forma:

c→ (d, here)

che ci dice che l’oggetto c viene trasformatonell’oggetto d che rimane nella stessa mem-brana, o, con significato facilmente ricavabile,

ab→ (cd, here)c→ (d, out)c→ (d, in)

La figura 5 visualizza un esempio di sistemaamembrane.L’applicazione delle regole di evoluzione de-termina la transizionedel sistemadaunostatoall’altro. Una computazione parte da una con-figurazione di input assegnata e procede ese-guendo ad ogni passo tutte le regole che èpossibile eseguire (massimo parallelismo) inogni membrana. Il risultato della computazio-ne, quando questa si arresta perché non è piùpossibile applicare nessuna regola, può esse-re letto in unamembrana di outputassegnata.I sistemi a membrane sono stati ampiamentestudiati negli ultimi anni, e ne sono state defi-nite diverse varianti; ad esempio, sono statiproposti diversi meccanismi formali che riflet-tono il modo selettivo in cui lemembrane bio-logiche permettono alle molecole di attraver-sarle. Per molte di queste varianti si è dimo-strata l’equivalenza computazionale con lemacchine di Turing. Inoltre, come nell’esperi-mento di Adleman, si può sfruttare il paralleli-smo per accelerare le computazioni. In parti-colare, se si aggiungono regole che permetto-nodi dividere oduplicare lemembrane, è faci-le dimostrare che si possono risolvere proble-mi NP-completi in tempo lineare, naturalmen-te al prezzo di una crescita esponenziale delnumero di membrane.Lasituazionenonèmoltodiversadaquelladelcalcolo basato sul DNA prima dell’esperimen-to di Adleman: abbiamo le idee e i risultati teo-rici, mamanca la prova della realizzabilità pra-

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

11

0

0

0

1

FIGURA 5Un esempiodi sistemaa membrane

0

tica di queste idee. Per questo, si stanno se-guendodiverse stradeper realizzare computa-zioni “in vivo”, progettandocellule sinteticheocercando di utilizzare colonie di batteri comesubstrati computazionali, estendendo il lorocomportamento attraverso l’inserimento dicircuiti logici biochimici che controllino i pro-cessi intra- ed inter-cellulari.

8. CALCOLARE CON I BATTERI

I batteri sono organismi unicellulari piuttostosemplici, e costituiscono un buon punto dipartenza per studiare il funzionamento dellacellula dal punto di vista dell’elaborazionedell’informazione.Lo studio dei Ciliati, un gruppo di circa 10.000diverse specie di batteri che sono tra i più anti-chi organismi noti, ha portato a scoprire che ilprocesso di decodifica dei geni che essi adot-tano presenta molte analogie con l’algoritmodi Adleman, e in alcuni passaggi usa meccani-smi molto simili ai puntatori nei linguaggi diprogrammazione.I ciliati hanno due tipi di nucleo: un macronu-cleoattivo (soma), chegoverna losviluppocel-lulare, e un micronucleo funzionalmente iner-te, che contribuisce solo alla riproduzione ses-suale. Il micronucleo contiene una versione“criptata” del DNA del macronucleo, ottenuta“ingarbugliando” frammenti dei geni funzio-nali delmacronucleo conoperazioni di permu-tazione, inversione e inclusione di sequenzenon codificanti. Nel processo di riproduzionesessuale i ciliati si scambiano informazionege-netica e formanonuovimicronuclei, cheusanoin tempo reale per assemblare i macronucleiche servono per la loro sopravvivenza. Questoprocesso di riorganizzazione e assemblaggiorichiede di riconoscere ed eliminare i fram-menti non codificanti di DNA, e quindi di porrenell’ordine corretto i frammenti codificanti, edè affascinante sia dal punto di vista biologicoche da quello computazionale. Dal punto di vi-sta computazionale, la struttura dati implicitanel DNA del micronucleo può essere definitacome una lista a puntatori, e la ricostruzionedel DNA del macronucleo corrisponde a tuttigli effetti a risolvere un problema NP-comple-to. Dal punto di vista della biologia, gli sforzicomuni di informatici e biologi hanno portatoad una ipotesi plausibile (già parzialmente so-

stenuta da alcuni dati sperimentali) sul“bioware” che implementa il processo dell’as-semblaggio dei geni nei ciliati, basato sul nuo-vo concetto di ricombinazione guidata da unmodello [22].Un secondo approccio per realizzare dispositi-vi di calcolo sfruttando i batteri è suggeritodalla biologia sistemica, che vede il genomadiun organismo come una rete di componenticomputazionali interagenti, simili a porte logi-che. Questo punto di vista, oltre a fornire aibiologi un’analogia utile a comprendere me-glio i meccanismi della vita, ha ispirato ricer-che nella direzione della reingegnerizzazionedella circuiteria geneticaemetabolicaallo sco-podi eseguire calcoli secondoprogrammidefi-niti dall’uomo.Consideriamo ad esempio il cosiddetto “ope-rone Lac”, costituito da tre geni con un pro-motore comune che nell’Escherichia coli pro-ducono un gruppo di proteine che consento-no di metabolizzare lo zucchero lattosio. Perragioni di efficienza, queste proteine devonoessere prodotte solo se nell’ambiente è pre-sente lattosio, altrimenti si avrebbe una inuti-le dissipazione delle risorse della cellula.Inoltre, se è presente anche glucosio, è prefe-ribile consumarlo prima del lattosio, perché èpiù facile da metabolizzare. La cellula contie-ne quindi una rete regolatoria che consentedi attivare l’operone Lac solo se c’è lattosio(L) e non c’è glucosio (G): di fatto, abbiamouna porta logica che calcola la funzione boo-leana (L AND (NOT G)), poiché dà in output 1(Lac attivo) se e solo se L= 1 (lattosio presen-te) e G = 0 (glucosio assente).La comprensione di questo meccanismo aprelaviaall’implementazionedi circuiti logici in vi-vo. Anzitutto, si seleziona un insieme di geniche rappresentano le porte logiche, assicuran-do che le dipendenze tra geni riflettano in mo-do corretto la connettività del circuito. Questigeni sono poi inseriti - ad esempio - in un bat-terio, usando gli strumenti standard della bio-logiamolecolare. Questa fase di inserimento èla più costosa, in termini di tempo, dell’interoprocesso sperimentale, in quanto l’inserimen-toanchediunsologenepuòessereproblema-tico. Tuttavia, una volta che l’intero insieme digeni è presente in una colonia di batteri abbia-mo a disposizione una quantità illimitata di“hardware biologico”. Gli ingressi del circuito

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

12

sono rappresentati dalla presenza o assenzanell’ambientedei vari composti da cuidipendel’espressione dei geni che rappresentano leporte logiche del primo livello. In seguito, losviluppo della cellula e i complessi processi diregolazione sottostanti simulano il circuito,senza bisogno di ulteriori interventi umani.Nell’ultimo decennio sono stati riportati inletteratura diversi esperimenti di laboratoriocon l’obiettivo di realizzare in vivo porte logi-che AND e OR o circuiti più complessi. Peresempio, in [11] Gardner, Cantor e Collins de-scrivono la realizzazione di un interruttoregenetico costituito da una rete regolatoria digeni bistabile sintetica inserita in EscherichiaColi. La transizione da uno degli stati stabiliall’altro è indotta chimicamente o termica-mente, con una soglia di transizione presso-ché ideale.Questo ha applicazioni ovvie alla realizzazio-ne di dispositivi di memoriamolecolari. Sem-pre in E. Coli, Elowitz e Leibler hanno realizza-to una rete sintetica di regolatori genici cheimplementa un oscillatore. La rete avvia pe-riodicamente la sintesi di una proteina confluorescenza verde che permette di leggerelo stato della rete in ogni singola cellula. Leoscillazioni risultanti, con periodi tipici del-l’ordine delle ore, sono più lente del ciclo didivisione cellulare, per cui lo stato dell’oscil-latore viene trasmesso di generazione in ge-nerazione.Un approccio diverso, seguito per esempioda Y. Sakakibara [24], punta a sviluppare unautoma a stati finiti programmabile e auto-nomo, nel senso che, una volta inserito in E.coli, funziona sfruttando il bio-hardware delbatterio, senza richiedere ulteriori interventiumani. Sia l’input che la funzione di transi-zione di stato dell’automa sono codificati conplasmidi, molecole di DNA circolari moltostabili e maneggevoli.Gli esperimenti sopra citati si basano su pro-cessi che avvengono all’interno di una singolacellula, ma anche i processi intercellulari, inparticolare i meccanismi di comunicazione tracellule batteriche, possono essere utilizzaticome substrato di calcolo [27].Quando milioni di batteri agiscono collettiva-mente comegruppo (comenel caso di coloniebatteriche), come risultato del modo in cui lesingole cellule rispondono a quelle che si tro-

vano nelle vicinanze e alle condizioni ambien-tali (in genere differenti per ogni batterio indi-viduale, anche se sono relativamente vicinil’uno all’altro) si produce una grande varietàdi schemi diversi nel modo in cui le cellule siraggruppano nelle diverse posizioni. Questischemi sono il risultato emergente delle inte-razioni locali e delle condizioni ambientali, epossono presentare aspetti funzionali; peresempio, in condizioni di stress (come la pre-senza nell’ambiente di sostanze tossiche), loschemaprodotto sarà finalizzatoaproteggereil maggior numero possibile di individui, mini-mizzando il numero di cellule senza vicini, e apromuovere la ricercadapartedella coloniadiun ambientemeno dannoso, con l’estensionedi “braccia” per esplorare l’ambiente in variedirezioni. Questo sviluppo spontaneo di sche-mi funzionali, come puro risultato della com-binazione di condizioni ambientali e di intera-zioni locali tra individui, è una forma di com-putazionemolto comune e utile in natura, maattualmente poco studiata e poco sfruttata intermini computazionali.Può essere possibile imbrigliare le sofisticatecapacità di generazione di schemi guidati dal-l’ambiente dei batteri allo scopo di fornire ap-plicazioni concrete (per esempio, alla “verniceintelligente” di un aereo o ai nodi di una retedi sensori) in cui l’input ambientale determinal’emergere di una organizzazione spazio-tem-porale adattiva e funzionale (negli esempi ci-tati, potrebe essere, rispettivamente, unoschema superficiale che stabilizzi rispetto aturbolenze, o uno schema di connessione cheottimizzi l’assorbimento di potenza).Per chiudere, torniamo al punto da cui siamopartiti, la soluzione di DHPP conDNA. In un re-centissimo lavoro [4], viene descritta la pro-grammazione di una colonia batterica con uncircuito genetico che consente ai batteri di va-lutare tutti i cammini posssibili in un grafo di-retto per verificare l’esistenza di un camminoHamiltoniano. Il grafo considerato ha tre verti-ci, e viene codificato con frammenti diDNAchevengono inseriti in Escherichia coli. I vertici delgrafo sono rappresentati da porzioni di due di-stinti geni che codificano due proteine fluore-scenti, rispettivamente verde e rossa. I batteriche individuano un cammino Hamiltoniano“comunicano” il successo producendo coloniedi colore giallo.

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

13

0

0

0

1

0

9. CONCLUSIONI

L’iniziale aspettativa, alimentata dal successodell’esperimento di Adleman, di poter risolve-re problemi combinatori complessi (NP com-pleti) sfruttando la densità di codifica del-l’informazione e il parallelismo massiccio concui si può operare sulle molecole di DNA si èdimostrata poco realistica, per imotivi discus-si nel paragrafo 4. Tuttavia le ricerche che daquell’esperimento e da quell’ aspettativa so-no scaturite hanno aperto scenari e prospetti-ve ancor più interessanti, sia teorici che appli-cativi, a partire dalla messa in evidenza, digrande importanza anche sul piano filosofi-co/epistemologico, del fatto che l’informazio-ne gioca nei processi biologici fondamentaliun ruolo pari a quello di materia ed energia.Capire la logica che sottostà all’elaborazionedell’informazionenelle celluleenei tessuti (que-

sto è anche il titolo di una importante serie diconferenzescientifichesuquesti argomenti) di-venta quindi un obiettivo scientifico e di avan-zamento della conoscenza fondamentale, cherichiede la collaborazione interdisciplinare dibiotecnologie, biologia, informatica, nanotec-nologie,medicina, e intornoal qualeogni disci-plina può articolare linee di ricerca sia teoricheche applicative di proprio interesse.Forse, o almeno non a breve termine, i compu-ter molecolari non sostituiranno i computerelettronici, probabilmente si arriverà ad unacoesistenza, su nicchie applicative diverse. Inogni caso, anche se che non si realizzasseroapplicazioni significative, la ricerca in questosettore hagià rivoluzionato i rapporti tra biolo-gia, matematica, scienze dell’informazione eingegneria, e ha costretto a ripensare il signifi-cato di “calcolare”.

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

0

0

1

14

Biologia molecolare – Nomenclatura essenzialeDNA (Acido Desossiribonucleico) – Molecola che codifica l’informazione genetica.

RNA (Acido Ribonucleico) – Molecola che rende disponibili le informazioni codificate nel DNA per la produ-zione di proteine. Si presenta in diverse forme, tra cui:

mRNA (RNA messaggero) – copia l’informazione genetica da un tratto di DNA, attraverso il processo ditrascrizione e la trasporta sui ribosomi.

tRNA (RNA di trasporto) – ha la funzione di interprete per la traduzione dell’mRNA nella proteina corri-spondente essendo in grado di associare ad ogni codone (tripletta di basi consecutive) l’aminoacido cor-rispondente.

Traduzione – Processo attraverso il quale viene sintetizzata una proteina, utilizzando l’informazione ge-netica contenuta in un filamento di mRNA. I nucleotidi che formano l’mRNA vengono letti a gruppi di tre(codoni), a ciascuno dei quail corrisponde un preciso aminoacido da inserire nella proteina (Gli aminoa-cidi distinti sono venti).

Ribosomi (al singolare ribosoma) –Organelli contenuti nella cellula, la cui funzione èquella di sintetizzare leproteine leggendo le informazioni contenute in un filamento dimRNA e traducendole con l’aiuto del tRNA.

Ribozima (termine composto da acido ribonucleico ed enzima), anche noto come enzima a RNA o RNAcatalitico – è unamolecola di RNA in grado di catalizzare una reazione chimica.

Reazione a catena della polimerasi (Polymerase Chain Reaction, PCR) – Tecnica di biologiamolecolare checonsente la moltiplicazione (amplificazione) di frammenti di DNA dei quali si conoscano le sequenze nu-cleotidiche iniziali e terminali. L'amplificazione mediante PCR consente di ottenere in vitro molto rapida-mente la quantità di materiale genetico necessaria per le successive applicazioni.

Bibliografia[1] Adleman L.: Molecular computation of solutions

to combinatorial problems. Science, Vol. 266,1994, p. 1021-1024.

[2] Amos M.: Theoretical and experimental DNAcomputation. Springer, 2005.

[3] Andrianantoandro E., Basu S., Karig D., Weiss,R.: Synthetic biology: new engineering rules for

an emerging discipline.Molecular Systems Bio-logy, Vol. 2, 2006, p. 1–14.

[4] Bath J., Turberfield A.: DNA nanomachines.Natu-reNanotechnology,Vol. 2,May2007,p. 275-284.

[5] Baumgardner J., et al.: Solving a HamiltonianPath Problemwith a bacterial computer. Journalof Biological Engineering, Vol. 3, 2009.

[6] BenensonY.,GilB.,Be-DorU.,AdarR.,ShapiroE.:

An autonomous molecular computer for logicalcontrol of gene expression. Nature, Vol. 429,2004, p. 423–429.

[7] Conrad M.: On design principles for a molecu-lar computer. Comm. ACM, Vol. 28, n. 5, 1985,p. 464-480.

[8] Ehrenfeucht A., Harju T., Petre I., Prescott D.,Rozenberg G.: Computation in Living Cells: Ge-ne Assembly in Ciliates. Springer, 2004.

[9] Ferretti C., Mauri G.:Word design for DNA com-puting: a survey. Proc. 9-th Int. Meeting onDNA Based Computers (J. Chen, J. Reif ed’s.),Lect. Not. Comp. Sci. 2943, Springer-Verlag,2003, p. 37-46.

[10] Feynman R.P.: There’s plenty of room at thebottom. In D. Gilbert, editor, Miniaturization,Reinhold, 1961, p. 282-296.

[11] Gardner T., Cantor R., Collins J.: Construction ofa genetic toggle switch in Escherichia Coli. Na-ture, Vol. 403, 2000, p. 339-342.

[12] Kitano H.: Foundations of Systems Biology. MITPress, Cambridge/MA, 2001.

[13] Frisco P.: Computing with Cells. Oxford Univer-sity Press, 2009.

[14] Head T.: Formal language theory and DNA: ananalysis of the generative capacity of specificrecombinant behaviors. Bull. Math. Biology,Vol. 49, 1987, p. 737-759.

[15] Kari L.: DNA computing—the arrival of biologi-cal mathematics. The Math. Intelligencer, Vol.19, n. 2, 1997, p. 9–22.

[16] Landweber L., Kari L.: The evolution of cellularcomputing: Nature’s solution to a computatio-nal problem. Biosystems, Vol. 52, n. 1/3, 1999,p. 3-13.

[17] Lipton R.J.: DNA solution of hard computationalproblems. Science, Vol. 268, 1995, p. 542-545.

[18] Manca V.: Frontiere della ricerca - DNA compu-ting, il calcolatore in provetta.Mondo Digitalen. 4, 2006.

[19] Mao C., LaBean T.H., Reif J.T., Seeman N.C.: Lo-gical computation using algorithmic self-as-sembly of DNA triple-crossover molecules. Na-ture, Vol. 407, 2000, p. 493-496.

[20] Ogihara M., Ray A.: DNA computing on a chip.Nature, Vol. 403, 2000, p. 143–144.

[21] Paun G.: Membrane Computing: An Introduc-tion. Springer, 2002.

[22] Reif J., LaBean T.: Autonomous programmablebiomolecular devices using self-assembledDNA nanostructures. Commun. ACM, Vol. 50, n.9, 2007, p. 46-53.

[23] Rothemund P., Papadakis N., Winfree E.: Algo-rithmic self-assembly of DNA Sierpinski trian-gles. PLoS Biology, Vol. 2, n. 12, dec. 2004.

[24] Sakakibara Y., Nakagawa H., Sakamoto K.: De-velopment of an in vivo computer based onEscherichia coli. Proceedings of 11-th Interna-tional Meeting on DNA Based Computers, Lon-don, Ontario, 2005, p. 68-77.

[25] Seeman N.: Nanotechnology and the doublehelix. Scientific American Reports, Vol. 17, n. 3,2007, p. 30-39.

[26] Vaintsvaig M.N., Liberman E.A.: Formal descrip-tion of cellmolecular computer.Biofizika, Vol. 18,1973, p. 939-942.

[27] Weiss R.: Cellular Computation and Communi-cations using Engineered Genetic RegulatoryNetworks. PhD thesis, Massachusetts Instituteof Technology, 2001.

M O N D O D I G I T A L E • n . 1 - m a r z o 2 0 1 0

1

15

0

0

0

1

GIANCARLO MAURI è docente di informatica presso l’Università di Milano-Bicocca. I suoi interessi di ricerca ri-guardano la bioinformatica, la modellazione e simulazione di sistemi biologici, i modelli e sistemi di calcolobasati sul DNA (DNA computing) o ispirati alla struttura e al funzionamento delle cellule (sistemi a membra-ne e calcolo cellulare).E-mail: [email protected]