Gianluca
Gilardoni
NOTIZIE DI BIOLOGIA MOLECOLARE
Tutte le informazioni riguardanti la vita
di una cellula, dalle sue caratteristiche morfologiche a quelle funzionali,
sono contenute direttamente o indirettamente in una macromolecola detta acido
desossiribonucleico (DNA)
e nel loro complesso costituiscono il genoma. Il DNA è una sequenza di acidi
nucleici, ciascuno costituito da una base azotata legata in posizione 1 ad una
molecola di deossiribosio (o desossiribosio), a sua volta
fosforilato in posizione 5. Le basi azotate coinvolte sono puriniche (adenina e guanina) o pirimidiniche (timina e citosina). L’insieme di una base e di una
molecola di zucchero, nel nostro caso desossiribosio, forma un nucleoside che, una volta fosforilato, dà luogo ad
un nucleotide. Quando i nucleotidi costituiscono la
struttura covalente del DNA, essi si legano tra di loro in modo che il gruppo
fosforico di ognuno sia esterificato con il gruppo ossidrilico in posizione 3
nella molecola di desossiribosio di un nucleotide adiacente. Si ottiene così un
polimero di nucleotidi che può contenere migliaia di monomeri. Il DNA è
tuttavia costituito da due filamenti di questo tipo che si avvolgono l’uno
sull’altro nel senso della lunghezza a dare una struttura a doppia
elica destrogira. Tale
conformazione geometrica (nota come DNA-B) è di gran lunga prevalente, non mancano tuttavia eccezioni
quale il DNA-Z
con struttura a zig-zag ed andamento sinistrorso. Quest’ultima forma è presente solo in
alcuni segmenti. La struttura del DNA è una conseguenza delle interazioni non
covalenti tra le basi azotate presenti nelle due catene. Tali basi infatti si
accoppiano instaurando ponti ad idrogeno tra i gruppi amminici, i gruppi
carbonilici e gli eteroatomi dei loro anelli. Ne risulta un accoppiamento
specifico in cui all’adenina corrisponde sempre la timina sull’altro filamento
(due legami idrogeno), mentre alla guanina corrisponde sempre la citosina (tre
legami idrogeno). Se la catena che ne risulta non è ciclica, ogni filamento di
DNA presenta un’estremità in cui il gruppo fosfato è libero (estremità
5’) ed una in cui
l’ossidrile del desossiribosio è libero (estremità 3’). Sia nella duplicazione che nel
sequenziamento del DNA si procede lungo il filamento dall’estremità 5’ alla 3’.
E’ da notare che i due filamenti costituenti la doppia elica sono tra loro
antiparalleli, cioè se uno è percorso nella direzione che va dall’estremità 5’
alla 3’, l’altro procede nel verso opposto. Nelle cellule procariote il DNA è generalmente
una struttura ciclica in sospensione nel citosol, mentre nelle cellule
eucariote il DNA è contenuto nel nucleo cellulare ed è associato ad una
proteina, detta cromatina, che gli conferisce una struttura
superavvolta a forma di X nota come cromosoma. Le cellule eucariote contengono
più cromosomi, il cui numero varia con la specie di appartenenza. Alcuni
organelli cellulari quali i mitocondri ed i cloroplasti contengono un proprio
DNA, testimonianza della loro origine evolutiva quali simbionti di cellule
arcaiche.
Tutte
le informazioni contenute nel DNA sono dovute alla sequenza dei nucleotidi, il
cui significato risulta dall’applicazione di regole che costituiscono il codice
genetico. Tale codice è
universale, cioè esprime il messaggio genetico in tutti gli organismi viventi
conosciuti, con alcune eccezioni per quanto riguarda il DNA mitocondriale. Il
messaggio contenuto nel DNA è costituito dalla sequenza amminoacidica di tutte
le proteine prodotte dalla cellula. Poiché gli amminoacidi standard sono venti
mentre i nucleotidi sono quattro, è necessario che più nucleotidi si associno
in sequenza nella catena del DNA per corrispondere ad un amminoacido. Il numero
sufficiente è dato da una sequenza di tre nucleotidi che, in un determinato
ordine, corrispondono nel codice genetico ad un amminoacido. Tali sequenze sono
dette triplette
o codoni. Si noti che tutte le possibili
combinazioni in sequenza dei quattro nucleotidi danno luogo a 43 =
64 triplette diverse, molte di più degli amminoacidi disponibili. Questo si
spiega col fatto che alcune triplette, dette non senso, non codificano per nessun amminoacido,
mentre alcune triplette diverse possono codificare per lo stesso amminoacido
(ma non vale il contrario!). Il motivo di tutto ciò è che le triplette non
senso separano tra loro le sequenze di DNA che codificano interamente per una
proteina, mentre le triplette ridondanti hanno lo scopo di minimizzare le
conseguenze di eventuali mutazioni genetiche. Una sequenza di triplette che codifica
per una proteina e compresa quindi tra codoni non senso è detta gene. Poiché dunque ogni caratteristica delle
cellule è direttamente (proteine strutturali) o indirettamente (enzimi nelle
vie metaboliche, trasportatori, ecc.) dovuta alle proteine, si comprende come
tutte le informazioni su di una cellula, e quindi su di un organismo, siano
contenute nel genoma.
Il DNA non è l’unico acido nucleico presente nelle cellule, infatti l’attività del DNA è strettamente correlata a quella degli acidi ribonucleici, detti anche RNA. Lo RNA è caratterizzato da una sequenza di nucleotidi in un’unica catena, legati secondo le stesse modalità di quelli presenti nel DNA ma che differiscono nella natura chimica dello zucchero che li costituisce e di una delle basi azotate pirimidiniche. Infatti nello RNA il desossiribosio è sostituito dal ribosio, mentre la timina è sostituita dall’uracile. Lo RNA, oltre ad essere l’unico materiale genetico presente in molti virus al posto del DNA, svolge funzioni importanti per quanto riguarda la duplicazione del DNA ma soprattutto la sua trascrizione e traduzione durante la sintesi proteica. Infatti il DNA non è in grado di provvedere direttamente alla sintesi delle proteine, che peraltro nelle cellule eucariote non avviene nel nucleo ma nel citosol. Il DNA necessita infatti di un complesso meccanismo, attraverso il quale le informazioni in esso contenute possano essere trasportate agli organelli cellulari deputati alla sintesi proteica e noti come ribosomi. A questo scopo esistono sostanzialmente tre tipi di RNA:
· mRNA : si tratta di RNA messaggero, che porta le informazioni genetiche dal DNA ai ribosomi;
· tRNA : si tratta di RNA di trasporto, che trasporta i singoli amminoacidi presenti nel citosol ai ribosomi;
· rRNA : si tratta di RNA ribosomiale, che rientra nella struttura costitutiva dei ribosomi.
Duplicazione del DNA
La duplicazione del DNA è un processo molto complesso che coinvolge l’azione di numerosi enzimi. Questi hanno lo scopo di denaturare la doppia elica in prossimità della zona da duplicare così da separare i due filamenti. In tal modo, durante la duplicazione, la doppia elica vede la presenza di un “occhio” di replicazione in cui i due filamenti parentali (cioè appartenenti al DNA di partenza) sono disaccoppiati e su ciascuno di essi si forma la nuova elica complementare. L’occhio di replicazione è delimitato da due forcelle di replicazione, in cui il DNA parentale divide i suoi due filamenti. Gli enzimi che provvedono a catalizzare la necessaria denaturazione del DNA in corrispondenza delle forcelle di replicazione sono detti elicasi e topoisomerasi. A questo punto l’avanzamento della forcella di replicazione lungo il DNA è seguita dagli enzimi DNA-polimerasi, che catalizzano la sintesi dei due filamenti complementari a partire dai nucleotidi forniti nella idrolisi esoergonica di nucleotidi trifosforilati (ATP, GTP, CTF, TTF). E’ da notare che tutte le DNA polimerasi note procedono nella duplicazione dall’estremità 5’ alla 3’ della catena; ne consegue che, qualunque sia la direzione della duplicazione, uno dei due filamenti parentali avrà l’andamento corretto, mentre l’altro avrà l’andamento contrario. Il risultato è la replicazione semidiscontinua, cioè il filamento parentale corretto è duplicato con continuità ed il nuovo filamento è indicato come leading o filamento leader, mentre il filamento antiparallelo è duplicato a segmenti tra loro separati ma ciascuno nella direzione coretta. I frammenti così ottenuti si dicono frammenti di Okazaki che, una volta legati tra loro dall’enzima ligasi, danno origine al filamento antiparallelo del leading e noto come lagging o filamento ritardato. Le DNA polimerasi iniziano la sintesi di un filamento, sia leading che frammento di Okazaki, grazie al segnale fornito da un segmento di RNA noto come primer e sintetizzato a partire dal DNA ad opera dell’enzima primasi. I primer sono poi rimossi e sostituiti con DNA dall’enzima DNA-polimerasi I prima della sintesi del DNA maturo. Una volta che i frammenti di Okazaki sono stati liberati dai primer, l’enzima ligasi li riunisce a formare il filamento lagging. Esistono diversi enzimi DNA-polimerasi; nei procarioti vi sono le DNA-polimerasi I, II e III, caratterizzati da diverse velocità di polimerizzazione, mentre negli eucarioti vi sono le DNA-polimerasi a, b, g, d, e, ciascuna dotata di una mansione e di una localizzazione diversa. Gli enzimi DNA-polimerasi sono inoltre dotati di una attività esonucleasica, cioè sono anche in grado di idrolizzare il filamento di DNA oltre che di sintetizzarlo. Tale attività esonucleasica procede da 3’ a 5’, tranne nella DNA-polimerasi I in cui segue il verso contrario. Tale attività si manifesta in corrispondenza di nucleotidi che non corrispondono a quelli parentali omologhi, cioè le DNA-polimerasi correggono automaticamente i propri errori di duplicazione.
La trascrizione
La
trascrizione è il processo tramite il quale l’informazione genetica di ciascun
filamento di DNA è trasferita ad un filamento complementare di mRNA al fine di
trasportarla ai ribosomi, dove si effettua la sintesi delle corrispondenti
proteine. La sintesi di RNA (non solo mRNA) a partire dal DNA è catalizzata da
un enzima noto come RNA-polimerasi. I procarioti hanno tre RNA-polimerasi
diverse:
Quando
la RNA-polimerasi deve trascrivere un segmento di DNA su RNA, la doppia elica
si denatura a dare una “bolla” di trascrizione in cui i filamenti disaccoppiati possono
interagire con la polimerasi. Il DNA si rinatura a monte della trascrizione e
si denatura a valle, permettendo alla bolla, e quindi alla RNA-polimerasi, di
scorrere lungo il DNA sintetizzando contemporaneamente lo RNA. Nei procarioti
la RNA-polimerasi può interagire direttamente con il DNA, negli eucarioti
l’interazione è mediata da una proteina. In tutti gli organismi esistono
funzioni di controllo dell’espressione genica che si manifestano nella fase di
trascrizione; infatti i geni si suddividono in costitutivi e non costitutivi. I primi agiscono sempre permettendo lo
svolgimento delle funzioni basilari comuni a tutte le cellule di un organismo,
gli altri vengono espressi solo in determinati tessuti e l’espressione di
alcuni di essi piuttosto che di altri determina la differenziazione tra le
cellule di tessuti diversi. Inoltre molti geni sono soggetti ad una attività
modulata o ad una attivazione temporanea che
risponde alla presenza di determinati stimoli. Il primo di tali
fenomeni, cioè l’espressione differenziata dei geni non costitutivi, è dovuta
al fatto che nella sequenza del DNA sono presenti delle sequenze di nucleotidi,
distanti dal gene corrispondente ed attive a prescindere da tale distanza, con
la funzione di attivare il gene stesso. Queste sequenze, dette enhancer o attivatori, interagiscono con proteine note come fattori
di trascrizione. Quando
la trascrizione deve aver luogo, il filamento di DNA si estroflette a dare
un’ansa in cui due segmenti di DNA risultano paralleli. Su di uno di essi vi
sono le sequenze enhancer, mentre sul segmento parallelo vi sono delle sequenze
corrispondenti note come promotori. Nei procarioti i promotori sono
sequenze del tipo TATAAT dette Pribnow box, che possono direttamente interagire con
la polimerasi a trascrivere la sequenza di DNA adiacente; negli eucarioti
invece i promotori sono del tipo TATA (detti TATA box) che interagiscono con specifiche
proteine (proteine leganti TATA) che a loro volta sono in grado di legare le polimerasi.
Quando una sequenza genica deve essere espressa, la proteina legante TATA, che
scorre lungo il DNA all’interno dell’ansa,
guida la polimerasi a trascriverla solo se all’interno dell’ansa essa
può interagire con il fattore di trascrizione corrispondente all’ enhancer di
quello stesso gene. Il risultato è che solo i geni non costitutivi per i quali
è presente il fattore di trascrizione vengono espressi. Una conseguenza
interessante di questo meccanismo è che l’evoluzione, per eliminare la proteina
codificata da un gene, può evitare di rimuovere il gene stesso modificando il
gene che codifica per il fattore di trascrizione. Ne consegue che il DNA di una
specie può contenere geni ancestrali che non si esprimono più ma che potenzialmente
potrebbero esprimersi se si fosse in presenza del fattore di trascrizione (vedi
l’esperimento dei denti di gallina). Il modello dei fattori di trascrizione
permette anche di attivare un gene (anche in modo modulato) in risposta a
stimoli esterni. Alcuni fattori di trascrizione sono infatti proteine
costituite da più subunità, che possono aggregarsi a svolgere la propria
funzione grazie alla presenza di opportune molecole tra le superfici di
contatto, dove sono presenti dei recettori. Un esempio tipico di questo
meccanismo è costituito dagli ormoni steroidei, il cui recettore è localizzato
tra le subunità di specifici fattori di trascrizione.
Un altro meccanismo di attivazione
genica, in grado di controllare non solo un singolo gene ma una sequenza di
geni (e quindi una via metabolica), si fonda sul modello dell’operone. Un operone è l’insieme di siti
di controllo (detti complessivamente operatore)
e di una sequenza di
geni. L’operone è a sua volta preceduto nella sequenza da un gene
regolatore. In
condizioni normali il gene regolatore codifica per una proteina, detta repressore, che, una volta sintetizzata, va a
legarsi ad un sito di controllo, impedendo fisicamente il passaggio della
RNA-polimerasi e quindi l’espressione dei geni dell’operone. In presenza di
specifiche molecole, dette induttori, in grado di legarsi al repressore,
l’operatore è liberato e la RNA-polimerasi non è più impedita nel suo cammino
di trascrizione. E’ importante considerare che molto spesso un gene codifica
per più amminoacidi di quanti ne contenga la corrispondente proteina, cioè una
volta avvenuta la trascrizione, lo mRNA ottenuto contiene segmenti che non
dovranno essere tradotti nei ribosomi. Tali segmenti sono detti introni, mentre quelli utili sono detti esoni. Lo mRNA trascritto deve quindi essere
modificato prima di essere tradotto. A questo scopo sono presenti nel nucleo
della cellula dei piccoli segmenti di RNA, detti piccoli RNA nucleari
(snRNA). La
sequenza di questi è complementare a quella di segmenti di mRNA esclusi
gli introni. Questo significa che lo
mRNA si accoppia agli snRNA formando anse costituite da introni ed avvicinando
gli esoni consecutivi a renderli
adiacenti. Gli snRNA si organizzano in ribonucleoproteine dette spliceosomi che, avendo un sito attivo di natura
ribonucleica e non peptidica, si dicono ribozimi. Gli spliceosomi avvicinano gli esoni,
tagliano il filamento allontanando gli introni e saldano poi gli esoni a dare
lo mRNA maturo pronto alla traduzione. Tale processo è detto splicing. Prima di essere trasformato dagli
spliceosomi, lo mRNA degli eucarioti è dotato, da una guanilil
transferasi, di una
struttura detta cap in posizione 5’. Tale struttura è costituita da una base
azotata metilata e dà il segnale di inizio della traduzione.
Anche
gli rRNA ed i tRNA subiscono modificazioni post trascrizionali ad opera di
ribozimi detti RNasi.
La traduzione è il processo che porta alla sintesi proteica a partire dal messaggio codificato nei filamenti di mRNA. La traduzione e la sintesi proteica avvengono nei ribosomi, organelli cellulari presenti nel citosol e costituiti da due subunità. Entrambe sono costituite da un filamento di rRNA, unitamente a molteplici proteine. Tra le due subunità si forma un tunnel da cui emerge il polipeptide sintetizzato. Sono inoltre riconoscibili sul ribosoma due siti specifici, indicati con P (legante il peptidil-tRNA) ed A (legante l’amminoacil-tRNA). Il peptidil-tRNA è una molecola di tRNA a cui è legato il peptide in fase di accrescimento, mentre l’amminoacil-tRNA è una molecola di tRNA a cui è legato un amminoacido da aggiungere al peptide. Il tRNA è infatti una molecola di RNA che presenta una struttura secondaria cosiddetta a trifoglio, costituita da tre bracci ortogonali di nucleotidi appaiati e terminanti ciascuno con un’ansa di nucleotidi non appaiati. Vi è poi un quarto braccio ortogonale e detto coda, terminante nelle due estremità 3’ e 5’. L’estremità 3’ termina con una sequenza CCA, in cui l’adenina può essere esterificata in 3’ con un amminoacido ad opera dell’enzima ATP dipendente amminoacil-tRNA sintetasi. Ogni molecola di tRNA è caratterizzata da una tripletta detta anticodone sull’ansa del braccio centrale, complementare alla tripletta che su mRNA codifica per l’amminoacido trasportato da quello stesso tRNA. Quando la sintesi ha inizio, il ribosoma lega dapprima delle proteine citoplasmatiche dette fattori di inizio e poi, grazie a queste, il filamento di mRNA da tradurre. A questo punto, attraverso un processo GTP dipendente, il ribosoma allinea il cap e riconosce in prossimità del sito P la sequenza AUG della metionina, che su mRNA indica sempre l’inizio della traduzione. Se il primo amminoacido del peptide non dovrà essere la metionina, questa verrà poi rescissa. In seguito al riconoscimento di AUG, una molecola di tRNA che presenti l’anticodone complementare (UAC) si lega al sito P, mentre il sito A riconosce la tripletta adiacente e permette il riconoscimento ed il legame di una molecola di tRNA con l’anticodone complementare al sito A. A questo punto il ribozima ribosomiale catalizza il trasferimento della metionina sul gruppo amminico del secondo amminoacido con formazione di un legame peptidico (transpeptidazione). Il tRNA “scarico” è ora rimosso mentre quello “caricato” con il dipeptide si sposta (traslocazione) tramite un meccanismo GTP dipendente, assieme alla corrispondente tripletta dello mRNA, sul sito P. Il sito A riconoscerà ora la tripletta successiva ed il procedimento si ripeterà fino alla fine della traduzione. E’ a questo punto che una tripletta non senso non corrisponderà ad alcun tRNA carico e quindi terminerà la sintesi.