Gianluca Gilardoni

 

NOTIZIE DI BIOLOGIA MOLECOLARE

 

 

Introduzione

 

Tutte le informazioni riguardanti la vita di una cellula, dalle sue caratteristiche morfologiche a quelle funzionali, sono contenute direttamente o indirettamente in una macromolecola detta acido desossiribonucleico (DNA) e nel loro complesso costituiscono il genoma. Il DNA è una sequenza di acidi nucleici, ciascuno costituito da una base azotata legata in posizione 1 ad una molecola di deossiribosio (o desossiribosio), a sua volta fosforilato in posizione 5. Le basi azotate coinvolte sono  puriniche (adenina e guanina) o pirimidiniche (timina e citosina). L’insieme di una base e di una molecola di zucchero, nel nostro caso desossiribosio, forma un nucleoside che, una volta fosforilato, dà luogo ad un nucleotide. Quando i nucleotidi costituiscono la struttura covalente del DNA, essi si legano tra di loro in modo che il gruppo fosforico di ognuno sia esterificato con il gruppo ossidrilico in posizione 3 nella molecola di desossiribosio di un nucleotide adiacente. Si ottiene così un polimero di nucleotidi che può contenere migliaia di monomeri. Il DNA è tuttavia costituito da due filamenti di questo tipo che si avvolgono l’uno sull’altro nel senso della lunghezza a dare una struttura a doppia elica destrogira. Tale conformazione geometrica (nota come DNA-B) è di gran lunga prevalente, non mancano tuttavia eccezioni quale il DNA-Z con struttura a zig-zag ed andamento sinistrorso. Quest’ultima forma è presente solo in alcuni segmenti. La struttura del DNA è una conseguenza delle interazioni non covalenti tra le basi azotate presenti nelle due catene. Tali basi infatti si accoppiano instaurando ponti ad idrogeno tra i gruppi amminici, i gruppi carbonilici e gli eteroatomi dei loro anelli. Ne risulta un accoppiamento specifico in cui all’adenina corrisponde sempre la timina sull’altro filamento (due legami idrogeno), mentre alla guanina corrisponde sempre la citosina (tre legami idrogeno). Se la catena che ne risulta non è ciclica, ogni filamento di DNA presenta un’estremità in cui il gruppo fosfato è libero (estremità 5’) ed una in cui l’ossidrile del desossiribosio è libero (estremità 3’). Sia nella duplicazione che nel sequenziamento del DNA si procede lungo il filamento dall’estremità 5’ alla 3’. E’ da notare che i due filamenti costituenti la doppia elica sono tra loro antiparalleli, cioè se uno è percorso nella direzione che va dall’estremità 5’ alla 3’, l’altro procede nel verso opposto. Nelle cellule procariote il DNA è generalmente una struttura ciclica in sospensione nel citosol, mentre nelle cellule eucariote il DNA è contenuto nel nucleo cellulare ed è associato ad una proteina, detta cromatina, che gli conferisce una struttura superavvolta a forma di X nota come cromosoma. Le cellule eucariote contengono più cromosomi, il cui numero varia con la specie di appartenenza. Alcuni organelli cellulari quali i mitocondri ed i cloroplasti contengono un proprio DNA, testimonianza della loro origine evolutiva quali simbionti di cellule arcaiche.

 

 

Il codice genetico

 

Tutte le informazioni contenute nel DNA sono dovute alla sequenza dei nucleotidi, il cui significato risulta dall’applicazione di regole che costituiscono il codice genetico. Tale codice è universale, cioè esprime il messaggio genetico in tutti gli organismi viventi conosciuti, con alcune eccezioni per quanto riguarda il DNA mitocondriale. Il messaggio contenuto nel DNA è costituito dalla sequenza amminoacidica di tutte le proteine prodotte dalla cellula. Poiché gli amminoacidi standard sono venti mentre i nucleotidi sono quattro, è necessario che più nucleotidi si associno in sequenza nella catena del DNA per corrispondere ad un amminoacido. Il numero sufficiente è dato da una sequenza di tre nucleotidi che, in un determinato ordine, corrispondono nel codice genetico ad un amminoacido. Tali sequenze sono dette triplette o codoni. Si noti che tutte le possibili combinazioni in sequenza dei quattro nucleotidi danno luogo a 43 = 64 triplette diverse, molte di più degli amminoacidi disponibili. Questo si spiega col fatto che alcune triplette, dette non senso, non codificano per nessun amminoacido, mentre alcune triplette diverse possono codificare per lo stesso amminoacido (ma non vale il contrario!). Il motivo di tutto ciò è che le triplette non senso separano tra loro le sequenze di DNA che codificano interamente per una proteina, mentre le triplette ridondanti hanno lo scopo di minimizzare le conseguenze di eventuali mutazioni genetiche. Una sequenza di triplette che codifica per una proteina e compresa quindi tra codoni non senso è detta gene. Poiché dunque ogni caratteristica delle cellule è direttamente (proteine strutturali) o indirettamente (enzimi nelle vie metaboliche, trasportatori, ecc.) dovuta alle proteine, si comprende come tutte le informazioni su di una cellula, e quindi su di un organismo, siano contenute nel genoma.

 

 

Gli acidi ribonucleici

 

Il DNA non è l’unico acido nucleico presente nelle cellule, infatti l’attività del DNA è strettamente correlata a quella degli acidi ribonucleici, detti anche RNA. Lo RNA è caratterizzato da una sequenza di nucleotidi in un’unica catena, legati secondo le stesse modalità di quelli presenti nel DNA ma che differiscono nella natura chimica dello zucchero che li costituisce e di una delle basi azotate pirimidiniche. Infatti nello RNA il desossiribosio è sostituito dal ribosio, mentre la timina è sostituita dall’uracile. Lo RNA, oltre ad essere l’unico materiale genetico presente in molti virus al posto del DNA, svolge funzioni importanti per quanto riguarda la duplicazione del DNA ma soprattutto la sua trascrizione e traduzione durante la sintesi proteica. Infatti il DNA non è in grado di provvedere direttamente alla sintesi delle proteine, che peraltro nelle cellule eucariote non avviene nel nucleo ma nel citosol. Il DNA necessita infatti di un complesso meccanismo, attraverso il quale le informazioni in esso contenute possano essere trasportate agli organelli cellulari deputati alla sintesi proteica e noti come ribosomi. A questo scopo esistono sostanzialmente tre tipi di RNA:

·        mRNA : si tratta di RNA messaggero, che porta le informazioni genetiche dal DNA ai ribosomi;

·        tRNA : si tratta di RNA di trasporto, che trasporta i singoli amminoacidi presenti nel citosol ai ribosomi;

·                    rRNA : si tratta di RNA ribosomiale, che rientra nella struttura costitutiva dei ribosomi.

 

 

 

 

 

 

 

 

 

 

Duplicazione del DNA

 

La duplicazione del DNA è un processo molto complesso che coinvolge l’azione di numerosi enzimi. Questi hanno lo scopo di denaturare la doppia elica in prossimità della zona da duplicare così da separare i due filamenti. In tal modo, durante la duplicazione, la doppia elica vede la presenza di un “occhio” di replicazione in cui i due filamenti parentali (cioè appartenenti al DNA di partenza) sono disaccoppiati e su ciascuno di essi si forma la nuova elica complementare. L’occhio di replicazione è  delimitato da due forcelle di replicazione, in cui il DNA parentale divide i suoi due filamenti. Gli enzimi che provvedono a catalizzare la necessaria denaturazione del DNA in corrispondenza delle forcelle di replicazione sono detti elicasi e topoisomerasi. A questo punto l’avanzamento della forcella di replicazione lungo il DNA è seguita dagli enzimi DNA-polimerasi, che catalizzano la sintesi dei due filamenti complementari a partire dai nucleotidi forniti nella idrolisi esoergonica di nucleotidi trifosforilati (ATP, GTP, CTF, TTF). E’ da notare che tutte le DNA polimerasi note procedono nella duplicazione dall’estremità 5’ alla 3’ della catena; ne consegue che, qualunque sia la direzione della duplicazione, uno dei due filamenti parentali avrà l’andamento corretto, mentre l’altro avrà l’andamento contrario. Il risultato è la replicazione semidiscontinua, cioè il filamento parentale corretto è duplicato con continuità ed il nuovo filamento è indicato come leading o filamento leader, mentre il filamento antiparallelo è duplicato a segmenti tra loro separati ma ciascuno nella direzione coretta. I  frammenti così ottenuti si dicono frammenti di Okazaki che, una volta legati tra loro dall’enzima ligasi, danno origine al filamento antiparallelo del leading e noto come lagging o filamento ritardato. Le DNA polimerasi iniziano la sintesi di un filamento, sia leading che frammento di Okazaki, grazie al segnale fornito da un segmento di RNA noto come primer e sintetizzato a partire dal DNA ad opera dell’enzima primasi. I primer sono poi rimossi e sostituiti con DNA dall’enzima DNA-polimerasi I prima della sintesi del DNA maturo. Una volta che i frammenti di Okazaki sono stati liberati dai primer, l’enzima ligasi li riunisce a formare il filamento lagging. Esistono diversi enzimi DNA-polimerasi; nei procarioti vi sono le DNA-polimerasi I, II e III, caratterizzati da diverse velocità di polimerizzazione, mentre negli eucarioti vi sono le DNA-polimerasi a, b, g, d, e, ciascuna dotata di una mansione e di una localizzazione diversa. Gli enzimi DNA-polimerasi sono inoltre dotati di una attività esonucleasica, cioè sono anche in grado di idrolizzare il filamento di DNA oltre che di sintetizzarlo. Tale attività esonucleasica procede da 3’ a 5’, tranne nella DNA-polimerasi I in cui segue il verso contrario. Tale attività si manifesta in corrispondenza di nucleotidi  che non corrispondono a quelli parentali omologhi, cioè le DNA-polimerasi correggono automaticamente i propri errori di duplicazione.

 

 

La trascrizione

 

La trascrizione è il processo tramite il quale l’informazione genetica di ciascun filamento di DNA è trasferita ad un filamento complementare di mRNA al fine di trasportarla ai ribosomi, dove si effettua la sintesi delle corrispondenti proteine. La sintesi di RNA (non solo mRNA) a partire dal DNA è catalizzata da un enzima noto come RNA-polimerasi. I procarioti hanno tre RNA-polimerasi diverse:

 

 

Quando la RNA-polimerasi deve trascrivere un segmento di DNA su RNA, la doppia elica si denatura a dare una “bolla” di trascrizione in cui i filamenti disaccoppiati possono interagire con la polimerasi. Il DNA si rinatura a monte della trascrizione e si denatura a valle, permettendo alla bolla, e quindi alla RNA-polimerasi, di scorrere lungo il DNA sintetizzando contemporaneamente lo RNA. Nei procarioti la RNA-polimerasi può interagire direttamente con il DNA, negli eucarioti l’interazione è mediata da una proteina. In tutti gli organismi esistono funzioni di controllo dell’espressione genica che si manifestano nella fase di trascrizione; infatti i geni si suddividono in costitutivi e non costitutivi. I primi agiscono sempre permettendo lo svolgimento delle funzioni basilari comuni a tutte le cellule di un organismo, gli altri vengono espressi solo in determinati tessuti e l’espressione di alcuni di essi piuttosto che di altri determina la differenziazione tra le cellule di tessuti diversi. Inoltre molti geni sono soggetti ad una attività modulata o ad una attivazione temporanea che  risponde alla presenza di determinati stimoli. Il primo di tali fenomeni, cioè l’espressione differenziata dei geni non costitutivi, è dovuta al fatto che nella sequenza del DNA sono presenti delle sequenze di nucleotidi, distanti dal gene corrispondente ed attive a prescindere da tale distanza, con la funzione di attivare il gene stesso. Queste sequenze, dette enhancer o attivatori, interagiscono con proteine note come fattori di trascrizione. Quando la trascrizione deve aver luogo, il filamento di DNA si estroflette a dare un’ansa in cui due segmenti di DNA risultano paralleli. Su di uno di essi vi sono le sequenze enhancer, mentre sul segmento parallelo vi sono delle sequenze corrispondenti note come promotori. Nei procarioti i promotori sono sequenze del tipo TATAAT dette Pribnow box, che possono direttamente interagire con la polimerasi a trascrivere la sequenza di DNA adiacente; negli eucarioti invece i promotori sono del tipo TATA (detti TATA box) che interagiscono con specifiche proteine (proteine leganti TATA) che a loro volta sono in grado di legare le polimerasi. Quando una sequenza genica deve essere espressa, la proteina legante TATA, che scorre lungo il DNA all’interno dell’ansa,  guida la polimerasi a trascriverla solo se all’interno dell’ansa essa può interagire con il fattore di trascrizione corrispondente all’ enhancer di quello stesso gene. Il risultato è che solo i geni non costitutivi per i quali è presente il fattore di trascrizione vengono espressi. Una conseguenza interessante di questo meccanismo è che l’evoluzione, per eliminare la proteina codificata da un gene, può evitare di rimuovere il gene stesso modificando il gene che codifica per il fattore di trascrizione. Ne consegue che il DNA di una specie può contenere geni ancestrali che non si esprimono più ma che potenzialmente potrebbero esprimersi se si fosse in presenza del fattore di trascrizione (vedi l’esperimento dei denti di gallina). Il modello dei fattori di trascrizione permette anche di attivare un gene (anche in modo modulato) in risposta a stimoli esterni. Alcuni fattori di trascrizione sono infatti proteine costituite da più subunità, che possono aggregarsi a svolgere la propria funzione grazie alla presenza di opportune molecole tra le superfici di contatto, dove sono presenti dei recettori. Un esempio tipico di questo meccanismo è costituito dagli ormoni steroidei, il cui recettore è localizzato tra le subunità di specifici fattori di trascrizione.

Un altro meccanismo di attivazione genica, in grado di controllare non solo un singolo gene ma una sequenza di geni (e quindi una via metabolica), si fonda sul modello dell’operone. Un operone è l’insieme di siti di  controllo (detti complessivamente operatore) e di una sequenza di geni. L’operone è a sua volta preceduto nella sequenza da un gene regolatore. In condizioni normali il gene regolatore codifica per una proteina, detta repressore, che, una volta sintetizzata, va a legarsi ad un sito di controllo, impedendo fisicamente il passaggio della RNA-polimerasi e quindi l’espressione dei geni dell’operone. In presenza di specifiche molecole, dette induttori, in grado di legarsi al repressore, l’operatore è liberato e la RNA-polimerasi non è più impedita nel suo cammino di trascrizione. E’ importante considerare che molto spesso un gene codifica per più amminoacidi di quanti ne contenga la corrispondente proteina, cioè una volta avvenuta la trascrizione, lo mRNA ottenuto contiene segmenti che non dovranno essere tradotti nei ribosomi. Tali segmenti sono detti introni, mentre quelli utili sono detti esoni. Lo mRNA trascritto deve quindi essere modificato prima di essere tradotto. A questo scopo sono presenti nel nucleo della cellula dei piccoli segmenti di RNA, detti piccoli RNA nucleari (snRNA). La  sequenza di questi è complementare a quella di segmenti di mRNA esclusi gli introni. Questo significa che  lo mRNA si accoppia agli snRNA formando anse costituite da introni ed avvicinando gli esoni consecutivi  a renderli adiacenti. Gli snRNA si organizzano in ribonucleoproteine dette spliceosomi che, avendo un sito attivo di natura ribonucleica e non peptidica, si dicono ribozimi. Gli spliceosomi avvicinano gli esoni, tagliano il filamento allontanando gli introni e saldano poi gli esoni a dare lo mRNA maturo pronto alla traduzione. Tale processo è detto splicing. Prima di essere trasformato dagli spliceosomi, lo mRNA degli eucarioti è dotato, da una guanilil transferasi, di una struttura detta cap in posizione 5’. Tale struttura è costituita da una base azotata metilata e dà il segnale di inizio della traduzione.

Anche gli rRNA ed i tRNA subiscono modificazioni post trascrizionali ad opera di ribozimi detti RNasi.

 

 

Traduzione e sintesi proteica

 

La traduzione è il processo che porta alla sintesi proteica a partire dal messaggio codificato nei filamenti di mRNA. La traduzione e la sintesi proteica avvengono nei ribosomi, organelli cellulari presenti nel citosol e costituiti da due subunità. Entrambe sono costituite da un filamento di rRNA, unitamente a molteplici  proteine. Tra le due subunità si forma un tunnel da cui emerge il polipeptide sintetizzato. Sono inoltre riconoscibili sul ribosoma due siti specifici, indicati con P (legante il peptidil-tRNA) ed A (legante l’amminoacil-tRNA). Il peptidil-tRNA è una molecola di tRNA a cui è legato il peptide in fase di accrescimento, mentre l’amminoacil-tRNA è una molecola di tRNA a cui è legato un amminoacido da aggiungere al peptide. Il tRNA è infatti una molecola di RNA che presenta una struttura secondaria cosiddetta a trifoglio, costituita da tre bracci ortogonali di nucleotidi appaiati e terminanti ciascuno con un’ansa di nucleotidi non appaiati. Vi è poi un quarto braccio ortogonale e detto coda, terminante nelle due estremità 3’ e 5’. L’estremità 3’ termina con una sequenza CCA, in cui l’adenina può essere esterificata in 3’ con un amminoacido ad opera dell’enzima ATP dipendente amminoacil-tRNA sintetasi. Ogni molecola di tRNA è caratterizzata da una tripletta detta anticodone sull’ansa del braccio centrale, complementare alla tripletta che su mRNA codifica per l’amminoacido trasportato da quello stesso tRNA. Quando la sintesi ha inizio, il ribosoma lega dapprima delle proteine citoplasmatiche dette fattori di inizio e poi, grazie a queste, il filamento di mRNA da tradurre. A questo punto, attraverso un processo GTP dipendente, il ribosoma allinea il cap e riconosce in prossimità del sito P la sequenza AUG della metionina, che su mRNA indica sempre l’inizio della traduzione. Se il primo amminoacido del peptide non dovrà essere la metionina, questa verrà poi rescissa. In seguito al riconoscimento di AUG, una  molecola di tRNA che presenti l’anticodone complementare (UAC) si lega al sito P, mentre il sito A riconosce la tripletta adiacente e permette il riconoscimento ed il legame di una molecola di tRNA con l’anticodone complementare al sito A. A questo punto il ribozima ribosomiale catalizza il trasferimento della metionina sul gruppo amminico del secondo amminoacido con formazione di un legame peptidico (transpeptidazione). Il tRNA “scarico” è ora rimosso mentre quello “caricato” con il dipeptide si sposta (traslocazione) tramite un meccanismo GTP dipendente, assieme alla corrispondente tripletta dello mRNA, sul sito P. Il sito A riconoscerà ora la tripletta successiva ed il procedimento si ripeterà fino alla fine della traduzione. E’ a questo punto che una tripletta non senso non corrisponderà ad alcun tRNA carico e quindi terminerà la sintesi.