Sequenziamento del DNA
Il sequenziamento del DNA è un metodo per individuare tutte le basi che compongono il filamento di DNA.
Sequenziamento di prima generazione
Figura 1. Metodo a terminazione di catena. Le molecole di DNA etichettate si dividono in base alle loro dimensioni. Ciascuna molecola ha un nucleotide modificato (ddNTP) marcato con un colorante fluorescente. La diversa fluorescenza indica una base specifica.
.
Per sequenziamento di prima generazione si intende il metodo a terminazione di catena sviluppato da Fredrick Sanger e dai suoi collaboratori nel 1977 (Figura 1). La molecola di DNA viene amplificata con un nucleotide modificato, permettendo solo di aggiungere una base a ciascun ciclo. Il DNA viene quindi amplificato con lunghezza variabile: Ciascun filamento è più lungo di una coppia di basi rispetto alla molecola precedente. Le molecole vengono poi separate in un capillare. Ciascuna base è etichettata con un colorante fluorescente. Attraverso i segnali di colore diverso, siamo in grado di identificare la base (A, G, T o C).
Sequenziamento di nuova generazione
Il sequenziamento di nuova generazione è una tecnologia avanzata nella quale vengono sequenziate simultaneamente numerose molecole corte di DNA. La tecnologia è detta anche sequenziamento massivo parallelo. Queste molecole corte di DNA vengono poi assemblate mettendo a confronto la loro sequenza con una sequenza di riferimento, svelando così la sequenza completa di DNA che può essere molto lunga (quanto il nostro genoma!).
Esistono diverse piattaforme di sequenziamento di nuova generazione, e ognuna di esse utilizza una tecnica diversa di sequenziamento del DNA. In questo caso, ci concentreremo sulla tecnologia di terminazione con colorante reversibile impiegata da Illumina. Con questo metodo il DNA viene prima frammentato in filamenti più corti, e due molecole di DNA corte chiamate "adattatori" vengono legate a ciascuna estremità del campione (Figura 2). Gli adattatori hanno la funzione di sito di aggancio del primer per amplificare il DNA durante la PCR e per legarsi alla flow cell. Prima di analizzare i dati, rimuoveremo gli adattatori perché non costituiscono una sequenza biologica.
Le molecole di DNA ricoperte di adattatori e primer vengono prima fissate su un vetrino (chiamato flow cell) e amplificate con un enzima polimerasi per creare colonie locali di DNA clonale. Queste colonie di DNA vengono anche chiamate cluster di DNA. Ciascun cluster contiene esattamente la stessa sequenza di DNA; da qui il termine colonie di DNA clonali. Analogamente alla tecnica di sequenziamento di prima generazione, i nucleotidi vengono etichettati singolarmente con un colorante fluorescente. etichettati con un colorante fluorescente. Dopo l'aggiunta di un nucleotide, l'allungamento si ferma e viene scattata una foto. In seguito, il bloccante che si trova all'estremità 3' viene rimosso chimicamente dal DNA, permettendo al ciclo successivo di aggiunta di nucleotidi di procedere.
Il sequenziamento in parallelo produce milioni e miliardi di reads per run. Si tratta di una quantità esponenzialmente maggiore rispetto alle reads prodotte dal sequenziamento di prima generazione. Il sequenziamento di nuova generazione è una tecnica molto efficace che può essere impiegata per diverse applicazioni, come il profiling di SNP, l'analisi dell'espressione genica e l'individuazione di aberrazioni cromosomiche come mutazioni o riarrangiamenti cromosomici. Dopo aver estratto il DNA, occorre trattarlo per prepararlo al sequenziamento.
Le diverse fasi di preparazione del campione sono descritte di seguito:
- Frammentazione
- Riparazione delle estremità
- A-tailing
- Legame con l'adattatore
- Amplificazione con PCR
Successivamente si procede alla creazione di cluster e al processo di sequenziamento vero e proprio.
Mutazione del DNA
Esistono diverse classificazioni per le mutazioni del DNA; è possibile scoprire di più sull'informazione della mutazione dal modo in cui è scritta. Per esempio:
- 345G>T indica che si è verificata una sostituzione nucleotidica da guanina a timina nella posizione 345.
- 345delGT indica che è avvenuta la cancellazione di due nucleotidi (guanina e timina) a partire dalla posizione 345.
- 345dupA indica che è avvenuta una duplicazione in posizione 345, con il risultato di due residui di adenina.
- 345insTA indica che sono stati inseriti due nucleotidi (timina e adenina) a partire dalla posizione 345.