Labster Logo

Analisi primaria

L'analisi primaria comprende tutti i passaggi richiesti per identificare ciascuna base. Oltre che identificare le basi, la macchina di sequenziamento assegnerà anche un punteggio di qualità a ciascuna delle basi.

I risultati vengono immagazzinati sotto forma di file FASTQ (vedi immagine) contenenti le sequenze identificanti, i nucleotidi assegnati (A, G, T o C), detti anche "letture", e il relativo punteggio di qualità su scala Phred. Quando la lettera "N" viene associata a un nucleotide, ciò significa che la macchina non è stata in grado di determinarlo con esattezza. Il punteggio qualitativo su scala Phred indica la probabilità di assegnazione sbagliata di una base. Viene immagazzinato come carattere ASCII (una lettere, una cifra o un simbolo), il cui valore indica l'accuratezza con cui viene identificata una base.

Solitamente l'analisi primaria viene eseguita in modo automatico nel macchinario di sequenziamento dopo ogni ciclo.

Se invece si desiderano sequenziare più campioni insieme nello stesso ciclo (ad esempio di diversi pazienti o di diversi esperimenti), è possibile assegnare un'etichetta specifica a ciascuno di essi. Questa etichetta (detta anche codice a barre) è una breve sequenza di DNA che viene aggiunta all'adattatore per differenziare le letture di ciascun campione. Tale etichetta verrà anch'essa sequenziata e, identificando l'adattatore specifico della sequenza di ciascun campione, sarà possibile distinguerli. Questo processo è detto anche multiplazione e offre gli ulteriori vantaggi di diminuire i costi di sequenziamento e produrre campioni più grandi.

Risultati di NGS: esempio di file FASTQ.

 Nella parte alta dei risultati vengono mostrati gli identificatori della sequenza Illumina. Successivamente sono mostrate le letture o sequenze di nucleotidi. Un punteggio qualitativo su scala Phred viene mostrato sotto la lettura. Gli identificatori della sequenza Illumina sono costituiti da numeri e lettere che rappresentano il nome dello strumento, il numero della flow cell, la piastra e le coordinate interne alla piastra. Il punteggio qualitativo su scala Phred è un numero compreso tra 10 e 50, dove 10 indica il 90% di accuratezza nell'identificazione delle basi e 50 il 99,999% di accuratezza

Il passaggio successivo dell'analisi dei dati NGS è detto analisi secondaria.