Analisi primaria
L'analisi primaria comprende tutti i passaggi richiesti per identificare ciascuna base. Oltre che identificare le basi, la macchina di sequenziamento assegnerà anche un punteggio di qualità a ciascuna delle basi.
I risultati vengono immagazzinati sotto forma di file FASTQ (vedi immagine) contenenti le sequenze identificanti, i nucleotidi assegnati (A, G, T o C), detti anche "letture", e il relativo punteggio di qualità su scala Phred. Quando la lettera "N" viene associata a un nucleotide, ciò significa che la macchina non è stata in grado di determinarlo con esattezza. Il punteggio qualitativo su scala Phred indica la probabilità di assegnazione sbagliata di una base. Viene immagazzinato come carattere ASCII (una lettere, una cifra o un simbolo), il cui valore indica l'accuratezza con cui viene identificata una base.
Solitamente l'analisi primaria viene eseguita in modo automatico nel macchinario di sequenziamento dopo ogni ciclo.
Se invece si desiderano sequenziare più campioni insieme nello stesso ciclo (ad esempio di diversi pazienti o di diversi esperimenti), è possibile assegnare un'etichetta specifica a ciascuno di essi. Questa etichetta (detta anche codice a barre) è una breve sequenza di DNA che viene aggiunta all'adattatore per differenziare le letture di ciascun campione. Tale etichetta verrà anch'essa sequenziata e, identificando l'adattatore specifico della sequenza di ciascun campione, sarà possibile distinguerli. Questo processo è detto anche multiplazione e offre gli ulteriori vantaggi di diminuire i costi di sequenziamento e produrre campioni più grandi.
Risultati di NGS: esempio di file FASTQ.
Il passaggio successivo dell'analisi dei dati NGS è detto analisi secondaria.