Analisi secondaria
L'analisi secondaria viene eseguita dopo l'analisi primaria. Prima di effettuare l'analisi secondaria è necessario effettuare un passaggio preventivo, ovvero tagliare tag e adattatori, dal momento che queste sequenze non hanno un significato biologico.
Lo scopo principale dell'analisi secondaria è di assemblare tutte le sequenze brevi di DNA (dette anche letture) in modo tale da poter interpretare la sequenza di dati. Prima dell'assemblaggio, le letture "grezze" ottenute dalla macchina vengono sottoposte a una stima e un filtraggio in base alla loro qualità, per ottenere i migliori risultati. Le letture con un basso punteggio qualitativo Phred devono essere rimosse e gli adattatori tagliati. Quando il riassemblaggio viene eseguito da zero senza un genoma di riferimento, è da considerarsi come un assemblaggio de novo. Al contrario, quando è disponibile un genoma di riferimento, il processo è molto più facile poiché possiamo semplicemente allineare tutte le letture al genoma di riferimento.
Di solito avremo numerose letture che mappano la stessa area del genoma; si parla, in questi casi, di "profondità della lettura". Tale profondità misura quante volte una determinata area è coperta da letture diverse. Ad esempio, se la profondità della lettura fosse pari a 10, ciò significa che esistono dieci mappature sovrapposte nella stessa area genomica.
Il passaggio successivo dell'analisi dei dati NGS è detto analisi terziaria.