L'analyse secondaire
L'analyse secondaire est effectuée après l'analyse primaire. Avant de procéder à l'analyse secondaire, la première étape consiste à éliminer les marqueurs et les adaptateurs car ces séquences n'ont pas de signification biologique.
L'objectif principal de l'analyse secondaire est d'assembler toutes les séquences d'ADN courtes (également appelées "lectures") afin d'interpréter les données de séquence. Avant ce réassemblage, les lectures "brutes" de la machine sont souvent évaluées et filtrées selon leur qualité afin de produire les meilleurs résultats. Les lectures qui ont un faible score de qualité Phred et les adaptateurs doivent être éliminés. Lorsque le réassemblage est effectué à partir de zéro sans génome de référence, on parle d'assemblage "de novo". En revanche, lorsqu'un génome de référence est disponible, le processus est beaucoup plus simple car il suffit d'aligner toutes les lectures sur le génome de référence.
Normalement, plusieurs lectures couvrent la même zone du génome. C'est ce qu'on appelle la "profondeur de lecture". La profondeur de lecture mesure le nombre de fois qu'une certaine zone est couverte par différentes lectures. Par exemple, une profondeur de lecture de dix implique que dix lectures se superposent dans la même zone génomique.
L'étape suivante de l'analyse des données NGS est appelée analyse tertiaire.