L'analyse primaire
L'analyse primaire comprend toutes les étapes nécessaires pour identifier chaque base. Outre l'identification des bases, la machine de séquençage attribue un score de qualité à chaque base.
Le résultat est stocké sous la forme d'un fichier FASTQ (voir image) qui contient les identificateurs de séquence, les nucléotides attribués (A, G, T ou C) également appelés "lectures", et le score de qualité Phred associé. Lorsque le caractère "N" est associé à un nucléotide, cela signifie que la machine ne peut pas déterminer le nucléotide exact. Le score de qualité Phred fait référence à la probabilité d'un appel de base incorrect. Dans un fichier FASTQ, le score de qualité Phred est stocké sous forme de caractère ASCII (une lettre, un chiffre ou un symbole), dont la valeur ASCII indique la précision de l'appel de base.
L'analyse primaire est généralement effectuée automatiquement dans la machine de séquençage après chaque cycle.
Si vous souhaitez séquencer plusieurs échantillons en un cycle (par exemple, provenant de différents patients ou de différentes expériences), vous pouvez attribuer un marqueur spécifique à chaque échantillon. Le marqueur (également appelé code-barres) est une séquence d'ADN courte ajoutée à l'adaptateur pour différencier les lectures de chaque échantillon. Ce marqueur sera également séquencé, et en identifiant la séquence spécifique de l'adaptateur pour chaque échantillon, vous serez en mesure de les séparer les uns des autres. Cette méthode, également appelée multiplexage, a l'avantage de réduire le coût de la séquence et de produire des échantillons plus importants.
Exemple d'un fichier FASTQ résultant de la SNG.
L'étape suivante de l'analyse des données SNG est appelée analyse secondaire.