Análisis primario
El análisis primario incluye todos los pasos necesarios para identificar cada base. Además de identificar las bases, la máquina de secuenciación también asignará una puntuación de calidad a cada una de las bases.
El resultado se almacena como un archivo FASTQ (ver imagen), que contiene los identificadores de la secuencia, los nucleótidos asignados (A, G, T o C), que también se denominan «lecturas», y la puntuación de calidad Phred asociada. Cuando el carácter «N» está asociado a un nucleótido, eso significa que la máquina no puede determinar el nucleótido exacto. La puntuación de calidad Phred se refiere a la probabilidad de una identificación de base incorrecta. En un archivo FASTQ, la puntuación de calidad Phred se almacena como un carácter ASCII (una letra, un dígito o un símbolo), cuyo valor ASCII indicará la precisión de la identificación de bases.
El análisis primario suele realizarse automáticamente en la máquina de secuenciación después de cada ejecución.
Si deseas secuenciar varias muestras juntas en una misma ejecución (por ejemplo, de diferentes pacientes o diferentes experimentos), puedes asignar un marcador específico a cada una de ellas. El marcador (también conocido como código de barras) es una secuencia corta de ADN que se añade al adaptador para diferenciar las lecturas de cada muestra. Este marcador también se secuenciará, y al identificar la secuencia específica del adaptador para cada muestra, podrá separarlas unas de otras. Esto también se llama multiplexación y tiene la ventaja añadida de reducir el coste de la secuencia y producir muestras más grandes.
Ejemplo de un archivo FASTQ resultado de la NGS.
El siguiente paso en el análisis de datos NGS se llama análisis secundario.