Labster Logo

Análisis primario

El análisis primario incluye todos los pasos necesarios para identificar cada base. Además de identificar las bases, la máquina de secuenciación también asignará una puntuación de calidad a cada una de las bases.

El resultado se almacena como un archivo FASTQ (ver imagen), que contiene los identificadores de la secuencia, los nucleótidos asignados (A, G, T o C), que también se denominan «lecturas», y la puntuación de calidad Phred asociada. Cuando el carácter «N» está asociado a un nucleótido, eso significa que la máquina no puede determinar el nucleótido exacto. La puntuación de calidad Phred se refiere a la probabilidad de una identificación de base incorrecta. En un archivo FASTQ, la puntuación de calidad Phred se almacena como un carácter ASCII (una letra, un dígito o un símbolo), cuyo valor ASCII indicará la precisión de la identificación de bases.

El análisis primario suele realizarse automáticamente en la máquina de secuenciación después de cada ejecución.

Si deseas secuenciar varias muestras juntas en una misma ejecución (por ejemplo, de diferentes pacientes o diferentes experimentos), puedes asignar un marcador específico a cada una de ellas. El marcador (también conocido como código de barras) es una secuencia corta de ADN que se añade al adaptador para diferenciar las lecturas de cada muestra. Este marcador también se secuenciará, y al identificar la secuencia específica del adaptador para cada muestra, podrá separarlas unas de otras. Esto también se llama multiplexación y tiene la ventaja añadida de reducir el coste de la secuencia y producir muestras más grandes.

Ejemplo de un archivo FASTQ resultado de la NGS.

En la parte superior de los resultados, se muestran los identificadores de la secuencia de Illumina. A continuación, se muestra la lectura, o secuencia de nucleótidos. Debajo de la lectura se muestra una puntuación de calidad Phred. Los identificadores de secuencia de Illumina consisten en números y letras que representan el nombre del instrumento, el número de célula de flujo, la celda y las coordenadas dentro de la celda. La puntuación de calidad Phred es un número del 10 al 50, en el que el 10 indica un 90 % de precisión en la identificación de bases y el 50 un 99,999 %.

El siguiente paso en el análisis de datos NGS se llama análisis secundario.