Sekundäranalyse
Die Sekundäranalyse wird nach der Primäranalyse durchgeführt . Der erste Schritt vor der Durchführung der Sekundäranalyse ist das Herausschneiden von Markern und Adaptern, da diese Sequenzen keine biologische Bedeutung haben.
Das Hauptziel der Sekundäranalyse besteht darin, alle kurzen DNA-Sequenzen (auch Reads genannt) zusammenzufügen, um die Sequenzdaten zu interpretieren. Vor dieser Zusammenfügung werden die "rohen" Reads aus dem Gerät häufig bewertet und auf ihre Qualität hin gefiltert, um die besten Ergebnisse zu erzielen. Reads mit niedrigen Phred-Qualitätsscores sollten entfernt und Adapter herausgeschnitten werden. Wenn die Neuzusammensetzung von Grund auf ohne Referenzgenom durchgeführt wird, spricht man von de novo assembly. Im Gegensatz dazu ist der Prozess viel einfacher, wenn ein Referenzgenom zur Verfügung steht, da wir einfach alle Reads an das Referenzgenom ausrichten können.
Normalerweise haben wir mehrere Reads, die denselben Bereich des Genoms abbilden; dies wird oft als „Lesetiefe“ bezeichnet. Die Lesetiefe misst, wie oft ein bestimmter Bereich von verschiedenen Reads abgedeckt wird. Eine Lesetiefe von zehn bedeutet beispielsweise, dass im selben Genombereich zehn Reads übereinander kartiert sind.
Der nächste Schritt in der NGS-Datenanalyse ist die Tertiäranalyse.