DNA-Sequenzierung
Die DNA-Sequenzierung ist eine Methode zur Identifizierung jeder einzelnen Base eines DNA-Strangs.
Sequenzierung der ersten Generation
Abbildung 1. Kettenterminierungsmethode. Die markierten DNA-Moleküle werden ihrer Größe nach getrennt. Jedes Molekül besitzt ein modifiziertes Nukleotid (ddNTP), welches mit einem fluoreszenten Farbstoff markiert ist. Jede Base besitzt eine unterschiedliche fluoreszente Farbe.
Die Sequenzierung der ersten Generation bezieht sich auf die Kettenterminationsmethode, die 1977 von Fredrick Sanger und seinen Mitarbeitern entwickelt wurde (Abbildung 1). Das DNA-Molekül wird mit einem modifizierten Nukleotid amplifiziert, in jedem Zyklus wird nur eine Base angehängt. Die DNA wird dann mit variierender Länge amplifiziert:
Jeder Strang ist ein Basenpaar länger als das vorherige Molekül. Die Moleküle werden dann in einer Kapillare getrennt. Jede Base ist mit einem fluoreszenten Farbstoff markiert. Indem die unterschiedlichen Farbsignale ausgelesen werden, sind wir in der Lage, die Base zu identifizieren (A, G, T oder C).
Sequenzierung der nächsten Generation
Die Sequenzierung der nächsten Generation (Next-Generation-Sequencing, NGS) ist eine fortgeschrittene Technologie bei der viele kurze DNA-Moleküle gleichzeitig sequenziert werden. Die Technologie wird auch Massive Parallelsequenzierung bezeichnet. Die kurzen DNA-Moleküle werden dann zusammengebaut, indem ihre Sequenz mit einer Referenzsequenz verglichen wird. Durch den Zusammenbau können wir die komplette DNA-Sequenz erhalten, die sehr lang sein kann (so lang wie unser gesamtes Genom!).
Es gibt viele unterschiedliche Arten des Next-Generation-Sequencings und jede verwendet eine andere Sequenzierungsmethode. In unserem Fall werden wir uns auf die Reversible Farbstoff-Terminationsmethode von Illumina konzentrieren. In dieser Methode wird die DNA zuerst in kürzere Stränge fragmentiert und zwei kurze DNA-Moleküle namens "Adapter" werden an jedes Ende der Probe ligiert (Abbildung 2). Diese Adapter fungieren als Primerbindestelle, um die DNA während der PCR zu amplifizieren und an die Fließzelle zu binden. Bevor wir die Daten analysieren, entfernen wir die Adapter, da sie keine biologische Sequenz darstellen.
DNA-Moleküle mit Adapter und Primern werden zuerst an die Fließzelle angeheftet und mit Hilfe des Enzyms Polymerase amplifiziert, was zur Bildung der klonalen DNA-Kolonien führt. Diese DNA-Kolonien heißen auch DNA-Cluster. Jedes Cluster enthält genau die gleiche DNA-Sequenz; deshalb wird die DNA auch klonal genannt. Ähnlich zur Sequenzierung der ersten Generation sind die Nukleotide individuell mit fluoreszenten Farbstoffen markiert. Nach der Addition eines Nukleotids endet die Elongation und es wird ein Bild gemacht. Danach wird der Blocker am 3'-Ende chemisch von der DNA entfernt, was den nächsten Zyklus ermöglicht.
Die Parallelsequenzierung produziert Millionen und Milliarden Reads pro Durchlauf. Dies führt zu einem exponentiell höheren Durchsatz im Vergleich mit der Sequenzierung der ersten Generation. NGS hat viele verschiedene Anwendungen, wie SNP-Profiling, Genexpressionsanalyse, Detektion von genetischen Veränderungen wie Mutationen oder chromosomale Veränderungen. Sobald die DNA extrahiert ist, muss sie für die Sequenzierung vorbereitet werden.
Die unterschiedlichen Schritte der Probenvorbereitung werden hier aufgelistet:
- Fragmentierung
- Enden-Reparatur
- A-Tailing
- Adapterligation
- PCR-Amplifikation
Darauf folgt die Cluster-Erstellung und die Sequenzierung.
DNA-Mutation
Es gibt unterschiedliche Klassifikationen von DNA-Mutationen; du kannst basierend auf der Schreibweise einiges über die Mutationen herausfinden. Zum Beispiel:
- 345G>T bedeutet, dass an Position 345 ein Guanin durch ein Thymin ersetzt wurde.
- 345delGT bedeutet, dass ab Position 345 zwei Nukleotide deletiert worden sind (Guanin und Thymin).
- 345dupA bedeutet, dass an Position 345 eine Duplikation stattgefunden hat, was in zwei Adeninen resultiert.
- 345insTA bedeutet, dass an Position 345 zwei Nukleotide eingefügt worden sind (Thymin und Adenin).