Le séquençage
Le séquençage de l'ADN est une méthode permettant d'identifier chaque base qui compose le brin d'ADN.
Séquençage de première génération
Figure 1. Méthode par terminaison de chaîne. Les molécules d'ADN marquées sont séparées en fonction de leur taille. Chaque molécule possède un nucléotide modifié (ddNTP) qui est marqué par un colorant fluorescent. La couleur de fluorescence différente indique une base spécifique.
Le séquençage de première génération fait référence à la méthode par terminaison de chaîne qui a été développée par Fredrick Sanger et ses collègues en 1977 (figure 1). La molécule d'ADN est amplifiée avec un nucléotide modifié, ne permettant qu'un seul addition de base par cycle. L'ADN est ensuite amplifié avec une longueur variable : Chaque brin est plus long d'une paire de bases que la molécule précédente. Ces molécules sont ensuite séparées dans un capillaire. Chaque base est marquée avec un colorant fluorescent. En lisant le signal de couleur différente, nous sommes capables d'identifier la base (A, G, T ou C).
Séquençage de nouvelle génération
Le séquençage de nouvelle génération est une technologie de séquençage avancée où de nombreuses molécules d'ADN courtes sont séquencées en même temps. Cette technologie est également appelée séquençage massivement parallèle. Ces courtes molécules d'ADN sont ensuite assemblées en comparant leur séquence à une séquence de référence, révélant ainsi la séquence complète de l'ADN qui peut être très longue (aussi longue que notre génome !)
Il existe de nombreuses plateformes de séquençage de nouvelle génération différentes, et chacune d'entre elles utilise une technique de séquençage de l'ADN différente. Dans notre laboratoire, nous nous concentrerons sur la *technologie de terminaison de colorant réversible employée par Illumina. Dans cette méthode, l'ADN est d'abord fragmenté en brins plus courts. Deux courtes molécules d'ADN, appelées "adaptateurs", sont ensuite ligaturées à chaque extrémité de l'échantillon (figure 2). Ces adaptateurs fonctionneront comme un site d'ancrage d'amorce pour amplifier l'ADN pendant la PCR et pour se lier à la cellule d'écoulement. Avant d'analyser les données, nous retirons les adaptateurs, car ils ne constituent pas une séquence biologique.
Les molécules d'ADN qui ont des adaptateurs et des amorces sont d'abord fixées sur une lame (appelée la cellule à circulation) et amplifiées avec une enzyme polymérase, créant ainsi des colonies d'ADN clonales locales. Ces colonies d'ADN sont également appelées amas d'ADN. Chaque amas contient exactement la même séquence d'ADN, d'où le terme de colonies d'ADN clonales. Comme pour la technique de séquençage de première génération, les nucléotides sont individuellement marqués avec un colorant fluorescent. Après l'ajout d'un nucléotide, l'élongation s'arrête et une photo est prise. Ensuite, le bloqueur se trouvant à l'extrémité 3' est chimiquement retiré de l'ADN, ce qui permet au cycle suivant d'ajouter des nucléotides et de se dérouler.
Le séquençage parallèle produit des millions et des milliards de lectures par cycle. C'est exponentiellement plus grand que les lectures produites par le séquençage de première génération. Le séquençage de nouvelle génération est une technique très puissante qui peut être utilisée pour de nombreuses applications différentes, telles que le génotypage des SNP, l'analyse de l'expression des gènes et la détection des aberrations génétiques (comme les mutations ou les réarrangements chromosomiques). Une fois l'ADN extrait, il doit être traité pour son séquençage.
Les différentes étapes de préparation des échantillons sont décrites ci-dessous :
- La fragmentation
- La réparation des extrémités
- L'extension homopolymérique
- La ligation des adaptateurs
- L'amplification PCR
Ceci est suivi par la génération de clusters et le processus de séquençage proprement dit.
Mutation de l'ADN
Il existe plusieurs classifications pour les mutations de l'ADN. Vous pouvez obtenir plus d'informations sur la mutation à partir de la manière dont elle est écrite. Par exemple :
- 345G>T signifie qu'il y a une substitution de nucléotide de la guanine en thymine sur la position 345.
- 345delGT signifie qu'il y a une délétion de deux nucléotides (guanine et thymine) à partir de la position 345.
- 345dupA signifie qu'il y a une duplication en position 345, ce qui entraîne deux résidus d'adénine.
- 345insTA signifie qu'il y a deux nucléotides insérés (thymine et adénine) à partir de la position 345.