L'évaluation de l'alignement des séquences de protéines
Pour étudier la relation phylogénétique entre les protéines, les séquences d'acides aminés sont alignées de manière à atteindre la similarité maximale. Les remplacements d'acides aminés sont ensuite classés en fonction de leur probabilité. Par exemple, un changement Gly-Ala est plus probable qu'un changement Gly-Pro qui modifierait la structure 3D de la protéine. Ainsi, on peut déduire le degré d'homologie. Ces distances évolutives sont généralement représentées sous la forme d'un arbre phylogénétique. Pour valider le résultat, l'analyse est répétée plusieurs fois et les arbres résultants sont superposés les uns aux autres (amorçage), en ne montrant que l'arbre phylogénétique le plus probable. Une valeur est attribuée à chaque nœud en fonction de la proportion d'arbres amorçés qui montrent ce même clade. Les nœuds dont la valeur est supérieure à 70 % sont considérés comme cohérents.
L'arbre phylogénétique résultant renseigne sur la taxonomie des différentes espèces. Dans le cas des protéines, les homologues proches sont généralement responsables des fonctions similaires. Lorsque des protéines bien étudiées sont incluses dans l'analyse phylogénétique, on peut déduire la fonction biologique des enzymes étroitement apparentées.