Puntuación de alineación de secuencias de proteínas
Para estudiar la relación filogenética entre proteínas, se alinean las secuencias de aminoácidos de manera que alcancen la máxima similitud. Después, los reemplazos de aminoácidos se clasifican según su probabilidad. Por ejemplo, es más probable un cambio de Gly-Ala que un cambio de Gly-Pro, que alteraría la estructura 3D de la proteína. Así, podemos derivar el grado de homología. Estas distancias evolutivas se suelen describir como un árbol filogenético. Para validar el resultado, se repite el análisis varias veces y se superponen entre sí los árboles resultantes (análisis bootstrap o de remuestreo), lo que solo muestra el árbol filogenético más probable. A cada nodo se le asigna un valor basado en la proporción de árboles remuestreados que muestran ese mismo predecesor. Los nodos con un valor superior al 70 % se consideran consistentes.
El árbol filogenético resultante proporciona información sobre la taxonomía de las diferentes especies. En el caso de las proteínas, los homólogos cercanos suelen ser responsables de funciones similares. Cuando se incluyen proteínas bien estudiadas en el análisis filogenético, se puede derivar la función biológica de enzimas estrechamente relacionadas.