Laboratorio 5: Contrastes y aplicaciones


5.1 MP bootstrap en PHYLIP
5.2 NJ bootstap con MEGA
5.3 ML bootstap con PHYML
5.4 Comparación de árboles con TREE-PUZZLE


5.1 MP bootstrap en PHYLIP

El paquete de programas
PHYLIP de Joe Felsenstein fue uno de los primeros programas ampliamente disponibles para la estimación filogenética. Aunque a día de hoy existen otros programas más sofisticados, se trata de un programa fácil de usar y por lo tanto conveniente para la realización de ejercicios básicos en filogenia.

Ejercicio 5.1.1. Estima un árbol consenso MP de bootstrap para el alineamiento HIV.gag.phy.
  1. Mueve tu archivo "HIV.gag.phy" a la misma carpeta que el programa "dnapars"
  2. Primero vamos a generar las pseudorréplicas de bootstrap. Inicia "seqboot" haciendo doble-click en su icono. Escribe "HIV.gag.phy".
  3. Fíjate el menu de opciones y explóralo. Para indicar cuantas pseudorréplicas de bootstrap quieres pulsa "R" (y enter) y a continuación escribe, por ejemplo 100 (se suelen hacer 1000 réplicas al menos).
  4. Cuando todo esté listo, escribe "Y" para comenzar el análisis, aunque antes deberás indicar la semilla de aleatorización (debe ser un número impar).
  5. Las pseudorréplicas se han grabado en el archivo "outfile". Renombra este archivo como "HIV.gag.MP.boot" y explóralo. Verás que contiene 100 alineamientos!
  6. A continuación queremos estimar el árbol de MP para cada una de estos 100 alineamientos. Para ello inicia "dnapars" haciendo doble-click en su icono. Escribe como archivo de entrada "HIV.gag.MP.boot"
  7. Nos interesa hacer varias búsquedas comenzado en diferentes puntos, por lo vamos a aleatorizar el order de entrada de las especies en las diferentes réplicas de búsqueda. Para ello pulsa "J" (y enter) y a continuación escribe un número impar (por ejemplo 13457; es la semilla de aleatorización). Indica ahora cuantas réplicas de búsqueda quieres, por ejemplo 10.
  8. Para indicar que O.CM.MVP5 será el "outgroup" pulsa "O" y a continuación el número que ocupa esta subtipo en tu archivo de entrada original (20).
  9. Finalmente, indica que quieres analizar varios alineamientos (100 en este caso) pulsando "M", luego "D", e indicando 100 sets de datos.
  10. Cuando todo esté listo, escribe "Y" para comenzar el análisis, que será algo más lento, ya que vas a hacer 10 x 100 = 1000 búsquedas! Ten paciencia. SI tarda demasiado, comienza de nuevo con un número menor de pseudorréplicas
  11. Los resultados se han grabado en los archivos "outfile" y "outree". Renombra estos archivos como "HIV.gag.MP.boot.analisis" y "HIV.gag.MP.boot.tre", respectivamente, y explóralos.
  12. Ya estamos llegando al final. Ahora sólo nos queda hacer un consenso de 50% de la mayoría de todos estos árboles del archivo "HIV.gag.MP.boot.tre". Para ello inicia el programa "consense", define el outgroup (opción "O"), e inicia el análisis (opción "Y").
  13. Los resultados se han grabado en los archivos "outfile" y "outree". Renombra estos archivos como "HIV.gag.MP.boot.consense.analisis" y "HIV.gag.MP.boot.consense.tre", respectivamente.
  14. Examina los archivo resultantes y visualiza el árbol consenso de bootstrap obtenido ("HIV.gag.MP.boot.consense.tre") con el programa FigTree. Si te pregunta qué son esas etiquetas ("labels"), dile que son "boostraps". Luego podrás seleccionarlos con los menús de la izquierda: "Branch labels"> Display > bootstraps (o la etiqueta que hayas escrito).
  15. ¿Existe un soporte alto para todos los nodos?

5.2 NJ bootstrap con MEGA

MEGA es un programa de análisis filogenético y molecular con diversas capacidades, como el alineamiento, la reconstrucción de árboles filogenéticos mediante parsimonia y distancias, representación de árboles, además de diversos análisis de divergencia y adaptación molecular.

Ejercicio 5.2.1 Con el alineamiento de 40 secuencias de la region tat del HIV: HIVtat.meg vamos a obtener el soporte de bootstrap para los nodos internos.
  1. Comienza MEGA5 pulsando dos veces en el icono de MEGA.
  2. Abre el archivo "HIVtat.meg": File > Open A File/Session.
  3. Indica que son secuencias nucletódicas, no codificantes (sí lo son pero para este ejercicio no vamos a usar modelos de codones).
  4. Selecciona el comando Phylogeny|Construct/Test|Neighbor-Joining Tree para observar las diferentes opciones.
  5. En la sección Substitution Model pulsa el menu Model/Method y selecciona la opción p-distance.
  6. En la sección Phylogeny Test, pulsa el menu Test of Phylogeny y selecciona la opción Bootstrap method. En No of Bootstrap replications indica 1000.
  7. Pulsa Compute para aceptar las opciones por defecto e iniciar los cálculos. Enseguida se abrirá la ventana del Explorador de árboles ("Tree Explorer") con dos pestañas. La primera pestaña es el árbol original NJ con los valores de bootstrap ya colocados en sus ramas, mientras que la segunda es el consenso de la mayoría de bootstrap.
  8. Para producir un árbol condensado, usa el comando Compute|Condensed Tree del menu del explorador. Si indicas un "Cutt-off" del 50%, este árbol mostrará sólo los nodos que superan el valor de bootstrap del 50%.

5.4 ML bootstrap con Phyml

En ésta práctica vamos a experimentar con el método de máxima verosimilitud usando el programa PHYML de nuevo. Más información en la página web de Phyml.

Ejercicio 5.4.1 Vamos a trabajar con el set de datos del dengue dengue.env.phy.
  1. Antes de nada, justifica el mejor modelo de sustitución nucleotídica con jModelTest, si no lo has hecho antes.
  2. Ejecuta el programa PHMYL y examina las opciones disponibles en el menú. Para moverte entre submenus usa las teclas "+" y "-".
  3. Especifica el archivo de entrada: dengue.env.phy, que deberá estar en el mismo directorio que el programa.
  4. Especifica las diferentes opciones de los datos (D, I).
  5. Muévete al siguiente submenu ("+")
  6. Especifica las diferentes opciones del modelo de evolución (M, F, T, V, R, C, A).
  7. Muévete al siguiente submenu ("+")
  8. Especifica las diferentes opciones de búsqueda (U, O, S). En principio las que están por defecto pueden servir.
  9. Muévete al siguiente submenu ("+")
  10. Especifica 100 réplicas de bootstrap (B) (ten paciencia o usa el servidor online de Phyml). En la práctica haríamos 1000!
  11. Inicia la estimación (Y).
  12. Examina los archivo resultantes y visualiza el árbol obtenido ("*.ml_tre.txt") con el programa FigTree. Sique te pregunta qué son esas etiquetas ("labels"), dile que son "bootstraps". Luego podrás seleccionarlo con los menús de la izquierda: Branch labels > Display > "bootstraps" (o la etiqueta que hayas escrito antes).

5.4 Comparación de árboles con TREE-PUZZLE

El programa TREE-PUZZLE utiliza la técnica de cuartetos ("quartets") para realizar diversas estimas filogenéticas. En este caso lo vamos a utilizar para comparar estadísticamente tres árboles diferentes.

Ejercicio 5.4.1 Vamos a usar el archivo HIVpol.phy. Bájalo a la carpeta de tree-puzzle.
  1. Instala TREE-PUZZLE en tu ordenador
  2. Abre la carpeta del programa y examina el archivo HIVpol.trees. Este archivo contiene los 4 árboles que queremos comparar.
  3. Arranca tree-puzzle pulsando dos veces sobre el ejecutable (""puzzle.exe"). Asegúrate de que los archivos que vas a usar estáne en la misma carpeta que el ejecutable.
  4. Especifica el archivo de entrada "HIVpol.phy"
  5. Elige la opción "k" para indicar que queremos evaluar nuestros propios árboles.
  6. Ajusta los distintos aspectos del modelo de sustitución (especifica TN+G), de forma que los parámetros sean estimado a partir de un NJ.
  7. Confirma ("y") para comenzar el análisis.
  8. Indica que el archivo "HIVpol.trees" contiene los árboles.
  9. Cuando el programa ha terminado, examina los archivos de salida (outfile, outree). En la sección "COMPARISON OF USER TREES (NO CLOCK)" del archivo "outfile" se indican los valores de probabilidad de diferentes tests de topología. Según el test 1sKH, ¿son los árboles diferentes? ¿Y según el test SH? ¿Qué concluyes?

This document last modified Monday June 06, 2011