| volver al índice |
Alineamiento de secuencias.
Búsqueda
de parecidos. Alineamientos
múltiples.
Parte
práctica
Primer ejercicio. Alineamiento de dos secuencias
Haz un alineamiento de estas dos secuencias usando el servidor del EMBL-EBI:
>RPE_YEASTPrueba a hacer un alineamiento global (opción "needle") y uno local (opción "water"). ¿Observas diferencias? ¿Crees que estas dos secuencias están relacionadas?
MVKPIIAPSI LASDFANLGC ECHKVINAGA DWLHIDVMDG HFVPNITLGQ PIVTSLRRSV
PRPGDASNTE KKPTAFFDCH MMVENPEKWV DDFAKCGADQ FTFHYEATQD PLHLVKLIKS
KGIKAACAIK PGTSVDVLFE LAPHLDMALV MTVEPGFGGQ KFMEDMMPKV ETLRAKFPHL
NIQVDGGLGK ETIPKAAKAG ANVIVAGTSV FTAADPHDVI SFMKEEVSKE LRSRDLLD>RPE_MYCPN
MLNLVVNREI AFSLLPLLHQ FDRKLLEQFF ADGLRLIHYD VMDHFVDNTV FQGEHLDELQ
QIGFQVNVHL MVQALEQILP VYLHHQAVKR ISFHVEPFDI PTIKHFIAQI KQAGKQVGLA
FKFTTPLVNY ERLVQQLDFV TLMSVPPGKG GQAFNSAVFN NLKQAHKYHC SIEIDGGIKL
DNIHQIQDDV NFIVMGSGFI KLERWQRQQL LKTNQ
Prueba a obtener el alineamiento utilizando distintas matrices de sustitución y distintas penalizaciones para la apertura y extensión de gaps. Por ejemplo, prueba con BLOSUM62 y BLOSUM40. ¿Observas diferencias? (podéis ver los resultados aquí)
¿Cómo podríamos estar más seguros de
cuál
es el mejor alineamiento? ¿cómo obtenerlo?
Segundo ejercicio. Búsqueda de parecidos en una base de datos. BLAST.
Haz una búsqueda BLAST de RPE_YEAST.
Utiliza los servidores de BLAST del EMBL
o del EBI, ya que permiten
obtener más fácilmente las secuencias de las
proteínas
homólogas (más tarde las utilizaremos en otro ejercicio).
En BLAST-EMBL:
database=Swiss-Prot (nrdb95 es más completa, pero encontraríamos demasiados homólogos que complicarían el análisis).Si pinchamos en "Get selected sequences" obtendremos la secuencia de las proteínas que hemos marcado (por defecto vienen marcadas las que tienen mejores p-values). Las podéis encontrar en este fichero.
filter=none
descriptions=250
alignments=250
Podéis probar a utilizar el BLAST del NCBI (el del EMBL es la versión WU-BLAST, que es un poco distinta) y ver qué os sale.
Resultados BLAST-EMBL. Resultados BLAST-NCBI.
Respecto a las dos proteínas que alineamos anteriormente,
¿qué
e-value tienen? ¿es significativo?
Tercer ejercicio. Alineamiento múltiple de las secuencias encontradas con BLAST.
En este ejercicio haremos un alineamiento múltiple de los
homólogos
que hemos encontrado. Utilizaremos ClustalW.
Podemos hacerlo a través de la red o bien instalarlo y
ejecutarlo
localmente.
A través de la web:
Servidores: ch.EMBNET.org, crick.genes.nig.ac.jp, NPS@.
Lo más importante es cambiar el formato de salida:output format= GCG (ó GCG-msf, que es lo mismo).
Localmente:
Descargarlo e instalarlo; cómo ejecutarlo localmente.Finalmente obtendréis un fichero más o menos como éste.
Practicad un poco con belvu, mirad el árbol de neighbor
joining,
ordenad las secuencias según distintos criterios, eliminad
secuencias
redundantes, etc...
Cuarto ejercicio.
Cuestión
teórica: ¿qué información sale a la luz
cuando
hacemos un alineamiento múltiple?
Quinto ejercicio. Identificación de regiones codificantes utilizando BLAST. (Ramón Alonso Allende)
>human
AGCTTTCTTCTTTTCCCTGTTGCTCAAATAAATAGTGTTCTTTGCTCAAA
CCCCCTTTCCCTCCTCCTTCTGCAATCTCAGCGCCTAGCGAAATCTGTTT
TCTTCATTGTAACCTCAGCTTCACCGCAATTAATTTTTTTTCCCTCTGGT
CACAAGATAATTCCTGACGCCAGTGAGTCTGGAGGTCAGACGAACAGCAA
ATTGGGGAACAAGGCGGCACTAATTCCTTACAAGTTCCTTGAAAAATCTT
TCGCTTAAAAAAAACGGGGGGTGGGGGGAGCTTCTTTGCTGTTCAGGGAT
TTATGCCTCGCGGAGCTGTGGCTCGAACCAGTGTTGGCTAAGGCGGACTG
GCAGGGGCAGGGAAGCTCAAAGATCTGGGGTGCTGCCAGGAAAAAGCAAA
TTCTGGAAGTTAATGGTTTTGAGTGATTTTTAAATCCTTGCTGGCGGAGA
GGCCCGCCTCTCCCCGGTATCAGCGCTTCCTCATTCTTTGAATCCGCGGC
TCCGCGGTCTTCGGCGTCAGACCAGCCGGAGGAAGCCTGTTTGCAATTTA
AGCGGGCTGTGAACGCCCAGGGCCGGCGGGGGCAGGGCCGAGGCGGGCCA
TTTTGAATAAAGAGGCGTGCCTTCCAGGCAGGCTCTATAAGTGACCGCCG
CGGCGAGCGTGCGCGCGTTGCAGGTCACTGTAGCGGACTTCTTTTGGTTT
TCTTTCTCTTTGGGGCACCTCTGGACTCACTCCCCAGCATGAAGGCGCTG
AGCCCGGTGCGCGGCTGCTACGAGGCGGTGTGCTGCCTGTCGGAACGCAG
TCTGGCCATCGCCCGGGGCCGAGGGAAGGGCCCGGCAGCTGAGGAGCCGC
TGAGCTTGCTGGACGACATGAACCACTGCTACTCCCGCCTGCGGGAACTG
GTACCCGGAGTCCCGAGAGGCACTCAGCTTAGCCAGGTGGAAATCCTACA
GCGCGTCATCGACTACATTCTCGACCTGCAGGTAGTCCTGGCCGAGCCAG
CCCCTGGACCCCCTGATGGCCCCCACCTTCCCATCCAGGTAAGCCTCGAA
GTCGGGACAGGGCTGAACACCCAGGCAAGGATGCTGCGGGACCCTCGGAG
CTCCCGATTGCCTCGCGTAACTCTTCCCTCTTTTCCTCTAATCAGACAGC
CGAGCTCGCTCCGGAACTTGTCATCTCCAACGACAAAAGGAGCTTTTGCC
ACTGACTCGGCCGTGTCCTGACACCTCCAGGTGAGTATCTCCTCTCTTGG
AGAGGGAGGTTTAAACGGCAAGTCCTGGAGTTGGCAGACGTTTTGAAAAA
TTGCCACTCACTCGGTTTAGGGAAACTGAGGCCAGAGAGGGACAAGTGAC
TTGCCCATGGTTGCATCAAATGAATGGCAGAGTCAGTTTCCATGTGATGT
GCATTTAAGCCTTAATGCGCCTGGCCCTGCCTCCGCAGTGGCCGAGGTCT
GGCAAGTAGACATGGTCCGACTAAATACAAGTCTTTCTGTTCCATGTTGT
ATAGGAGCTGTCTTCGGCAGCCCCCTCCCAGCTAGTGTCAATTCCAAGTA
GGAGGGGTAGCGCAACGTCCGCCTGTGGTCTTTGGCGCCAACTGGGTGGG
GGCAGCGTGGGGGGCGGAGTTATCAGGCTGGAGGTACAGACCAAGTTTCC
TCCCTGGCGCCGGCCAGTCTGCGGACGGCCCCCGCCTCGGCACGCTCGGC
GGAAACTGACTGCTCCTTGGTCTTCTTTCCTCCCCCGCCCAGAACGCAGG
TGCTGGCGCCCGTTCTGCCTGGGACCCCGGGAACCTCTCCTGCCGGAAGC
CGGACGGCAGGGATGGGCCCCAACTTCGCCCTGCCCACTTGACTTCACCA
AATCCCTTCCTGGAGACTAAACCTGGTGCTCAGGAGCGAAGGACTGTGAA
CTTGTGGCCTGAAGAGCCAGAGCTAGCTCTGGCCACCAGCTGGGCGACGT
CACCCTGCTCCCACCCCACCCCCAAGTTCTAAGGTCTTTTCAGAGCGTGG
AGGTGTGGAAGGAGTGGCTGCTCTCCAAACTATGCCAAGGCGGCGGCAGA
GCTGGTCTTCTGGTCTCCTTGGAGAAAGGTTCTGTTGCCCTGATTTATGA
ACTCTATAATAGAGTATATAGGTTTTGTACCTTTTTTACAGGAAGGTGAC
TTTCTGTAACAATGCGATGTATATTAAACTTTTTATAAAAGTTAACATTT
TGCATAATAAACGATTTTTAAACACTTGTGTATATGATGACACCCGTCTC
CATTAAGTACTAATGATGCTTTCTCGCACATGGCCGAATTTTGGGAGCTT
TGGGAAAGTGAACTTGCTTATTCTACGAGAGGGAAATGAAAAACTGCCTG
GTTGAGAGGGGATGGGGTGGAGAGAGAAGGGTTCATGATGGGAGTCTCAT
GTCCATTGAGGGATGGGTGCAGAGAAAAGTTCTGGCTCTGCCTCATTATT
TCAGAGATGAAACCAGAGACTGGTGCAAGCT
Trataremos de determinar si hay evidencias de transcripción de algún fragmento de nuestra secuencia (lo cual sería prueba de que hay algún gen). Para ello usaremos la herramienta de BLAST contra una base de datos de ESTs (expressed sequence tags).
* Entramos en la pagina web del Blast
del NCBI y pinchamos en "Nucleotide-nucleotide BLAST
[blastn]"
* Copiamos nuestra secuencia y la pegamos en la
caja de "search"
* Elegimos la base de datos de "est" en el apartado
"Choose database". En el caso de la secuencia de humano, elegimos la de
ESTs de humanos
* El resto se deja como está y pulsamos
"BLAST!"
* Después de un rato debería salir
un resultado semejante a este
Cuestiones: ¿qué es un EST?, ¿crees que la secuencia de ADN podría contener algún gen?, de ser así: ¿qué estructura tendría ese gen aproximadamente?
Otra cuestión: Si no hubiese librerías de ESTs
y tuvieses una secuencia de ADN ¿se te ocurre alguna forma de
determinar
si esa secuencia contiene algún gen utilizando BLAST?
| volver al índice |