alineamientos con pr Áctica 2: clustal...
TRANSCRIPT
-
PRÁCTICA 2: Alineamientos con Clustal Omega
-
1. Clustal Omega Programa para realizar alineamientos de múltiples secuencias de proteínas y DNA/RNA
-
Cómo funciona Clustal Omega
3
5 pasos principales en la ejecución:
1. Alineamiento por pares2. mBed clustering3. K-means clustering4. Creación de un árbol filogenético5. Alineamiento progresivo (Hidden Markov Model)
-
Clustal Omega online
4
Alternativa online -> https://www.ebi.ac.uk/Tools/msa/clustalo/
https://www.ebi.ac.uk/Tools/msa/clustalo/
-
Instalación
1. Descargar binarios para Windows, Linux o Mac -> http://www.clustal.org/omega/Debian Package -> clustalo
2. Para los usuarios de Linux y Mac asegurarse de que se tienen permisos de ejecución -> chmod u+x clustalo
3. Descargar e instalar argtable2 (instrucciones en el README) -> http://argtable.sourceforge.net/
4. En el caso de haber problemas en Linux y Mac: Añadir la variable de entorno LD_LIBRARY_PATH = /usr/local/lib/DYLD_LIBRARY_PATH en Mac
5
http://www.clustal.org/omega/http://argtable.sourceforge.net/
-
Uso Web
1. Seleccionar tipo de secuencia: Proteinas, DNA o RNA2. Introducir secuencias en cualquiera de los siguientes formatos GCG,
FASTA, EMBL (Solo nucleótidos), GenBank, PIR, NBRF, PHYLIP o UniProtKB/Swiss-Prot (Solo proteinas):
3. 2 maneras de introducir:a. Textob. Añadir fichero
4. Exportar a diferentes formatos: ClustalW, Fasta, PHYLIP...etc.
6
-
Ejemplo Mus Musculus (Ratón común)
7
-
Otro ejemplo (DNA mitocondrial)
8
10 secuencias de 16.568 pb tiempo aproximado 4 minutos
-
Ejemplo grande (Canis Lupus Familiaris : Perro)
9
2 secuencias de 100.000 pb tiempo aproximado 15 minutos
-
Uso en local o lab
▪ clustalo --help para mas ayuda▪ Comando generico: clustalo -i secuencia.fa -o salida.fa -v▪ Ejemplos comandos en web▪ Tiempo mejor en local que en web
▫ ¿Merece la pena? Web produce salidas visuales
10
-
In and Out File
-i, --in, --infile={,-}
Multiple sequence input file (- for stdin)
-o, --out, --outfile={file,-}
Multiple sequence alignment output file (default: stdout)
11
-
Configuraciones Clustal Omega
12
for Fasta format set: --outfmt=a2m or --outfmt=fa or --outfmt=fasta
for Clustal format set: --outfmt=clu or --outfmt=clustal
-
Más opciones:
13
-
mBed-like Clustering Guide-tree
Esta opción usa una muestra de las secuencias de entrada y luego representa todas las secuencias como vectores de estas secuencias, lo que permite una generación mucho más rápida del árbol guía, especialmente cuando el número de secuencias es grande.
14
- -full
Use full distance matrix for guide-tree calculation (slow; mBed is default)
-
mBed-like Clustering Iteration
- -full-iter
Use full distance matrix for guide-tree calculation during iteration (mBed is default)
15
-
Number of iterations
--iterations, --iter= Number of (combined guide tree/HMM) iterations
--max-guidetree-iterations= Maximum guide tree iterations
--max-hmm-iterations= Maximum number of HMM iterations
16
-
Para más opciones
http://clustal.org/omega/README
--cluster-size=
soft maximum of sequences in sub-clusters
--use-kimura
use Kimura distance correction for aligned sequences (default no) (Sólo puede utilizarse con proteínas)
17
-
Ejemplos típicos
clustalo.exe -i sequence.fasta -o sequenceAling.fa --threads=8 -v
clustalo.exe -i hiv.fasta -o sequenceAlingHIV.fa --threads=8 -v --cluster-size=10
18
-
2. MSAviewerComponente modular para visualizar grandes Multiple Sequence Alignment en la web
-
Instalación
La instalación estándar requiere tener una página web funcional, o utilizar un entorno de desarrollo web.
Lo más sencillo sería instalar el entorno NPM e instalar MPA como dependencia.
20
-
Solución sencilla: versión web
http://msa.biojs.net/app/Podemos trabajar directamente sin necesidad de instalación: es más lento pero nos simplifica la vida en nuestro caso.
21
http://msa.biojs.net/app/
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
Alternativa: AliView
30
-
Gracias¿Preguntas?
31