1 ensamblado de fragmentos de adn grupo 6. 2 organizaciÓn 1. background biológico 2.modelos...
TRANSCRIPT
![Page 1: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/1.jpg)
1
Ensamblado de fragmentos de ADN
Grupo 6
![Page 2: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/2.jpg)
2
ORGANIZACIÓN
1. Background Biológico
2.Modelos
3.Algoritmos
![Page 3: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/3.jpg)
3
BACKGROUND BIOLÓGICO
•¿Qué es una secuencia de ADN ?
Es un método que nos permite descubrir como es la secuencia del ADN.
•¿Qué es la secuenciación ?
Es una disposición u ordenamiento
de las cuatro bases (A, T, C, G), en la
molécula de ADN.
![Page 4: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/4.jpg)
4
METODOLOGÍA
Gen no es igual Genoma
Secuenciación a gran escala
Herramientas de la bioinformática
![Page 5: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/5.jpg)
5
GENOMA
Dos métodos de secuenciación principales:
WHOLE GENOME SEQUENCING
Por lo general utilizado para genomas poco repetitivos
(virus, bacterias, moscas)
HIERARCHICAL SHOTGUN SEQUENCING
Por lo general para genomas con repeticiones
(eucariontes en general)
Ventajas:
-Detecta secuencias repetidas
-No tiene problemas de regiones poco representadas
1 2
![Page 6: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/6.jpg)
6
Enzima de restricción de alta frecuencia de corte (1 a 2 kb)
Se eligen clones en forma aleatoria
DNA TARGET
Se introducen fragmentos en vectores
Fragmentos desordenados
Introducción de1 vector por cada bacterias (clon)
Secuenciación y Ensamblado
Secuencia de DNA target
1
![Page 7: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/7.jpg)
7
YACS
Mapeo Físico
DNA target (muchas copias)
Enzima de restricción de baja frecuencia de corte
fragmentos de 10 a 1000 kb
Elección al azar de algunas colonias
2
![Page 8: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/8.jpg)
8
Elección al azar de algunas colonias
Se replican
Se elige un clon
fragmentos cortos (40 kb)
Enzima de restricción de alta frecuencia de corte
Inclusión de fragmentos en cósmidos
Introducción de fragmentos en bacterias
Secuenciación de fragmentos pequeños
ENSAMBLADO DE SECUENCIAS DE FRAGMENTOS CORTOS
![Page 9: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/9.jpg)
9
ENZIMAS DE RESTRICCION
![Page 10: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/10.jpg)
10
CASO IDEAL
Supongamos que tenemos las siguientes secuencias:
ACCGT CGTGC TTAC TACCGT
Una posible manera de ensamblarlas :
--ACCGT-- ----CGTGC TTAC----- -TACCGT--
TTACCGTGC
Las secuencias fueron alineadas ignorando los espacios de las extremidades. Se trata de alinear en la misma columna bases que sean iguales.
![Page 11: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/11.jpg)
11
COMPLICACIONES
1. Instancias reales del problema muy largas
2. Errores
Inserciones, deleciones , sustituciones
Fragmentos quiméricos
Contaminación
Regiones repetidas
3. Orientación desconocida
4. Regiones repetidas
5. Pérdida de cobertura
![Page 12: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/12.jpg)
12
Inserción: inserta una base o varias (fragmento).
Deleción: se pierde una base o varias (fragmento).
Sustitución: cambio de una base por otra.
Contaminación con vector: existencia de vector entre los fragmentos de ADN a secuenciar.
Fragmento quimérico: unión de dos fragmentos de ADN que no son parte contigua en el ADN target.
Orientación desconocida: se desconoce a que hebra pertenece cada fragmento (aunque sabemos que la lectura es de 5’ a 3’. (Problema vs. Beneficio)
![Page 13: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/13.jpg)
13
Regiones repetidas: sucesiones de nucleótidos que aparecen más de una vez.
Falta de cubrimiento: quedan gaps, en la secuencia, se define cubrimiento en la posición i del target como el número de fragmentos que cubren esta posición. (concepto imposible de computar, no se conocen las posiciones de los fragmentos en el target. Se saca el cubrimiento medio)
![Page 14: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/14.jpg)
14
ERRORES1-5 errores / 100 caracteres
FRAGMENTOS TARGET
ACCGT --ACCGT--
CGTGC ----CGTGC
TTAC TTAC-----
TGCCGT -TGCCGT--
TTACCGTGCError de sustitución en la segunda posición del últimofragmento donde la A fue remplazada por una G
![Page 15: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/15.jpg)
15
FRAGMENTO TARGET
ACCGT --ACC-GT--
CAGTGC ----CAGTGC
TTAC TTAC------
TACCGT -TACC–GT--
TTACC–GTGC
Error de inserción en la segunda posición del segundo fragmento
![Page 16: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/16.jpg)
16
FRAGMENTO TARGET
ACCGT --ACCGT--
CGTGC ----CGTGC
TTAC TTAC-----
TACGT -TAC-GT--
TTACCGTGC
Deleción en la tercera o cuarta posición del último fragmento
![Page 17: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/17.jpg)
17
CACGT CACGT--------
ACGT -ACGT--------
ACTACG --CGTAGT-----
GTACT -----AGTAC---
ACTGA --------ACTGA
CTGA ---------CTGA
ORIENTACION DESCONOCIDA
![Page 18: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/18.jpg)
18
ACCGT --ACCGT--
CGTGC ----CGTGC
TTAC TTAC-----
TACCGT -TACCGT--
TTATGC
TTA---TGC
FRAGMENTOS QUIMERICOS
TTACCGTGC
![Page 19: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/19.jpg)
19
REGIONES REPETIDAS
x1 x2
Los bloques marcados con x1 y x2 son aproximadamente la misma secuencia
A X B X C X D
![Page 20: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/20.jpg)
20
A X C X B X D
La secuencia ensamblada es ambigua debido a que las repeticiones son de la forma XXX
![Page 21: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/21.jpg)
21
Area descubierta
Fragmentos
ADN
FALTA DE CUBRIMIENTO
![Page 22: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/22.jpg)
22
![Page 23: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/23.jpg)
23
1.Shortest Common Superstring (SCS)
2.Reconstruction
3.Multicontig
MODELOS
Todos los modelos asumen que la colección de fragmentos esta libre de contaminación y fragmentos quiméricos.
![Page 24: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/24.jpg)
24
Shortest Common Superstring (SCS)
Características
• No contempla errores
• La orientación de cada fragmento debe ser conocida
•No soporta regiones repetidas
• Solamente tiene interes teórico, ya que no se lo usa como solución del problema biológico real.
• Es un problema NP-hard.
![Page 25: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/25.jpg)
25
X X
La secuencia tiene dos copias de la misma subsecuencia, además estas copias son largas y contienen muchos fragmentos de los cuales conocemos su correcta orientación y no tienen errores.
![Page 26: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/26.jpg)
26
X X’
Sin embargo, al intentar buscar el superstring más corto, encontraremos una “mejor solución” si ensablamos todos los fragmentos de la segunda ocurrencia como subcadenas de la primera.
![Page 27: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/27.jpg)
27
ALGORITMO
Entrada: un conjunto de fragmentos F
Salida: S la cadena más corta , donde para todo f que pertenece a F, S es una supercadena de f. (O sea para todo f que pertenece a F, f es una subcadena de S que representará la secuencia de ADN reconstruida)
![Page 28: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/28.jpg)
28
Podemos representarlo en un grafo
Overlap multigraph (Multigrafo de solapamiento) OM(F)
b ACCCTACGA
CTAAAG
GACA
1
1
1
12
d
c
a
![Page 29: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/29.jpg)
29
Cada eje entre un par de nodos (a, b) tendrá asociado un peso mayor o igual a 0, si el sufijo con t caracteres es prefijo de b.
Los pesos en el grafo están representando solapamientos entre fragmentos, utilizaremos estos para unir los fragmentos y formar la supercadena.
Dado un camino P en OM(F) podemos construir, un alineamiento múltiple con las secuencias que están en P. Luego la secuencia final puede ser derivada de ese alineamiento, produciendo la supercadena de la siguiente manera:
![Page 30: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/30.jpg)
30
Cada eje (a, b) en el camino tiene un peso t, entonces para alinear los fragmentos a y b, b comenzará t posiciones antes del final de a.
Ya que el largo de la secuencia generada en el recorrido es igual a la suma de las longitudes de los fragmentos de los nodos menos la suma de los pesos de los ejes usados.
Buscamos, el camino hamiltoniano más pesado (camino que usa todos los nodos sin repetir ninguno). Es problema es el Traveling salesman problem, que es NP-Completo.
![Page 31: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/31.jpg)
31
camino abcd, peso = 3
TACGA-----------
----ACCC--------
-------CTAAAG---
------------GACA
TACGACCCTAAAGACA
camino adbc, peso = 4
TACGA----------
---GACA--------
------ACCC-----
---------CTAAAG
TACGACACCCTAAAG
![Page 32: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/32.jpg)
32
Si resolvemos este problema por fuerza bruta, es decir probando todos los caminos posibles, continuaremos con un algoritmo exponencial. Por eso, debemos intentar otra alternativa.
Definición:
Algoritmo goloso (greedy): En cada paso intenta maximizar la solución del subproblema analizado. No retrocede una vez tomada cada decisión.
![Page 33: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/33.jpg)
33
Contruimos el grafo OG(F) a partir del multigrafo OM(F), dejando entre cada cada par de nodos únicamente el eje más pesado, ya que estamos buscando el camino de peso máximo.
El algoritmo comienza ordenando los ejes según el peso, de mayor a menor. En cada paso agrega el proximo eje más pesado, mientras no forme ciclos, y los nodos en los que es incidente, se hayan usado a los sumo una vez, respetando las orientaciones.
La solución encontrada es a los sumo 2,75 veces peor que la optima, y se conjetura que lo es 2 veces.
![Page 34: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/34.jpg)
34
GCC
ATGC TGCATcb
a
Este algoritmo, no siempre encuentra la solución óptima.
2
2
3
0
0
0
![Page 35: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/35.jpg)
35
RECONSTRUTION
Características
• Contempla errores
• Contempla la orientación desconocida.
• No soporta regiones repetidas ni falta de cubrimiento
• Es un problema NP-hard.
![Page 36: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/36.jpg)
36
RECONSTRUTION - Definiciones
Veamos al ensamblado como un problema de alineamientos múltiples.
Distancia de edición ( d(a,b) ): Función de puntuación de alineamiento entre dos cadenas que otorga un punto por cada inserción, deleción o sustitución.
Distancia de edición de subcadena (ds(a,b) ): Es similar a la distancia de edición, pero no agrega puntos por las deleciones en los extremos del segundo segmento.
![Page 37: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/37.jpg)
37
RECONSTRUTION - Definiciones
Formalmente
ds(a,b) = min s en S(b) d(a, s),
donde S(b) es el conjunto de todos las subcadenas de b.
Error de tolerancia( ): Entre 0 y 1.
f es un subcadena aproximada de S con error si
ds(a,b) <= |f |
donde |f | es la longitud de f.
![Page 38: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/38.jpg)
38
ALGORITMO
Entrada: Una colección F de fragmentos y un error de tolerancia entre 0 y 1.
Salida: La cadena más corta posible S tal que para cada f en F vale que:
min(ds(f,S), ds(f c,S)) <= |f |
donde f c es el complemento de f.
![Page 39: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/39.jpg)
39
MULTICONTIG – Definiciones
t-contig: Es un contig donde el solapamiento mínimo es de t bases. Se tiene en cuenta cada fragmento o su complemento, pero no ambos.
Si es posible construir un t-contig con un colección de fragmentos F diremos que F admite un t-config.
Dado un error de tolerancia diremos que una secuencia S es un consenso- para un contig, si la distancia de edición entre cada fragmento f en el contig y su imagen en S es a lo sumo | f |
![Page 40: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/40.jpg)
40
ALGORITMO
Entrada: Una colección F de fragmentos, un entero t >= 0 y un error de tolerancia entre 0 y 1.
Salida: Una partición de F en la mínima cantidad de subcolecciones Ci tal que cada Ci admite un t-contig con un consenso-
Es un problema NP-Hard
![Page 41: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/41.jpg)
41
EN LA PRACTICA1. Buscar solapamientos
• Para cada par de fragmentos, calcular el match prefijo-sufijo
• Alineamiento semiglobal sin penalidad para
• Espacios en el final del primer fragmento o el principio del segundo
2. Ordenar de los fragmentos
• Construir el camino con algoritmos greedy o heurísticas
• Cada camino tiene su correspondiente camnino complementario
• No es necesario incluir fragmetnos incluídos en otros
• Los ciclos y la cubrimiento abundante pueden indicar repeticiones.
3. Alineamiento y consenso
![Page 42: 1 Ensamblado de fragmentos de ADN Grupo 6. 2 ORGANIZACIÓN 1. Background Biológico 2.Modelos 3.Algoritmos](https://reader035.vdocuments.pub/reader035/viewer/2022062301/5665b4331a28abb57c8fea73/html5/thumbnails/42.jpg)
42
EN LA PRACTICA
TIGR-Assembler
CAP2
GAP
Dhrap (Univ of Washington, Seattle)
En 1994, en el paper A quantitative comparision of DNA sequence assmbly programs, Miller y Powell comparando 11 paquetes distintos encontraron que los resultados fueron muy diferentes.