bases de datos en biología computacional cristian s. rocha 28 de mayo del 2002

29
Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Upload: ladislao-loya

Post on 23-Jan-2016

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Bases De Datos En Biología Computacional

Cristian S. Rocha28 de Mayo del 2002

Page 2: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

¿Qué Es Una Base De Datos?

- Objetivos:- Almacenar datos organizados de alguna manera para su

eventual consulta.

- Operaciones básicas:- Ingresar.- Eliminar.- Consultar.

- Propiedades:- Finita.- Organización restringida desde la creación.- Consultas limitadas a la información almacenada.

Page 3: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Ventajas

• Fácil acceso a la información.

• Fuerza la organización de los datos.

• Automatización de operaciones.

Page 4: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Datos Biológicos

• Bibliografía.• Nucleótidos.• Proteínas.• Genoma.• Estructuras.• Alineamientos.• Organismos.• Genes.

• Expresión.• Dominios.• Mapas.• Mutaciones.• Repeticiones.• Anatomía.• ???

Page 5: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Características

• Alta complejidad.

• Gran cantidad y variabilidad de la información.

• Interpretaciones múltiples.

• Consultas impredecibles.

Page 6: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Inserción

• Supone consulta a futuro.

• Supone alguna relación con la BD.

• Formato restringido.

Page 7: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Eliminación

• Nunca se volverá a consultar.

• No se pierde relaciones de interés.

• Mantiene consistencia de la BD.

Page 8: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Consulta

• Formulario o lenguaje de consulta.

• Exacta o inexacta.

• Presentación.

• Tiempo de respuesta.

Page 9: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Tipos

• Analíticas.

• Operacionales.

Page 10: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Bases de datos analíticas

• Optimizada para consultas.

• Los datos están confirmados.

• La información no esta actualizada continuamente.

Page 11: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Bases de datos operacionales

• Optimizadas para la inserción de datos.

• Los datos provienen de un proceso automático o repetitivo, pueden traer error.

• Es información actualizada.

Page 12: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

• Planas.

• Jerárquicas.

• Redes.

• Relaciónales.

• Orientada a objetos.

• Base de objetos.

• Especializadas.

Modelos

Page 13: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Organización

• Centralizada.

• Distribuida.

• Mixta.

Page 14: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Motores De Base De Datos

• Soporte para el diseño y operación de la base de datos.– Diseño: definición de la base de datos y sus

propiedades.– Operación: manejo de la base de datos. Manejo

de los datos.

Page 15: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002
Page 16: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Estado Del Arte

NCBI

EMBL

DDBJ

Tipo: Operacional.Modelo: Relacional.Organización: Centralizada.

Tipo: Analítica.Modelo: Mixtas.

Organización: Distribuida.

Page 17: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Transparencia E Integración

• Transparencia.– El usuario no debe conocer la implementación

de la base de datos.– Para el usuario debe existir una única base de

datos.

• Integración.– Las herramientas deben interactuar con las

consultas de manera transparente.

Page 18: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Limitaciones

• Nadie conoce cual es la mejor implementación.

• Definición de un estándar.

• Problemas políticos.

Page 19: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

MySQL

Base De Datos Local

BDBioPerl

InternetInternet

SQLGUI HTML

HTMLXML

FASTAEtc..

Page 20: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Motores De Base de Datos

• Relaciónales (SQL).– Postgres, mysql, oracle.

• Jerárquicas.– Acedb.

• Especializadas.– Blast.

Page 21: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Ventajas & Limitaciones

• Las consultas están limitadas a la información requerida.

• Las modificaciones solo afectan a la base de datos local.

• No se puede operar directamente sobre la información de la base de datos.

• Las consultas son 100% especializadas.• No existe una única solución.

Page 22: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Bioperl (www.bioperl.org)

• Extensión del lenguaje de programación perl para:– Manejo de secuencias genómicas.– Manejo de diferentes formatos de información.– Intercomunicación de motores de bases de

datos especializadas.

Page 23: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Acedb (www.acedb.org)

• Base datos orientada a objetos con organización jerárquica.

• Especializada para genómas.

• Integra herramientas de visualización.

• Apis a java, perl y C.

Page 24: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Blast (NCBI)

• Motor de base de datos de secuencias de genómicas.

• Archivos planos.

• La inteligencia esta concentrada en los índices.

Page 25: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Roles (1/2)

• Usuarios.– Consultar.– Ingresar datos.

• Analista.– Relevar la información a almacenar.– Diseñar un modelo consistente al problema

planteado.

Page 26: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Roles (2/2)

• Administrador del sistema.– Mantener el sistema funcionando.

• Administrador de la base de datos.– Mantener el motor de base de datos estable.

• Curador.– Clasificar, publicar y chequear la validez de los

datos.

Page 27: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Herramientas de Diseño

• Diagramas Entidad Relación.

• UML.

Page 28: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Conclusiones

• No existe una única solución para almacenar datos biológicos.

• Es necesario aprender lenguajes de programación y de consulta.

• Mantener una base de datos biológica necesita mantenimiento constante o la responsabilidad de los usuarios.

Page 29: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002