bases de datos distribuidas carlos rojas kramer universidad cristóbal colón

34
Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Upload: emperatriz-tejada

Post on 12-Jan-2015

3 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Bases de datos distribuidas

Carlos Rojas Kramer

Universidad Cristóbal Colón

Page 2: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Orígenes

• Evolución acelerada de los sistemas de información

• Crecimiento no planeado de la información al interior de las organizaciones

• Dispersión en sitios geográficamente distantes

• Sistemas tecnológicamente diferentes

Page 3: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Orígenes

• Necesidad de compartir e integrar la información dispersa

• Se requiere un tipo de tecnología diferente al tradicional

• La Base de Datos Distribuida es una buena solución a lo anterior.

Page 4: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Definición

• Una Base de Datos Distribuida (BDD) es una colección de datos relacionados lógicamente, pero dispersos entre diversos sitios de una red de computadoras. [Ceri y Pelagatti]

• Cada sitio en la red tiene capacidad de procesamiento autónomo y puede ejecutar aplicaciones locales.

Page 5: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

BDD (ilustración esquemática)

Page 6: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Razones para la dispersión

• Naturaleza de la información

• Motivos económicos

• Consideraciones de desempeño

• Necesidades de fiabilidad

• Requerimientos de disponibilidad

• Etc.

Page 7: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Consecuencias de la dispersión

• Incremento en la complejidad de diseño

• Mayores dificultades para la instrumentación de las soluciones

• Administración y resolución de problemas implican aplicación de mejores recursos

• Necesidad de apego a estándares

Page 8: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Software para BDD

• DDBMS = Distributed DataBase Management System

• Debe permitir la creación, el uso y el mantenimiento de la BDD

• Debe realizar funciones típicas de un DBMS no distribuido

• También debe soportar otras funciones

Page 9: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Funciones extra para un DDBMS

• Capacidad de accesar sitios remotos y transmitir consultas y datos entre diversos sitios a través de una red de computadoras

• Capacidad de rastrear la pista de distribución y de replicación de los datos en el catálogo del DDBMS

Page 10: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

• Capacidad de elaborar estrategias de ejecución para consultas y transacciones que accesan datos en más de un sitio

• Capacidad de mantener la consistencia en las copias de un elemento de información

Page 11: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

• Capacidad de recuperarse ante caídas de sitios individuales y fallos de un enlace de comunicación

• Capacidad de decidir cual de las copias de un elemento de información será accesada

Page 12: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Componentes de un DDBMS

• Componente de manejo de Base de Datos (DB)

• El componente de Comunicación de Datos (DC)

• El Diccionario de Datos (DD), el cual es

extendido para representar información sobre la

distribución de los datos sobre la red

• El componente de base de datos distribuida (BDD)

Page 13: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Tipos de DDBMs

• Clasificados según su grado de:

– homogeneidad / heterogeneidad

– autonomía

– transparencia de la distribución

Page 14: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Grado de homogeneidad

• Un DDBMS homogéneo se caracteriza principalmente por la utilización del modelo descendente para la conceptualización del diseño de la BD, en donde la fragmentación vertical u horizontal de un esquema global de datos determina la naturaleza de cada uno de los componentes de la BDD

Page 15: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

• Un DDBMS heterogéneo se caracteriza por la diversidad de DBMSs, modelos de diseño, sistemas operativos, conceptualización del diseño y hardware utilizado en cada uno de sus componentes de BD

Page 16: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

• La heterogeneidad debida a diversos DBMSs es común en organizaciones que crecen sin una planeación en cuanto a sus sistemas de información.

• Dichos sistemas evolucionan paulatinamente en diferentes DBMSs o diferentes modelos de conceptualización, tales como: jerárquico, de red, relacional u orientado a objetos

Page 17: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Tipos de heterogeneidad según Larson y Sheth

Page 18: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Heterogeneidad semántica

• Ocurre cuando existe una diferencia en el significado, interpretación o uso del mismo modelo de datos

Page 19: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Sistemas de Multibase de Datos

• MDBMS = multi database management system

• También llamado Sistema de Base de Datos Federado

• Es un tipo de DDBMS

• Se compone de una colección de DBMS con alto grado de autonomía

Page 20: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

MDBMS (cont.)

• Cada servidor es un DBMS centralizado independiente y autónomo que tiene sus propios usuarios locales, transacciones locales y administrador de base de datos (DBA)

• Por lo mismo, cada uno posee un alto grado de autonomía local

Page 21: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

• En un MDBMS cada servidor puede autorizar el acceso a porciones específicas de la BD definiendo un esquema de exportación, el cual especifica la parte de la BD a la cual puede tener acceso una cierta parte de usuarios no locales

• Los MDBMS son catalogados como un sistema híbrido entre los sistemas distribuidos y los centralizados

Page 22: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Grado de autonomía

• Es el grado de independencia de operación de cada uno de los DBMS componentes del DDBMS

Page 23: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Autonomía de diseño

• La capacidad de que cada Base de Datos Componente (BDC) decida los aspectos concernientes con su diseño. Es decir, las personas involucradas son libres de decidir cualquier particularidad e incluso decidir que DBMS usar.

Page 24: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Aspectos a considerar en la autonomía de diseño

– El universo de datos relevante para el sistema

– La representación (modelo de datos, lenguaje de consultas) y el nombrado de los datos

– La conceptualización o interpretación semántica de los datos (heterogeneidad semántica)

– Restricciones usadas para administrar los datos

– La funcionalidad del sistema

– La asociación y compartición con otros sistemas y

– La implementación (p.e. registros y estructuras de archivos).

Page 25: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Autonomía de comunicación

• La habilidad de que una BDC decida comunicarse o no con otro componente de una misma federación

Page 26: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Autonomía de ejecución

• Es la habilidad de una BDC para ejecutar operaciones locales sin la interferencia de operaciones externas, en el orden que la BDC lo decida

Page 27: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Autonomía de asociación

• Cada BDC decide cuánto y cuándo puede compartir su funcionalidad y recursos con otros componentes, inclusive la capacidad de asociarse o retirarse de una o más federaciones

Page 28: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Grado de Transparencia de Distribución

• Si el usuario percibe un solo esquema integrado sin información alguna relativa a la fragmentación, replicación o distribución, se dice que el DDBMS tiene un alto grado de transparencia de distribución.

• Si el usuario puede ver toda la fragmentación, el reparto y la aplicación, el DDBMS no tiene transparencia de distribución

Page 29: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Distribución de los datos

Page 30: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Fragmentación

• La fragmentación de una base de datos consiste en descomponer en partes los datos, siguiendo algún patrón conveniente y relacionado con la forma como estos serán alimentados y explotados.

Page 31: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Tipos de fragmentación

• Tipos primitivos de fragmentación:– Horizontal– Vertical

• Tipos derivados:– Horizontal derivada– Mixta

Page 32: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Objetivos ideales

• Separar el concepto de fragmentación de los datos del concepto de localización (o ubicación) de los mismos.

• Control explícito de la redundancia

• Independencia de DBMSs locales

Page 33: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Tipos de transparencia

• Transparencia de fragmentación

• Transparencia de localización

• Transparencia de replicación

• Transparencia de correspondencia

Page 34: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

Niveles de transparencia

1. Transparencia de fragmentación

2. Transparencia de localización

3. Transparencia de correspondencia local

4. Sin transparencia