implantación de los

17
Implantación de los Sistemas de Archivos Distribuidos

Upload: universidad-catolica-de-cuenca

Post on 14-Aug-2015

64 views

Category:

Documents


1 download

TRANSCRIPT

Implantación de losSistemas de Archivos Distribuidos

Definición

Un sistema de archivos distribuidos, es una implementacióndistribuida del clásico modelo de tiempo compartido de un sistemade archivos, donde varios usuarios comparten archivos y almacenanrecursos.

Conceptos de base

Sistema Distribuido: colección de máquinas interconectadas por una red de comunicación.

Máquina: puede ser una estación o un mainframe

Recursos locales: recursos con los que cuenta la máquina

Recursos remotos: el resto de las máquina y sus recursos

Servicio: software ejecutándose en una o más máquinas que proporcionan un tipo particular de función

Servidor: software de servicio en una sola máquinaUn servidor es un proceso que implementa servicios

Cliente: proceso que puede invocar un servicio a través de un conjuntode operaciones que forman su interfaz de cliente

Características

DFS proporciona servicios de archivos a clientes

Clientes, servidores, y dispositivos de almacenamiento se encuentrandispersos entre las máquinas de un sistema distribuido

Diversidad de clientes y de archivos

Desempeño:tiempo para satisfacer varias peticiones de servicio.

convencional:tiempo acceso disco + tiempo procesamiento CPU

DFS:sobrecarga debido a la estructura distribuida

Principales componentes

Servicio directorio resolución nombres, añadir y borrar archivos

Servicio autorización eficiencia y/o lista de control de acceso

Servicio transacción admón. de concurrencia y duplicidadarchivos básico lectura/escritura archivos y atributos

Servicio sistema admón. de dispositivos, caché y bloques

Nombramiento y Transparencia

Nombramiento:mapeo entre objetos lógicos y físicos

usuario = objetos lógicos de datossistema = objetos físicos

Transparencia“esconder” el lugar de la red donde se encuentra el archivo (file replication)

Nociones de Nombramiento

- Transparencia de la ubicación

- Independencia de la ubicación

Importante diferencias dos nociones relacionadas que involucranmapeo de nombres dentro de los DFS

Independencia de ubicación vstransparencia estática de la ubicación

“Divorciar” datos de la ubicación

Transparencia estática de ubicación proporciona a losusuarios una forma conveniente de compartir datos

La independencia de la ubicación separa la jerarquía de nombres de la jerarquía de los dispositivos de almacenamientodentro de la estructura de la computadora.

Esquemas de nombramiento

1. Archivos son nombrados a partir de una combinación delhost y de un nombre local, (por ejemplo windows )

2. Proporcionar un medio para “atar” directorios remotos a directorios locales, (por ejemplo NFS )

3. Una sola estructura de nombres global se encarga de nombrartodos los archivos del sistema

Técnicas de implementación

Se requiere de una forma de realizar un mapeo entre un nombre dearchivo y su ubicación física.

Métodos posibles:duplicidad, caching local, o ambos

Posibles técnicas:introducción de identificadores independientes de la ubicación

Montaje de archivos

Una operación de montaje del cliente ata un sistema de archivosremoto a la jerarquía del sistema de archivos del cliente

El punto de montaje generalmente es una hoja de la jerarquía quecontiene un subdirectorio vacío.

Montajes son operaciones privilegiadas que pueden realizarse en tresdiferentes instantes:

Montaje explícitoMontaje de booteoAutomontaje

Desventaja: requiere conocimiento de la localización de los servidores

Registro de servidores

Útil en el caso de un sistema con múltiples servidores que proporcionan el mismo servicio de archivos.

Servidor puede localizarse de dos formas:

1. Servidores se registran en un servicio de registro2. Clientes realizan un broadcast de una petición de automontaje

Estas dos formas son esencialmente un protocolo de resolución de nombres o direcciones.

Algunas veces el montaje de archivos se hace en forma de cascada,un sistema de archivos montado puede contener subdirectorios montadosde otros directorios.

Acceso de archivos remotos

Mecanismo servicio remoto:peticiones de acceso son pasadas al servidor,servidor realiza el accesosus resultados son regresados al usuario

El compartir archivos significa que varios clientes pueden tener accesoal mismo archivo al mismo tiempo, para lo cual:

1. se tienen que hacer coincidir operaciones de acceso2. se tienen que intercalar operaciones de acceso

La primera implica que existen diferentes copias del mismo archivo, mientras que la segunda implica el intercalar a múltiples granularidades de operaciones de acceso de datos.

Tipos acceso a datos

Acceso remotoningún dato del archivo es dejado en la máquina del cliente

Acceso cacheuna pequeña parte de la información es almacenada en lacaché local

Acceso de download/updownTodo el archivo es bajado para poder consultarlo o

modificarlo localmente

Características coherencia datos

Todas las copias son idénticas en todo el tiempo Copias son percibidas como idénticas tan solo en

algunos puntos en el tiempo Usuarios siempre leen los datos más recientes en las

copias Operaciones de escritura siempre son realizadas

“inmediatamente” y sus resultados son propagados

Tipos operaciones

Simple RW (Lectura/Escritura)Cada operación de lectura y escritura es un acceso independiente de tipo petición/respuesta al servidor

TransacciónUna secuencia de operaciones lectura/escritura es tratadacomo una unidad fundamental de acceso a archivo

SesiónUna sesión consiste de una secuencia de transacciones y deoperaciones simples de lectura/escritura, con semánticas adicionales asociadas con la sesión de acuerdo a la aplicación

Concurrencias de espacio y tiempo en acceso de archivos

espacio acceso acceso accesotiempo remoto cache carga down/up

RW simple no es un verdadero control controlDFS coherencia coherencia

transacción control concurrencia coherencia y coherencia yconcurrencia concurrencia

sesión no aplicable no aplicable ignora el compartir