Download - Implantación de los
Definición
Un sistema de archivos distribuidos, es una implementacióndistribuida del clásico modelo de tiempo compartido de un sistemade archivos, donde varios usuarios comparten archivos y almacenanrecursos.
Conceptos de base
Sistema Distribuido: colección de máquinas interconectadas por una red de comunicación.
Máquina: puede ser una estación o un mainframe
Recursos locales: recursos con los que cuenta la máquina
Recursos remotos: el resto de las máquina y sus recursos
Servicio: software ejecutándose en una o más máquinas que proporcionan un tipo particular de función
Servidor: software de servicio en una sola máquinaUn servidor es un proceso que implementa servicios
Cliente: proceso que puede invocar un servicio a través de un conjuntode operaciones que forman su interfaz de cliente
Características
DFS proporciona servicios de archivos a clientes
Clientes, servidores, y dispositivos de almacenamiento se encuentrandispersos entre las máquinas de un sistema distribuido
Diversidad de clientes y de archivos
Desempeño:tiempo para satisfacer varias peticiones de servicio.
convencional:tiempo acceso disco + tiempo procesamiento CPU
DFS:sobrecarga debido a la estructura distribuida
Principales componentes
Servicio directorio resolución nombres, añadir y borrar archivos
Servicio autorización eficiencia y/o lista de control de acceso
Servicio transacción admón. de concurrencia y duplicidadarchivos básico lectura/escritura archivos y atributos
Servicio sistema admón. de dispositivos, caché y bloques
Nombramiento y Transparencia
Nombramiento:mapeo entre objetos lógicos y físicos
usuario = objetos lógicos de datossistema = objetos físicos
Transparencia“esconder” el lugar de la red donde se encuentra el archivo (file replication)
Nociones de Nombramiento
- Transparencia de la ubicación
- Independencia de la ubicación
Importante diferencias dos nociones relacionadas que involucranmapeo de nombres dentro de los DFS
Independencia de ubicación vstransparencia estática de la ubicación
“Divorciar” datos de la ubicación
Transparencia estática de ubicación proporciona a losusuarios una forma conveniente de compartir datos
La independencia de la ubicación separa la jerarquía de nombres de la jerarquía de los dispositivos de almacenamientodentro de la estructura de la computadora.
Esquemas de nombramiento
1. Archivos son nombrados a partir de una combinación delhost y de un nombre local, (por ejemplo windows )
2. Proporcionar un medio para “atar” directorios remotos a directorios locales, (por ejemplo NFS )
3. Una sola estructura de nombres global se encarga de nombrartodos los archivos del sistema
Técnicas de implementación
Se requiere de una forma de realizar un mapeo entre un nombre dearchivo y su ubicación física.
Métodos posibles:duplicidad, caching local, o ambos
Posibles técnicas:introducción de identificadores independientes de la ubicación
Montaje de archivos
Una operación de montaje del cliente ata un sistema de archivosremoto a la jerarquía del sistema de archivos del cliente
El punto de montaje generalmente es una hoja de la jerarquía quecontiene un subdirectorio vacío.
Montajes son operaciones privilegiadas que pueden realizarse en tresdiferentes instantes:
Montaje explícitoMontaje de booteoAutomontaje
Desventaja: requiere conocimiento de la localización de los servidores
Registro de servidores
Útil en el caso de un sistema con múltiples servidores que proporcionan el mismo servicio de archivos.
Servidor puede localizarse de dos formas:
1. Servidores se registran en un servicio de registro2. Clientes realizan un broadcast de una petición de automontaje
Estas dos formas son esencialmente un protocolo de resolución de nombres o direcciones.
Algunas veces el montaje de archivos se hace en forma de cascada,un sistema de archivos montado puede contener subdirectorios montadosde otros directorios.
Acceso de archivos remotos
Mecanismo servicio remoto:peticiones de acceso son pasadas al servidor,servidor realiza el accesosus resultados son regresados al usuario
El compartir archivos significa que varios clientes pueden tener accesoal mismo archivo al mismo tiempo, para lo cual:
1. se tienen que hacer coincidir operaciones de acceso2. se tienen que intercalar operaciones de acceso
La primera implica que existen diferentes copias del mismo archivo, mientras que la segunda implica el intercalar a múltiples granularidades de operaciones de acceso de datos.
Tipos acceso a datos
Acceso remotoningún dato del archivo es dejado en la máquina del cliente
Acceso cacheuna pequeña parte de la información es almacenada en lacaché local
Acceso de download/updownTodo el archivo es bajado para poder consultarlo o
modificarlo localmente
Características coherencia datos
Todas las copias son idénticas en todo el tiempo Copias son percibidas como idénticas tan solo en
algunos puntos en el tiempo Usuarios siempre leen los datos más recientes en las
copias Operaciones de escritura siempre son realizadas
“inmediatamente” y sus resultados son propagados
Tipos operaciones
Simple RW (Lectura/Escritura)Cada operación de lectura y escritura es un acceso independiente de tipo petición/respuesta al servidor
TransacciónUna secuencia de operaciones lectura/escritura es tratadacomo una unidad fundamental de acceso a archivo
SesiónUna sesión consiste de una secuencia de transacciones y deoperaciones simples de lectura/escritura, con semánticas adicionales asociadas con la sesión de acuerdo a la aplicación
Concurrencias de espacio y tiempo en acceso de archivos
espacio acceso acceso accesotiempo remoto cache carga down/up
RW simple no es un verdadero control controlDFS coherencia coherencia
transacción control concurrencia coherencia y coherencia yconcurrencia concurrencia
sesión no aplicable no aplicable ignora el compartir