Download - Cuestiones de repaso_cap_31_utpl
UNIVERSIDAD TECNICA PARTICULAR DE LOJA
La Universidad Católica de Loja
Escuela de Ciencias de la Computación
Titulación de Sistemas Informáticos y Computación
Ejercicios sobre almacenes
Base de Datos Avanzada
Alumno: Carlos Francisco Ojeda Ureña
Docentes: Angel Eduardo Encalada Encalada
Fecha: 26/06/2013
Periodo académico
Abril 2013 - Agosto 2013
Cuestiones de Repaso Capitulo 31
Explique que quieren decir los siguientes términos a la hora de describir las características de los datos contenidos en un almacén de datos:
Clasificados por temas: El almacén de datos se clasifica por los temas de
mayor importancia para la empresa.
Integrados: En el almacén de datos la mescla datos procedentes de
diferentes sistemas.
Variables en el tiempo: Son aquellos datos del almacén de datos que solo
son válidos temporalmente en un intervalo de tiempo determinado.
No volátiles: Son aquellos datos que no se actualizan en tiempo real más
bien se refrescan en forma periódica.
Explique las diferencias entre los sistemas OLTP (Online TransactionProcessing) y los almacenes de datos.
Las aplicaciones de OLTP están organizadas para ejecutar las transacciones
para los cuales fueron hechos, como por ejemplo: mover dinero entre
cuentas, un cargo o abono, una devolución de inventario. Por otro lado, un
Data Warehouse está organizado en base a conceptos, como por ejemplo:
clientes, facturas, productos, etc.
Explique los beneficios y los problemas principales asociados con los almacenes de datos.
Beneficios
La ventaja principal de este tipo de bases de datos radica en las estructuras
en las que se almacena la información en modelos de tablas en estrella, en
copo de nieve, cubos relacionales.
Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar información de una o más fuentes distintas, para luego
procesarla permitiendo su análisis desde infinidad de perspectivas y con
grandes velocidades de respuesta.
Este tipo de persistencia de la información es homogénea y fiable, y permite
la consulta y el tratamiento jerarquizado de la misma
Problemas
Al tener un almacén de datos en una empresa los costos pueden resultar
muy altos variando de acuerdo a la implementación pero esto no resulta
una perdida para la empresa ya que a lo largo de unos años su inversión se
verá favorecida obteniendo retornos de inversión bastantes satisfactorios.
Privacidad de los datos.
Infravaloración del esfuerzo necesario para su diseño y creación.
Incremento de los requerimientos de los usuarios
Describa las características y funciones principales de los siguientes componentes de un almacén de datos.
Gestor De Carga:Realiza todas las operaciones relacionadas con la
extracción, propagación, depuración (limpieza), transformacióny carga de
los datos en el almacén de datos.
Gestor Del Almacén De Datos:En algunos casos el gestor del almacén de
datos también genera perfiles de consultas para determinar qué índices y
agregaciones son apropiadas.
Gestor De Consultas: permiten acceder a los datos y sobre ellos se
conectan herramientas más sofisticadas (OLAP, EIS, minería de datos).
Metadatos: Esta área del datawarehouse almacena todas las definiciones
de los meta datos (datos acerca de los datos) usados por todos los procesos
en el datawarehouse. Los meta datos son usados para una variedad de
propósitos.
Herramientas De Acceso Para Usuario Final: es la parte en que los
usuarios utilizan la solución datawarehouse, para esto necesitan
herramientas que les proporcione acceso a la información generada y
proceder a la toma decisiones estratégicas. Por tanto la comunicación entre
el Almacén deDatos y la herramienta será mediante consultas de tipo ad-
hoc.
Cuáles son las tres técnicas principales que los fabricantes de software utilizan para implementar herramientas de extracción, limpieza, y transformación de datos.
Generadores de código
Herramientas de replicación de datos
Motores de transformación dinámica.
Explique la importancia de la gestión de los metadatos y qué relación tiene con la integración del almacén de datos.
Como se explicó en una pregunta anterior los metadatos son datos sobre
datos pero estos tienen o cumples funciones primordiales que los
convierten en datos muy preciados del almacén ya que se utilizan para:
Extraer y cargar información mapeando las fuentes de datos sobre una
vista común de los datos dentro del almacén.
Gestionar el almacén de datos con la finalidad de automatizar la
producción de tablas de resumen.
Gestiona consultas para dirigir una consulta a la fuente de datos más
apropiada.
Explique las tareas principales asociadas con la administración y gestión de un almacén de datos.
Monitorizar la carga de datos desde múltiples fuentes
Comprobar la calidad y la integridad de los datos
Gestionar y actualizar los metadatos
Monitorizar el rendimiento de la base de datos para garantizar unos
tiempos de respuesta cortos a las consultas.
Auditar la utilización del almacén de datos para atribuir los costes de
los distintos usuarios
Purgar los datos
Archivar los datos y realizar copias de seguridad
Implementar mecanismos de recuperación de fallos gestionar
adecuadamente la seguridad
Explique las diferencias entre un mercado de datos y un almacén de datos e indique las razones principales para implementar un mercado de datos.
Un mercado de datos se puede definir como un subconjunto de un almacén
de datos y soporta los requisitos de un departamento o área de negocio en
concreto mientras que el almacén de datos comprante todos los
departamentos de la empresa.
Las principales razones que fomentan la creación de mercados de datos se
deben a que:
Los mercados de datos surgen por la complejidad y elevados recursos
asociados a la implementación de los proyectos de almacenes de datos.
Un almacén de datos al intentar integrar toda la información de la
organización requiere tratar con más; fuentes de datos, plataformas,
requisitos de usuarios, presupuesto, tiempo de desarrollo y personal.
Una solución es enfocarse en una unidad de negocios y crear un mercado de
datos que satisfaga sus requisitos de información.
Proponer un ejemplo de diseño multidimensional (esquema estrella) para un caso que usted conozca
Consultar al menos 3 herramientas para inteligencia de negocios describir las características principales.
Microstrategy: Es otra de las herramientas más difundidas, cuya característica
fundamental reside en que provee de las soluciones necesarias a los clientes de
cualquier tipo de empresa o sector funcional de las mismas, con el objetivo de
brindar un marco de ayuda que les permitirá acceder a un mayor conocimiento de
la información que está siendo manejada por la empresa.
Business Objects: Ofrece a los usuarios el acceso constante y de manera sencilla y
clara a los datos relevantes, para facilitar el análisis de la información que ha sido
almacenada, y el posterior desarrollo de distintos informes para mejorar los
procesos globales de la empresa.
Cognos: Este brinda un sistema efectivo para llevar a cabo evaluaciones correctas
de la información y una posterior toma de decisiones adecuada. Cabe destacar que
Cognos cuenta además con una herramienta especial, que ha sido desarrollada
para permitir la realización de modelos, pronósticos y simulaciones de negocios,
con el fin de ofrecer la posibilidad de planificar el futuro de las operaciones.