2. ssis 2008 r2

Click here to load reader

Upload: miguel-murillo

Post on 17-Jun-2015

1.163 views

Category:

Education


7 download

DESCRIPTION

presentacion

TRANSCRIPT

  • 1. SQL Server 2008Integration Services Carlos Lobo ValerioAlexander Jimnez Palacios

2. Qu es? Es una plataforma para la creacin de solucionesempresariales de transformaciones de datos eintegracin de datos. Sirve para resolver complejos problemasempresariales mediante la copia o descarga dearchivos, la actualizacin de almacenamientos dedatos, la limpieza y minera de datos. 3. Caractersticas Permite crear soluciones de integracin de datosde alto rendimiento, incluidas la extraccin, latransformacin y la carga (ETL) de datos paraalmacenes de datos. Integration Services reemplaza a DataTransformation Services (DTS). Se pueden usar para crear soluciones sin escribiruna sola lnea de cdigo. 4. Diagrama 5. Paquetes Un paquete es el objeto que implementa lafuncionalidad de Integration Services paraextraer, transformar y cargar datos Un paquete se crea utilizando el Diseador SSISen BI Development Studio Un paquete bsico incluye los elementos: flujode control y flujo de datos 6. 1. Elementos de flujo de control Proporcionan estructura y controlan el orden enel que se ejecutan los elementos Los principales elementos de flujo de control sonlas tareas, los contenedores y restricciones deprecedencia 7. a) Contenedores Proporcionan estructura en paquetes y serviciosa las tareas en el flujo de control Permiten repetir flujos de control en paquetes yagrupan tareas y contenedores en unidades detrabajo significativas Los contenedores pueden incluir otroscontenedores, adems de tareas 8. a) Contenedores (fines) Repetir tareas para cada elemento de unacoleccin, como archivos de una carpeta Repetir las tareas hasta que una expresinespecificada se evale como false Agrupar tareas y contenedores que debencompletarse correctamente o no completarsecomo una unidad (todas o ninguna) 9. a) Contenedores (tipos) 10. b) Tareas Las tareas son elementos de flujo de control quedefinen las unidades de trabajo que se realizanen un flujo de control de paquetes. Un paquete consta de una o ms tareas Tambin se puede escribir tareas personalizadasmediante un lenguaje de programacin.NET, como C#. 11. Tarea Flujo de datos La tarea Flujo de datos encapsula el motor de flujo de datos que mueve datos entre orgenes y destinos, y permite al usuario transformar, limpiar y modificar datos a medida que se mueven 12. Tarea Sistema de archivos La tarea Sistema de archivos realiza operacionesen archivos y directorios del sistema de archivos. Por ejemplo, un paquete puede utilizar la tareaSistema de archivos para crear, mover o eliminardirectorios y archivos 13. Tarea Servicio web La tarea Servicio web ejecuta un mtodo deservicio web Escribir en una variable los valores devueltos porun mtodo de servicio web Escribir en un archivo los valores devueltos porun mtodo de servicio web 14. Tarea XML La tarea XML se usa para trabajar con datosXML. Un paquete puede recuperar documentosXML, aplicar operaciones a los documentosmediante las hojas de estilos (XSLT) yexpresiones XPath, mezclar variosdocumentos, o bien validar, comparar y guardarlos documentos actualizados en archivos yvariables. 15. Tarea Ejecutar paquete Permite que los paquetes ejecuten otrospaquetes como parte de un flujo de trabajo Descomponer un flujo de trabajo de paquetescomplejo Reutilizar partes de paquetes Agrupar unidades de trabajo Controlar la seguridad de los paquetes 16. Tarea Enviar correo La tarea Enviar correo enva un mensaje decorreo electrnico. Un paquete puede utilizar la tarea Enviar correopara enviar mensajes si las tareas del paquete deflujo de trabajo finalizan correctamente o si seproducen errores 17. Tareas de SQL Server Tarea Insercin masiva: proporciona una formamuy eficaz de copiar grandes cantidades de datos auna tabla o vista de SQL Server. Tarea Ejecutar SQL: ejecuta instrucciones SQL oprocedimientos almacenados de un paquete Tarea Transferir bases de datos: transfiere unabase de datos de SQL Server entre dos instanciasde SQL Server. 18. Tarea Ejecutar DDL de AnalysisServices Ejecuta instrucciones del lenguaje de definicin de datos (DDL) que pueden crear, quitar o modificar modelos de minera y objetos multidimensionales, como cubos y dimensiones 19. Tarea Procesamiento de AnalysisServices Procesa objetos de Analysis Services comocubos, dimensiones y modelos de minera dedatos Slo se puede procesar objetos de anlisiscreados mediante las herramientas de SQLServer 20. Tarea Consulta de minera dedatos Ejecuta consultas de prediccin basadas enmodelos de minera de datos integrados enAnalysis Services. La consulta de prediccin crea una prediccinpara datos nuevos a partir de modelos de minerade datos. 21. Tareas de mantenimiento Tarea Copia de seguridad de la base de datos Tarea Ejecutar instruccin T-SQL Tarea Reducir base de datos 22. c) Restricciones de precedencia Las restricciones de precedencia vinculanejecutables, contenedores y tareas de paquetesen un flujo de control, y especifican condicionesque determinan si se ejecutan los ejecutables. Un ejecutable puede ser un contenedor de buclesFor, de bucles Foreach o de secuencia, o bienuna tarea o un controlador de eventos 23. c) Restricciones de precedencia 24. 2. Elementos de flujo de datos Proporcionan el origen, transformaciones y destinos de los datos. 25. a) Orgenes Son los componentes de flujo de datos que hacen que datos de distintos tipos de orgenes de datos estn disponibles para un flujo de datos. Origen de ADO .NET Origen de Excel Origen de archivo plano Origen de OLE DB Origen XML 26. b) Transformaciones Son los componentes en el flujo de datos de unpaquete que agregan, mezclan, distribuyen ymodifican datos Las transformaciones tambin pueden realizaroperaciones de bsqueda y generar conjuntos dedatos de ejemplo 27. Transformaciones de inteligenciaempresarial Bsqueda aproximada: realiza tareas delimpieza de datos como normalizar datos, corregirdatos y proporcionar valores que faltan. Consulta de minera de datos: realiza consultasde prediccin en modelos de minera de datos 28. Transformaciones de fila Copiar columna: crea columnas nuevas copiandocolumnas de entrada y agregando las columnasnuevas a la salida de la transformacin. Conversin de datos: convierte los datos de unacolumna de entrada a otro tipo de datos diferente ydespus los copia a una nueva columna de salida. 29. Transformaciones de conjunto de filas Agregado: realiza agregaciones comoaverage, sum y count Ordenar: ordena los datos Muestreo de porcentaje: crea una muestraaleatoria a partir de un porcentaje Muestreo de fila: crea una muestra aleatoria a partirde una cantidad 30. Transformaciones de divisin y combinacin Divisin condicional: puede dirigir filas de datos asalidas diferentes en funcin del contenido de losdatos (CASE) Unin de todo: combina varias entradas en unasalida. Mezclar: combina dos conjuntos de datosordenados en un solo conjunto de datos Bsqueda: realiza bsquedas mediante lacombinacin de datos de columnas de entrada concolumnas de un conjunto de datos de referencia 31. c) Destinos Los destinos son los componentes de flujo de datosque cargan los datos en un flujo de datos endiferentes tipos de orgenes de datos o crean unconjunto de datos almacenados en memoria. Los destinos tienen una entrada y una salida deerror. Los destinos deben tener una entrada. 32. c) Destinos ADO NET: carga datos en una serie de bases dedatos compatibles con ADO.NET que usan una tablao vista de base de datos Entrenamiento del modelo de minera de datos:entrena los modelos de minera de datos pasandolos datos que recibe el destino por los algoritmos demodelos de minera de datos DataReader: expone los datos en un flujo de datosmediante la interfaz ADO.NET DataReader 33. c) Destinos Excel: carga datos en hojas de clculo o intervalosen libros de Microsoft Excel Archivo plano escribe datos en un archivo de texto OLE DB: carga datos en una serie de bases dedatos compatibles con OLE DB SQL Server: se conecta a una base de datos localde SQL Server y realiza una carga masiva de datosen tablas y vistas de SQL Server 34. Usos tpicos Mezclar datos de almacenes de datos heterogneos Informacin almacenada en sistemas dealmacenamiento de datos antiguos. Datos almacenados en archivos planos, hojas deExcel, documentos XML. Diferentes bases de datos relacionales: SQLServer, Oracle, MySQL, DB2,etc. 35. Usos tpicos Llenar almacenamientos de datos y puestos de datos. Suelen actualizarse frecuentemente y normalmentelas cargas de datos son muy grandes. Carga masiva de datos directamente desde unarchivo plano a tablas y vistas de SQL Server 36. Usos tpicos Limpiar y normalizar datos Los datos proceden de varias sucursales de unaorganizacin y en cada una de las sucursales se usanconvenciones y estndares distintos. Los datos pueden ser alquilados o comprados. Los datos son especficos de la configuracin regional. Remplazo de los valores de las columnas por valoresde una tabla de referencia mediante una bsquedaexacta o aproximada 37. Usos tpicos Generar inteligencia de negocio Resumir, convertir y distribuir los datos en funcin devalores de datos. Rechazar datos en funcin de una evaluacin devalores de columna. Combinar datos de varios orgenes de datos. Evaluar datos y aplicar conversiones de datos. Dividir un conjunto de datos en mltiples conjuntos dedatos en funcin de valores de datos. 38. Usos tpicos Automatizar funciones administrativas y la carga de datos Automatizar las funciones administrativas como lacopia de seguridad y la restauracin de bases dedatos. Copia de objetos de SQL Server y la carga dedatos. 39. Arquitectura