cursos de verano 2014 - ugr · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo...
TRANSCRIPT
![Page 1: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/1.jpg)
CURSOS DE VERANO 2014
TÍTULO DEL CURSO
TÍTULO PONENCIA
NOMBRE PROFESOR
APROXIMACIÓN PRÁCTICA A LA CIENCIA DE DATOS Y BIG DATA: HERRAMIENTAS KNIME, R, HADOOP Y
MAHOUT
Introducción a KNIME María José del Jesus
![Page 2: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/2.jpg)
Epígrafe o tema
¤ ¿Por qué aprender KNIME?
¤ El entorno de trabajo de KNIME
¤ Ejemplos
KNIME
![Page 3: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/3.jpg)
Epígrafe o tema
¤ KNIME es una herramienta Open Source
¤ Ofrece el ciclo completo de KDD ¤ Visualización de datos ¤ Pre-procesado de datos ¤ Extracción de modelos mediante algoritmos de Minería de Datos ¤ Comparación de modelos ¤ Análisis de resultados
¤ Integración con Weka y R
¤ Información sobre instalación y uso: ¤ https://www.knime.org
¿Por qué aprender KNIME?
![Page 4: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/4.jpg)
Epígrafe o tema El entorno de trabajo en KNIME
![Page 5: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/5.jpg)
Epígrafe o tema El entorno de trabajo en KNIME
Conceptos básicos
¤ Un proceso de análisis de datos se representa mediante un flujo de trabajo
¤ Construcción de un flujo de trabajo: ¤ arrastrar nodos del Almacén de nodos y pegar en el editor de flujo de trabajo ¤ Conectar nodos
¤ Estado de un nodo ¤ Rojo à hay que configurar antes de ejecutar ¤ Amarillo à el nodo está preparado para ejecutar ¤ Verde à el nodo se ha ejecutado
¤ Puertos (de entrada o salida) ¤ Solo se pueden conectar puertos del mismo tipo
¤ Datos (triángulo amarillo): transfieren tablas de datos entre nodos ¤ Bases de datos (cuadrado marrón) ¤ PMML: transfieren modelos ya aprendidos ¤ Otros puertos
![Page 6: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/6.jpg)
Epígrafe o tema El entorno de trabajo en KNIME
Acciones básicas:
¤ Crear un proyecto
¤ Utilizar nodos
¤ Construir un flujo de datos
¤ Nodo color manager
¤ Configuración de nodos
¤ Ejecución de flujo de datos
¤ Resultados HiLiting
![Page 7: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/7.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► nodos
¤ Son unidades de procesamiento de un workflow
Puerto de entrada (datos)
Puerto de salida
Puerto de modelo
Estados no listo para la ejecución configurado y listo para ejecutar ejecutado
Nombre (Se puede cambiar)
![Page 8: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/8.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► Construir un flujo de datos
¤ Se construye un flujo arrastrando y soltando los nodos desde el almacén de nodos al editor de proyectos y conectándolos entre ellos
¤ Los datos se transportan entre nodos a través de los puertos
¤ Es necesario, una vez colocados los nodos en el editor, conectar la salida de cada nodo con el predecesor
![Page 9: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/9.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► Construir un flujo de datos
![Page 10: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/10.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► nodo Color Manager
¤ Permite colorear los resultados generados a partir de los datos de entrada
¤ El coloreo afecta a muchas vistas y ayuda a diferenciar los datos
¤ Si se inserta este nodo en el flujo de trabajo, los datos se codifican según los colores determinados por el Color Manager
![Page 11: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/11.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► ejecución del flujo de datos
¤ Cuando los nodos del flujo tienen color amarillo, se puede ejecutar
¤ Los nodos se ejecutan de izquierda a derecha ¤ Un nodo puede ejecutarse cuando todos los nodos predecesores
han terminado su ejecución
¤ Formas de ejecución: ¤ Por nodo (con la opción Execute)
¤ Ejecutando el último nodo del flujo (KNIME ejecuta los predecesores)
¤ Seleccionando varios nodos y disparando la ejecución (KNIME determina el orden y ejecuta nodos en paralelo, si es posible)
![Page 12: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/12.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
¤ Si se seleccionan datos en una vista y se aplica “Hilite” sobre ellos, se podrá ver el efecto “Hilite” sobre los datos en el resto de vistas del flujo que soporten esta opción
¤ Los datos seleccionados se resaltarán en color naranja
![Page 13: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/13.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 14: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/14.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 15: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/15.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 16: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/16.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 17: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/17.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
Árbol simple
![Page 18: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/18.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 19: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/19.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 20: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/20.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 21: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/21.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 22: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/22.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 23: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/23.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 24: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/24.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 25: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/25.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 26: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/26.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► HiLiting
![Page 27: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/27.jpg)
Epígrafe o tema El entorno de trabajo en KNIME ► Hotkeys
![Page 28: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/28.jpg)
Epígrafe o tema
¤ Carga de datos
¤ Visualización
¤ Análisis predictivo
¤ Análisis descriptivo
https://archive.ics.uci.edu/ml/datasets/Iris ¤ Nº ejemplos: 150
¤ Nº variables: 4
¤ Nº clases: 3 (50/50/50)
Ejemplo: Iris
![Page 29: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/29.jpg)
Epígrafe o tema
1. Cargar el fichero de ejemplos iris.dat
2. Obtener medidas estadísticas
3. Asignar a cada ejemplo un color en función de la clase a la que pertenece
4. Visualizar el conjunto de ejemplos en base a pares de variables ¤ Determinar el par de variables “más relevantes”
5. Realizar una partición con hold-out al 60% estratificada
6. Visualizar el conjunto de test en base a las dos variables seleccionadas en el paso 4
Ejemplo: Iris
![Page 30: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/30.jpg)
Epígrafe o tema
1. File Reader: IO à Read
2. Statistics: Statistics ¤ Calcula y muestra estadísticas
3. Color Manager: Data Views à Property ¤ Asigna colores a las clases
4. Scatter Matrix : Data Views à Utility ¤ Visualiza los ejemplos según pares de variables (scatter plots)
5. Partitioning: Data Manipulation à Row à Transform ¤ Hold-out
6. Scatter Plot: Data Views à Utility
Ejemplo: Iris
![Page 31: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/31.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Carga de datos y visualización
![Page 32: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/32.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Visualizar
![Page 33: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/33.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Visualizar
![Page 34: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/34.jpg)
Epígrafe o tema Ejemplo 1: Iris
![Page 35: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/35.jpg)
Epígrafe o tema ¤ Para agilizar: hold-out 60% estratificado
¤ 1-NN (k Nearest Neigbor: Mining à Misc Classifiers) ¤ Visualizar resultados (Scorer: Mining à Scoring) ¤ Marcar y visualizar errores en test
¤ Scatter Plot ¤ Interactive Table: Data Views à Utility
¤ ¿Funcionará mejor con otro valor de k? ¤ ¿Funcionará mejor ponderando por distancias?
¤ Decision trees
¤ Random forest
¤ Naïve Bayes
Ejemplo: Iris
![Page 36: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/36.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► kNN
![Page 37: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/37.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► kNN
![Page 38: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/38.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► kNN
¿Normalización? Normalizer: Data Manipulation à Column à Transform
![Page 39: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/39.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► kNN
![Page 40: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/40.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► Naïve Bayes
![Page 41: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/41.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► Árboles de decisión
![Page 42: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/42.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► Árboles de decisión
![Page 43: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/43.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo
Los ciclos de validación cruzada se verán en los casos de estudio
![Page 44: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/44.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis predictivo ► Random Forest
![Page 45: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/45.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► A priori Weka
![Page 46: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/46.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► A priori Weka
![Page 47: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/47.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► k means
![Page 48: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/48.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► k means
![Page 49: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/49.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► k means
![Page 50: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/50.jpg)
Epígrafe o tema Ejemplo 1: Iris ► Análisis descriptivo ► k means
Clustering con k-means
![Page 51: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/51.jpg)
Epígrafe o tema Ejemplo 2: Pima
¤ Carga de datos
¤ Visualización
¤ Análisis predictivo
¤ Análisis descriptivo
https://archive.ics.uci.edu/ml/datasets/Pima+Indians+Diabetes ¤ 8 variables predictoras (continuas)
¤ 768 ejemplos
¤ 2 clases (500/268)
¤ ¿Valores perdidos?
![Page 52: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/52.jpg)
Epígrafe o tema Ejemplo 3: Wine
¤ Carga de datos
¤ Visualización
¤ Análisis predictivo
¤ Análisis descriptivo
https://archive.ics.uci.edu/ml/datasets/Wine
¤ 12 variables predictoras (continuas)
¤ 178 ejemplos
¤ 3 clases (59/71/48)
![Page 53: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/53.jpg)
Epígrafe o tema Ejemplo 4: Spam
¤ Carga de datos
¤ Visualización
¤ Preprocesamiento
¤ Análisis predictivo
¤ Análisis descriptivo
https://archive.ics.uci.edu/ml/datasets/Spambase ¤ 57 variables predictoras (55 continuas, 2 enteras) ¤ 4601 ejemplos ¤ 2 clases (2788/1813)
![Page 54: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/54.jpg)
Epígrafe o tema
¤ The Elements of Statistical Learning: Data Mining, Inference, and Prediction, by Trevor Hastie, Robert Tibshirani and Jerome Friedman. 2009
¤ Guide to Intelligent Data Analysis. How to Intelligently Make Sense of Real Data, by M. R. Berthold, C. Borgelt, F. Höppner, F. Klawonn. Springer 2010
Bibliografía
![Page 55: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/55.jpg)
Epígrafe o tema
¤ KNIME pages (www.knime.org)
¤ KNIME Tech (tech.knime.org) ¤ KNIME Quickstart Guide
https://tech.knime.org/files/KNIME_quickstart.pdf
¤ KNIME TV Channel on YouTube
¤ 100 best KNIME Videos http://meta-guide.com/videography/100-best-knime-videos
Más información
![Page 56: CURSOS DE VERANO 2014 - UGR · 2014-11-22 · cursos de verano 2014 tÍtulo del curso tÍtulo ponencia nombre profesor aproximaciÓn prÁctica a la ciencia de datos y big data: herramientas](https://reader033.vdocuments.pub/reader033/viewer/2022042021/5e77fa303d45f90178438b2e/html5/thumbnails/56.jpg)
CURSOS DE VERANO 2014
TÍTULO DEL CURSO
TÍTULO PONENCIA
NOMBRE PROFESOR
APROXIMACIÓN PRÁCTICA A LA CIENCIA DE DATOS Y BIG DATA: HERRAMIENTAS KNIME, R, HADOOP Y
MAHOUT
Introducción a KNIME María José del Jesus