Download - Ejemplo Weka Titanic
![Page 1: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/1.jpg)
Ejemplo en WEKA
TITANIC
![Page 2: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/2.jpg)
Abarca “Reglas de Asociación y Dependencias” a partir de datos sobre el hundimiento del Titanic.
Los datos se encuentran en el fichero “titanic.arff” y corresponden a las características de los 2.201 pasajeros del Titanic. Estos datos son reales y se han obtenido de: "Report on the Loss of the ‘Titanic’ (S.S.)" (1990), British Board of Trade Inquiry Report_ (reprint), Gloucester, UK: Allan Sutton Publishing.
![Page 3: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/3.jpg)
Titanic Database: relation titanic attribute C {crew,first,second,third} attribute age {adu,enf} attribute sex {f,m} attribute Class {mort,surv}
Data: crew,adu,m,surv crew,adu,m,surv crew,adu,f,surv third,adu,m,mort ...
![Page 4: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/4.jpg)
Para este ejemplo sólo se van a considerar cuatro variables:
• Clase (0 = tripulación, 1 = primera, 2 = segunda, 3 = tercera)
• Edad (1 = adulto, 0 = niño)• Sexo (1 = hombre, 0 = mujer)• Sobrevivió (1 = sí, 0 = no)
Para ello, vamos a ver que reglas de asociación interesantes podemos extraer de estos atributos. Para ejecutar los métodos en Weka de reglas de asociaciación, seleccionamos la ventana de associate.
![Page 5: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/5.jpg)
![Page 6: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/6.jpg)
Entre otros, este sistema de minería de datos provee el paquete “WEKA.associations.Apriori” que contiene la implementación del algoritmo de aprendizaje de reglas de asociación Apriori. Podemos configurar este algoritmo con varias opciones: con la opción “UpperBoundMinSupport” indicamos el límite superior de cobertura requerido para aceptar un conjunto de ítems.
Si no se encuentran conjuntos de ítems suficientes para generar las reglas requeridas se va disminuyendo el límite hasta llegar al límite inferior (opción “LowerBoundMinSupport”).
![Page 7: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/7.jpg)
![Page 8: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/8.jpg)
Con la opción “minMetric” indicamos la confianza mínima (u otras métricas dependiendo del criterio de ordenación) para mostrar una regla de asociación; y con la opción “numRules” indicamos el número de reglas que deseamos que aparezcan en pantalla.
La ordenación de estas reglas en pantalla puede configurarse mediante la opción “MetricType”, algunas opciones que se pueden utilizar son: confianza de la regla, lift (confianza divido por el número de ejemplos cubiertos por la parte derecha de la regla), y otras más elaboradas.
![Page 9: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/9.jpg)
![Page 10: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/10.jpg)
![Page 11: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/11.jpg)
![Page 12: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/12.jpg)
En cada regla, tenemos la cobertura de la parte izquierda y de la regla, así como la confianza de la regla. Podemos conocer alguna regla interesante aunque otras los son menos. Por ejemplo, la regla 1 indica que, como era de esperar toda la tripulación es adulta. La regla 2 nos indica lo mismo, pero teniendo en cuenta a los varones.
Parecidas conclusiones podemos sacar de las reglas 4, 5 y 6. La regla 3 nos indica que los varones que murieron fueron en su mayoría adultos (97%). La regla 7 destaca que la mayoría que murieron fueron adultos (97%). Y finalmente la 10 informa que la mayoría de los muertos fueron hombres (92%).
![Page 13: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/13.jpg)
Cabe destacar que la calidad de las reglas de asociación que aprendamos muchas veces viene lastrada por la presencia de atributos que estén fuertemente descompensados. Por ejemplo, en este caso la escasa presencia de niños provoca que no aparezcan en las reglas de asociación, ya que las reglas con este ítemset poseen una baja cobertura y son filtradas. Podemos mitigar parcialmente este fenómeno si cambiamos el método de selección de reglas.
A CONTINUACION VEREMOS EL COMPORTAMIENTO DE LOS DEMAS ALGORITMOS: FiltroAsociado, HotSpot, A priori-Predictivo y el Tertius.
![Page 14: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/14.jpg)
Es igual al Apriori normal, devuelve los mismos resultados para este caso.
![Page 15: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/15.jpg)
Actúa de manera distinta al Usar un valor de conteo mínimo para los segmentos, en este caso de 726 instancias, usa también un factor máximo de ramificación de 2, y una mejora mínima en margen del 1%.
Con estas métricas para nuestro ejemplo devuelve valores de:
No sobrevivieron el 67.7% (1490/2201) De sexo masculino el 78.8% (1364/1731)
Eran adultos el 79.72% (1329/1667) De ambos sexos adultos: 68.74% (1438/2092)
![Page 16: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/16.jpg)
![Page 17: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/17.jpg)
Es más exhaustivo y combina las probabilidades de forma distinta.
![Page 18: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/18.jpg)
Consideró 440 hipótesis de las cuales exploró 332, Así:
![Page 19: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/19.jpg)
Usando el “ADTree ” obtenemos los resultados:
![Page 20: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/20.jpg)
El árbol generado para “ADTree” será
![Page 21: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/21.jpg)
Usando“FT” será
![Page 22: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/22.jpg)
El árbol generado para “FT” será
![Page 23: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/23.jpg)
Usando“J48” será
![Page 24: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/24.jpg)
El árbol generado para “J48” será
![Page 25: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/25.jpg)
Usando “LADTree” será
![Page 26: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/26.jpg)
El árbol generado para “LADTree” será
![Page 27: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/27.jpg)
Usando “LMT” será
![Page 28: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/28.jpg)
El árbol generado para “LMT” será
![Page 29: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/29.jpg)
Usando “NBTree” será
![Page 30: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/30.jpg)
El árbol generado para “NBTree” será
![Page 31: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/31.jpg)
Y Usando “REPTree” será
![Page 32: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/32.jpg)
El árbol generado para “REPtree” será
![Page 33: Ejemplo Weka Titanic](https://reader034.vdocuments.pub/reader034/viewer/2022050616/54831e84b07959520c8b4996/html5/thumbnails/33.jpg)
La explicación inicial del ejemplo fue extraída de:
http://users.dsic.upv.es/~jorallo/docent/doctorat/weka.p