PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA INFORMÁTICA
MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES ENAGENCIAS VIRTUALES DE ALOJAMIENTO
DANIEL ESTEBAN GUZMÁN SUAZO
INFORME FINAL DE PROYECTO PARA
OPTAR AL TÍTULO PROFESIONAL DE
INGENIERO CIVIL EN INFORMÁTICA
VALPARAÍSO, JULIO DE 2016
PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÍA INFORMÁTICA
MINERÍA DE DATOS SOBRE OPINIONES DE CLIENTES ENAGENCIAS VIRTUALES DE ALOJAMIENTO
DANIEL ESTEBAN GUZMÁN SUAZO
PROFESOR GUÍA
ALEXANDRU CRISTIAN RUSU
PROFESOR CO-REFERENTE
SILVANA RONCAGLIOLO DE LA HORRA
VALPARAÍSO, JULIO DE 2016
Dedicatoria
A mi madre Jacqueline.Por haberme apoyado en todo momento durante mi vida,
por sus consejos, sus valores, por la motivaciónconstante que me ha permitido siempre ser una persona
mejor, y por su amor en los buenos y malos momentosque hemos y seguiremos viviendo juntos.
A mis familiares.Por creer siempre en mi, por entregarme su apoyo y amor
en todo momento, por sus consejos, por su motivación,por las enseñanzas, y por los buenos momentos juntos.
A mis amigos.Por alegrar los momentos de mi vida, por sus consejos,por su apoyo incondicional, y por el apoyo mutuo en la
etapa profesional, y estoy seguro que seguiremos compartiendomuy buenos y gratos momentos a lo largo de la vida.
A mis profesores.Por todo el conocimiento que me entregaron desde mis
primeros años de estudio, por sus consejos, por losvalores recibidos, por volver a explicar las cosas que
no me quedaron claras las veces que fueran necesarias.Agradecer también especialmente al profesor Cristian Rusu,
por guiarme en el desarrollo de esta Memoria de titulo.
A mis compañeros.Por esos momentos que me enseñaron cuando no sabia
algo, por esos largos momentos de estudio en labiblioteca o en sus propias casas, por apoyarme
en los momentos difíciles, y por que sin ellosme habría costado mucho más lograr esta meta.
I
ResumenEn la presente investigación se identificaron técnicas y fundamentos de la Minería de Datos, Ciencia
de los Servicios, Usabilidad, Experiencia del Usuario, Experiencia del Consumidor, entre otras, con
el objetivo de tener conocimiento previo al tema fundamental de este estudio, el cual consiste en
identificar tendencias en opiniones vertidas por clientes de hoteles a través de agencias virtuales de
alojamiento. Para cumplir a cabalidad con este objetivo, en primer lugar se escogió un caso de estudio
(Hotelclub.com), en segundo lugar, se analizó la estructura de este sitio web elegido, específicamente su
código HTML, realizando Minería Web de Contenido, es decir, extrayendo la información almacenada
en el sitio. Para poder realizar la Minería Web de Contenido, fue necesario desarrollar una herramienta
que se conectara al sitio web y extrajera estos datos. El formato obtenido de los datos en esta herramienta
fue de dos formas, la primera fue mostrando los datos a través de ventanas de la aplicación y la segunda
a través de un archivo Excel generado. Con este archivo Excel obtenido, se realizaron análisis de
estadística descriptiva, análisis de correlación a través de las pruebas de Spearman ρ, para encontrar
relaciones entre los datos y por último la prueba no paramétrica de Kruskall Wallis H que permite
saber si existen diferencias significativas entre los distintos datos analizados.
Palabras Claves: Minería de Contenido Web, Experiencia del Consumidor, Ciencia de los Servicios.
AbstractThe study’s aim is to analyse customers’ opinions about hospitality services express through the
web. Thus, this research is based on the use of data mining service science as the main and fundamental
data collection in order to identify trends in opinions expressed by customers through virtual hotels
accommodation agencies. To faithfully fulfil this goal, first a case study was carried on Hotelclub.com.
Secondly, the structure of this web site was chosen and then the specifically HTML code was analysed.
Web Mining Content was chosen to extract the information stored on the site. To apply the Web Content
Mining was necessary to develop a tool that will connect to the website and to extract this data. The
format of the data obtained in this tool has two forms, the first was showing data through application
windows and the second via an Excel file generated. With this Excel file obtained, analysis of descriptive
statistics, correlation analysis through tests Spearman ρ were conducted to find the nonparametric
Kruskal Wallis H that lets you know if there are significant differences relationships between data
and finally between the various data analysed.
Key words: Web Content Mining, Consumer Experience, Service Science.
II
Índice
1. Introducción 1
2. Definición del Problema 22.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2.2. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3. Metodología de la Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.4. Plan de Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3. Conceptos Básicos 63.1. Sitios Web Transaccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2. Ciencia de los Servicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3. Experiencia del Usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.4. Experiencia del Cliente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.5. Usabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.6. Arquitectura de la Información . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.7. Descubrimiento del Conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.8. Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.8.1. Definición de Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.8.2. Técnicas de la Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.8.3. Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.8.4. Etapas de la Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.8.5. Minería de Opinión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4. Caso de Estudio 204.1. Sitio Web Hotelclub.com . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.2. Justificación del Caso de Estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5. Trabajo Realizado 225.1. Extracción de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.2. Herramienta de Extracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.3. Análisis de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.1. Análisis de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5.3.2. Medidas de Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.3.3. Spearman ρ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3.4. Kruskall Wallis H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.3.5. Kruskall Wallis H por año de publicación . . . . . . . . . . . . . . . . . . . . . 43
6. Síntesis de Resultados 486.1. Comparación Santiago de Chile y localidades de Chile . . . . . . . . . . . . . . . . . . 48
6.2. Comparación Santiago de Chile y localidades de Latinoamérica . . . . . . . . . . . . . 48
6.3. HotelClub V/S TripAdvisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
III
6.3.1. Santiago y las ciudades de Chile analizadas . . . . . . . . . . . . . . . . . . . . 49
6.3.2. Santiago de Chile y las ciudades de Latinoamérica analizadas . . . . . . . . . . 50
7. Conclusiones y Trabajo Futuro 51
Anexos 56
A. Medidas de Resumen y Matrices de Correlación de Spearman 57A.1. Hoteles de Santiago de Chile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
A.2. Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
A.3. Hoteles de Buenos Aires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
A.4. Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
A.5. Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
A.6. Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
A.7. Hoteles de Río de Janeiro Brasil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
A.8. Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
A.9. Hoteles de Panamá . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
B. Matrices de Correlación de Spearman - Hoteles de Chile 64B.1. Hoteles de Viña del Mar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
B.1.1. BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . . . . . . . . . . 64
B.1.2. Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
B.1.3. Sheraton Miramar Hotel & Convention Center . . . . . . . . . . . . . . . . . . 65
B.2. Hoteles de Santiago de Chile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
B.2.1. Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . . . . . . . . . . 66
B.2.2. Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
B.2.3. Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
B.2.4. Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
B.2.5. Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
B.2.6. Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . . . . . . . . . . 69
B.2.7. Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
B.2.8. Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
B.2.9. Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
B.2.10. Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
B.2.11. Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
B.2.12. NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
B.2.13. Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . . . . . . . . . . 72
B.2.14. Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
B.2.15. BEST WESTERN PREMIER Marina Las Condes . . . . . . . . . . . . . . . . 74
B.2.16. Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . . . . . . . . . . 74
B.2.17. Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
B.2.18. Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . . . . . . . . . . 75
B.3. Hoteles de Isla de Pascua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.3.1. Tupa Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
IV
B.4. Hoteles de Puerto Montt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.4.1. Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.4.2. Hotel Cabana del Lago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.5. Hoteles de San Pedro de Atacama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.5.1. Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . . . . . . . . . . 77
B.6. Hoteles de Punta Arenas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
B.6.1. BEST WESTERN Hotel Finis Terrae . . . . . . . . . . . . . . . . . . . . . . . 78
C. Capturas del Sitio Web Hotelclub.com 78
D. Capturas del Sitio Web Hoteles.com 79
E. Estructura HTML del Sitio Web Hotelclub.com 83
F. Código de la Aplicación en Lenguaje JAVA 85
V
Lista de Figuras
1. Etapas del Proceso KDD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2. Tipos de Minería Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3. Etapas de la Minería Web. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4. Interfaz Gráfica Programa-Inicio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5. Interfaz para agregar hoteles por locación . . . . . . . . . . . . . . . . . . . . . . . . . 24
6. Interfaz para Selección de Locación y Hotel . . . . . . . . . . . . . . . . . . . . . . . . 25
7. Menú de la Aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
8. Árbol con los Datos Extraídos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
9. Tabla de los datos cuantitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
10. Matriz de Correlación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
11. Excel Generado con la Aplicación - parte 1 . . . . . . . . . . . . . . . . . . . . . . . . 27
12. Excel Generado con la Aplicación - parte 2 . . . . . . . . . . . . . . . . . . . . . . . . 28
13. Porcentaje de viajeros según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . . . 30
14. Porcentaje de viajeros según finalidad de viaje . . . . . . . . . . . . . . . . . . . . . . . 31
15. Relación entre recomendación y tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . 32
16. Interfaz del sitio web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
17. Comentario con la interfaz del sitio web. . . . . . . . . . . . . . . . . . . . . . . . . . . 79
18. Interfaz del Sitio Web Hoteles.com - Todas las categorías . . . . . . . . . . . . . . . . . 80
19. Interfaz del Sitio Web Hoteles.com - De Negocio . . . . . . . . . . . . . . . . . . . . . 80
20. Interfaz del Sitio Web Hoteles.com - En Pareja . . . . . . . . . . . . . . . . . . . . . . 81
21. Interfaz del Sitio Web Hoteles.com - En Familia . . . . . . . . . . . . . . . . . . . . . . 81
22. Interfaz del Sitio Web Hoteles.com - Entre Amigos . . . . . . . . . . . . . . . . . . . . 82
23. Interfaz del Sitio Web Hoteles.com - Otras categorías . . . . . . . . . . . . . . . . . . . 82
24. Interfaz del Sitio Web Hoteles.com - Comentarios . . . . . . . . . . . . . . . . . . . . . 83
VI
Lista de Tablas
1. Fases y Etapas de la Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Distribución de Trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3. Clasificación de Sitios Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4. Tipos de Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5. Técnicas de la Minería de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6. Datos Extraídos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7. Cantidad de comentarios según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . . 30
8. Porcentaje de comentarios según tipo de viaje . . . . . . . . . . . . . . . . . . . . . . . 30
9. Cantidad de comentarios según finalidad de viaje . . . . . . . . . . . . . . . . . . . . . 31
10. Porcentaje de comentarios según finalidad de viaje . . . . . . . . . . . . . . . . . . . . 31
11. Cantidad de comentarios según recomendación del viaje . . . . . . . . . . . . . . . . . 32
12. Porcentaje de comentarios según recomendación del viaje . . . . . . . . . . . . . . . . . 32
13. Cantidad de comentarios según año de publicación . . . . . . . . . . . . . . . . . . . . 33
14. Resumen de los Promedios por Locación . . . . . . . . . . . . . . . . . . . . . . . . . . 33
15. Matriz de Correlación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 34
16. Coeficiente de Determinación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . 35
17. Matriz de Correlación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 35
18. Coeficiente de Determinación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . 36
19. Matriz de Correlación - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 36
20. Coeficiente de Determinación - Hoteles Buenos Aires Argentina . . . . . . . . . . . . . 36
21. Matriz de Correlación - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 37
22. Coeficiente de Determinación - Hoteles de Lima . . . . . . . . . . . . . . . . . . . . . . 37
23. Matriz de Correlación - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 37
24. Coeficiente de Determinación - Hoteles de Montevideo . . . . . . . . . . . . . . . . . . 38
25. Matriz de Correlación - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 38
26. Regresión Lineal - Hoteles de Quito . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
27. Matriz de Correlación - Hoteles de Río de Janeiro . . . . . . . . . . . . . . . . . . . . . 39
28. Coeficiente de Determinación - Hoteles de Quito . . . . . . . . . . . . . . . . . . . . . 39
29. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 40
30. Coeficiente de Determinación - Hoteles de México . . . . . . . . . . . . . . . . . . . . 40
31. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 40
32. Coeficiente de Determinación - Hoteles de Panamá . . . . . . . . . . . . . . . . . . . . 41
33. Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago, por dimensiones . . . . . . 41
34. Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogota, por dimensiones . . . . . . . 42
35. Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires, por dimensiones . . . . 42
36. Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima, por dimensiones . . . . . . . . 42
37. Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito, por dimensiones . . . . . . . . 42
38. Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro, por dimensiones . . . 43
39. Prueba 7: Kruskal-Wallis H - Tipos de viajeros de Montevideo, por dimensiones . . . . . 43
40. Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México, por dimensiones . 43
41. Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá, por dimensiones . . . . . . . 43
42. Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago de Chile por año de publicación 44
VII
43. Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogotá por año de publicación . . . . 44
44. Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires por año de publicación . 45
45. Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima por año de publicación . . . . . 45
46. Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito por año de publicación . . . . . 45
47. Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro por año de publicación 46
48. Prueba 7: Kruskal-Wallis H - Tipos de viajeros en Montevideo por año de publicación . . 46
49. Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México por año de publicación 46
50. Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá por año de publicación . . . . 47
51. Medidas de Resumen - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 57
52. Matriz de Correlación - Hoteles Santiago de Chile . . . . . . . . . . . . . . . . . . . . . 57
53. Medidas de Resumen - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 58
54. Matriz de Correlación - Hoteles de Bogota Colombia . . . . . . . . . . . . . . . . . . . 58
55. Medidas de Resumen - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 59
56. Matriz de Correlación - Hoteles de Buenos Aires Argentina . . . . . . . . . . . . . . . . 59
57. Medidas de Resumen - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 59
58. Matriz de Correlación - Hoteles de Lima Perú . . . . . . . . . . . . . . . . . . . . . . . 60
59. Medidas de Resumen - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 60
60. Matriz de Correlación - Hoteles de Montevideo Uruguay . . . . . . . . . . . . . . . . . 60
61. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 61
62. Matriz de Correlación - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 61
63. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 62
64. Matriz de Correlación - Hoteles de Río de Janeiro . . . . . . . . . . . . . . . . . . . . . 62
65. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 63
66. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 63
67. Medidas de Resumen - Hoteles de Quito Ecuador . . . . . . . . . . . . . . . . . . . . . 63
68. Matriz de Correlación - Hoteles de Ciudad de México . . . . . . . . . . . . . . . . . . . 64
69. Medidas de Resumen - BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . . 64
70. Matriz de Correlación - BEST WEST Hotel Marina del Rey . . . . . . . . . . . . . . . 65
71. Medidas de Resumen - Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
72. Matriz de Correlación - Hotel Ultramar . . . . . . . . . . . . . . . . . . . . . . . . . . 65
73. Medidas de Resumen - Sheraton Miramar Hotel & Convention Center . . . . . . . . . . 65
74. Matriz de Correlación - Sheraton Miramar Hotel & Convention Center . . . . . . . . . . 66
75. Medidas de Resumen - Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . 66
76. Matriz de Correlación - Hotel Plaza el Bosque San Sebastián . . . . . . . . . . . . . . . 66
77. Medidas de Resumen - Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
78. Matriz de Correlación - Hotel Kennedy . . . . . . . . . . . . . . . . . . . . . . . . . . 67
79. Medidas de Resumen - Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . 67
80. Matriz de Correlación - Hotel Plaza el Bosque Ebro . . . . . . . . . . . . . . . . . . . . 67
81. Medidas de Resumen - Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . 68
82. Matriz de Correlación - Hotel Park Plaza Santiago . . . . . . . . . . . . . . . . . . . . . 68
83. Medidas de Resumen - Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . . 68
84. Matriz de Correlación - Park Plaza Apart Hotel . . . . . . . . . . . . . . . . . . . . . . 68
85. Medidas de Resumen - Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . . 69
VIII
86. Matriz de Correlación - Hotel Plaza el Bosque Nueva Las Condes . . . . . . . . . . . . 69
87. Medidas de Resumen - Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . . 69
88. Matriz de Correlación - Hotel Ismael 312 . . . . . . . . . . . . . . . . . . . . . . . . . 70
89. Medidas de Resumen - Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . 70
90. Matriz de Correlación - Hotel Plaza San Francisco . . . . . . . . . . . . . . . . . . . . . 70
91. Medidas de Resumen - Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . . 70
92. Matriz de Correlación - Hotel Regal Pacific . . . . . . . . . . . . . . . . . . . . . . . . 71
93. Medidas de Resumen - Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . 71
94. Matriz de Correlación - Hotel Manquehue . . . . . . . . . . . . . . . . . . . . . . . . . 71
95. Medidas de Resumen - Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
96. Matriz de Correlación - Hotel Galerías . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
97. Medidas de Resumen - NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . 72
98. Matriz de Correlación - NH Ciudad de Santiago . . . . . . . . . . . . . . . . . . . . . . 72
99. Medidas de Resumen - Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . 73
100. Matriz de Correlación - Holiday Inn Santiago - Airport Terminal . . . . . . . . . . . . . 73
101. Medidas de Resumen - Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . 73
102. Matriz de Correlación - Santiago Marriott Hotel . . . . . . . . . . . . . . . . . . . . . . 73
103. Medidas de Resumen - BEST WESTERN PREMIER Marina Las Condes . . . . . . . . 74
104. Matriz de Correlación - BEST WESTERN PREMIER Marina Las Condes . . . . . . . . 74
105. Medidas de Resumen - Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . 74
106. Matriz de Correlación - Hotel Presidente Edificio Santiago . . . . . . . . . . . . . . . . 74
107. Medidas de Resumen - Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . . 75
108. Matriz de Correlación - Soho Santiago Apartments . . . . . . . . . . . . . . . . . . . . 75
109. Medidas de Resumen - Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . 75
110. Matriz de Correlación - Holiday Inn Express Santiago Las Condes . . . . . . . . . . . . 75
111. Medidas de Resumen - Tupa Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
112. Matriz de Correlación - Tupa Hotels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
113. Medidas de Resumen - Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . 76
114. Matriz de Correlación - Manquehue Hotel Puerto Montt . . . . . . . . . . . . . . . . . . 77
115. Medidas de Resumen - Hotel Cabana del Lago . . . . . . . . . . . . . . . . . . . . . . . 77
116. Matriz de Correlación - Hotel Cabana del Lagos . . . . . . . . . . . . . . . . . . . . . . 77
117. Medidas de Resumen - Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . 77
118. Matriz de Correlación - Hotel Cumbres San Pedro de Atacama . . . . . . . . . . . . . . 78
119. Medidas de Resumen - Holiday Inn Express Antofagasta . . . . . . . . . . . . . . . . . 78
120. Matriz de Correlación - BEST WESTERN Hotel Finis Terrae . . . . . . . . . . . . . . . 78
121. Extracción del dato Nombre Hotel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
122. Extracción del dato Recomendación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
123. Extracción del dato Usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
124. Extracción de los datos Proposito, Ubicación y Fecha . . . . . . . . . . . . . . . . . . . 84
125. Titulo Comentario y Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
126. Extracción del dato Características del hotel . . . . . . . . . . . . . . . . . . . . . . . . 85
IX
1. Introducción
La gran cantidad de información disponible en la actualidad, provocada por el aumento en las
tecnologías de la información, constituye una enorme ventaja para las necesidades de búsqueda de
los usuarios que utilizan estas nuevas tecnologías. Sin embargo, al mismo tiempo, surge también
un nuevo problema, derivado de la dificultad existente para distinguir cuál es la información ne-
cesaria que nos permite tomar decisiones en una organización, a partir de la generación del conocimiento.
Mayoritariamente, la información que existe hoy en día en Internet es del tipo de opiniones de
usuario. Esta, como todos sabemos, es generada a cada minuto gracias a las redes sociales, pero también
existe una gran parte de ella en los sitios web de servicios; es aquí donde los usuarios publican sus
experiencias, ya sean positivas o negativas, de las prestaciones adquiridas. Por lo tanto, constituyen
una información fundamental para las organizaciones del rubro de los servicios, debido a que con
ella es posible realimentar futuras mejoras en la organización. Pero esta gran cantidad de información
existente, no tiene sentido sin un debido tratamiento de los datos, y por consiguiente, una generación de
conocimiento para la toma de decisiones. Es por ello, que ha tomado gran fuerza una nueva disciplina en
el área informática, conocida como "Minería de Datos".
La Minería de Datos, se refiere al proceso de extraer conocimiento útil y comprensible, previamente
desconocido, desde grandes cantidades de datos almacenados en distintos formatos. En términos
más simples, se trata de un método de explotación de datos y extracción de información, para luego
convertirlo en conocimiento útil y de esta forma, ayudar a tomar decisiones en una organización, a través
de la determinación de patrones y modelos. Este conocimiento entregado por la minería de datos, puede
ser interpretado desde distintos puntos de vista, dependiendo del área de interés de la organización que
lo utiliza.
En este proyecto, se utilizará el conocimiento extraído, como apoyo a la calidad de los servicios de
un sitio web transaccional, el cual ha sido elegido como caso estudio. Este conocimiento, será extraído
partir de comentarios vertidos por usuarios de sitio web Hotelclub.com, acerca de los servicios de hoteles
de la regián de Valparaíso.
En el siguiente informe, se presenta el marco teórico de esta investigación, lo cual permitirá
comprender los conceptos básicos involucrados en esta. En el primer capítulo, se da a conocer la
descripción del problema; la metodología de la investigación; los objetivos y el plan de trabajo a utilizar.
En el capítulo dos, se encuentran los conceptos básicos, de los cuales, los más importantes son: Sitios Web
Transaccionales, Ciencia de los Servicios y Minería de Datos. Por su parte, el tercer capítulo da a conocer
el caso de estudio y la justificación de esta elección. Mientras que en el cuarto capítulo, se presenta el
trabajo realizado, destacando las técnicas de minería de datos a utilizar, el análisis de la estructura del
sitio web, las herramientas de la minería de datos y la extracción de los datos que se utilizarán.
1
2. Definición del Problema
A continuación se define el problema que aborda la investigación, los objetivos, metodología y el plan
de trabajo a utilizar.
2.1. Planteamiento del Problema
Desde su creación, la World Wide Web ha sido objeto de una transformación constante y apresurada;
lo que se refleja en el momento en que los usuarios comunes comenzaron a unirse a la red. Mientras
tanto, varias nuevas tecnologías aparecieron para mejorar los computadores y redes; de esta manera, los
costos operativos relacionados con los sitios web y el precio de los equipos informáticos disminuyeron
drásticamente; lo que en conjunto contribuyó a la popularización masiva de Internet.
De igual modo, se produjo el surgimiento de un número asombroso de herramientas y aplicaciones,
como el llamado CMS (Content Management System), el cual es un marco que permite el desarrollo
de sitios web ágiles. Estos son sistemas que se encuentran dispuestos para su uso y los cuales están
habilitados de las herramientas necesarias para una instalación fácil con publicación de contenidos y
edición; todo lo cual permite que un usuario común pueda publicar contenido en línea sin ser un experto.
Debido a ello, se han ido desarrollando más foros, blogs y sitios web especializados aumentando
enormemente el número de contenidos generados por los usuarios. Por tanto, con los nuevos conceptos
introducidos por la Web 2.0, comenzó a darse más valor a la participación activa de los usuarios y
las comunidades, especialmente a través de la contribución del conocimiento de cada miembro para
enriquecer la información global.
Como consecuencia de este nuevo orden, proporcionar un espacio público para el debate de la comu-
nidad se convirtió casi en un modelo para las nuevas aplicaciones web. Es así que para satisfacer la nueva
demanda, la mayoría de los sitios web existentes, como las redes sociales, revistas web, comercio elec-
trónico, periódicos tuvieron que cambiar sus sistemas para cumplir con las nuevas normas de diseño, las
cuales proporcionan un espacio común que permite la interacción de los usuarios a través del intercambio
de opiniones y experiencias. Desde entonces, una enorme cantidad de datos han sido producido por los
usuarios, lo que es considerado como contenido valioso que puede ser extremadamente útil, no solo co-
mo un complemento, sino también en muchos casos, como una fuente primaria y única de la información.
En el caso de los sitios web turísticos, el intercambio de opiniones y experiencias son fundamentales,
tanto para los usuarios o consumidores como para las empresas que prestan los servicios. Para los
usuarios, estas sirven para ayudar a la toma de decisiones en el caso de contratar o no algún servicio,
por ejemplo, el alojarse en algún lugar del mundo; en el caso de las empresas, estas les permiten
retroalimentarse, en lo que respecta a las mejoras de sus productos y/o servicios; todo lo que posibilita
hacer más efectiva la toma de decisiones, en lo referente a la calidad del servicio, y teniendo como base
información fidedigna que requiere de un procesamiento y extracción desde el sitio web. Por todo ello,
se hace necesario utilizar técnicas especializadas de minería de datos.
Existen muchos sitios web con contenido turístico, de hoteles en particular, pero no se sabe con
precisión cuales entregan información real y confiable, además de que forma evitar que las personas
2
no sean estafadas por estos; así como también que no obtengan malos servicios. En este sentido se
evalúan distintos casos de estudio a considerar; de los cuales se escoge el sitio web hotelclub.com
para desarrollar esta investigación. Esto, debido a que se analizaron sus políticas privacidad,
logrando determinar que es una empresa seria y reconocida a nivel mundial. Además de ello, po-
see una interfaz gráfica intuitiva para el usuario, lo que permite extraer datos del sitio con mayor facilidad.
Por lo tanto, la idea principal sería utilizar técnicas de minería de datos para extraer estas opiniones y
experiencias; analizándolas y obteniendo información significativa con el fin de entregar, tanto a usuarios
como a los proveedores, información útil a través de una aplicación. Esta información relevante, sería
acerca de cuál es el hotel que posee mayores recomendaciones, dentro de una determinada zona de interés
que el mismo ingrese, para en definitiva, proceder a contratar un determinado servicio. Mientras que por
otro lado, a los proveedores se les daría a conocer, luego de análisis estadísticos de sus mismos datos
representados en comentarios, cuáles son sus falencias y sus ventajas según la opinión de sus clientes;
todo lo cual permitiría a estos generar, si es posible en una instancia posterior, las correcciones pertinentes
a las prestaciones que brindan a los consumidores.
2.2. Objetivos
A continuación se dan a conocer los objetivos de esta investigación
2.2.1. Objetivo General
Identificar tendencias en opiniones vertidas por clientes de hoteles a través de una agencia virtual de
alojamiento.
2.2.2. Objetivos Específicos
Identificar conceptos, técnicas y fundamentos de la Minería de Datos, Ciencia de los Servicios,
Usabilidad, Experiencia del Usuario y Experiencia del Consumidor.
Extraer opiniones vertidas por clientes en una agencia virtual de alojamiento.
Analizar los datos extraídos a través de métodos estadísticos, para la obtención de conocimiento.
Validar el conocimiento obtenido, identificando tendencias de evaluación.
2.3. Metodología de la Investigación
Para esta investigación se utilizará una metodología con un enfoque cuantitativo, en el cual se
llevan a cabo procesos sistemáticos y ordenados siguiendo una serie de pasos. La metodología de la
investigación cuantitativa se basa en el uso de técnicas estadísticas para conocer ciertos aspectos de
interés sobre la población que se está estudiando.
Planificar una investigación, consiste en proyectar un trabajo de acuerdo con una estructura lógica de
decisiones y con una estrategia que esté orientada a la obtención de respuestas adecuadas a los problemas
de indagación propuestos. Pese a tratarse de un proceso metódico y sistemático, no existe un esquema
completo de validez universal, aplicable mecánicamente a todo tipo de investigación. No obstante, es
3
posible identificar una serie de elementos comunes, que se encuentran lógicamente estructurados, y que
a su vez, nos proporcionan la dirección y guía suficiente al momento de realizar una investigación; todo
lo cual admite la posibilidad de ser organizado en objetivos de aprendizaje, fases y etapas.
Para esta investigación se utilizará esta metodología, debido a que se requieren realizar análisis
estadístico de datos, para lograr descubrir conocimiento a partir de estos.
A continuación se presenta la forma en cómo se organizará esta metodología (tabla 1).
a. Objetivos de AprendizajeDefinir las fases y etapas de la investigación cuantitativa.
b. fases y etapasLa tabla 1 muestra las fases y etapas que se mencionaron anteriormente.
Fases Etapas
Fase Conceptual
Formulación y limitación del problema.
Revisión de la literatura.
Construcción del marco teórico.
Fase de Planificación y Diseño.
Selección de un diseño de investigación.
Identificación de la población que se va a estudiar.
Selección de métodos e instrumentos.
Diseño del plan de muestreo.
Término y revisión del plan de investigación.
Realización del estudio piloto y revisiones.
Fase Empírica.Recolección de datos.
Preparación de los datos para análisis.
Fase Analítica.Análisis de Datos.
Interpretación de resultados.
Fase de Difusión.Comunicación de las observaciones.
Aplicación de las observaciones.
Tabla 1: Fases y Etapas de la Metodología
2.4. Plan de Trabajo
A continuación se presenta en la tabla 2 el plan de trabajo para el desarrollo de este proyecto con sus
períodos de tiempo estimado.
4
Actividad / Mes (2015-2016) Sep Oct Nov Dic Mar Abr May Jun
Proyecto 1 O O O OFormulación y limitación del problema O
Revisión de la literatura O
Construcción del marco teórico O O
Selección de un diseño de investigación O O
Identificación de la población que se va a estudiar O O
Selección de métodos e instrumentos O O
Diseño del plan de muestreo O O
Término y revisión del plan de investigación O O
Realización del estudio piloto y revisiones O O
Proyecto 2 O O O ORecolección de datos O
Preparación de los datos para análisis O
Análisis de Datos O O
Interpretación de resultados O O O
Comunicación de las observaciones O
Aplicación de las observaciones O
Tabla 2: Distribución de Trabajo
5
3. Conceptos Básicos
A modo de tener una visión general de los conceptos que se estudiarán más adelante en el desarrollo
principal del tema, se expone una definición de los conceptos más fundamentales de este proyecto, los
cuales son: Sitios Web Transaccionales, Ciencia de los Servicios, Usabilidad, Experiencia del Usuario,
Experiencia del Cliente, Arquitectura de la Información, Descubrimiento del Conocimiento, Minería de
Datos, Minería Web y Minería de Opinión.
3.1. Sitios Web Transaccionales
El uso de Internet permite a los usuarios de la red, hacer cada vez más gestiones que se relacionan con
su diario vivir: realizar trámites, pagar servicios, comprar, entre otros. El desarrollo de estas gestiones
virtuales, se ha logrado gracias a los llamados sistemas transaccionales; programas que garantizan la
seguridad y el éxito de la interacción que se genera entre un usuario con una determinada aplicación.
Ello permite a los ciudadanos comunicarse y operar con las instituciones públicas y privadas de manera
fiable a través de Internet; lo cual ayuda a solucionar problemas que van en aumento entre los usuarios,
permitiendo organizar su vida de mejor manera.
Bajo este modelo, las empresas exhiben sus productos y/o servicios en los sitios para que los clientes
los compren o contraten a través de Internet. El principal objetivo de estos sitios web, es el de realizar
ventas o transacciones online, pero un segundo objetivo muy común, es el de alojar información sobre
sus productos y/o servicios. Uno de los mejores ejemplos de este tipo de sitio es Amazon, siendo una de
las tiendas online más grandes y con mayor presencia a nivel mundial.
Además podemos entender lo que es un sitio web, según su definición, como un conjunto de páginas
html relacionadas entre sí por hiperenlaces, gestionadas por organización, accesibles desde Internet
a partir de una dirección URL de su página índice (index) y con una unidad de contenido y de estilo
gráfico. Incluye textos, imágenes, archivos de audio, vídeo y enlaces a otros sitios web. Normalmente no
suele diseñarse una página web de manera aislada, sino más bien, un sitio completo donde a partir de una
página principal o índice, se enlaza el resto de páginas. Este a su vez, puede ser considerado como un
sistema distribuido, es decir, que se basa en una arquitectura cliente-servidor o una arquitectura multicapa.
Existe una gran gama de sitios webs, los que han sido clasificados según su contenido o el uso para
el cual estos hayan sido creados. Dicha clasificación se puntualiza de la siguiente manera en la tabla 3,
en la cual se clasifican según su dinamismo, por su audiencia, por su apertura, por su profundidad, y por
sus objetivos. [AMCM14].
En el sentido de esta investigación, el sitio web elegido como caso de estudio Hotelclub.com, posee
una clasificación mixta entre sitio web transaccional y de servicio; debido a que presta servicios a los
usuarios de hoteles y además permite realizar reservas con pagos o transacciones dentro del mismo. Lo
cual, es considerado como una ventaja dentro del circulo de empresas de este rubro, ya que mejora la
experiencia del usuario y del cliente, utilizando la lógica de un sistema unificado.
La presente investigación por lo tanto, se enfoca netamente en los sitios web catalogados como
6
Clasificación de los Sitios Web
Por su DinamismoSitios Estáticos
Sitios Dinámicos
Por su Audiencia
Públicos
Extranet
Intranet
Por su Apertura
Estructuras Abiertas
Estructuras Cerradas
Estructuras Semicerradas
Por su Profundidad
Por sus Objetivos
E-commerce
Transaccionales
Servicio
Informativos
Ocio
Navegación
Artísticos
Personales
Tabla 3: Clasificación de Sitios Web
transaccionales y de servicio, los cuales proveen múltiples beneficios a la hora de utilizarlos, tales como:
Óptima explotación de la información ejerciendo un adecuado control sobre la misma.
Ágil atención a los requerimientos de las dependencias usuarias, con la consiguiente reducción de
los costos operativos, y obteniendo un incremento en el grado de satisfacción de las áreas.
Incremento del grado de calidad de automatización en los servicios administrativos; liberando a
los usuarios de labores manuales - mecánicas rutinarias, permitiendo que sus funciones y esfuerzos
estén inclinados a obtener mayores niveles de productividad.
Modularidad, tanto del hardware como del software, logrando satisfacer la necesidad de
crecimiento controlado de las oficinas, y en general de la organización; protegiendo la inversión
inicial y la subsiguiente.
Facilidad que brinda el sistema al permitir que su proceso sea distribuido.
Optimización, estandarización y simplificación de los procedimientos operativos; además de
organización en las oficinas y áreas centrales, para proporcionar un servicio más ágil y eficiente
a la clientela.
Contabilización automática e interactiva hasta el último nivel de cada operación, teniendo como
beneficio la optimización de las áreas contables, de presupuesto y de operación.
Control de la tesorería, el que permita conocer en cualquier momento, la posición financiera real
de la institución.
Reducción tanto de los gastos administrativos como operativos.
7
Sustancial incremento de las utilidades.
Incremento sustancial en el nivel de seguridad de manejo de la información.
3.2. Ciencia de los Servicios
El sector servicios es el motor de las economías desarrolladas; y por este motivo, ha dado lugar a
una nueva disciplina que se conoce como La Ciencia de los Servicios (en inglés Services Sciences,
Management and Engineering: SSME). La Ciencia de los Servicios es la aplicación de disciplinas
científicas, de gestión e ingeniería a los trabajos que una organización (la proveedora de los servicios)
realiza para y con otra organización (la receptora de los mismos) [Abe05].
En los términos en los que se emplea en esta definición, un servicio es aquello que tiene un valor
económico, pero que carece de una consistencia material. Se concreta en intenciones de coproducción de
materiales y/o realización de acciones conjuntamente entre los proveedores y los receptores mencionados
más arriba. Estas intenciones se reflejan en un hecho contractual, en donde se especifica la forma de
repartir riesgos, tareas, información y activos; así como el proceso de gestión de tal contrato (toma de
decisiones, formas de pago, penalizaciones, etc.) [Cen07].
A partir de una definición amplia, arriba mencionada, de la Ciencia de los Servicios (Ciencia,
Gestión e Ingeniería de los Servicios), nos da además las claves para entender cómo se desarrolla la
actividad dentro de esta área de conocimiento: Ciencia es la forma de crear conocimiento, el cual es
necesario; si es que realmente queremos afirmar la existencia de una nueva disciplina académica y de un
cuerpo razonablemente sólido de actividad profesional y empresarial.
Esta área de conocimiento, nueva disciplina académica, actividad profesional y empresarial, tiene un
triple enfoque:
Ciencia porque se crea conocimiento
Gestión porque se convierte en valor empresarial
Ingeniería por su contribución al desarrollo técnico y social.
En términos generales, el sector de servicios se basa en gran medida en la intuición y la experiencia
de los empleados. La Ciencia de los Servicios, busca tomar estos elementos y examinar científicamente,
investigando a través de la utilización de las disciplinas académicas existentes; con el fin de aumentar
la productividad y crear evaluaciones visibles de inversiones. Un ejemplo de tales esfuerzos, es el
mejoramiento futuro de predecir efectos y riesgos, en las inversiones de servicios a través de la
modelización matemática de procesos de negocios, que a su vez daría lugar a una mayor productividad.
3.3. Experiencia del Usuario
Se puede definir la Experiencia del Usuario (user experience: ux) sencillamente como aquella que
es obtenida por el usuario, cuando interactúa con un producto en condiciones determinadas. En contexto
de la web, lo que se persigue es generar sensaciones, para los usuarios del sitio web, lo más agradables,
positivas y placenteras posibles; lo que se concreta en las valoraciones que estos realizarán, y que
8
plasman la garantía de obtener como satisfacción final; lo que se traduce en conservar la fidelidad del
usuario. Por tanto, la experiencia de usuario (UX), consiste en la vivencia real que tienen los usuarios
con determinado producto, al relacionarse o interactuar con él [AMCM14].
Peter Morville diseñó un diagrama para explicar la importancia de la experiencia de usuario, donde lo
primordial es asegurar que estos encuentren valor en lo que se les proporciona. Este diagrama se denomina
User Experience Honeycomb", y señala que una experiencia de usuario es significativa y valiosa cuando
el producto es [Jos]:
1. Útil: su contenido es original y satisface una necesidad.
2. Usable: el producto es fácil de usar.
3. Deseable: la imagen, identidad, marca y otros elementos de diseño evocan emociones hacia el
producto.
4. Localizable: su contenido es navegable y localizable dentro y fuera del producto.
5. Accesible: su contenido es accesible para personas con necesidades especiales.
6. Creíble: los usuarios confían y creen lo que el producto muestra.
7. Valioso: Este elemento deriva como resultado de cubrir correctamente todos los demás. De este modo,
es posible aportar más valor al producto.
Por otra parte, Dillon (2001) propone una sencilla definición como la suma de tres niveles, y estos
son: Acción, qué hace el usuario; Resultado, qué obtiene el usuario; y Emoción, qué siente el usuario.
La diferencia respecto a las anteriores definiciones, es que el autor descompone el fenómeno causante
(interacción) en dos niveles: Acción y Resultado; y enfatiza el aspecto emocional de la experiencia
resultante [AMCM14].
Finalmente, podemos definir la experiencia del usuario como la sensación, sentimiento, respuesta
emocional, valoración y satisfacción, que experimenta este respecto a los sitios web; siendo esta experien-
cia el resultado del fenómeno que se genera en la interacción que se produce entre el sitio web y el usuario.
Esta investigación se enfoca en extraer la experiencia del usuario, a través de opiniones compartidas
por clientes de un sitio web, en donde quedan registradas las experiencias vividas por las personas al utili-
zar los servicios brindados; todo ello, por la interacción que se reporta con el producto del caso de estudio.
Dentro de un proyecto web, podemos encontrar trabajando a diseñadores de interacción, arquitectos
de información, especialistas en accesibilidad, diseñadores gráficos y especialistas en usabilidad, entre
muchos otros perfiles; todos abocados a la búsqueda de visiones y soluciones globales para mejorar
considerablemente la experiencia del usuario en aplicaciones.
A consecuencia de todo ello, en los últimos años se ha popularizado el concepto de experiencia del
usuario, noción que integra en sí misma, diferentes disciplinas y roles profesionales.
9
3.4. Experiencia del Cliente
La Experiencia del cliente (Customer Experience: CX) se puede definir como la percepción que
tienen los clientes de las interacciones que mantienen con una empresa u organización. La CX está en
gran medida fundamentada en la suma de las experiencias que tiene un cliente con un proveedor de
bienes y servicios, especialmente de aquellas con alto impacto emocional.
Las organizaciones que brindan una experiencia del cliente superior de manera constante obtiene
beneficios comerciales que van mucho mas allá de mejorar la lealtad del cliente y las ganancias. Las
empresas que gestionan el recorrido del cliente (para obtener su(s) producto(s) o servicio(s)) de principio
a fin y entre múltiples puntos de contacto y canales, poseen una gran ventaja competitiva, al reducir la
deserción de clientes, y a la vez al diferenciarse de sus competidores. De esta manera, al obtener una
experiencia más completa del cliente, se mejoran considerablemente las ventas, lo que contribuye a
reducción de costos.
Para mejorar la experiencia del cliente, es esencial tener la capacidad de satisfacer sus expectativas,
entender el contexto de cada interacción en cualquier canal, optimizar el enrutamiento y aprovechar los
comentarios que vierten los clientes en los sitios web de la empresa, a través de herramientas analíticas,
como las de minería de datos, que permiten obtener mejores resultados y mejor calidad en los servicios.
Esto permite ajustar el proceso y adoptar las medidas necesarias para que la CX sea inmejorable, lo cual,
brinda una experiencia superior, genera mayores ventas, disminuye costos, mejora deficiencias y los
empleados estarán más satisfechos.
La forma más sencilla y rentable de generar recorridos bien definidos es a través de una única
plataforma; en vez de malgastar recursos y esfuerzos en integrar soluciones de diversos proveedores.
Para esto, la clave es brindar una CX superior con una plataforma unificada lista para ser usada y que
dirija los puntos de contacto y optimice el compromiso entre todos los canales; logrando que el recorrido
del cliente no implique esfuerzo alguno, siendo proactivo y personalizado, y aumentando la productividad
de la empresa, ya que los clientes se contactan a través de múltiples canales que tenga a su disposición,
como lo son el web chat, correo electrónico, aplicación móvil, y redes sociales.
3.5. Usabilidad
Según el estándar ISO 9241-11, la usabilidad se puede definir como “el grado en la que un producto
se puede usar por determinados usuarios para conseguir objetivos específicos con efectividad, eficiencia
y satisfacción en un contexto de uso especificado” [Jos].
Este estándar explica cómo identificar la información que es necesaria considerar, cuando se
especifica o evalúa la usabilidad en términos de medidas del desempeño de los usuarios y su satisfacción.
Se incluye además una explicación de cómo la usabilidad de un producto puede ser especificada y
evaluada como parte de la calidad del sistema.
La usabilidad es un neologismo, proveniente de la palabra inglesa usability, que significa facilidad de
uso, y que según la ISO 9241 (1998), hace referencia a la eficacia, eficiencia y satisfacción con la que un
10
producto permite alcanzar objetivos específicos a usuarios específicos en un contexto de uso específico.
Por lo tanto, la usabilidad es la disciplina que estudia la forma de diseñar sitios web para que los usuarios
puedan interactuar con ellos de forma más fácil, cómoda e intuitiva posible[AMCM14].
El psicólogo Donald Norman (2002), socio de la Nielsen y Bruce Tognazzini en la N/N Group,
una firma de consultoría en usabilidad, en el libro "The Design of everyday things", presenta algunos
principios de diseño para la orientación en la construcción de interfaces de sistemas interactivos. Los
principios son [Jos]:
1. Visibilidad: para que el usuario sepa cómo proceder, las funciones deben estar visibles.
2. Feedback: el debido retorno de las acciones ayuda al usuario a seguir la tarea. La respuesta puede ser
verbal y/o visual o de audio.
3. Restricciones: inhibir las opciones del menú, en algunos momentos, pueden evitar que el usuario siga
opciones incorrectas y reduce la posibilidad de errores.
4. Mapeamento: las convenciones de la interfaz deben mirar a los símbolos comunes presentes en la
vida natural del usuario.
5. consistencia: la interfaz debe tener una norma, donde las operaciones y elementos semejantes
correspondan a tareas similares, para que sea más fácil al usuario de aprender a usarla.
6. Affordance: cuando el objeto es auto explicativo, es decir, cuando la forma de interacción es evidente.
Al mismo tiempo, Jakob Nielsen (2000), otro socio de la Nielsen y Bruce Tognazzini en la N/N
Group, define la usabilidad en términos de cinco atributos [Jos]:
1. Facilidad de aprendizaje (learnability): como de fácil resulta para los usuarios llevar a cabo tareas
básicas la primera vez que se enfrentan al diseño.
2. Eficiencia: una vez que los usuarios han aprendido el funcionamiento básico del diseño, ¿cuánto
tardan en la realización de tareas?
3. Cualidad de ser recordado (memorability): cuando los usuarios vuelven a usar el diseño después
de un período sin hacerlo, ¿cuánto tardan en volver a adquirir el conocimiento necesario para usarlo
eficientemente?
4. Eficacia: durante la realización de una tarea, ¿cuántos errores comete el usuario?, ¿cómo de graves son
las consecuencias de esos errores?, ¿Qué tan de rápido puede el usuario deshacer las consecuencias de
sus propios errores?
5. Satisfacción: ¿Qué tan agradable y sencillo le ha parecido al usuario la realización de las tareas?
En el modelo de Nielsen, la usabilidad es: “Parte de la utilidad del sistema, la cual es parte de la
aceptabilidad práctica y, finalmente parte de la aceptabilidad del sistema”.
11
3.6. Arquitectura de la Información
El término Arquitectura de la Información, fue utilizado por primera vez por Richard Saul Wurman
en 1975, quien la define como el estudio de la organización de la información con el objetivo de permitir
al usuario encontrar su vía de navegación hacia el conocimiento y la comprensión de la información. De
esta manera, podemos señalar que esta disciplina se encarga de diseñar sitios que sean útiles, para que el
usuario pueda encontrar lo que busca, si se halla lo que se busca en el sitio, existe una buena arquitectura
de la información (IA) [AMCM14].
En términos generales, podemos convenir que se trata de una disciplina encargada de estructurar,
organizar y etiquetar los elementos que conforman los entornos informacionales, para facilitar de esta
manera la localización y el acceso a la información contenida en los mismos, y mejorar así su utilidad y
aprovechamiento por parte de sus usuarios.
Por otra parte, Hassan y Ortega el 2009 [AMCM14], establecen que la arquitectura de la información
de un sitio web representa su esqueleto; esto es, aquel elemento del diseño que sostiene estructuralmente
el contenido. Por tanto, la arquitectura de la información, debe definirse en las primeras etapas del ciclo
de diseño, ya que de esta organización conceptual dependerán otros elementos de diseño; como lo son su
diseño de interacción o su diseño gráfico.
Muchos sitios web reciben millones de visitas, mientras que otras pasan desapercibidas, sin apenas
registrar usuarios que se interesen por ellas. Las causas que pueden explicar esa variación en el éxito
comunicativo pueden ser múltiples, tales como, el grado de interés de sus contenidos, el posicionamiento
en el que las sitúan los buscadores en los resultados de búsqueda, o su nivel de usabilidad y accesibilidad.
Todas estas causas, pueden explicar el éxito comunicativo de un sitio web.
Como afirma Nielsen [AMCM14], una mala arquitectura de la información es la piedra con la que
tropiezan los usuarios cuando buscan cualquier tipo de contenido en un sitio web, y por tanto lo que les
impide poder llegar a realizar otras tareas. Esto es clave en los sitios web transaccionales, especialmente
para el caso de estudio de esta investigación, ya que se requiere una captación amplia de clientes para
poder tener un éxito en el negocio, y para esto el sitio web debe cumplir todas las normas de la Usabilidad
y Arquitectura de la Información.
3.7. Descubrimiento del Conocimiento
El proceso completo de extraer conocimiento, a partir de bases de datos, se conoce como Knowledge
Discovery in Databases (KDD) o simplemente Descubrimiento del Conocimiento. Este proceso
comprende diversas etapas, que van desde la obtención de los datos hasta la aplicación del conocimiento
adquirido en la toma de decisiones. [Rod09]
El Descubrimiento de Conocimiento en Bases de Datos, se puede definir como el proceso no
trivial de identificación de patrones válidos, novedosos, potencialmente útiles y fundamentalmente
comprensibles en los datos.
12
Generalmente, se consideran las siguientes etapas del Proceso de Extracción del Conocimiento
[PMS12a]:
1. Selección de datos: Consiste en buscar el objetivo y las herramientas del proceso de minería;
identificando los datos que deben ser extraídos, buscando los atributos apropiados de entrada y la
información de salida para representar la tarea. Es decir, se debe saber lo que se quiere obtener y
cuáles son los datos que facilitarán esa información para lograr la meta.
2. Limpieza de datos: En este paso se limpian los datos sucios, incluyendo los datos incompletos (donde
hay atributos o valores de atributos perdidos), el ruido (valores incorrectos o inesperados) y datos
inconsistentes (conteniendo valores y atributos con nombres diferentes). Los datos sucios en algunos
casos deben ser eliminados, ya que pueden contribuir a un análisis inexacto y resultados incorrectos.
En síntesis, se definen y se determinan los tipos de errores, se busca e identifican las instancias que
contienen errores y se corrigen los errores descubiertos.
3. Integración de datos: Combina datos de diversas procedencias, incluyendo múltiples bases de datos,
que podrían tener diferentes contenidos y formatos. La inconsistencia en el formato, puede desembocar
en una redundancia e incongruencia en los atributos y valores de los datos. Normalmente, cuando se
trabaja en un problema de proceso de descubrimiento, es necesario primero formar un único conjunto
con todos los datos que provienen de distintas fuentes.
4. Transformación de datos:: Las transformaciones consisten principalmente en modificaciones
sintácticas llevadas a cabo sobre datos sin que supongan un cambio para la técnica de minería aplicada.
Las transformaciones discretas de los datos, tienen la ventaja de que mejoran la comprensión de las
reglas descubiertas, al transformar los datos de bajo nivel en datos de alto nivel; y también reduce
significativamente el tiempo de ejecución del algoritmo de búsqueda. Su principal desventaja, es que
se puede reducir la exactitud del conocimiento descubierto, debido a que puede causar la pérdida de
alguna información.
5. Reducción de datos: Reducir el tamaño de los datos, encontrando las características más significativas
para representar los datos, dependiendo del objetivo del proceso. Se pueden utilizar métodos de
transformación, para reducir el número efectivo de variables a ser consideradas, o para encontrar
otras representaciones de los datos. Las estrategias incluyen reducción de dimensiones (la extracción
irrelevante y débil de atributo), compresión de datos (reemplazando valores de datos con datos
alternativos codificados), reducción de tamaño (reemplazando valores de datos con representación
alternativa más pequeña), y una generalización de datos (reemplazando valores de datos de niveles
conceptuales bajos con niveles conceptuales más altos).
6. Minería de Datos: Consiste en la búsqueda de los patrones de interés, que pueden expresarse como un
modelo o simplemente que expresen dependencia de los datos. El modelo encontrado depende de su
función y de su forma de representarlo. Ahora bien, se tiene que especificar un criterio de preferencia
para seleccionar un modelo de un conjunto de posibles modelos; además de precisar la estrategia de
búsqueda a utilizar (normalmente está determinado en el algoritmo de minería).
7. Evaluación de los patrones: Se identifican verdaderamente patrones interesantes que representan
conocimiento, usando diferentes técnicas; además del uso de análisis estadísticos y lenguajes de
consultas.
13
8. Interpretación de resultados: Consiste en entender los resultados del análisis y sus implicaciones, lo
que nos puede llevar a retroceder hacia alguno de los pasos anteriores. En este punto, hay técnicas de
visualización que pueden ser útiles para facilitar el entendimiento de los patrones descubiertos.
En la figura 1 se visualizan las etapas del proceso KDD, las cuales se describieron anteriormente.
Figura 1: Etapas del Proceso KDD.
3.8. Minería de Datos
3.8.1. Definición de Minería de Datos
En la sección anterior (Descubrimeinto del Conocimiento) se pudo apreciar que la Minería de Datos
es parte de una de las etapas del proceso KDD, por ende, es importante discutir sobre la diferencia
entre KDD y Minería de Datos (Data Mining: DM), ya que muchos estudios e investigaciones dan por
hecho que ambos son sinónimos. Existen muchos casos en los que no es posible identificar o distinguir
claramente la etapa de Minería de Datos dentro del Proceso de Descubrimiento, porque en ocasiones no
es necesario realizar todas y cada una de las etapas del mismo, como por ejemplo, preprocesamiento,
limpieza de datos, etc [PMS12a].
Entonces, la Minería de Datos la podemos definir como una etapa particular en el proceso KDD,
etapa en la que se aplican algoritmos específicos o técnicas determinadas para la extracción de patrones
de los datos, distinguiéndolo del proceso KDD, que ya antes ha sido definido.
La Minería de Datos es la etapa más importante del KDD; es la que integra los procesos de
aprendizaje y métodos estadísticos para la obtención de hipótesis de patrones y modelos. Se fundamenta
en varias disciplinas, como lo son la estadística, la visualización de datos, sistemas para tomas de
decisión, el aprendizaje automático o la computación paralela y distribuida; beneficiándose de los
avances en estas tecnologías, pero difiriendo de ellas en la finalidad que persigue: extraer patrones,
describir tendencias y predecir comportamientos [PMS12a].
Debemos tener claro, que el proceso de Minería de Datos genera muchos tipos de patrones,
pero lo más importante es determinar qué patrones son útiles e interesantes y cuáles no. Un patrón
es interesante si cumple con ciertas condiciones. Si un patrón es de fácil comprensión, será válido
con cierto grado de certeza, para otro conjunto de datos, ya sea nuevo o de prueba; teniendo así una
14
utilidad potencial y siendo expresión además, de un conocimiento novedoso que escapa a lo trivial [IP07].
El Aprendizaje Automático, es el área de la Inteligencia Artificial que se ocupa de desarrollar
técnicas capaces de aprender, es decir, extraer de forma automática conocimiento subyacente en la
información; y constituye, junto con la estadística, el corazón del análisis inteligente de los datos.
Con todo ello, cabe señalar que existen dos tipos de minería de datos [Rod09], las cuales se muestran
en la tabla 4:
Tipos de Minería de Datos
Aprendizaje SupervisadoClasificación
Regresión o Estimación
Aprendizaje No SupervisadoClustering o agrupamiento
Reglas de Asociación
Tabla 4: Tipos de Minería de Datos
Además la Minería de Datos posee distintas técnicas, las cuales pueden ser descriptivas o predictivas.
Las descriptivas, caracterizan las propiedades generales de los datos en una DB (Base de Datos) y por el
contrario, la predictiva realiza inferencias en los datos para poder realizar predicciones, por lo mismo, es
importante tener claro lo que se desea obtener para ver cual de los dos enfoques se utiliza [PMS12a].
3.8.2. Técnicas de la Minería de Datos
En la tabla 5 se puede apreciar las técnicas más utilizadas en la Minería de Datos, las cuales pueden
ser descriptivas o predictivas [PMS12a]:
Para realizar estas técnicas, es necesario utilizar un software especializados en minería de datos. A
continuación se presentan cinco de las mejores herramientas de software de código abierto para minería
de datos: Orange, RapidMiner, WEKA, JHepWork y KNIME.
3.8.3. Minería Web
Minería Web (Web Mining: WM), es un área que se desprendió del proceso de Minería de Datos
y cuyo término fue acuñado por Oren Etzioni en 1996, y actualmente es un área de investigación
extensa. Algunos autores definen a la WM como el uso de técnicas para descubrir y extraer de forma
automática información de los documentos y servicios de la web. Según M. Scotto, la WM es el proceso
de descubrir y analizar información útil de los documentos de la Web. Sin embargo, la Minería Web se
puede definir como el descubrimiento y análisis de información relevante que involucra el uso de técnicas
y acercamientos basados en la minería de datos (Data Mining: DM), orientados al descubrimiento y
extracción automática de información de documentos y servicios de la Web, teniendo en consideración el
comportamiento y preferencias del usuario. Entre los objetivos principales del WM se tiene [JS03]:
Descubrir recursos, extraer información, analizar datos e inferir generalidades.
15
Técnicas DescripciónTécnicas Descriptivas
Descripción de Clases
Se puede dar de tres formas:
1. Caracterización de los Datos
2. Discriminación de los Datos
3. Combinación de ambas
Análisis de Asociación Es el procesos de búsqueda interesante de correlaciones entre un conjunto
grande de datos mostrando condiciones del tipo atributo-valor.
Análisis de Clusters El proceso trabaja agrupando objetos según el principio de maximizar la
similitud dentro de una clase y minimizar la similitud entre clases. Un clusters
es una colección de objetos de datos mutuamente similares.
Técnicas PredictivasClasificación y Predicción Son dos tipos de análisis de datos, aquellos que pueden ser usados para
clasificar datos y los que se usan para predecir tendencias. La clasificación
de datos predice clases de etiquetas mientras la predicción de datos predice
funciones de valores continuos.
Árboles de Decisión Definen un conjunto de clases, asignando a cada dato de entrada una clase y
determina la probabilidad de que ese registro pertenezca a la clase.
Redes Neuronales Son modelos predictivos no lineales que aprenden a través del entrenamiento.
Las tareas principales son: reconocer, clasificar, asociar, almacenar patrones,
aproximación de funciones, sistemas (predicción, control) y optimización.
Tabla 5: Técnicas de la Minería de Datos
Obtener nuevos conocimientos provenientes de la información disponible en la Web.
Encontrar información relevante.
Optimizar el diseño y estructura del sitio web.
La Web, es una enorme colección de datos con información muy heterogénea, que posee un
aumento en problemas de escalabilidad y dinamismo. Por consiguiente, la Web es un área fértil para
la investigación de Minería Web, con la existencia de una enorme cantidad de información en línea.
Este proceso de Minería Web, lo podemos definir formalmente como “el proceso global de descubrir
información o conocimiento potencialmente útil y previamente desconocido a partir de datos de la Web”
[PMS12b].
Se suele usar la denominación WM para catalogar tres tipos de actividades considerablemente
diferentes. Todas estas actividades se enmarcan dentro de la MD y además, están relacionadas con la
web; sin embargo, los datos que son objeto de la minería son diferentes.
Estas tres actividades son las siguientes [SG13]:
Minería de Contenido Web (WCM, Web Content Mining): WCM se trata del descubrimiento
de información útil de los contenidos, datos, documentos y servicios de la web. Sin embargo,
los contenidos web no se componen únicamente de texto, sino también de audio, vídeo, datos
simbólicos e hiperenlazados y metadatos [Rod09].
16
Minería de Estructura Web (WSM, Web Structure Mining): WSM extrae la estructura de los
hiperenlaces, es decir, cómo están los documentos estructurados respecto a los otros. La estructura
se representa como un grafo de los enlaces en un sitio web o entre sitios web. WSM revela
más información que la contenida en los documentos, por ejemplo, los enlaces que apuntan a un
documento pueden indicar la popularidad o importancia de este; mientras que los enlaces salientes
indican la riqueza o variedad de los temas que contiene. Esto nos lleva a una organización jerárquica
por temas, que puede ser inferida directamente de los patrones de enlazado. Es posible incluso
no especificar los documentos mediante palabras clave, sino mediante documentos ejemplares
[Rod09].
Minería de Uso Web (WUM, Web Usage Mining): Mientras que la minería de contenidos (WCM)
y la minería de estructura (WSM) usan los datos reales o primarios de la web; la minería de uso
(WUM), utiliza datos secundarios generados por la interacción de los usuarios con la web. WUM
incluye datos de las conexiones a los servidores web, servidores Proxy o buscadores, perfiles de
usuarios, archivos de registro, sesiones de usuario, búsquedas, clicks de ratón o scrolls, carpetas de
favoritos, etc [Rod09].
Por lo tanto, WCM clasifica los documentos automáticamente o construye una base de información
web multicapa; WSM extrae la estructura de una página web; mientras que, WUM descubre patrones de
acceso a las páginas en los usuarios.
A continuación, en la figura 2, se ilustran las categorías de la Minería Web
Figura 2: Tipos de Minería Web
3.8.4. Etapas de la Minería Web
Para poder procesar los datos y transformarlos en información útil, podemos distinguir una serie de
etapas dentro del proceso global de la Minería Web.
Selección y recopilación de datos: Lo primero es determinar qué es lo que se quiere obtener
y cuáles son los datos que nos facilitarán esa información para lograr la meta. Posteriormente,
se localizan los documentos o archivos a adquirir; capturándose y almacenándose los datos
17
pertinentes. El objetivo de esta etapa es recuperar automáticamente los documentos más
importantes, indexándolos para optimizar la búsqueda. El proceso de indexación es complejo,
debido a la gran cantidad de páginas Web, además que estas cambian continuamente; por lo cual
existen cuatro enfoques de indexación, los cuales son: indexación manual, automática, inteligente
o basada en agentes y basada en Metadatos.
Extracción y preprocesamiento de información: Se trata principalmente de filtrar y limpiar los
datos recogidos. Una vez extraída la información determinada a partir de un documento (ya sea
HTML, XML, TEXTO, PS, PDF, LaTeX, FAQs), se eliminarán los datos erróneos o incompletos,
y se presentarán de manera ordenada, para luego realizar transformación de estos por medios
automáticos. El objetivo es identificar y etiquetar el contenido esencial del documento, para mapear
hacia algún modelo de datos. La extracción de la información entrega nueva información a partir
de la estructura del documento y su representación.
Minería: En esta etapa, se descubren automáticamente los modelos o patrones generales sobre un
sitio Web, así como por múltiples sitios, utilizando recursos estadísticos, técnicas de Minería de
Datos, etc.
Análisis: Una vez teniendo los patrones identificados, es necesario interpretarlos; para esto, existen
diversas herramientas que permiten entender, ya sea visualmente o por algún otro método que
facilita la interpretación de dichos patrones.
A continuación, en la figura 3, se pueden visualizar de forma gráfica las etapas de la minería web.
Figura 3: Etapas de la Minería Web.
3.8.5. Minería de Opinión
La Minería de Opinión (Opinion Mining: OM) o Análisis del Sentimiento (Sentiment Analysis), es
un campo de la Minería Web que utiliza una serie de aplicaciones de técnicas del procesamiento del
lenguaje natural, lingüística computacional y minería de textos, que tienen como objetivo encontrar
información subjetiva en opiniones vertidas por los usuarios. La Minería de Opinión, es un tema bastante
nuevo hoy en día, y su importancia ha crecido significativamente, debido principalmente al crecimiento
del comercio electrónico, blogs, foros y redes sociales; logrando extraer información valiosa que puede
ser catalogada como positiva o negativa [Mat10].
Con el alto crecimiento del comercio electrónico, muchas personas cambiaron sus hábitos de ir a una
tienda para comprar sus productos o contratar servicios; y en cambio, han preferido hacerlo de forma
cómoda desde un computador con conexión a Internet, y al mismo tiempo, compartir sus opiniones en
los sitios webs. De esta manera, la búsqueda de información útil sobre las opiniones de los usuarios
antes de comprar un producto o contratar un servicio, se convirtió en una práctica común para muchas
18
personas. Encontrar sitios webs con miles de comentarios de un solo producto y/o servicio no es nada
complicado, lo difícil es encontrar una información que pueda servir de utilidad entre los usuarios
[AH08].
La Minería de Opiniones es un campo que cada vez se hace más extenso, el cual esta relacionado
con el análisis de las componentes subjetivas que están implícitas en los contenidos generados por
los usuarios. Dentro de este campo, existen aplicaciones que realizan un análisis profundo de los
contenidos textuales, en función de la tarea o problemática que se quiera resolver. En términos generales,
encontramos dos tipos de tareas relacionadas con la Minería de Opiniones [Shu08]:
Detección de la polaridad: Se refiere a la capacidad de determinar si una opinión es positiva o
negativa. Más allá de una polaridad básica, también se puede querer obtener un valor numérico
dentro de un rango determinado, en otras palabras, es la búsqueda de un “rating” asociado a una
determinada opinión.
Análisis del sentimiento basado en características: Se refiere a la capacidad de determinar
distintas características del producto tratadas en la opinión o review escrita por el usuario, y para
cada una de esas características mencionadas en la opinión, ser capaces de extraer una polaridad.
Este tipo de acercamientos son mucho más complejos y de un grado más específico que la detección
de la polaridad.
19
4. Caso de Estudio
4.1. Sitio Web Hotelclub.com
El 15 Enero del año 2016 la empresa encargada de la agencia virtual que escogimos como caso de
estudio hace el siguiente comunicado: “Hotelclub.com se unirá Hoteles.com el 15 de febrero de 2016.
Puede continuar reservando a través de HotelClub.com como normal hasta esta fecha. A partir del 15 de
febrero de 2016 usted será capaz de hacer nuevas reservas en Hoteles.com”. Esto implicó, agilizar el
proceso de extracción de datos antes de la fecha de migración del sitio web y además, dejó obsoleta la
aplicación desarrollada, debido a que la estructura del sitio cambio completamente (ver Anexo secciónA: figuras 15 a 21).
La escala con la que se califica cada comentario se mantuvo en 5 puntos desde 1 (peor calificación)
a 5 (mejor calificación) tal como se hacía en HotelClub.com y para los viajeros con finalidad de viaje
de Negocio, Pareja, Familia, Amigos y Otras categorías, eliminando la finalidad LGBT. Además, las
dimensiones evaluadas en Hoteles.com son las siguientes:
Servicio
Desayuno
Ubicación
Limpieza
Internet
Áreas deportivas
Hotel Club era una comunidad online internacional de viajes para la reserva de alojamiento por
internet. Los socios de esta comunidad, recibían múltiples beneficios económicos a la hora de elegir un
hotel. Hotel Club poseía opciones de alojamiento en 7.400 ciudades de 141 países de todo el mundo, y
contaba con servicios disponibles en 16 idiomas y 35 tipos de moneda. Hotel Club pertenecía a Hotel
Club Pty Ltd., una empresa registrada en Australia y parte de Orbitz Worldwide Inc. Este último, es un
líder mundial en viajes por Internet y utiliza innovadoras tecnologías para permitir a los viajeros, ya
sea por negocios o placer, la posibilidad de poder investigar, planear y reservar una amplia gama de
productos de viaje.
En este sitio web, se encontraban múltiples comentarios realizados por los usuarios registrados en
el mismo sitio. En sus comentarios se daba a conocer las opiniones que lograban percibir respecto del
servicio entregado; además a estos se les permitía efectuar múltiples valoraciones, las cuales podían
ingresar de acuerdo a ciertas categorías como, por ejemplo, en relación a las instalaciones, el servicio
proporcionado, la limpieza, el personal del hotel, la comodidad, ubicación y calidad v/s precio, etcétera.
Todas estas categorías podían ser evaluadas por los clientes con calificaciones que van desde el 1 al 5,
entregando así una puntuación final o nota; y teniendo la posibilidad final de señalar si se recomendaría
o no el servicio contratado.
20
4.2. Justificación del Caso de Estudio
Las personas a menudo realizan transacciones a través de sitios web de servicios, de hoteles en
particular, en donde realizan reservas de estos. A la hora de elegir uno, muchas de los usuarios revisa los
comentarios de estos sitios web, para poder obtener el mejor servicio posible. Es por esto, que hoy en
día los comentarios realizados en los sitios web de servicios son una fuente de información valiosa, tanto
para los usuarios como para las empresas. Por lo tanto, es de suma importancia que estos comentarios
sean confiables, ya que asegurará que lo que el usuario leyó acerca de un determinado comentario es
totalmente real.
El Sitio Web Hotelclub.com se aseguraba que solo los usuarios registrados en el sitio, y además
que hayan utilizado sus servicios hoteleros, podían comentar en él. Lo cual es fundamental para esta
investigación, ya que se trabaja con estos datos, lo que permite obtener un conocimiento de mayor calidad.
Hotelclub.com pertenecía a una empresa conocida en todo el mundo como se describió en la sección
anterior, pero aun no es muy utilizada en Chile, debido a que existen otras empresas del mismo rubro
que han tenido mayor auge en este país. Sin embargo, se eligió como caso de estudio, ya que forma parte
de una investigación mayor, en la cual existen otros investigadores de la misma Universidad, realizando
análisis de este tipo, pero de otras empresas del mismo rubro. Como lo son: Booking.com, Tripadvisor.cl,
Expedia.com, y Despegar.cl. Todo ello permite, comparar futuros resultados con estos investigadores, lo
cual posibilita generar otro tipo de conclusiones.
21
5. Trabajo Realizado
Para dar solución a la problemática planteada, se realizó un proceso de extracción y procesamiento
de los datos del sitio web que existía como caso de estudio (Hotelclub.com), con el objetivo de identificar
la información relevante de estos. Para ello, se realizaron análisis estadísticos de los comentarios, lo cual
en primera instancia fue con hoteles de Chile. Luego, expandimos el horizonte de análisis a hoteles de
latinoamerica y finalmente realizamos una comparación de Santiago de Chile con el resto de ciudades de
Latinoamérica.
5.1. Extracción de los Datos
Para extraer los comentarios se desarrolló un programa en Eclipse apoyados de la librería
JSoup y JFrame en el lenguaje de programación JAVA (ver punto 5.2 con capturas del prototipo
y código de este). La herramienta desarrollada, en primer lugar, pide seleccionar ubicación del
hotel y nombre de este (según la ubicación antes seleccionada), en segundo lugar se ingresa a un
menú, en donde hay cinco funciones principales, estas son: Crear Excel con los datos extraídos,
Visualizar los datos extraídos, Visualizar una tabla de los datos cuantitativos y un análisis estadís-
tico de estos, Visualizar la matriz de correlación de Spearman, y por último el botón Salir de la aplicación.
En la primera fase de este análisis, se obtuvieron los comentarios de 27 servicios de alojamiento
pertenecientes a San Pedro de Atacama, Antofagasta, Valparaíso, Isla de Pascua, Santiago, Puerto Montt
y Punta Arenas. La cantidad de comentarios corresponde a 373, una cantidad muy inferior con respecto
a otros sitios web de este rubro en Chile, lo cual se debe principalmente a que Hotelclub no era muy
conocido a lo largo de este país.
En la segunda fase, se expandió el horizonte de análisis a ciudades turísticas de Latinoamérica,
con el fin de realizar comparaciones con Chile y lograr interpretar resultados. Estas ciudades son
las siguientes: Santiago de Chile, Buenos Aires, Montevideo, Lima, Bogota, Río de Janeiro, Quito,
Ciudad de México y Panamá con las cuales se llega a un total de 4687 comentarios. A pesar de
la baja cantidad de comentarios, cabe destacar que cada uno de ellos posee mucha información
relevante, la cual se puede visualizar en la tabla 6. En la misma tabla, se pueden apreciar los datos
cuantitativos, los que fueron analizados a través de medidas de resumen (Media y Desviación estándar)
y a además, pruebas no paramétricas como lo son: Prueba de Spearman ρ y Kruskall Wallis H , con
el objetivo de encontrar tendencias en los datos obtenidos por clientes esta agencia virtual de alojamiento.
La tabla 6 muestra el formato de los datos que fueron extraídos (en Anexo, Sección E, se puede
encontrar la estructura HTML de los datos extraídos), con Nombre del Dato, Tipo de Dato y Descripción
.
22
Dato Extraído Tipo de Dato DescripciónFecha Date Corresponde a la fecha del comentario
Nombre Hotel String Corresponde al nombre del hotel
Titulo Comentario String Corresponde al titulo de un comentario
Comentario String Corresponde al comentario
Nombre Usuario String Corresponde al nombre de usuario del comentario
Ubicación Usuario String Corresponde a la ubicación de donde proviene el usuario
Recomendación String Corresponde a una palabra reservada de recomendación (Lo
recomendaría/No lo recomendaría)
Finalidad del Viaje String Corresponde a una palabra reservada de la finalidad del viaje
(Negocio, Pareja, Familia, Amigos, Solo y LGBT)
Rating Numérico[1;5] Corresponde a una nota dada por el usuario
Instalaciones y Servicios Numérico[1;5] corresponde a una nota por los servicios e instalaciones
Limpieza Numérico[1;5] Corresponde a una nota por la limpieza del hotel
Personal del Hotel Numérico[1;5] Corresponde a una nota por el personal del hotel
Comodidad Numérico[1;5] Corresponde a una nota por comodidad del hotel
Ubicación Numérico[1;5] Corresponde a una nota por la ubicación del hotel
Calidad-Precio Numérico[1;5] Corresponde una nota por la relación precio-calidad
Tabla 6: Datos Extraídos
5.2. Herramienta de Extracción
Se programó una herramienta (en formato .JAR) que permite extraer los datos a partir de los
parámetros de locación y nombre de un hotel. Por lo tanto, este programa cuenta con una interfaz gráfica
en la cual se le solicita en primera instancia Agregar hoteles, Elegir hotel y/o Salir, como se puede apreciar
en la figura 4:
23
Figura 4: Interfaz Gráfica Programa-Inicio.
Al presionar Agregar Hoteles, se despliega una interfaz que solicita un link, el cual se puede obtener
del sitio web Hotelclub.com, al buscar una locación de interés, luego al poner aceptar, el programa
procederá a extraer todos los hoteles de la locación indicada, para almacenar cada hotel en un txt. Ver
figura 5:
Figura 5: Interfaz para agregar hoteles por locación
Al presionar Elegir Hotel se despliega una sección en dónde se solicita la locación de interés y el
hotel según la locación indicada, y los datos serán obtenidos el txt antes creado. Ver figura 6
24
Figura 6: Interfaz para Selección de Locación y Hotel
Luego, al presionar siguiente, se muestra otra pantalla con un menú de la aplicación como se ve en la
figura 7, en donde destacan 3 funciones principales, las cuales son: Visualizar los comentarios extraídos,
generar un excel con los comentarios extraídos para su posterior análisis estadístico y mayor manejo de
los datos, y por último la opción de visualizar estadísticas de los datos cuantitativos extraídos.
Figura 7: Menú de la Aplicación
En la figura 8 se muestra la función Visualizar Comentarios, en un formato de árbol, en este caso del
hotel Park Plaza Santiago.
25
Figura 8: Árbol con los Datos Extraídos
En la figura 9 se muestra una tabla con los datos cuantitativos, a los cuales se les aplicó estadística
básica.
26
Figura 9: Tabla de los datos cuantitativos
La figura 10 muestra la tabla de correlación de Spearman de los datos mostrados en la imagen
anterior:
Figura 10: Matriz de Correlación de Pearson
En la figura 11 se muestra el excel generado al seleccionar la opción de crear excel. Esta función es
realizada con el objetivo de hacer análisis manuales de los datos.
Figura 11: Excel Generado con la Aplicación - parte 1
27
Figura 12: Excel Generado con la Aplicación - parte 2
5.3. Análisis de Datos
En base a los datos que fueron extraídos se pueden hacer relaciones a través de gráficos, para que
las tendencias sean vistas con mayor claridad. Para esto, primero se debe realizar un procesamiento
previo de los datos en un archivo Excel (.xls) a partir de la información obtenida de cada hotel
por medio de la herramienta desarrollada. Luego de esto, se resumen los datos cuantitativos en
una tabla, y con ella se genera cada gráfico. Para este estudio, contamos con un universo de 4687comentarios, de los cuales 294 corresponden a Santiago de Chile, 202 a Bogota, 326 a Buenos
Aires, 393 a Lima, 137 a Quito, 722 a Río de Janeiro, 69 a Montevideo, 1428 a Ciudad de México
y 1116 a Panamá. En la siguiente cita se documenta parte del trabajo realizado en la primera fase de
esta investigación y además es publicado en “Proceedings HCI International 2016, Springer”: [RRG+16].
5.3.1. Análisis de Resultados
Hotel Club clasificaba a sus viajeros en 6 tipos, obteniéndose para este análisis 4687 comentarios de
los cuales 134 son sin especificar su finalidad, lo que daría un total de 4553 comentarios que si especifican
su finalidad, y estos son:
Negocios (1011 comentarios).
Parejas (1610 comentarios).
Familias (647 comentarios).
Amigos (489 comentarios).
Solos (760 comentarios).
LGBT (36 comentarios).
28
No especificado (134 comentarios).
Hotel Club, además de clasificar los tipos de viajeros y sus finalidades de viaje, permite realizar
evaluaciones cuantitativas utilizando un rango para cada comentario con el objetivo de dar una calificación
por los servicios obtenidos en cada hotel. Esto, se realiza para las siguientes dimensiones cualitativas de
tipo ordinal:
D0: Rating
D1: Instalaciones y Servicios
D2: Limpieza
D3: Personal del Hotel
D4: Comodidad
D5: Ubicación
D6: Calidad/Precio
Esta calificación se realiza mediante una escala de 5 puntos desde 1 (peor calificación) a 5 (mejor
calificación), donde:
1: Pésimo
2: Malo
3: Regular
4: Muy Bueno
5: Excelente
5.3.2. Medidas de Resumen
A continuación se mostrará una serie de tablas y gráficos que resumen la estadística descriptiva
realizada a los datos extraídos para los hoteles de Latinoamérica. En las tablas podremos ver la cantidad
y porcentaje de comentarios según tipo de viaje, cantidad y porcentaje de comentarios según finalidad
de viaje, cantidad y porcentaje de comentarios según recomendación del viaje, cantidad de comentarios
según año de publicación, y resumen de promedios por locación. En cuanto a los gráficos, podremos ver
el porcentaje de viajeros según tipo de viaje, porcentaje de viajeros según finalidad de viaje, y por último
relación entre recomendación y tipo de viaje.
En la figura 13 se puede ver el gráfico con el porcentaje de viajeros según tipo de viaje, este puede
ser de ocio o negocios. Se puede apreciar que predominan los comentarios de ocio con un total de 3676
equivalentes al 78,4 % y por otro lado los de negocio con 1011 comentarios equivalentes al 21,6 % del
total de comentarios extraídos en Latinoamérica. En cuanto a la relación entre ciudades, se puede ver
que la mayoría de comentarios provienen de la ciudad de México con un total de 1428 comentarios de
los cuales 448 son de Negocio y 980 de Ocio. Además, la ciudad que posee menor cantidad de comen-
tarios es Montevideo, Uruguay, con tan solo 69 comentarios de los cuales 15 son de Negocio y 54 de Ocio.
29
Figura 13: Porcentaje de viajeros según tipo de viaje
Para ver con mayor exactitud los datos del gráfico presentado anteriormente (figura 13) se muestra la
tabla 7 y la tabla 8 con la cantidad de viajeros y porcentaje de estos según tipo de viaje respectivamente.
Propósito/Locación Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá
Negocios 77 57 33 78 18 97 15 448 188
Ocio 217 145 293 315 119 625 54 980 928
Total 294 202 326 393 137 722 69 1428 1116
Tabla 7: Cantidad de comentarios según tipo de viaje
Propósito/Locación Santiago Bogota Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá
Negocios 26.2 28.2 10.1 19.8 13.1 13.4 21.7 31.4 16.8
Ocio 73.8 71.8 89.9 80.2 86.9 78.3 68.6 83.2 78.4
Tabla 8: Porcentaje de comentarios según tipo de viaje
En la figura 14 se puede ver el gráfico con la cantidad de viajeros según la finalidad de su viaje,
ya sea en grupo de amigos, familia, pareja, persona que viaja sola, LGBT y sin Especificar. Se puede
observar, que predominan los viajes en pareja en todas las ciudades analizadas con un total de 1610
comentarios, registrándose la mayoría de estos en la localidad de Panamá con 392 comentarios seguido
por Ciudad de México con 392 comentarios, Buenos Aires 145,Lima con 134, Santiago de Chile con
123, Bogota con 51, Quito con 50 y finalmente Montevideo con 29. Además, se puede ver que la menor
cantidad de comentarios es realizada por la finalidad de viaje LGBT con un total de 16 comentarios en
todas las ciudades y registrando cero en la ciudad de Bogota.
Para ver con mayor exactitud los datos de la figura 14 se muestra la tabla 9 y la tabla 10 con la
cantidad de viajeros y porcentaje de estos según finalidad de viaje respectivamente.
30
Figura 14: Porcentaje de viajeros según finalidad de viaje
Finalidad Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá Total
Negocios 77 57 33 78 18 97 15 448 188 1011
Parejas 123 51 145 134 50 304 29 382 392 1610
Amigos 27 21 58 38 10 92 5 117 121 489
Familias 21 25 44 67 18 76 5 199 192 647
Solo 35 42 27 63 36 109 14 224 210 760
No especificado 9 6 18 12 3 35 0 47 4 134
LGBT 2 0 1 1 2 9 1 11 9 36
Total 294 202 326 393 137 722 69 1428 1116 4687
Tabla 9: Cantidad de comentarios según finalidad de viaje
Propósito/Locación [ %] Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo Cd. de México Panamá
Negocios 26.2 28.2 10.1 19.8 13.1 13.4 21.7 31.4 16.8
Parejas 41.8 25.2 44.5 34.1 36.5 42.1 42.0 26.8 35.1
Amigos 9.2 10.4 17.8 9.7 7.3 12.7 7.2 8.2 10.8
Familias 7.1 12.4 13.5 17.0 13.1 10.5 7.2 13.9 17.2
Solo 11.9 20.8 8.3 16.0 26.3 15.1 20.3 15.7 18.8
No especificado 3.1 3.0 5.5 3.1 2.2 4.8 0 3.3 0.4
LGBT 0.7 0 0.3 0.3 1.5 1.2 1.4 0.8 0.8
Tabla 10: Porcentaje de comentarios según finalidad de viaje
En la figura 15 se puede ver el gráfico con la cantidad de viajeros que recomiendan o no hoteles
según su tipo de viaje, es decir, viajes de negocios o viajes de ocio. Se puede observar, en el universo de
comentarios analizados, que existe un porcentaje superior al 80 % que recomienda estos hoteles. En el
tipo de viajes de negocio, se llega a un total de 375 comentarios de los cuales 322 recomiendan y 53 no
recomiendan hoteles. En el tipo de viaje de Ocio, se registra un total de 1768 comentarios de los cuales
1574 recomiendan y 194 no recomiendan hoteles.
31
Figura 15: Relación entre recomendación y tipo de viaje
Para ver con mayor exactitud los datos de la figura 15 se muestra la tabla 11 y la tabla 12 con la
cantidad de viajeros y porcentaje de estos según recomendación del viaje respectivamente.
Finalidad/CiudadNegocio Ocio
Lo recomendaría No lo recomendaría Lo recomendaría No lo recomendaría
Santiago 70 7 198 19
Bogota 49 8 130 15
Buenos Aires 29 4 266 27
Lima 73 5 291 24
Quito 13 5 107 12
Río de Janeiro 75 22 538 87
Montevideo 13 2 44 10
Ciudad de México 361 87 839 141
Panamá 151 37 786 142
Total 834 177 3199 477
Tabla 11: Cantidad de comentarios según recomendación del viaje
Finalidad/Ciudad [ %]Negocio Ocio
Lo recomendaría No lo recomendaría Lo recomendaría No lo recomendaría
Santiago 23.8 2.4 67.3 6.5
Bogota 24.3 4.0 64.4 7.4
Buenos Aires 8.9 1.2 81.6 8.3
Lima 18.6 1.3 74.0 6.1
Quito 9.5 3.6 78.1 8.8
Río de Janeiro 10.4 3.0 74.5 12.0
Montevideo 18.8 2.9 63.8 14.5
Ciudad de México 25.3 6.1 58.8 9.9
Panamá 13.5 3.3 70.4 12.7
Tabla 12: Porcentaje de comentarios según recomendación del viaje
En la tabla 13, “cantidad de comentarios según año de publicación”, se puede apreciar que el año con
mayor cantidad de comentarios es el 2014 con 1010 comentarios. En este año se puede ver que la ciudad
32
que tuvo la mayor cantidad de estos fue Ciudad de México con 294 comentarios.
Año/Locación Santiago Bogotá Buenos Aires Lima Quito Río de Janeiro Montevideo México Panamá Total
2007 1 1 5 1 0 3 0 21 13 45
2008 2 2 16 5 1 11 0 26 10 73
2009 5 8 23 21 2 50 2 130 53 294
2010 13 11 29 26 1 76 4 235 61 456
2011 16 24 25 40 27 62 2 179 85 460
2012 35 23 42 48 37 102 13 176 127 603
2013 62 38 56 69 24 126 12 175 148 710
2014 84 58 62 108 24 125 19 236 294 1010
2015 76 37 61 72 21 156 17 242 316 998
2016 0 0 7 3 0 11 0 8 9 38
Total 294 202 326 393 137 722 69 1428 1116 4687
Tabla 13: Cantidad de comentarios según año de publicación
A continuación se puede ver un cuadro resumen (tabla 14) con los promedios de cada dimensión por
locación y el total de comentarios por locación (N). En este resumen se puede observar lo siguiente:
La locación con mayor cantidad de comentarios es Ciudad de México.
La locación con menos cantidad de comentarios es Montevideo.
Bogota posee las mejores calificaciones en la dimensiones: Rating, Instalaciones y Servicios,
Limpieza y Comodidad.
Buenos Aires posee la mejor puntuación de Ubicación.
Montevideo posee la mejor puntuación de Calidad/Precio.
Las localidad con peores puntuaciones es Santiago de Chile.
Locación / Dimensión N D0 D1 D2 D3 D4 D5 D6
Santiago de Chile 294 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 3,9420
Buenos Aires 326 4,1963 3,9540 4,4540 4,4018 4,2669 4,4294 4,1810
Lima 393 4,1399 4,0153 4,4860 4,3893 4,3053 4,2850 4,1705
Montevideo 69 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 4,9420Bogota 202 4,2079 4,1485 4,5594 4,5050 4,3564 4,0396 4,2178
Río de Janeiro 722 3,9349 3,8490 4,1842 4,0859 4,0720 4,3310 3,8019
Quito 137 3,9051 3,7518 4,3504 4,3212 3,8686 4,0146 3,9635
Ciudad de México 1428 3,8564 3,7913 4,2563 4,1141 4,0399 4,4125 3,9181
Panamá 1116 3,9131 3,9292 4,1873 4,0358 4,1013 4,1792 3,9220
Tabla 14: Resumen de los Promedios por Locación
5.3.3. Spearman ρ
Luego de realizar el análisis de estadística descriptiva, procedemos a ver relaciones entre los datos
cuantitativos entregados por los usuarios de esta agencia virtual de alojamiento. Para esto, se extrajeron
datos de 9 ciudades de Latinoamérica, para luego hacer comparaciones con Chile, y específicamente de
Santiago, localidad que había sido utilizada para la primera fase de este estudio.
33
En primer lugar, para realizar esta comparación, se utiliza el coeficiente de correlación de
Spearmanρ, el cual es una medida de la relación lineal entre dos variables aleatorias cuantitativas. En
palabras simples, es un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando estas sean cuantitativas.
La prueba de Spearman ρ se realizó para comprobar la siguiente hipótesis:
H0 : ρ = 0, las dimensiones Dm y Dn son independientes.
H1 : ρ �= 0, las dimensiones Dm y Dn son dependientes.
Esta hipótesis nos comprueba la dependencia o independencia de los datos (dimensiones). Para esto,
deben utilizarse las tablas de correlación de Spearmanρ las cuales fueron calculadas por locación.
Además, cabe destacar lo siguiente acerca del coeficiente de correlación de Spearmanρ: un ρ cercano
a 1 indica relación, un ρ cercano a 0 indica no hay relación, y un ρ cercano a -1 indica relación inversa.
Solo las correlaciones marcadas con negrita son significativas al nivel α = 0, 05, y será interpretado por
cada locación de la siguiente forma (tomando rho como valor absoluto):
ρ = 0 : la correlación es nula.
0 < ρ ≤ 0, 190 : la correlación es muy baja.
0, 200 ≤ ρ ≤ 0, 390 : la correlación es baja.
0, 400 ≤ ρ ≤ 0, 590 : la correlación es moderada.
0, 600 ≤ ρ ≤ 0, 790 : la correlación es alta.
0, 800 ≤ ρ < 1 : la correlación es muy alta.
ρ = 1 : la correlación es perfecta.
Para analizar de mejor manera el Coeficiente de correlación de Spearman ρ, interpretaremos la
relación de sus dimensiones con el Coeficiente de Determinación bajo cada una de las matrices. El
Coeficiente de Determinación se explicará en términos de proporción de variabilidad compartida, donde
se ofrece una idea mas cabal de la magnitud de la relación. Dicho coeficiente se define como el cuadrado
del coeficiente de correlación; esto es, dadas dos variables X e Y , hace referencia a r2xy (coeficiente de
correlación al cuadrado), y se entiende como una proporción de variabilidades.
1. Matriz de Correlación Hoteles de Santiago de Chile
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,688 0,621 0,593 0,593 0,387 0,625D1 – 1,000 0,566 0,480 0,567 0,299 0,507D2 – – 1,000 0,577 0,632 0,319 0,514D3 – – – 1,000 0,493 0,383 0,590D4 – – – – 1,000 0,295 0,534D5 – – – – – 1,000 0,363
D6 – – – – – – 1,000
Tabla 15: Matriz de Correlación - Hoteles Santiago de Chile
34
Como se muestra en la tabla 15, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a medianamente fuerte.
Se puede observar que el mayor grado de correlación se da entre Instalaciones y Servicios y
Comodidad, lo cual podría indicarnos que los clientes mientras más cómodos se sientan con las
instalaciones y servicios del hotel, mejor va ser su percepción y calificación en cuanto a la calidad
y precio de este. Por otra parte, se puede ver otra correlación medianamente fuerte entre Rating e
Instalaciones y servicios, lo cual podría decirnos que los clientes entregarán un mayor Rating al recibir
mejores instalaciones y buenos servicios.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 47,3 38,5 35,1 35,1 22,9 39,0
D1 – 100 32,0 23,0 32,1 8,9 25,7
D2 – – 100 33,2 39,9 10,1 26,4
D3 – – – 100 24,3 14,6 34,8
D4 – – – – 100 8,7 28,5
D5 – – – – – 100 13,1
D6 – – – – – – 100
Tabla 16: Coeficiente de Determinación - Hoteles Santiago de Chile
Un 47,3 % del Rating es debido a las Instalaciones y Servicios
Un 39,9 % de la Comodidad es debido a la Limpieza
2. Matriz de Correlación Hoteles de Bogota
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,749 0,629 0,610 0,676 0,565 0,598D1 – 1,000 0,571 0,481 0,621 0,557 0,604D2 – – 1,000 0,559 0,690 0,409 0,463
D3 – – – 1,000 0,555 0,397 0,531D4 – – – – 1,000 0,460 0,577D5 – – – – – 1,000 0,425
D6 – – – – – – 1,000
Tabla 17: Matriz de Correlación - Hoteles de Bogota Colombia
Como se muestra en la tabla 17, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que el mayor grado de correlación se da entre Instalaciones y Servicios y Rating, lo
cual podría indicarnos que los clientes mientras más satisfechos estén con las instalaciones y servicios
de estos hoteles, mejor será la calificación al Rating. Además, se puede ver una segunda correlación
alta entre Limpieza y Comodidad, lo cual nos indicaría que mientras más limpio este el lugar de
hospedaje .mayor será la valoración de comodidad del cliente.
35
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 56.1 39,5 37,2 45,6 31,9 35,7
D1 – 100 32,6 23,1 38,5 31,0 36,4
D2 – – 100 31,2 47,6 16,7 21,4
D3 – – – 100 30,8 15,7 28,1
D4 – – – – 100 21,1 33,2
D5 – – – – – 100 18,0
D6 – – – – – – 100
Tabla 18: Coeficiente de Determinación - Hoteles de Bogota Colombia
Un 56,1 % del Rating es debido a las Instalaciones y Servicios
Un 47,6 % de la Comodidad es debido a la Limpieza
3. Matriz de Correlación Hoteles de Buenos Aires
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,662 0,564 0,597 0,638 0,416 0,567D2 – 1,000 0,437 0,389 0,514 0,369 0,416
D3 – – 1,000 0,524 0,605 0,406 0,483
D3 – – – 1,000 0,470 0,383 0,458
D4 – – – – 1,000 0,311 0,527D65 – – – – – 1,000 0,368
D6 – – – – – – 1,000
Tabla 19: Matriz de Correlación - Hoteles de Buenos Aires Argentina
Como se muestra en la tabla 19, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que el mayor grado de correlación se da entre Rating e Instalaciones y Servicios, lo
cual, tal como en el caso anterior, se puede interpretar como: mientras mejores servicios e instalaciones
tenga el hotel mejor será la calificación general del cliente. Además, entre Comodidad e Instalaciones
y servicios también se da una correlación alta, lo cual se puede interpretarse de la siguiente manera:
mientras mejores sean los servicios e instalaciones mejor será la valoración de la comodidad entregada
por el cliente.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 43,8 31,8 35,6 40,7 17,3 32,1
D1 – 100 19,0 15.1 26,4 15,1 17,3
D2 – – 100 27,4 36,6 16,4 23,3
D3 – – – 100 22,0 14,6 20,9
D4 – – – – 100 9,6 27,7
D5 – – – – – 100 13,5
D6 – – – – – – 100
Tabla 20: Coeficiente de Determinación - Hoteles Buenos Aires Argentina
Un 43,8 % del Rating es debido a las Instalaciones y Servicios
36
Un 40,7 % del Rating es debido a la Comodidad
4. Matriz de Correlación Hoteles de Lima
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,674 0,673 0,602 0,675 0,580 0,629D1 – 1,000 0,608 0,487 0,610 0,441 0,494
D2 – – 1,000 0,564 0,793 0,499 0,573D3 – – – 1,000 0,488 0,376 0,547D4 – – – – 1,000 0,457 0,528D5 – – – – – 1,000 0,471
D6 – – – – – – 1,000
Tabla 21: Matriz de Correlación - Hoteles de Lima Perú
Como se muestra en la tabla 21, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que las dimensiones con mayor grado de correlación son Limpieza con Comodidad,
lo cual se puede interpretar como: los clientes de la localidad de Lima se sienten con mayor comodidad
al tener un ambiente más limpio. Además, nuevamente existe una correlación medianamente fuerte
entre Rating y comodidad lo cual quiere decir que las personas de esta localidad al estar más cómodas
en un determinado hotel darán una mejor valoración general.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 45,4 45,2 36,2 45,5 33,6 39,5
D1 – 100 36,9 23,7 37,2 19,4 24,4
D2 – – 100 31,8 62,8 24,9 32,8
D3 – – – 100 23,8 14,1 29,9
D4 – – – – 100 20,8 27,8
D5 – – – – – 100 22,1
D6 – – – – – – 100
Tabla 22: Coeficiente de Determinación - Hoteles de Lima
Un 62,8 % de la Comodidad es debido a la Limpieza
Un 45,5 % del Rating es debido a la Comodidad
5. Matriz de Correlación Hoteles de Montevideo
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,714 0,569 0,645 0,666 0,405 0,696D1 – 1,000 0,547 0,569 0,681 0,321 0,689D2 – – 1,000 0,489 0,722 0,298 0,687D3 – – – 1,000 0,618 0,267 0,591D4 – – – – 1,000 0,340 0,788D5 – – – – – 1,000 0,444
D6 – – – – – – 1,000
Tabla 23: Matriz de Correlación - Hoteles de Montevideo Uruguay
37
Como se muestra en la tabla 23, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que existe nuevamente una mayor correlación alta entre las dimensiones Rating e
Instalaciones y Servicios, lo cual nos puede indicar que los usuarios de la localidad de Montevideo,
dan una mejor valoración del Rating dependiendo en mayor medida de los servicios obtenidos y de las
instalaciones del hotel. Además, también existe una correlación alta entre las dimensiones Limpieza y
Comodidad, lo cual indica que a mayor Limpieza mejor es la comodidad de los clientes.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 50,9 32,3 41,6 44,3 16,4 48,4
D1 – 100 29,9 32,3 46,3 10,3 47,4
D2 – – 100 23,9 52.1 8,8 47,1
D3 – – – 100 38,1 7,1 34,9
D4 – – – – 100 11,5 62,0
D5 – – – – – 100 19,7
D6 – – – – – – 100
Tabla 24: Coeficiente de Determinación - Hoteles de Montevideo
Un 62,0 % de la Comodidad es debido a la Calidad/Precio
Un 52,1 % de la Comodidad es debido a la Limpieza
6. Matriz de Correlación Hoteles de Quito
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,753 0,570 0,633 0,603 0,546 0,671D1 – 1,000 0,563 0,542 0,600 0,495 0,494
D2 – – 1,000 0,580 0,678 0,346 0,484
D3 – – – 1,000 0,523 0,397 0,584D4 – – – – 1,000 0,456 0,578D5 – – – – – 1,000 0,583D6 – – – – – – 1,000
Tabla 25: Matriz de Correlación - Hoteles de Quito Ecuador
Como se muestra en la tabla 25, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que existe una correlación fuerte entre las dimensiones Rating e Instalaciones y
Servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será la
calificación general de este. La segunda correlación más fuerte, se da entre Rating y Calidad/Precio,
lo que nos podría indicar que los viajeros de esta localidad les interesa el precio de los hoteles versus
la calidad entregada para poder efectuar una mejor valoración del hotel.
38
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 56,7 32,4 40,0 36,3 29,8 45,0
D1 – 100 31,6 29,3 36,0 24,5 24,4
D2 – – 100 33,6 45,9 11,9 23,4
D3 – – – 100 27,3 15,7 34,1
D4 – – – – 100 20,7 33,4
D5 – – – – – 100 33,9
D6 – – – – – – 100
Tabla 26: Regresión Lineal - Hoteles de Quito
Un 56,7 % del Rating es debido a las Instalaciones y Servicios
Un 45,9 % de la Comodidad es debido a la Limpieza
7. Matriz de Correlación Hoteles de Río de Janeiro
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,720 0,720 0,665 0,647 0,653 0,642D1 – 1,000 0,636 0,567 0,610 0,378 0,537D2 – – 1,000 0,586 0,660 0,412 0,526D3 – – – 1,000 0,534 0,431 0,528D4 – – – – 1,000 0,322 0,552D5 – – – – – 1,000 0,427
D6 – – – – – – 1,000
Tabla 27: Matriz de Correlación - Hoteles de Río de Janeiro
Como se muestra en la tabla 27, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que las dimensiones con mayor grado de correlación son Rating con Instalaciones
y Servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será la
calificación general de este. Además, existe una correlación igual a la anterior entre Rating y Limpieza,
lo cual nos podría indicar que los clientes de los hoteles de Río de Janeiro, se basan mayormente en la
limpieza del hotel para dar su valoración general.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 51,8 51,8 44,2 41,8 42,6 41,2
D1 – 100 40,0 32,1 37,2 14,2 28,8
D2 – – 100 34,3 43,5 16,9 23,4
D3 – – – 100 28,5 18,5 27,6
D4 – – – – 100 10,3 30,4
D5 – – – – – 100 18,2
D6 – – – – – – 100
Tabla 28: Coeficiente de Determinación - Hoteles de Quito
Un 51,8 % del Rating es debido a las Instalaciones y Servicios
Un 51,8 % del Rating es debido a la Limpieza
39
8. Matriz de Correlación Hoteles de Ciudad de México
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,685 0,607 0,640 0,654 0,426 0,613D1 – 1,000 0,552 0,567 0,631 0,357 0,505D2 – – 1,000 0,554 0,656 0,475 0,521D3 – – – 1,000 0,545 0,450 0,575D4 – – – – 1,000 0,391 0,509D5 – – – – – 1,000 0,430
D6 – – – – – – 1,000
Tabla 29: Matriz de Correlación - Hoteles de Ciudad de México
Como se muestra en la tabla 29, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que las dimensiones con mayor grado de correlación son Rating con Instalaciones
y servicios, lo cual no indica que mientras mejor infraestructura y servicios del hotel, mejor será
la calificación general de este. Además, existe una correlación medianamente alta entre Limpieza y
Comodidad, lo cual nos podría indicar que los clientes de los hoteles de Ciudad de México realizan su
valoración de comodidad con respecto a la limpieza.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 46,9 36,8 40,9 42,7 18,1 37,5
D1 – 100 30,4 32,1 39,8 12,7 25,5
D2 – – 100 30,6 43,0 22.5 27,1
D3 – – – 100 29,7 20,2 33,0
D4 – – – – 100 15,2 25,9
D5 – – – – – 100 18,4
D6 – – – – – – 100
Tabla 30: Coeficiente de Determinación - Hoteles de México
Un 46,9 % del Rating es debido a las Instalaciones y Servicios
Un 42,7 % del Rating es debido a la Comodidad
9. Matriz de Correlación Hoteles de Panamá
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,764 0,704 0,712 0,775 0,516 0,745D1 – 1,000 0,671 0,626 0,717 0,511 0,654D2 – – 1,000 0,645 0,783 0,451 0,619D3 – – – 1,000 0,654 0,454 0,629D4 – – – – 1,000 0,462 0,673D5 – – – – – 1,000 0,453
D6 – – – – – – 1,000
Tabla 31: Matriz de Correlación - Hoteles de Ciudad de México
40
Como se muestra en la tabla 31, existen correlaciones positivas entre todas las dimensiones. En todos
los casos, las correlaciones son significativas, porque el valor ρ es menor que el nivel de significación
elegido (α = 0,05). Además, las correlaciones van de moderadas a muy fuerte.
Se puede observar que las dimensiones con mayor grado de correlación son Rating con Comodidad, lo
cual nos puede indicar que los usuarios de hoteles de esta localidad darán una mejor valoración general
al poseer mayor comodidad. Además, los clientes de Panamá dan un mayor Rating a los hoteles con
respecto a la calidad y precio obtenidos.
D [ %] Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 100 58,3 45,5 50,6 60,0 26,6 55,5
D1 – 100 45,0 39,1 51,4 26,1 42,7
D2 – – 100 41,6 61,3 20,3 38,3
D3 – – – 100 42,7 20,6 39,5
D4 – – – – 100 21,3 45,2
D5 – – – – – 100 20,5
D6 – – – – – – 100
Tabla 32: Coeficiente de Determinación - Hoteles de Panamá
Un 61,3 % de la Comodidad es debido a la Limpieza
Un 58,3 % del Rating es debido a las Instalaciones y Servicios
Por lo tanto, las dimensiones que poseen mayor relación en los hoteles de Latinoamérica, y que
por lo tanto marcan una tendencia clara, son la relación entre las dimensiones Rating e Instalaciones y
Servicios, seguido de Comodidad y Limpieza.
5.3.4. Kruskall Wallis H
En segundo lugar, se realizó la prueba no paramétrica de Kruskal −Wallis H , la cual nos permite
decidir si puede aceptarse la hipótesis de que K muestras independientes proceden de la misma población
o de poblaciones idénticas con la misma mediana. El único supuesto necesario para realizar esta prueba
es que las distribuciones subyacentes de las variables sean continuas y que estas hayan sido medidas
por lo menos en una escala ordinal. Dado que las condiciones mencionadas anteriormente se cumplen,
procedemos a comprobará la siguiente hipótesis:
H0: No existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros.
H1: Existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros.
Como regla de decisión se utiliza ρ = 0, 05.
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,002 0,000 0,005 0,011 0,006 0,119 0,007
Tabla 33: Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago, por dimensiones
41
Los resultados de la Prueba 1: Kruskal-Wallis H (tabla 33) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros en las dimensiones de: D0
(Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad),
D6 (Calidad/Precio); y por consiguiente, no existen diferencia significativas únicamente en la dimensión
D5 (Ubicación).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,006 0,012 0,017 0,008 0,000 0,012 0,267
Tabla 34: Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogota, por dimensiones
Los resultados de la Prueba 2: Kruskal-Wallis H (tabla 34) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros en las dimensiones de: D0 (Rating), D1
(Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación);
y por consiguiente, no existen diferencia significativas únicamente en la dimensión D6 (Calidad/Precio).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,001 0,069 0,000 0,003 0,000 0,091 0,195
Tabla 35: Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires, por dimensiones
Los resultados de la Prueba 3: Kruskal-Wallis H (tabla 35) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros en relación a las dimensiones de:
D0 (Rating), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad); y por consiguiente, no existen
diferencia significativas únicamente en las dimensiones D1 (Instalaciones y Servicios), D5 (Ubicación)
y D6 (Calidad/Precio).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,000 0,000 0,000 0,000 0,000 0,008 0,006
Tabla 36: Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima, por dimensiones
Los resultados de la Prueba 4: Kruskal-Wallis H (tabla 36) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,
Solos y LGBT).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,564 0,420 0,009 0,010 0,803 0,511 0,370
Tabla 37: Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito, por dimensiones
Los resultados de la Prueba 5: Kruskal-Wallis H (tabla 37) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros únicamente en relación con las
dimensiones D2 (Limpieza) y D3 (Personal del Hotel).
42
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000
Tabla 38: Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro, por dimensiones
Los resultados de la Prueba 6: Kruskal-Wallis H (tabla 38) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,
Solos y LGBT).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,190 0,868 0,986 0,063 0,894 0,044 0,804
Tabla 39: Prueba 7: Kruskal-Wallis H - Tipos de viajeros de Montevideo, por dimensiones
Los resultados de la Prueba 7: Kruskal-Wallis H (tabla 39) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros únicamente en relación con la
dimensión D5 (Ubicación).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000
Tabla 40: Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México, por dimensiones
Los resultados de la Prueba 8: Kruskal-Wallis H (tabla 40) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,
Solos y LGBT).
D0 D1 D2 D3 D3 D5 D6
ρ− valor 0,000 0,000 0,000 0,000 0,000 0,000 0,000
Tabla 41: Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá, por dimensiones
Los resultados de la Prueba 9: Kruskal-Wallis H (tabla 41) indican que existen diferencias
significativas entre las opiniones de los diferentes tipos de viajeros (Negocio, Parejas, Familias, Amigos,
Solos y LGBT).
Como se puede observar las localidades que presentan mayor cantidad de diferencias significativas
en todas sus dimensiones son las que poseen mayor cantidad de comentarios como es el caso de Río
de Janeiro, Ciudad de México y Panamá. Por otro lados las que poseen menor cantidad de diferencias
significativas son las que posen menos comentarios, como es el caso de Santiago de Chile y Montevideo.
5.3.5. Kruskall Wallis H por año de publicación
En los siguientes análisis también se utilizó la prueba no paramétrica de Kruskal−Wallis H , pero
esta vez aplicada a cada locación según año de publicación de cada comentario, es decir, se ordenaron
43
los datos de cada Excel según su fecha, las cuales están en un rango desde el año 2007 al año 2016, y
luego se realizó la prueba para el conjunto de dimensiones correspondientes a cada año, con el objetivo
de comprobar la siguiente hipótesis:
H0: No existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros en
el año analizado.
H1: Existen diferencias significativas entre las opiniones de los diferentes tipos de viajeros en el
año analizado.
Como regla de decisión se utiliza ρ = 0, 05.
Como observación, se puede ver que no todas las tablas poseen la misma cantidad de años, esto
debido a que debe existir un mínimo de comentarios por locación para poder realizar la prueba no
paramétrica de Kruskal − Wallis H , el cual consideramos sobre 5 comentarios. Por ende, aquella
tabla que no posea un año del rango 2007-2016, es debido a que posee menos de 5 comentarios.
Dimensión / Año Año D0 D1 D2 D3 D4 D5 D6
ρ− valor
2009 0,506 0,506 0,261 0,261 0,261 0,375 0,261
2010 0,599 0,221 0,725 0,456 0,849 0,805 0,074
2011 0,162 0,165 0,184 0,189 0,180 0,234 0,160
2012 0,010 0,036 0,079 0,158 0,183 0,301 0,159
2013 0,185 0,080 0,049 0,122 0,048 0,232 0,240
2014 0,141 0,168 0,483 0,077 0,472 0,785 0,385
2015 0,311 0,298 0,465 0,587 0,063 0,064 0,758
Tabla 42: Prueba 1: Kruskal-Wallis H - Tipos de viajeros en Santiago de Chile por año de publicación
Los resultados de la Prueba 1: Kruskal-Wallis H tabla 42 indican que existen diferencias significa-
tivas solo en los años 2012 y 2013. Las dimensiones que presentan estas diferencias significativas son:
D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza) y D4 (Comodidad). Por consiguiente, no
existen diferencia significativas en el resto de los años (2009, 2010, 2011, 2014 y 2015).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2009 0,515 0,711 0,801 0,000 0,515 0,366 0,706
2010 0,364 0,388 0,257 0,186 0,021 0,438 0,096
2011 0,519 0,547 0,329 0,221 0,333 0,619 0,555
2012 0,288 0,183 0,109 0,122 0,305 0,209 0,171
2013 0,336 0,095 0,793 0,111 0,242 0,269 0,438
2014 0,019 0,014 0,004 0,054 0,006 0,156 0,174
2015 0,541 0,291 0,374 0,495 0,613 0,236 0,840
Tabla 43: Prueba 2: Kruskal-Wallis H - Tipos de viajeros en Bogotá por año de publicación
Los resultados de la Prueba 2: Kruskal-Wallis H tabla 43 indican que existen diferencias
significativas en los años 2009, 2010 y 2014. Las dimensiones que presentan estas diferencias
significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel),
y D4 (Comodidad). Por consiguiente, no existen diferencia significativas en el resto de los años (2011,
44
2012, 2013 y 2015).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2007 0,596 0,277 0,490 0,487 0,679 0,490 0,490
2008 0,331 0,137 0,607 0,363 0,685 0,769 0,065
2009 0,671 0,669 0,224 0,551 0,659 0,328 0,905
2010 0,092 0,278 0,105 0,085 0,057 0,009 0,205
2011 0,711 0,547 0,609 0,045 0,589 0,692 0,377
2012 0,365 0,852 0,177 0,733 0,071 0,411 0,739
2013 0,139 0,162 0,282 0,247 0,023 0,776 0,746
2014 0,074 0,156 0,001 0,196 0,042 0,285 0,069
2015 0,108 0,033 0,077 0,456 0,559 0,879 0,450
Tabla 44: Prueba 3: Kruskal-Wallis H - Tipos de viajeros en Buenos Aires por año de publicación
Los resultados de la Prueba 3: Kruskal-Wallis H tabla 44 indican que existen diferencias
significativas en los años 2010m, 2011, 2013, 2014 y 2015. Las dimensiones que presentan estas
diferencias significativas son: D1 (Instalaciones y Servicios), D2 (Limpieza), D3 (Personal del Hotel),
D4 (Comodidad) y D5 (Ubicación). Por consiguiente, no existen diferencia significativas en el resto de
los años (2007, 2008, 2009 y 2012).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2007 0,596 0,277 0,490 0,487 0,679 0,490 0,490
2008 0,506 0,261 0,000 0,506 0,261 0,682 0,506
2009 0,843 0,653 0,718 0,330 0,870 0,873 0,149
2010 0,209 0,049 0,236 0,138 0,110 0,094 0,143
2011 0,096 0,076 0,175 0,427 0,165 0,582 0,396
2012 0,011 0,125 0,034 0,136 0,015 0,277 0,0042013 0,073 0,177 0,161 0,175 0,073 0,176 0,435
2014 0,243 0,228 0,328 0,584 0,023 0,027 0,189
2015 0,227 0,443 0,239 0,082 0,293 0,230 0,478
Tabla 45: Prueba 4: Kruskal-Wallis H - Tipos de viajeros en Lima por año de publicación
Los resultados de la Prueba 4: Kruskal-Wallis H tabla 45 indican que existen diferencias significati-
vas solo en los años 2008, 2012 y 2014. Las dimensiones que presentan estas diferencias significativas
son: D0 (Rating), D2 (Limpieza), D4 (Comodidad) y D5 (Ubicación) y D6 (Calidad/Precio). Por
consiguiente, no existen diferencia significativas en el resto de los años (2007, 2009, 2010 2011, 2013 y
2015).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2010 0,757 0,876 0,822 0,548 0,894 0,402 0,496
2011 0,357 0,110 0,248 0,162 0,291 0,665 0,148
2012 0,011 0,125 0,034 0,136 0,015 0,277 0,0042013 0,714 0,548 0,095 0,051 0,535 0,410 0,837
2014 0,040 0,023 0,154 0,066 0,147 0,122 0,0412015 0,057 0,306 0,229 0,146 0,456 0,112 0,058
Tabla 46: Prueba 5: Kruskal-Wallis H - Tipos de viajeros en Quito por año de publicación
45
Los resultados de la Prueba 5: Kruskal-Wallis H tabla 46 indican que existen diferencias significati-
vas solo en los años 2012 y 2014. Las dimensiones que presentan estas diferencias significativas son: D0
(Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D4 (Comodidad) y D6 (Calidad/Precio). Por
consiguiente, no existen diferencia significativas en el resto de los años (2010, 2011, 2013 y 2015).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2008 0,379 0,201 0,320 0,379 0,721 0,320 0,379
2009 0,038 0,092 0,423 0,203 0,079 0,245 0,333
2010 0,016 0,002 0,021 0,160 0,010 0,045 0,0122011 0,248 0,156 0,180 0,212 0,111 0,006 0,0372012 0,068 0,056 0,041 0,535 0,003 0,028 0,370
2013 0,004 0,006 0,000 0,034 0,001 0,000 0,213
2014 0,008 0,002 0,008 0,122 0,001 0,027 0,178
2015 0,000 0,001 0,000 0,004 0,000 0,002 0,051
2016 0,442 0,293 0,304 0,792 0,753 0,754 0,672
Tabla 47: Prueba 6: Kruskal-Wallis H - Tipos de viajeros en Río de Janeiro por año de publicación
Los resultados de la Prueba 6: Kruskal-Wallis H tabla 47 indican que existen diferencias
significativas en los años 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que presentan
estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza), D3
(Personal del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no
existen diferencia significativas en el resto de los años (2008 y 2016).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2010 0,325 0,223 0,223 0,632 0,325 0,223 0,325
2012 0,508 0,304 0,478 0,536 0,451 0,339 0,220
2013 0,660 0,958 0,471 0,458 0,619 0,361 0,680
2014 0,585 0,811 0,559 0,371 0,731 0,328 0,437
2015 0,198 0,689 0,588 0,095 0,368 0,362 0,511
Tabla 48: Prueba 7: Kruskal-Wallis H - Tipos de viajeros en Montevideo por año de publicación
Los resultados de la Prueba 7: Kruskal-Wallis H tabla 48 indican que no existen diferencias
significativas solo en los años 2010, 2012, 2013, 2014 y 2015.
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2007 0,442 0,136 0,088 0,168 0,476 0,777 0,373
2008 0,326 0,259 0,175 0,433 0,036 0,139 0,151
2009 0,157 0,098 0,074 0,070 0,043 0,003 0,0182010 0,140 0,007 0,118 0,470 0,194 0,238 0,105
2011 0,142 0,236 0,314 0,099 0,496 0,010 0,445
2012 0,003 0,122 0,288 0,118 0,034 0,051 0,127
2013 0,022 0,072 0,115 0,046 0,049 0,003 0,269
2014 0,003 0,000 0,001 0,000 0,001 0,117 0,002
2015 0,042 0,028 0,146 0,626 0,053 0,024 0,0462016 0,321 0,420 0,373 0,321 0,321 0,290 0,458
Tabla 49: Prueba 8: Kruskal-Wallis H - Tipos de viajeros en Ciudad de México por año de publicación
46
Los resultados de la Prueba 8: Kruskal-Wallis H tabla 49 indican que existen diferencias
significativas en los años 2008, 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que
presentan estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D3 (Personal
del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no existen
diferencia significativas en el resto de los años (2007 y 2016).
Dimensión / Año Año D0 D1 D2 D3 D3 D5 D6
ρ− valor
2008 0,051 0,279 0,000 0,346 0,000 0,346 0,287
2009 0,325 0,008 0,114 0,116 0,274 0,002 0,048
2010 0,044 0,001 0,051 0,028 0,045 0,398 0,154
2011 0,000 0,000 0,000 0,024 0,000 0,000 0,0012012 0,000 0,000 0,000 0,004 0,000 0,000 0,0022013 0,000 0,000 0,000 0,018 0,000 0,002 0,0032014 0,000 0,000 0,000 0,001 0,000 0,000 0,0042015 0,000 0,000 0,000 0,033 0,000 0,033 0,0022016 0,456 0,423 0,401 0,334 0,336 0,321 0,380
Tabla 50: Prueba 9: Kruskal-Wallis H - Tipos de viajeros en Panamá por año de publicación
Los resultados de la Prueba 9: Kruskal-Wallis H tabla 50 indican que existen diferencias
significativas en los años 2008, 2009, 2010, 2011, 2012, 2013, 2014 y 2015. Las dimensiones que
presentan estas diferencias significativas son: D0 (Rating), D1 (Instalaciones y Servicios), D2 (Limpieza)
D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación), y D6 (Calidad/Precio). Por consiguiente, no
existen diferencia significativas en año 2016.
47
6. Síntesis de Resultados
Para poder cumplir con los objetivos establecidos en esta investigación, validaremos el conocimiento
obtenido e identificaremos las tendencias de evaluación en los datos analizados. Esto lo realizamos en
primer lugar, con una comparación entre la ciudad de Santiago y las ciudades de Chile; en segundo lugar,
una comparación entre Santiago de Chile y las ciudades de Latinoamérica.
6.1. Comparación Santiago de Chile y localidades de Chile
Según los análisis realizados en la primera fase de este estudio, el cual fue en hoteles de Chile,
podemos obtener los siguientes resultados:
A través del análisis de de Spearmanρ se observa una mayor cantidad de correlaciones positivas
que negativas en las ciudades de Chile, en cambio Santiago presenta una cantidad similar de
correlaciones positivas que negativas.
Al analizar que dimensión D0(Rating) se puede apreciar que la dimensión que posee menor
correlación es D5(Ubicacin) tanto en Santiago como el resto de las ciudades de Chile.
Al analizar que dimensión D0(Rating) se puede apreciar que las dimensiones que poseen mayor
correlación son D1(InstalacionesyServicios) y D6(Calidad/Precio) tanto en Santiago como
el resto de las ciudades de Chile.
La valoración general del Rating que los clientes realizan son bastante similares con un promedio
que varia entre 4,11 a 4,74 en todas las localidades (Santiago y Regiones), excepto en San Pedro
de Atacama que se presenta un promedio más bajo con un 3,86, además el más alto se presenta en
la localidad de Isla de Pascua.
La dimensión que presenta el promedio más alto es D6(Calidad/Precio) con un 4,94.
La dimensión que presenta el promedio más bajo es D1(InstalacionesyServicios) con 3,710.
6.2. Comparación Santiago de Chile y localidades de Latinoamérica
Según los análisis realizados en la segunda fase de este estudio, el cual fue en hoteles de
Latinoamérica, podemos obtener los siguientes resultados:
A través del análisis de de Spearmanρ se observa solo correlaciones positivas tanto en la localidad
de Santiago de Chile como en las de Latinoamérica. Estas, varían entre correlaciones bajas (ρ
entre : 0, 200− 0, 390) y correlaciones altas (ρ entre : 0, 600− 0, 790).
Al analizar que dimensión D0(Rating) se puede apreciar que la dimensión que posee menor
correlación es D5(Ubicacin) tanto en Santiago como el resto de las ciudades de Latinoamérica.
Al analizar que dimensión D0(Rating) se puede apreciar que las dimensiones que poseen mayor
correlación son D1(InstalacionesyServicios) tanto en Santiago como el resto de las ciudades de
Latinoamérica.
La valoración general del Rating que los clientes realizan varia entre 3,797 a 4,207. Encontrándose
este promedio del rating más bajo en la localidad de Santiago de Chile y el promedio más alto en
Bogota, Colombia.
48
La prueba no paramétrica de Kruskall Wallis H indica que existen diferencias significativas en
todas las localidades analizadas.
La prueba de Kruskall Wallis H aplicada por año de publicación de los comentarios indica que
existen diferencias significativas entre los distintos años.
6.3. HotelClub V/S TripAdvisor
Terminando la fase analítica de nuestro estudio continua la fase de Difusión, según nuestra
metodología, y en esta nosotros debemos comunicar nuestras observaciones. Por lo tanto, realizaremos
una comparación de los resultados de nuestro caso de estudio Hotel Club (www.hotelclub.com), con el
de otros investigares, este es TripAdvisor (www.tripadvisor.cl).
6.3.1. Santiago y las ciudades de Chile analizadas
A continuación podemos ver los análisis de TripAdvisor en cuanto a la comparación de Santiago y
las ciudades de Chile analizadas, seguidos por la comparación realizada en HotelClub.
Con el análisis Spearman ρ se observa una correlación positiva en la mayor parte de la dimensiones
analizadas, tanto en Santiago como en las demás ciudades. En el caso de HotelClub, también se
observa una correlación positiva en la mayoría de las localidades, y estas tienden a fluctuar entre
un grado bajo a un grado alto de correlación.
Tras analizar la Valoración General (D0), la dimensión que influye en menor medida es
la Ubicación (D1). En HotelClub, se da la misma situación (correlación baja en dimensión
Ubicación), con cifras muy cercanas a cero. Además, la que posee mayor correlación en la mayoría
de las ciudades es Instalaciones y Servicios (D1).
Al momento de asignar la valoración general los viajeros lo hacen de manera similar tanto en
regiones como en Santiago. En HotelClub, también existe una valoración similar en el Rating o
valoración general con un promedio sobre 4, lo cual significa muy bueno.
El análisis Kruskal-Wallis H por el tipo de viajero indica que existen diferencias significativas al
momento en el que estos califican un hotel. En HotelClub, también existen diferencias significativas
entre los distintos tipos de viajeros, pero existen en las cuales no existen diferencias significativas,
como lo es el caso de Viña del Mar.
El mismo análisis pero sobre el año en el que fue realizada la valoración, también indica que
existen diferencias significativas. Esto se traduce a que los usuarios califican de forma distinta un
hotel según el año. En HotelClub en cambio, existen diferencias significativas, pero solo en algunos
años, ya que en la mayoría de los años no se registran evidencias significativas.
La dimensión con mejor promedio de evaluación tendió a ser predominantemente D1 (Ubicación).
En HotelClub, la dimensión que presenta el mayor promedio es Calidad/Precio en Montevideo con
un 4,942.
La dimensión con peor promedio de evaluación tendió a ser D5 (Mejor precio). En HotelClub, el
que presenta el peor promedio es Instalaciones y Servicios (D1) en Montevideo y Santiago de Chile
con un 3,701.
49
6.3.2. Santiago de Chile y las ciudades de Latinoamérica analizadas
A continuación podemos ver los análisis de TripAdvisor en cuanto a la comparación de Chile y las
ciudades de Latinoamérica analizadas, seguidos por la comparación realizada en HotelClub.
Con el análisis Spearman ρ se observa una correlación positiva en la mayor parte de las dimensiones
analizadas, tanto en Santiago como en las demás ciudades de Latinoamérica. Estas siguen una
tendencia de fluctuar entre moderada a altamente correlacionadas. En el caso de HotelClub, también
se observa una correlación positiva en la mayoría de las localidades, y estas tienden a fluctuar entre
correlaciones bajas (ρ entre : 0, 200− 0, 390) y correlaciones altas (ρ entre : 0, 600− 0, 790).
La dimensión que influye en menor medida sobre la Valoración General (D0) tiende a ser D1
(Ubicación) en la mayoría de las ciudades. En HotelClub, se da la misma situación, con cifras
muy cercanas a cero. Además, la que posee mayor correlación en la mayoría de las ciudades es
Instalaciones y Servicios (D1).
La Valoración General de los viajeros tiene una tendencia similar en las distintas ciudades de
Latinoamérica con respecto a Santiago de Chile. En HotelClub, también existe una valoración
similar, esta varia entre 3,797 a 4,207. Encontrándose el promedio del rating más bajo en la
localidad de Santiago de Chile y el promedio más alto en Bogota, Colombia.
El análisis Kruskal-Wallis H indica que si existe una diferencia significativa entre las valoraciones
de los distintos tipos de viajeros en las diversas ciudades. En HotelClub, indica que existen
diferencias significativas en todas las localidades analizadas.
También, el mismo análisis pero sobre el año en el que fue realizada la valoración, indica que
también existen diferencias significativas entre un año y otro. En HotelClub, indica que existen
diferencias significativas entre los distintos años.
La dimensión con mejor promedio de evaluación tendió a ser predominantemente D1 (Ubicación).
En HotelClub, la dimensión que presenta el mayor promedio es Calidad/Precio.
La dimensión con peor promedio de evaluación tendió a ser D5 (Mejor precio). En HotelClub, el
que presenta el peor promedio es Instalaciones y Servicios (D1).
50
7. Conclusiones y Trabajo Futuro
Es fundamental, para este estudio, conocer la diferencia entre experiencia del cliente (CX)
y experiencia del usuario (UX). CX extiende el concepto de UX, inclusive más allá del uso de
sistemas de software interactivo, servicios y productos. UX se ocupa de las personas que interactúan
con el producto y la experiencia que reciben de esa interacción. CX, por el contrario, abarca
todas las interacciones que una persona tiene con su marca, empresa u organización; centrándose
en la ciencia gestión e ingeniería de los servicios como área de estudio interdisciplinar. De esta
manera, se entiende como ciencia al crear al crear conocimiento; como gestión al convertirse en un
valor empresarial; y se manifiesta como ingeniería por el hecho de contribuir al desarrollo técnico y social.
En el presente estudio, se desarrolló una herramienta en el lenguaje de programación JAVA, la
cual permitió extraer los datos de opiniones de clientes de hotelclub.com en los principales hoteles y
localidades de latinoamérica. Las localidades utilizadas fueron: Santiago de Chile, Bogotá, Buenos
Aires, Lima, Quito, Río de Janeiro, Montevideo, Ciudad de México y Panamá. Estas localidades suman
170 hoteles con 4687 comentarios en total. La mayoría de las investigaciones de este rubro se centran en
análisis cualitativos, pero nosotros decidimos tomar un enfoque alternativo, poniendo especial atención
en lo que respecta los datos cuantitativos. De esta forma, buscamos tendencias en los datos para medir
la experiencia del cliente de dicha agencia virtual de alojamiento; interpretando la experiencia vivi-
da por los usuarios, la continuidad en el uso del servicio y las posibles recomendaciones a futuros clientes.
Para llevar a cabo ello, se procedió al análisis de los datos cuantitativos sobre los hoteles situados en
Latinoamérica, los cuales se caracterizan por contar con la mayor popularidad y concurrencia turística
de entre los usuarios. La agencia virtual de alojamiento elegida como caso de estudio es: Hotelclub.com,
como se mencionó anteriormente, la cual posee libre acceso a los datos en el sitio web; ya sean datos
cualitativos como cuantitativos. Los viajeros de esta agencia virtual de alojamiento, entregan una
calificación en una escala de 1 a 5, donde 1 representa la peor puntuación y 5 la mejor. Dividimos
los viajeros en dos grandes grupos según su tipo de viaje en Negocio y Ocio. Los viajeros de Ocio se
subdividen a su vez, según la finalidad del viaje, esto es en viajes de parejas, amigos, solos, familia y
LGBT.
Los resultados de las medias aritméticas indican que en promedio los usuarios de esta agencia virtual
de alojamiento valoran mejor la dimensión Comodidad (D4) en el caso de las ciudades de Chile y la
dimensión Calidad/Precio (D6) en el caso de las localidades de Latinoamérica. El peor promedio de las
ciudades de Chile se da en la dimensión Instalaciones y Servicios (D1) al igual que en las localidades
de Latinoamérica, en donde encontramos Montevideo y Santiago de Chile como las ciudades con el
promedio más bajo. Esto, nos puede indicar que los clientes que visitan estos hoteles (que en su mayoría
son extranjeros), encuentran más deficiente las Instalaciones y servicios de estos a diferencia del resto de
países de Latinoamérica.
La prueba de Spearman ρ nos indica la existencia de correlaciones positivas en la mayor parte
de Chile, por ende, solo algunas negativas en regiones, y solo correlaciones positivas en territorio
Latinoamericano. Las correlaciones se presentan desde un grado muy bajo (ρ entre : 0 − 0, 190,)
hasta un grado muy alto (ρ entre : 0, 800 − 1) para el caso de las ciudades de Chile; bajo (ρ
51
entre : 0, 200 − 0, 390 hasta un grado alto (ρ entre : 0, 600 − 0, 790) para el caso de las localidades
de Latinoamérica. Al analizar la dimensión del Rating, se puede apreciar que la dimensión con la que
posee menor relación es la Ubicación (D5) y con la que posee mayor relación es con Instalaciones y
Servicios (D1). Por lo tanto, de estos análisis se puede deducir, que los clientes no valoran los recintos
hoteleros por la ubicación en los que estos se encuentren; y por ende, lo más importante para ellos son
las instalaciones y los servicios recibidos en estos.
La prueba de Kruskall-Wallis H, indica que existen diferencias significativas entre los diferentes
tipos de viajeros (negocio, parejas, amigos, solos, familia y LGBT) de las localidades de Chile y
Latinoamérica. Lo cual nos puede indicar, que los clientes de estas agencias virtuales de alojamiento
opinan de forma distinta dependiendo de su finalidad de viaje, ya sea de negocio u ocio. Las localidades
que no presentan diferencias significativas en alguna de sus dimensiones son: Santiago de Chile en
D5 (Ubicación), Bogota en D6 Calidad/Precio, Quito en D2 Limpieza y D3 Personal del Hotel; y
por último Montevideo en la dimensión D5 Ubicación. Además, se realizó esta prueba por año de
publicación de los comentarios, los cuales van entre el año 2007 y 2016. Estos análisis indican que
existen diferencias significativas entre los distintos años analizados, tanto en las localidades de Chile
como en Latinoamérica. Esto, nos da a entender que los recintos hoteleros van evolucionando en el
tiempo, y mejorando las falencias que tuvieron en años anteriores, por ende, los comentarios tienden a
ser distintos entre cada año.
Finalmente se realizó una síntesis de los resultados de este estudio y se compararon las localidades de
Chile con su capital (Santiago de Chile), y esta a su vez con las localidades de Latinoamérica. En general,
los análisis de correlación de Spearman ρ, señalan que que existe mayor cantidad de correlaciones
positivas, tanto en Chile como en localidades de Latinoamérica, en esta última no existen correlaciones
negativas; la dimensión con menor correlación con respecto a la valoración general del Rating (D0) es la
Ubicación (D5), esto tanto para Chile como para Latinoamérica. Kruskall Wallis H , indica que existen
diferencias significativas en todas las localidades analizadas. Además, se realizo esta prueba por año de
publicación de los comentarios, encontrándose diferencias entre estos, lo cual lo interpretamos como una
evolución en las características de los hoteles en cada año. El análisis de medias, para Chile y en cuanto
a el Rating de cada localidad indica que son bastante similares mostrando un promedio sobre 4 en la
mayoría de estas ciudades; para el caso de Latinoamérica existe una puntuación más baja, variado entre
3,797 a 4,207, siendo la más baja en Santiago de Chile y la más alta en Bogota.
Para poder cumplir con los objetivos establecidos en esta investigación, validaremos el conocimiento
obtenido e identificaremos las tendencias de evaluación en los datos analizados. Esto lo realizamos en
primer lugar, con una comparación entre la ciudad de Santiago y las ciudades de Chile; en segundo
lugar, una comparación entre Santiago de Chile y las ciudades de Latinoamérica. Las comparaciones
tendieron a ser bastante similares, con correlaciones positivas, menor correlación de la dimensión Rating
con la dimensión Ubicación, diferencias significativas en la mayoría de las localidades y con pequeñas
variaciones en los mejores y peores promedios de cada dimensión, lo cual es bastante valido debido
a que los servicios de la agencia son distintos y existe bastante diferencia en cantidad de comentarios.
Esto es, 9.163 comentarios de TripAdvisor v/s 375 comentarios de Hotelel Club en el caso de Chi-
le y 46.684 comentarios de TripAdvisor v/s 4.687 comentarios de Hotel Club en el caso de Latinoamérica.
52
Como trabajo futuro, queda abierta la investigación para poder ser analizada por otros colaboradores,
y de esta manera ampliar el caso de estudio ya sea analizándolo en otros casos de estudio similares o
para otras regiones del Mundo, aplicando nuevos métodos estadísticos o matemáticos. Además, se puede
realizar un herramienta con la que podamos obtener conocimiento de estos análisis la cual pueda ser
utilizada por trabajadores en el rubro turístico o bien clientes que quieran escoger el mejor hotel en sus
viajes.
53
Referencias
[Abe05] Tadahiko Abe. Research Report: What is the Service Science? - Tokyo, Japan. 2005.
[AH08] Gérard Dray Mathieu Roche Francois Trousset Pascal Poncelet Ali Harb, Michel Plantié.
Web Opinion Mining: How to extract opinions from blogs? - Francia. 2008.
[AMCM14] Natalia Stefany Perla Ribadeneira Adriana María Castellanos Méndez, Cristina Rami-
rez Calderón. Estudio Descriptivo de la Factibilidad del User Experience (UX) Para laWeb - UNIVERSIDAD DR. JOSÉ ÍAS DELGADO. 2014.
[Cen07] Paul P. Maglio IBM Almaden Research Center. Service Science, Management, andEngineering (SSME): An Interdisciplinary Approach to Service Innovation - IBM: AlmadenServices Research. 2007.
[IP07] Directores de Tesis: M. Ing. Enrique Fernández y Dr. Ramón García Martínez Ignacio Per-
versi. APLICACIÓN DE MINERÍA DE DATOS PARA LA EXPLORACIÓN Y DETECCIÓNDE PATRONES DELICTIVOS EN ARGENTINA. 2007.
[Jos] S Joshi. Customer experience management: An exploratory study on the parametersaffecting - customer experience for cellular mobile services of a telecom company. Procedia- Social and Behavioral Sciences, 133, pp. 392-399 - 2014.
[JS03] Vipin Kumar Jaideep Srivastava, Prasanna Desikan. Web Mining - Concepts, Applicationsy Research Directions - Department of Computer Science, University of Minnesota,Minneapolis, USA, volume 3. 2003.
[Mat10] Felipe Jordao Almeida Prado Mattosinho. MASTER THESIS, Mining Product Opinions andReviews on the Web - Cruzeiro Brazil. 2010.
[PMS12a] Kirit Modi Pooja Mehtaa, Brinda Parekh and Paresh Solanki. Web Personalization UsingWeb Mining: Concept and Research Issue, volume 2. 2012.
[PMS12b] Kirit Modi Pooja Mehtaa, Brinda Parekh and Paresh Solanki. Web Personalization UsingWeb Mining: Concept and Research Issue - International Journal of Information andEducation Technology, USA, volume 2. 2012.
[Rod09] Jorge Ropero Rodríguez. Método general de Extracción de Información basado en el usode Lógica Borrosa, Aplicación en portales web - Sevilla. 2009.
[RRG+16] Cristian Rusu, Virginica Rusu, Daniel Guzmán, Diego Espinoza, Daniel Rojas, Silvana
Roncagliolo, and Daniela Quiñones. Assessing the Customer eXperience Based onQuantitative Data: Virtual Travel Agencies, Springer International Publishing Switzerland2016 - A. Marcus (Ed.): DUXU 2016, Part I, LNCS 9746, pp. 499 - 508 - 2016 - DOI:10.1007/978-3 - 319 - 40409 -7 - 47. 2016.
[SG13] Darshak B. Mehta Shaily G.Langhnoja, Mehul P. Barot. Web Usage Mining UsingAssociation Rule Mining on Clustered Data for Pattern Discovery - Computer Department,M.E.(Pursing) Gujarat Technical University, Gujarat, India. 2013.
54
[Shu08] Hanjie Shu. Master in information system: Opinion MIning for Song Lyrics - NTNU. 2008.
55
ANEXOS
56
A. Medidas de Resumen y Matrices de Correlación de Spearman
En esta sección del anexo se mostrarán las medidas de resumen de los datos extraídos por ciudades y
capitales de países, donde x representa la media y S la desviación estándar; cantidad de comentarios por
cada hotel; y por último el test ρ de Spearman, en donde cabe destacar lo siguiente acerca del coeficiente
de correlación de Spearman: un r cercano a 1 indica relación, un r cercano a 0 indica no hay relación, y
un r cercano a -1 indica relación inversa.
A.1. Hoteles de Santiago de Chile
En la tabla 51 se muestran las medidas de resumen Hoteles de Santiago de Chile, los cuales tienen
un total de 294 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,2143 4,0374 4,4354 4,3095 4,3299 4,5034 4,2245
S 0,90411 0,87940 0,76679 0,95430 0,81997 0,70468 0,93689
Tabla 51: Medidas de Resumen - Hoteles Santiago de Chile
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,688 0,621 0,593 0,593 0,387 0,625D1 – 1,000 0,566 0,480 0,567 0,299 0,507D2 – – 1,000 0,577 0,632 0,319 0,514D3 – – – 1,000 0,493 0,383 0,590D4 – – – – 1,000 0,295 0,534D5 – – – – – 1,000 0,363
D6 – – – – – – 1,000
Tabla 52: Matriz de Correlación - Hoteles Santiago de Chile
La tabla 52 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), y D6 (Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con la dimensión D4 (Comodidad).
c. Limpieza está fuertemente correlacionada con las dimensiones D3 (Personal del Hotel) y D4
(Comodidad).
d. Personal del Hotel (D3) esta moderadamente correlacionada con las dimensiones D4 (Comodidad) y
D6 (Calidad/Precio).
e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está fuertemente relacionada con la dimensión D6 (Calidad/Precio).
57
A.2. Hoteles de Bogota Colombia
En la tabla 53 se muestran las medidas de resumen Hoteles de Bogota Colombia, los cuales tienen
un total de 202 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,2079 4,1485 4,5594 4,5050 4,3564 4,0396 4,2178
S 0,96007 0,95559 0,75240 0,94236 1,03264 0,94549 1,00352
Tabla 53: Medidas de Resumen - Hoteles de Bogota Colombia
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,749 0,629 0,610 0,676 0,565 0,598D1 – 1,000 0,571 0,481 0,621 0,557 0,604D2 – – 1,000 0,559 0,690 0,409 0,463
D3 – – – 1,000 0,555 0,397 0,531D4 – – – – 1,000 0,460 0,577D5 – – – – – 1,000 0,425
D6 – – – – – – 1,000
Tabla 54: Matriz de Correlación - Hoteles de Bogota Colombia
La tabla 54muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D4 (Comodidad), D6 (Calidad/Precio), D2 (Limpieza), D3 (Personal del Hotel) y D5
(Ubicación).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio),
D3 (Personal del Hotel), D4 (Comodidad) y D5 (Ubicación).
c. Limpieza está fuertemente correlacionada con D4 (Comodidad), D3 (Personal del Hotel) y D6
(Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D4 (Comodidad), D6
(Calidad/Precio).
e. Comodidad (D4) está fuertemente correlacionada con la dimensión D5 (Ubicación) y D6 (Calidad/-
Precio).
f. Ubicación (D5) está moderadamente relacionada con la dimensión D6 (Calidad/Precio).
A.3. Hoteles de Buenos Aires
En la tabla 55 se muestran las medidas de resumen Hoteles de Buenos Aires Argentina, los cuales
tienen un total de 326 Comentarios.
58
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,1963 3,9540 4,4540 4,4018 4,2669 4,4294 4,1810
S 0,88654 0, 0,98965 0,82052 0,92451 0,77634 0,95163
Tabla 55: Medidas de Resumen - Hoteles de Buenos Aires Argentina
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,662 0,564 0,597 0,638 0,416 0,567D2 – 1,000 0,437 0,389 0,514 0,369 0,416
D3 – – 1,000 0,524 0,605 0,406 0,483
D3 – – – 1,000 0,470 0,383 0,458
D4 – – – – 1,000 0,311 0,527D65 – – – – – 1,000 0,368
D6 – – – – – – 1,000
Tabla 56: Matriz de Correlación - Hoteles de Buenos Aires Argentina
La tabla 56 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6
(Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),
D3 (Personal del Hotel), D4 (Comodidad),D6 (Calidad/Precio), y moderadamente correlacionada con
D5 (Ubicación).
c. Limpieza esta fuertemente correlacionada con las dimensiones D3 (Personal del Hotel), D4
(Comodidad), D5 (Ubicación) y D6 (Calidad/Precio).
d. Personal del Hotel (D3) está fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6
(Calidad/Precio), y moderadamente correlacionada con la dimensión D5 (Ubicación).
e. Comodidad (D4) está moderadamente correlacionada con la dimensión D5 (Ubicación) y fuertemente
correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
A.4. Hoteles de Lima Perú
En la tabla 57 se muestran las medidas de resumen Hoteles de Lima Perú, los cuales tienen un total
de 393 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,1399 4,0153 4,4860 4,3893 4,3053 4,2850 4,1705
S 0,87672 0,89487 0,79246 0,91115 0,87970 0,87494 0,94704
Tabla 57: Medidas de Resumen - Hoteles de Lima Perú
59
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,674 0,673 0,602 0,675 0,580 0,629D1 – 1,000 0,608 0,487 0,610 0,441 0,494
D2 – – 1,000 0,564 0,793 0,499 0,573D3 – – – 1,000 0,488 0,376 0,547D4 – – – – 1,000 0,457 0,528D5 – – – – – 1,000 0,471
D6 – – – – – – 1,000
Tabla 58: Matriz de Correlación - Hoteles de Lima Perú
La tabla 58 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6
(Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza) y
D4 (Comodidad).
c. Limpieza está fuertemente correlacionada con las dimensiones D3 (Personal del Hotel), D4
(Comodidad) y D6 (Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D6 (Calidad/Precio).
e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
A.5. Hoteles de Montevideo Uruguay
En la tabla 59 se muestran las medidas de resumen Hoteles de Lima Perú, los cuales tienen un total
de 69 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,7971 3,7101 4,0580 4,0725 4,0290 4,0000 4,9420
S 0,993802 1,07240 0,95308 0,94431 0,99957 0,95518 1,01292
Tabla 59: Medidas de Resumen - Hoteles de Montevideo Uruguay
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,714 0,569 0,645 0,666 0,405 0,696D1 – 1,000 0,547 0,569 0,681 0,321 0,689D2 – – 1,000 0,489 0,722 0,298 0,687D3 – – – 1,000 0,618 0,267 0,591D4 – – – – 1,000 0,340 0,788D5 – – – – – 1,000 0,444
D6 – – – – – – 1,000
Tabla 60: Matriz de Correlación - Hoteles de Montevideo Uruguay
60
La tabla 60 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), y D6 (Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),
D3 (Personal del Hotel), D4 (Comodidad), D6 (Calidad/Precio).
c. Limpieza está fuertemente relacionada con D4 (Comodidad) y D6 (Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con la dimensión D4 (Comodidad) y D6
(Calidad/Precio).
e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está fuertemente relacionada con D6 (Calidad/Precio).
A.6. Hoteles de Quito Ecuador
En la tabla 61 se muestran las medidas de resumen Hoteles de Quito Ecuador, los cuales tienen un
total de 137 comentarios.
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
x 3,9051 3,7518 4,3504 4,3212 4,8686 4,0146 4,9635
S 0,95396 1,92180 0,83658 1,07056 1,06286 0,99989 1,09416
Tabla 61: Medidas de Resumen - Hoteles de Quito Ecuador
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,753 0,570 0,633 0,603 0,546 0,671D1 – 1,000 0,563 0,542 0,600 0,495 0,494
D2 – – 1,000 0,580 0,678 0,346 0,484
D3 – – – 1,000 0,523 0,397 0,584D4 – – – – 1,000 0,456 0,578D5 – – – – – 1,000 0,583D6 – – – – – – 1,000
Tabla 62: Matriz de Correlación - Hoteles de Quito Ecuador
La tabla 62 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensión D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D4 (Comodidad), D5 (Ubicación) y D6
(Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D2 (Limpieza),
D3 (Personal del Hotel), D4 (Comodidad) y D6 (Personal del Hotel).
61
c. Limpieza está fuertemente correlacionada con las dimensiones D2 (Limpieza), D3 (Personal del
Hotel), D4 (Comodidad) y D6 (Personal del Hotel).
d. Personal del Hotel (D3) está fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6
(Calidad/Precio).
e. Comodidad (D4) está fuertemente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está fuertemente relacionada con la dimensión D6 (Calidad/Precio).
A.7. Hoteles de Río de Janeiro Brasil
En la tabla 63 se muestran las medidas de resumen Hoteles de Río de Janeiro, los cuales tienen un
total de 722 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,9349 3,8490 4,1842 4,0859 4,0720 4,3310 4,8019
S 1,05200 1,02300 1,04709 1,07852 1,04957 0,96821 1,14223
Tabla 63: Medidas de Resumen - Hoteles de Quito Ecuador
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,720 0,720 0,665 0,647 0,653 0,642D1 – 1,000 0,636 0,567 0,610 0,378 0,537D2 – – 1,000 0,586 0,660 0,412 0,526D3 – – – 1,000 0,534 0,431 0,528D4 – – – – 1,000 0,322 0,552D5 – – – – – 1,000 0,427
D6 – – – – – – 1,000
Tabla 64: Matriz de Correlación - Hoteles de Río de Janeiro
La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).
c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)
y D6 (Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6
(Calidad/Precio).
e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).
62
A.8. Hoteles de Ciudad de México
En la tabla 65 se muestran las medidas de resumen Hoteles de Ciudad de México, los cuales tienen
un total de 1428 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,8564 3,7913 4,2563 4,1141 4,0399 4,4125 3,9181
S 1,04206 1,08497 ,97487 1,13194 1,08785 ,84713 1,11667
Tabla 65: Medidas de Resumen - Hoteles de Quito Ecuador
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,685 0,607 0,640 0,654 0,426 0,613D1 – 1,000 0,552 0,567 0,631 0,357 0,505D2 – – 1,000 0,554 0,656 0,475 0,521D3 – – – 1,000 0,545 0,450 0,575D4 – – – – 1,000 0,391 0,509D5 – – – – – 1,000 0,430
D6 – – – – – – 1,000
Tabla 66: Matriz de Correlación - Hoteles de Ciudad de México
La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).
c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)
y D6 (Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6
(Calidad/Precio).
e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).
A.9. Hoteles de Panamá
En la tabla 67 se muestran las medidas de resumen Hoteles de Ciudad de México, los cuales tienen
un total de 1116 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,9131 3,9292 4,1873 4,0358 4,1013 4,1792 3,9220
S 1,10383 1,10661 1,06970 1,13508 1,09690 1,01299 1,13415
Tabla 67: Medidas de Resumen - Hoteles de Quito Ecuador
63
D Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
D0 1,000 0,764 0,704 0,712 0,775 0,516 0,745D1 – 1,000 0,671 0,626 0,717 0,511 0,654D2 – – 1,000 0,645 0,783 0,451 0,619D3 – – – 1,000 0,654 0,454 0,629D4 – – – – 1,000 0,462 0,673D5 – – – – – 1,000 0,453
D6 – – – – – – 1,000
Tabla 68: Matriz de Correlación - Hoteles de Ciudad de México
La tabla 64 muestra las correlaciones entre todas las dimensiones. Solo correlaciones destacadas con
negrita son significativas al nivel de ρ = 0, 05, y será interpretado:
a. La valoración del rating (D0) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel), D5 (Ubicación) y D6 (Calidad/Precio).
b. Instalaciones y Servicios (D1) está fuertemente correlacionada con las dimensiones D1 (Instalaciones
y Servicios), D2 (Limpieza), D3 (Personal del Hotel) y D6 (Calidad/Precio).
c. Limpieza está fuertemente relacionada con las dimensiones D3 (Personal del Hotel), D4 (Comodidad)
y D6 (Calidad/Precio).
d. Personal del Hotel (D3) esta fuertemente correlacionada con las dimensiones D4 (Comodidad) y D6
(Calidad/Precio).
e. Comodidad (D4) está moderadamente correlacionada con la dimensión D6 (Calidad/Precio).
f. Ubicación (D5) está moderadamente relacionada con D6 (Calidad/Precio).
B. Matrices de Correlación de Spearman - Hoteles de Chile
B.1. Hoteles de Viña del Mar
B.1.1. BEST WEST Hotel Marina del Rey
En la tabla 69 se muestran las medidas de resumen del BEST WEST Hotel Marina del Rey, el cual
posee 11 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,18 3,82 4,64 4,09 4,55 4,18 4,18
S 0,40 0,60 0,50 0,83 0,52 0,52 0,60
Tabla 69: Medidas de Resumen - BEST WEST Hotel Marina del Rey
A continuación se presenta la tabla 70, se puede apreciar que los datos mas relacionados son:
Instalaciones y Servicios con personal del Hotel (r=0,53), Rating con Instalaciones y Servicios (r=0,58),
y los datos con mayor relación fueron Limpieza con Comodidad (r=0,80).
64
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,58 0,33 0,20 0,41 0,16 0,67
Inst. y Serv. – 1,00 0,15 0,53 0,07 0,16 0,11
Limpieza – – 1,00 0,47 0,80 0,31 0,22
Pers. del Hotel – – – 1,00 0,22 -0,33 -0,09
Comodidad – – – – 1,00 0,38 0,27
Ubicación – – – – – 1,00 0,36
Calidad/Precio – – – – – – 1,00
Tabla 70: Matriz de Correlación - BEST WEST Hotel Marina del Rey
B.1.2. Hotel Ultramar
En la tabla 71 se muestran las medidas de resumen del Hotel Ultramar, el cual posee 10 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,9 3,5 3,5 3,4 3,4 3,1 3,0
S 1,2 1,08 1,51 1,43 1,43 1,43 1,33
Tabla 71: Medidas de Resumen - Hotel Ultramar
A continuación se presenta la tabla 72, se puede apreciar que los datos más relacionados
son: Rating con Instalaciones y Servicios (r=0,90), Instalaciones y Servicios con Calidad/Precio
(r=0,69), Limpieza con Personal del Hotel (r=0,88), Limpieza con Comodidad (r=0,82), Limpieza
con Calidad/Precio (r=0,77), Personal del Hotel con Comodidad (r=0,78), Personal del Hotel con
Calidad/Precio (r=0,64), Comodidad con Ubicación (r=0,83), Comodidad con Calidad/Precio (r=0,82), y
Ubicación con Calidad/Precio (r=0,67).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,90 0,28 0,16 0,35 0,14 0,42
Inst. y Serv. – 1,00 0,44 0,29 0,50 0,34 0,69Limpieza – – 1,00 0,88 0,82 0,73 0,77Pers. del Hotel – – – 1,00 0,78 0,88 0,64Comodidad – – – – 1,00 0,83 0,82Ubicación – – – – – 1,00 0,67Calidad/Precio – – – – – – 1,00
Tabla 72: Matriz de Correlación - Hotel Ultramar
B.1.3. Sheraton Miramar Hotel & Convention Center
En la tabla 73 se muestran las medidas de resumen del Sheraton Miramar Hotel & Convention Center,
el cual posee 6 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,33 4,67 4,67 4,00 4,83 4,83 4,33
S 0,82 0,52 0,52 1,55 0,41 0,41 0,82
Tabla 73: Medidas de Resumen - Sheraton Miramar Hotel & Convention Center
65
A continuación se presenta la tabla 73, se puede apreciar que todas las dimensiones se encuentran
muy relacionadas mostrando el valor r más bajo en Instalaciones y Servicios con Comodidad ( r=0,63) y
Limpieza con Comodidad (r=0,63), excepto en Ubicación con el resto de las dimensiones, en las cuales
se aprecian solo relaciones negativas o inversas.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,79 0,79 0,95 0,80 -0,40 0,70Inst. y Serv. – 1,00 1,00 0,75 0,63 -0,32 0,79Limpieza – – 1,00 0,75 0,63 -0,32 0,79Pers. del Hotel – – – 1,00 0,95 -0,32 0,79Comodidad – – – – 1,00 -0,20 0,80Ubicación – – – – – 1,00 -0,40
Calidad/Precio – – – – – – 1,00
Tabla 74: Matriz de Correlación - Sheraton Miramar Hotel & Convention Center
B.2. Hoteles de Santiago de Chile
B.2.1. Hotel Plaza el Bosque San Sebastián
En la tabla 75 se muestran las medidas de resumen del Hotel Plaza el Bosque San Sebastián, el cual
posee 17 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,29 4,06 4,53 4,47 4,71 4,65 4,47
S 0,59 0,75 0,51 0,72 0,59 0,59 0,72
Tabla 75: Medidas de Resumen - Hotel Plaza el Bosque San Sebastián
A continuación se presenta la tabla 76, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,67), Instalaciones y Servicios con Comodidad (r=0,75), Instalaciones
y Servicios con Calidad/Precio (r=0,64), Limpieza con Calidad/Precio (r=0,64), y Comodidad con
Calidad/Precio (r=0,65).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,67 0,49 0,54 0,45 0,48 0,54
Inst. y Serv. – 1,00 0,56 0,18 0,75 0,19 0,64Limpieza – – 1,00 0,47 0,34 0,44 0,64Pers. del Hotel – – – 1,00 0,05 0,55 0,51
Comodidad – – – – 1,00 0,22 0,65Ubicación – – – – – 1,00 0,41
Calidad/Precio – – – – – – 1,00
Tabla 76: Matriz de Correlación - Hotel Plaza el Bosque San Sebastián
B.2.2. Hotel Kennedy
En la tabla 77 se muestran las medidas de resumen del Hotel Kennedy, el cual posee 22 Comentarios.
66
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,55 4,41 4,68 4,68 4,68 4,36 4,55
S 0,51 0,59 0,57 0,48 0,57 0,57 0,60
Tabla 77: Medidas de Resumen - Hotel Kennedy
A continuación se presenta la tabla 78, se puede apreciar que los datos más relacionados son: Personal
del Hotel con Ubicación (r=0,54) y Comodidad con Calidad /Precio (r=0,54). El resto de los datos muestra
relación baja o relación inversa.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,17 0,46 0,16 0,13 0,40 -0,09
Inst. y Serv. – 1,00 0,12 0,32 -0,16 0,35 -0,12
Limpieza – – 1,00 0,14 0,26 0,15 0,12
Pers. del Hotel – – – 1,00 0,14 0,54 0,30
Comodidad – – – – 1,00 0,35 0,54Ubicación – – – – – 1,00 0,44
Calidad/Precio – – – – – – 1,00
Tabla 78: Matriz de Correlación - Hotel Kennedy
B.2.3. Hotel Plaza el Bosque Ebro
En la tabla 79 se muestran las medidas de resumen del Hotel Plaza el Bosque Ebro, el cual posee 21Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,29 4,24 4,67 4,48 4,38 4,52 4,24
S 1,23 0,83 0,66 1,21 0,80 0,80 1,09
Tabla 79: Medidas de Resumen - Hotel Plaza el Bosque Ebro
A continuación se presenta la tabla 80, se puede apreciar que todos los datos se encuentran bastante
relacionados en los cuales el valor r más bajo es de 0,68.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,81 0,86 0,95 0,74 0,79 0,95Inst. y Serv. – 1,00 0,70 0,78 0,75 0,69 0,82Limpieza – – 1,00 0,90 0,72 0,81 0,81Pers. del Hotel – – – 1,00 0,68 0,80 0,90Comodidad – – – – 1,00 0,60 0,69
Ubicación – – – – – 1,00 0,81Calidad/Precio – – – – – – 1,00
Tabla 80: Matriz de Correlación - Hotel Plaza el Bosque Ebro
B.2.4. Hotel Park Plaza Santiago
En la tabla 81 se muestran las medidas de resumen del Hotel Park Plaza Santiago, el cual posee 24Comentarios.
67
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,29 4,08 4,38 4,38 4,33 4,50 4,21
S 0,86 0,72 0,65 0,82 0,70 0,70 0,83
Tabla 81: Medidas de Resumen - Hotel Park Plaza Santiago
A continuación se presenta la tabla 82, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,74), Rating con Limpieza (r=0,74), Rating con Comodidad (r=0,78),
Instalaciones y Servicios con Comodidad (r=0,73), y Comodidad con Calidad/Precio (r=0,71).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,74 0,74 0,55 0,78 0,27 0,77
Inst. y Serv. – 1,00 0,60 0,28 0,73 0,16 0,57
Limpieza – – 1,00 0,43 0,68 0,35 0,67
Pers. del Hotel – – – 1,00 0,42 0,44 0,67
Comodidad – – – – 1,00 0,15 0,71Ubicación – – – – – 1,00 0,38
Calidad/Precio – – – – – – 1,00
Tabla 82: Matriz de Correlación - Hotel Park Plaza Santiago
B.2.5. Park Plaza Apart Hotel
En la tabla 83 se muestran las medidas de resumen del Park Plaza Apart Hotel, el cual posee 26Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,12 3,96 4,62 4,27 4,38 4,50 4,27
S 0,71 0,87 0,50 0,67 0,64 0,64 0,87
Tabla 83: Medidas de Resumen - Park Plaza Apart Hotel
A continuación se presenta la tabla 84, se puede apreciar que los datos más relacionados son:
Rating con Instalaciones y Servicios (r=0,65), Rating con Comodidad (r=0,64), Rating con Calidad/Precio
(r=0,78), Limpieza con Personal del Hotel (r=0,60), Limpieza con Comodidad (r=0,74), y Personal del
Hotel con Calidad/Precio (r=0,61).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,65 0,46 0,58 0,52 0,64 0,78Inst. y Serv. – 1,00 0,50 0,34 0,38 0,53 0,38
Limpieza – – 1,00 0,60 0,74 0,56 0,43
Pers. del Hotel – – – 1,00 0,59 0,42 0,61Comodidad – – – – 1,00 0,55 0,46
Ubicación – – – – – 1,00 0,51
Calidad/Precio – – – – – – 1,00
Tabla 84: Matriz de Correlación - Park Plaza Apart Hotel
68
B.2.6. Hotel Plaza el Bosque Nueva Las Condes
En la tabla 85 se muestran las medidas de resumen del Hotel Plaza el Bosque Nueva Las Condes, el
cual posee 22 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,45 4,36 4,59 4,27 4,59 4,27 4,50
S 0,74 0,58 0,59 0,83 0,59 0,59 0,51
Tabla 85: Medidas de Resumen - Hotel Plaza el Bosque Nueva Las Condes
A continuación se presenta la tabla 86, se puede apreciar que los datos más relacionados son: Rating
con Calidad/Precio (r=0,52) Instalaciones y Servicios con Limpieza (r=0,60), y Limpieza con Personal
del Hotel (r=0,54). Además, todas las dimensiones con ubicación muestran relación inversa o muy baja
relación.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,29 0,25 0,43 0,46 0,31 0,52Inst. y Serv. – 1,00 0,60 0,31 0,34 -0,04 0,50Limpieza – – 1,00 0,54 0,47 -0,08 0,41
Pers. del Hotel – – – 1,00 0,45 0,19 0,25
Comodidad – – – – 1,00 -0,08 0,26
Ubicación – – – – – 1,00 0,41
Calidad/Precio – – – – – – 1,00
Tabla 86: Matriz de Correlación - Hotel Plaza el Bosque Nueva Las Condes
B.2.7. Hotel Ismael 312
En la tabla 87 se muestran las medidas de resumen del Hotel Ismael 312, el cual posee 11Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,55 4,09 4,73 4,73 4,09 4,82 4,36
S 0,69 0,83 0,65 0,65 0,70 0,70 0,81
Tabla 87: Medidas de Resumen - Hotel Ismael 312
A continuación se presenta la tabla 88, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,78), Rating con Ubicación (r=0,75), Limpieza con Personal del Hotel
(r=0,76), Limpieza con Ubicación (r=0,89), Personal del Hotel con Ubicación (r=0,89), y Comodidad con
Calidad/Precio (r=0,64).
69
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,78 0,59 0,59 0,51 0,75 0,51
Inst. y Serv. – 1,00 0,42 0,24 0,50 0,44 0,39
Limpieza – – 1,00 0,76 0,28 0,89 0,59
Pers. del Hotel – – – 1,00 0,50 0,89 0,59
Comodidad – – – – 1,00 0,52 0,64Ubicación – – – – – 1,00 0,56
Calidad/Precio – – – – – – 1,00
Tabla 88: Matriz de Correlación - Hotel Ismael 312
B.2.8. Hotel Plaza San Francisco
En la tabla 89 se muestran las medidas de resumen del Hotel Plaza San Francisco, el cual posee 28Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,36 4,25 4,43 4,50 4,54 4,61 4,43
S 0,78 0,70 0,92 1,04 0,79 0,79 0,79
Tabla 89: Medidas de Resumen - Hotel Plaza San Francisco
A continuación se presenta la tabla 90, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,63), Rating con Personal del Hotel (r=0,76), Rating con Calidad/Precio
(r=0,75), y Limpieza con Comodidad (r=0,84).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,63 0,53 0,76 0,51 0,17 0,75Inst. y Serv. – 1,00 0,50 0,28 0,47 0,39 0,41
Limpieza – – 1,00 0,30 0,84 0,37 0,58
Pers. del Hotel – – – 1,00 0,34 -0,13 0,57
Comodidad – – – – 1,00 0,45 0,43
Ubicación – – – – – 1,00 0,26
Calidad/Precio – – – – – – 1,00
Tabla 90: Matriz de Correlación - Hotel Plaza San Francisco
B.2.9. Hotel Regal Pacific
En la tabla 91 se muestran las medidas de resumen del Hotel Regal Pacific, el cual posee 8Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,75 4,50 4,88 4,75 4,62 4,50 4,38
S 0,46 0,76 0,35 0,46 0,52 0,52 0,52
Tabla 91: Medidas de Resumen - Hotel Regal Pacific
A continuación se presenta la tabla 92, se puede apreciar que los datos más relacionados son: Rating
con Limpieza (r=0,65), Instalaciones y Servicios con Personal del Hotel (r=0,82). Además, se pueden ver
70
dos valores negativos en: Instalaciones y Servicios con Comodidad (r=-0,18) y Comodidad con Ubicación
(r=-0,26).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,82 0,65 1,00 0,15 0,58 0,45
Inst. y Serv. – 1,00 0,27 0,82 -0,18 0,35 0,55
Limpieza – – 1,00 0,65 0,49 0,38 0,29
Pers. del Hotel – – – 1,00 0,15 0,58 0,45
Comodidad – – – – 1,00 -0,26 0,07
Ubicación – – – – – 1,00 0,26
Calidad/Precio – – – – – – 1,00
Tabla 92: Matriz de Correlación - Hotel Regal Pacific
B.2.10. Hotel Manquehue
En la tabla 93 se muestran las medidas de resumen del Hotel Manquehue, el cual posee 10Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,30 3,30 3,70 3,70 4,40 3,80 3,60
S 1,42 1,25 1,16 1,42 1,26 1,26 1,43
Tabla 93: Medidas de Resumen - Hotel Manquehue
A continuación se presenta la tabla 94, se puede apreciar que en su mayoría los datos se encuentran
muy relacionados, mostrando el valor más bajo de relación en Rating con Ubicación (r=0,57).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,95 0,80 0,93 0,85 0,57 0,78Inst. y Serv. – 1,00 0,83 0,93 0,83 0,65 0,88Limpieza – – 1,00 0,89 0,92 0,90 0,92Pers. del Hotel – – – 1,00 0,88 0,68 0,92Comodidad – – – – 1,00 0,72 0,84Ubicación – – – – – 1,00 0,84Calidad/Precio – – – – – – 1,00
Tabla 94: Matriz de Correlación - Hotel Manquehue
B.2.11. Hotel Galerías
En la tabla 95 se muestran las medidas de resumen del Hotel Galerías, el cual posee 12 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,83 3,42 4,00 3,67 3,92 4,42 4,00
S 0,83 0,67 0,85 1,07 0,67 0,67 0,85
Tabla 95: Medidas de Resumen - Hotel Galerías
A continuación se presenta la tabla 96, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,62), Rating con Calidad/Precio (r=0,77), Instalaciones y Servicios con
71
Comodidad (r=0,69), Instalaciones y Servicios con Calidad/Precio (r=0,64), Limpieza con Comodidad
(r=0,64), Limpieza con Calidad/Precio (r=0,62), Personal del Hotel con Ubicación (r=0,60), y Personal
del Hotel con Calidad/Precio (r=0,70).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,62 0,26 0,54 0,30 0,18 0,77Inst. y Serv. – 1,00 0,64 0,59 0,69 0,51 0,64Limpieza – – 1,00 0,50 0,64 0,21 0,62Pers. del Hotel – – – 1,00 0,59 0,60 0,70Comodidad – – – – 1,00 0,64 0,48
Ubicación – – – – – 1,00 0,41
Calidad/Precio – – – – – – 1,00
Tabla 96: Matriz de Correlación - Hotel Galerías
B.2.12. NH Ciudad de Santiago
En la tabla 97 se muestran las medidas de resumen del NH Ciudad de Santiago, el cual posee 12Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,17 3,17 4,00 3,83 3,92 4,08 3,17
S 1,19 1,47 1,13 0,94 1,31 1,31 1,27
Tabla 97: Medidas de Resumen - NH Ciudad de Santiago
A continuación se presenta la tabla 98, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,87), Rating con Limpieza (r=0,74), Rting con Comodidad (r=0,88),
Rating con Calidad/Precio (r=0,88), Instalaciones y Servicios con Limpieza (r=0,71) Instalaciones y
Servicios con Comodidad (r=0,81), Instalaciones y Servicios con Calidad/Precio (r=0,67), Limpieza con
Comodidad (r=0,92), Limpieza con Calidad/Precio (r=0,70), y Comodidad con Calidad/Precio (r=0,83).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,87 0,74 0,60 0,88 0,24 0,88Inst. y Serv. – 1,00 0,71 0,62 0,81 0,13 0,67Limpieza – – 1,00 0,60 0,92 -0,09 0,70Pers. del Hotel – – – 1,00 0,58 -0,09 0,48
Comodidad – – – – 1,00 0,01 0,83Ubicación – – – – – 1,00 0,31
Calidad/Precio – – – – – – 1,00
Tabla 98: Matriz de Correlación - NH Ciudad de Santiago
B.2.13. Holiday Inn Santiago - Airport Terminal
En la tabla 99 se muestran las medidas de resumen del Holiday Inn Santiago - Airport Terminal, el
cual posee 23 Comentarios.
72
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,17 3,78 4,26 4,13 4,13 4,61 4,61
S 0,89 0,85 1,01 1,10 1,01 1,01 1,12
Tabla 99: Medidas de Resumen - Holiday Inn Santiago - Airport Terminal
A continuación se presenta la tabla 100, se puede apreciar que los datos más relacionados son: Rating
con Personal del Hotel (r=0,71), Rating con Calidad/Precio (r=0,78), Limpieza con Personal del Hotel
(r=0,84), Limpieza con Comodidad (r=0,90), y Personal del Hotel con Calidad/Precio (r=0,73).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,51 0,55 0,71 0,63 0,36 0,78Inst. y Serv. – 1,00 0,49 0,51 0,44 0,33 0,42
Limpieza – – 1,00 0,84 0,90 0,48 0,60
Pers. del Hotel – – – 1,00 0,89 0,44 0,73Comodidad – – – – 1,00 0,48 0,67
Ubicación – – – – – 1,00 0,33
Calidad/Precio – – – – – – 1,00
Tabla 100: Matriz de Correlación - Holiday Inn Santiago - Airport Terminal
B.2.14. Santiago Marriott Hotel
En la tabla 101 se muestran las medidas de resumen del Santiago Marriott Hotel, el cual posee 8Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,50 4,25 4,75 4,25 4,62 4,62 4,00
S 1,07 1,04 0,71 1,16 0,74 0,74 1,07
Tabla 101: Medidas de Resumen - Santiago Marriott Hotel
A continuación se presenta la tabla 102, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,90), Rating con Limpieza (r=0,94), Rating con Comodidad (r=0,99),
Rating con Calidad/Precio (r=0,75), Instalaciones y Servicios con Limpieza (r=0,88), Instalaciones y
Servicios con Comodidad (r=0,88), Instalaciones y Servicios con Calidad/Precio (r=0,90), Limpieza con
Personal del Hotel (r=0,78), Limpieza con Comodidad (r=0,88), Limpieza con Calidad/Precio (r=0,76),
y Comodidad con Calidad/Precio (r=0,72).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,90 0,94 0,69 0,99 0,27 0,75Inst. y Serv. – 1,00 0,88 0,65 0,88 0,14 0,90Limpieza – – 1,00 0,78 0,88 0,34 0,76Pers. del Hotel – – – 1,00 0,62 0,78 0,69
Comodidad – – – – 1,00 0,23 0,72Ubicación – – – – – 1,00 0,36
Calidad/Precio – – – – – – 1,00
Tabla 102: Matriz de Correlación - Santiago Marriott Hotel
73
B.2.15. BEST WESTERN PREMIER Marina Las Condes
En la tabla 103 se muestran las medidas de resumen del BEST WESTERN PREMIER Marina Las
Condes, el cual posee 6 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,33 4,33 4,67 4,67 4,33 4,67 4,50
S 0,82 0,82 0,52 0,52 0,82 0,82 0,84
Tabla 103: Medidas de Resumen - BEST WESTERN PREMIER Marina Las Condes
A continuación se presenta la tabla 104, se puede apreciar que todos los datos poseen alta relación
excepto las relaciones entre la ubicación y las demás dimensiones, las cuales tienen baja relación.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 1,00 0,81 0,81 1,00 0,37 0,88Inst. y Serv. – 1,00 0,81 0,81 1,00 0,37 0,88Limpieza – – 1,00 1,00 0,81 0,30 0,93Pers. del Hotel – – – 1,00 0,81 0,30 0,93Comodidad – – – – 1,00 0,37 0,88Ubicación – – – – – 1,00 0,06
Calidad/Precio – – – – – – 1,00
Tabla 104: Matriz de Correlación - BEST WESTERN PREMIER Marina Las Condes
B.2.16. Hotel Presidente Edificio Santiago
En la tabla 104 se muestran las medidas de resumen del Hotel Presidente Edificio Santiago, el cual
posee 7 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,14 3,14 4,57 4,71 3,86 4,57 4,57
S 0,69 0,90 0,53 0,76 1,21 1,21 0,79
Tabla 105: Medidas de Resumen - Hotel Presidente Edificio Santiago
A continuación se presenta la tabla 106, se puede apreciar que los datos más relacionados son: Rating
con Comodidad (r=0,82), Rating con Calidad/Precio (r=0,75), Instalaciones y Servicios con Comodidad
(r=0,78), y Personal del Hotel con Calidad/Precio (r=0,88).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,50 0,65 0,73 0,82 0,19 0,75Inst. y Serv. – 1,00 0,15 0,56 0,78 0,15 0,34
Limpieza – – 1,00 0,47 0,40 -0,17 0,28
Pers. del Hotel – – – 1,00 0,67 -0,35 0,88Comodidad – – – – 1,00 0,40 0,62
Ubicación – – – – – 1,00 -0,11
Calidad/Precio – – – – – – 1,00
Tabla 106: Matriz de Correlación - Hotel Presidente Edificio Santiago
74
B.2.17. Soho Santiago Apartments
En la tabla 106 se muestran las medidas de resumen del Soho Santiago Apartments, el cual posee 32Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,22 4,25 4,22 4,09 4,25 4,66 4,53
S 0,61 0,57 0,66 1,06 0,62 0,62 0,67
Tabla 107: Medidas de Resumen - Soho Santiago Apartments
A continuación se presenta la tabla 108, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,77), Rating con Comodidad (r=0,70), Rating con Limpieza (r=0,60),
Instalaciones y Servicios con Comodidad (r=0,64), y Comodidad con Calidad/Precio (r=0,60).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,77 0,60 0,37 0,70 0,23 0,58
Inst. y Serv. – 1,00 0,45 0,28 0,64 0,29 0,49
Limpieza – – 1,00 0,25 0,57 -0,05 0,31
Pers. del Hotel – – – 1,00 0,31 0,34 0,47
Comodidad – – – – 1,00 0,07 0,60Ubicación – – – – – 1,00 0,25
Calidad/Precio – – – – – – 1,00
Tabla 108: Matriz de Correlación - Soho Santiago Apartments
B.2.18. Holiday Inn Express Santiago Las Condes
En la tabla 108 se muestran las medidas de resumen del Holiday Inn Express Santiago Las Condes,
el cual posee 6 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,83 3,83 4,33 4,17 4,33 4,83 3,67
S 1,83 1,60 1,03 1,33 1,03 1,03 1,51
Tabla 109: Medidas de Resumen - Holiday Inn Express Santiago Las Condes
A continuación se presenta la tabla 110, se puede apreciar que todos los datos poseen alta relación
excepto las relaciones entre la ubicación y las demás dimensiones, las cuales tienen una relación inversa.
.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,94 0,99 1,00 0,99 -0,31 0,84Inst. y Serv. – 1,00 0,89 0,95 0,89 -0,36 0,72
Limpieza – – 1,00 0,97 1,00 -0,32 0,86Pers. del Hotel – – – 1,00 0,97 -0,31 0,83Comodidad – – – – 1,00 -0,32 0,86Ubicación – – – – – 1,00 -0,43
Calidad/Precio – – – – – – 1,00
Tabla 110: Matriz de Correlación - Holiday Inn Express Santiago Las Condes
75
B.3. Hoteles de Isla de Pascua
B.3.1. Tupa Hotel
En la tabla 110 se muestran las medidas de resumen del Tupa Hotel, el cual posee 19 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,74 3,05 4,21 4,42 3,475 4,42 3,89
S 1,05 1,27 0,98 1,21 0,96 0,96 1,15
Tabla 111: Medidas de Resumen - Tupa Hotel
A continuación se presenta la tabla 112, se puede apreciar que los datos más relacionados son:
Rating con Limpieza (r=0,76), Rating con Comodidad (r=0,79), Rating con Calidad/Precio (r=0,85),
Instalaciones y Servicio con Comodidad (r=0,71), Limpieza con Personal del Hotel (r=0,78), Personal
del Hotel con Calidad/Precio (r=0,77), y Comodidad con Calidad/Precio (r=0,75).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,77 0,76 0,67 0,79 0,33 0,85Inst. y Serv. – 1,00 0,53 0,61 0,71 0,31 0,69
Limpieza – – 1,00 0,78 0,48 0,37 0,66
Pers. del Hotel – – – 1,00 0,52 0,45 0,77Comodidad – – – – 1,00 0,14 0,75Ubicación – – – – – 1,00 0,27
Calidad/Precio – – – – – – 1,00
Tabla 112: Matriz de Correlación - Tupa Hotels
B.4. Hoteles de Puerto Montt
B.4.1. Manquehue Hotel Puerto Montt
En la tabla 113 se muestran las medidas de resumen del Manquehue Hotel Puerto Montt, el cual
posee 5 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,60 4,00 4,20 4,40 4,40 4,00 4,20
S 0,55 0,71 0,84 0,55 0,89 0,89 0,84
Tabla 113: Medidas de Resumen - Manquehue Hotel Puerto Montt
A continuación se presenta la tabla 114, se puede apreciar que los datos más relacionados son: Rating
con Comodidad (r=0,92), Instalaciones y Servicios con Limpieza (r=0,85), Instalaciones y Servicios con
Calidad/Precio (r=0,85), Limpieza con Personal del Hotel (r=0,87), Limpieza con Comodidad (r=0,87),
y Comodidad con Calidad/ Precio.
76
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,65 0,76 0,67 0,92 0,00 0,76
Inst. y Serv. – 1,00 0,85 0,65 0,79 0,50 0,85Limpieza – – 1,00 0,87 0,87 0,42 0,64
Pers. del Hotel – – – 1,00 0,61 0,65 0,33
Comodidad – – – – 1,00 0,00 0,87Ubicación – – – – – 1,00 0,00
Calidad/Precio – – – – – – 1,00
Tabla 114: Matriz de Correlación - Manquehue Hotel Puerto Montt
B.4.2. Hotel Cabana del Lago
En la tabla 115 se muestran las medidas de resumen del Hotel Cabana del Lago, el cual posee 6Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,83 4,67 4,83 4,50 4,83 4,83 4,83
S 0,41 0,52 0,41 0,84 0,41 0,41 0,41
Tabla 115: Medidas de Resumen - Hotel Cabana del Lago
A continuación se presenta la tabla 116, se puede apreciar que los datos más relacionados son: Rating
con Instalacione (r=0,63) e Instalaciones y servicios con Calidad/Precio (r=0,63).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,63 -0,20 -0,29 -0,20 -0,20 1,00
Inst. y Serv. – 1,00 -0,32 -0,46 -0,32 -0,32 0,63Limpieza – – 1,00 -0,29 -0,20 -0,20 -0,20
Pers. del Hotel – – – 1,00 0,29 0,29 -0,29
Comodidad – – – – 1,00 1,00 -0,20
Ubicación – – – – – 1,00 -0,20
Calidad/Precio – – – – – – 1,00
Tabla 116: Matriz de Correlación - Hotel Cabana del Lagos
B.5. Hoteles de San Pedro de Atacama
B.5.1. Hotel Cumbres San Pedro de Atacama
En la tabla 117 se muestran las medidas de resumen del Hotel Cumbres San Pedro de Atacama, el
cual posee 7 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 3,86 4,29 4,43 4,29 4,43 3,86 3,86
S 1,46 0,95 0,98 1,50 0,79 0,79 0,69
Tabla 117: Medidas de Resumen - Hotel Cumbres San Pedro de Atacama
A continuación se presenta la tabla 118, se puede apreciar que la gran mayoría de los datos tienen
una relación bastante alta mostrando el mayor r en Instalaciones y Servicios con Limpieza (r=0,92)
77
e Instalaciones y Servicios con Comodidad (r=0,92). Además no se ven valores negativos o inversos,
mostrando el valor más bajo de relación con un r=0,16 en Persona del Hotel con Comodidad.
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,75 0,87 0,86 0,50 0,74 0,80Inst. y Serv. – 1,00 0,92 0,52 0,92 0,62 0,83Limpieza – – 1,00 0,59 0,81 0,76 0,85Pers. del Hotel – – – 1,00 0,16 0,58 0,53
Comodidad – – – – 1,00 0,42 0,75Ubicación – – – – – 1,00 0,37
Calidad/Precio – – – – – – 1,00
Tabla 118: Matriz de Correlación - Hotel Cumbres San Pedro de Atacama
B.6. Hoteles de Punta Arenas
B.6.1. BEST WESTERN Hotel Finis Terrae
En la tabla 119 se muestran las medidas de resumen del BEST WESTERN Hotel Finis Terrae, el cual
posee 6 Comentarios.
Medida Rating Inst. y Serv. Limpieza Pers. Hotel Comodidad Ubicación Calidad/Prec.
x 4,33 3,33 4,33 4,50 4,00 4,50 3,50
S 0,82 1,37 0,52 0,84 0,63 0,63 0,55
Tabla 119: Medidas de Resumen - Holiday Inn Express Antofagasta
A continuación se presenta la tabla 120, se puede apreciar que los datos más relacionados son: Rating
con Instalaciones y Servicios (r=0,78), Limpieza con Ubicación (r=0,71), Rating con Calidad/Precio
(r=0,89),y Limpieza con Calidad/Precio (r=0,71).
Dimensiones Rating Inst. y Serv. Limpieza Pers. del Hotel Comodidad Ubicación Calidad/Precio
Rating 1,00 0,78 0,63 0,29 0,00 0,00 0,89Inst. y Serv. – 1,00 0,66 0,00 0,46 0,00 0,53
Limpieza – – 1,00 0,46 0,61 0,71 0,71Pers. del Hotel – – – 1,00 0,00 0,65 0,65
Comodidad – – – – 1,00 0,58 0,00
Ubicación – – – – – 1,00 0,33
Calidad/Precio – – – – – – 1,00
Tabla 120: Matriz de Correlación - BEST WESTERN Hotel Finis Terrae
C. Capturas del Sitio Web Hotelclub.com
En la figura 16 se muestra la interfaz del sitio web Hotelclub.com en la sección del hotel BEST
WESTERN Marina del Rey.
78
Figura 16: Interfaz del sitio web
En la figura 17 se muestra un comentario del hotel BEST WESTERN Marina del Rey en la interfaz
del sitio web Hotelclub.com
Figura 17: Comentario con la interfaz del sitio web.
D. Capturas del Sitio Web Hoteles.com
En la figura 18 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de todas las
categorías.
79
Figura 18: Interfaz del Sitio Web Hoteles.com - Todas las categorías
En la figura 19 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de negocio.
Figura 19: Interfaz del Sitio Web Hoteles.com - De Negocio
En la figura 20 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de parejas.
80
Figura 20: Interfaz del Sitio Web Hoteles.com - En Pareja
En la figura 21 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de familia.
Figura 21: Interfaz del Sitio Web Hoteles.com - En Familia
En la figura 22 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de amigos.
81
Figura 22: Interfaz del Sitio Web Hoteles.com - Entre Amigos
En la figura 23 se muestra la interfaz del sitio web Hoteles.com, sección: puntuaciones de otras
categorías.
Figura 23: Interfaz del Sitio Web Hoteles.com - Otras categorías
En la figura 24 se muestra la interfaz del sitio web Hoteles.com, sección: comentarios del hotel.
82
Figura 24: Interfaz del Sitio Web Hoteles.com - Comentarios
E. Estructura HTML del Sitio Web Hotelclub.com
1 < div c l a s s ="offscreen item">
2 Review of <span c l a s s ="fn">BEST WESTERN Marina Del Rey< / span>
3 < / div >
Tabla 121: Extracción del dato Nombre Hotel
1 < div c l a s s ="recommended">
2 <img s r c ="http://www.tnetnoc.com/static/28.222/image/global/reviews-positive
-lg.png" a l t ="" data−c o n t e x t ="reviews-positive-lg">
3 <p>Lo r e c o m e n d a r í a < / p>
4 < / div >
Tabla 122: Extracción del dato Recomendación
83
1 < div c l a s s ="reviewerName">
2 <img s r c ="http://www.tnetnoc.com/static/28.222/image/global/reviews-verified
.png" a l t ="" t i t l e ="La etiqueta de Cliente Verificado sólo se asigna a
aquellos clientes que han reservado este hotel con nosotros" data−c o n t e x t
="reviews-verified">
3 < s t r o n g c l a s s ="reviewer" lang ="es-ES">Maryland Matt < / s t r o n g >
4 < / div >
Tabla 123: Extracción del dato Usuario
1 < div c l a s s ="purpose"> Couples < / div >
2 < div c l a s s ="location"> S a n t i a g o < / div >
3 <abbr c l a s s ="date dtreviewed" t i t l e ="2013-08-05">
4 0 5 / 0 8 / 2 0 1 3
5 < / abbr>
Tabla 124: Extracción de los datos Proposito, Ubicación y Fecha
1 <h3 lang ="es-ES"><q c l a s s ="summary">Bueno pe ro c a r o < / q>< / h3>
2 < div c l a s s ="review">
3 <p c l a s s ="reviewComment description" lang ="es-ES">
4 Todo b i e n y a c o r d e con un e s t á n d a r de un buen h o t e l de
negoc io s , pe r o con p r e c i o de h o t e l c i n c o e s t r e l l a s a
n i v e l i n t e r n a c i o n a l .
5 < / p>
Tabla 125: Titulo Comentario y Comentario
84
1 < div c l a s s ="reviewScores userReviewGraph" data−a g e n t ="{"type":"
UserReviewGraph"}">
2 < dl ><dt c l a s s ="noneBlock graphHeading">  ; < / dt ><dd c l a s s ="graphHeading">
3 <span>1< / span><span>2< / span><span>3< / span><span>4< / span><span>5< / span>< / dt >
4 <dt > I n s t a l a c i o n e s y s e r v i c i o s : < / dt >
5 <dd t i t l e ="4"><span c l a s s ="score" s t y l e ="width: 80%;">4< / span>< / dd>
6 <dt > Limpieza : < / dt >
7 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>
8 <dt > P e r s o n a l d e l h o t e l : < / dt >
9 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>
10 <dt >Comodidad : < / dt >
11 <dd t i t l e ="5"><span c l a s s ="score" s t y l e ="width: 100%;">5< / span>< / dd>
12 <dt > U b i c a c i ó n : < / dt >
13 <dd t i t l e ="4"><span c l a s s ="score" s t y l e ="width: 80%;">4< / span>< / dd>
14 <dt > Cal idad−P r e c i o : < / dt >
15 <dd t i t l e ="3"><span c l a s s ="score" s t y l e ="width: 60%;">3< / span>< / dd>
16 < / dl >
17 < / div >
Tabla 126: Extracción del dato Características del hotel
F. Código de la Aplicación en Lenguaje JAVA
1 public class ExtractDataWeb {
2
3 public Elements TitulosComentarios;
4 public Elements Comentarios;
5 public Elements Ratings;
6 public Elements Recomendaciones;
7 public Elements Ubicaciones;
8 public Elements Users;
9 public Elements CaracteristicasHotel;
10 public Elements HotelName;
11 public Elements Fechas;
12 public Elements Propositos;
13 public Elements currentPages;
14 public Elements countViajeros;
15 public Elements NoRatings;
16 public Elements streetAddress;
17 public Elements addressLocality;
18 public int size;
19 public Elements Linkes;
20 public int ContNoRating;
21 public ExtractDataWeb(){
22
23 }
24
85
25 public ExtractDataWeb(Elements TitulosComentarios,Elements Comentarios,
Elements Ratings, Elements Recomendaciones,
26 Elements Ubicaciones, Elements Users, Elements CaracteristicasHotel,
Elements HotelName, Elements Fechas, Elements Propositos,
27 Elements currentPage, Elements countViajeros, Elements NoRatings, Elements
streetAddress, Elements addressLocality) {
28 this.TitulosComentarios=TitulosComentarios;29 this.Comentarios=Comentarios;30 this.Ratings=Ratings;31 this.Recomendaciones=Recomendaciones;32 this.Ubicaciones=Ubicaciones;33 this.Users=Users;34 this.CaracteristicasHotel=CaracteristicasHotel;35 this.HotelName=HotelName;36 this.Fechas=Fechas;37 this.Propositos=Propositos;38 this.currentPages=currentPages;39 this.countViajeros=countViajeros;40 this.NoRatings=NoRatings;41 this.addressLocality=addressLocality;42 this.streetAddress=streetAddress;43 }
44
45 public ListaObjetos ExtraerData(String link) throws IOException{
46 Document doc;
47 Document doc1;
48
49 ListaObjetos list=new ListaObjetos();
50 ArrayList<String> tc =new ArrayList();
51 ArrayList<String> co =new ArrayList();
52 ArrayList<String> ra =new ArrayList();
53 ArrayList<String> re =new ArrayList();
54 ArrayList<String> ub =new ArrayList();
55 ArrayList<String> us =new ArrayList();
56 ArrayList<String> iys =new ArrayList();
57 ArrayList<String> hn =new ArrayList();
58 ArrayList<String> f =new ArrayList();
59 ArrayList<String> p =new ArrayList();
60 ArrayList<String> cp =new ArrayList();
61 ArrayList<String> listLink =new ArrayList();
62 ArrayList<Integer> contr =new ArrayList();
63 int countV=0;
64 listLink.add(link);
65 doc1=Jsoup.connect(link).get();
66 Elements count=doc1.select(".count");
67
68 Linkes =doc1.select(".pages a[href]");
69 for(Element cantidad : count){
70 size=Integer.parseInt(cantidad.text());
86
71 }
72 String Extractlink=Linkes.attr("abs:href");
73 String[] linkSplit=Extractlink.split("reviewPage=");
74 for(int i=2;i<=size;i++){
75 listLink.add(linkSplit[0]+"reviewPage="+i);
76 }
77 System.out.println("Linkesssss: "+listLink);
78 //for(Element Link : Linkes){
79 // listLink.add(Link.attr("abs:href"));
80 //}
81 int div=size/10;
82 int mod=size%10;
83 if(mod==0) size=div;
84 else size=div+1;
85 System.out.println("Largo del FOR: "+size);
86 try{87 for(int i=0;i<size;i++){
88 doc=Jsoup.connect(listLink.get(i)).get();
89
90 TitulosComentarios=doc.select(".summary");
91 Comentarios=doc.select(".review .reviewComment");
92 Ratings=doc.select(".reviewDetails .userReviewScore .score .rating");
93 Recomendaciones=doc.select(".recommended p");
94 Users=doc.select(".reviewerName strong");
95 Ubicaciones=doc.select(".location");
96 CaracteristicasHotel=doc.select(".review dd .score");
97 HotelName=doc.select(".headline h1");
98 Fechas=doc.select(".reviewDetails .date");
99 Propositos=doc.select(".purpose ");
100 currentPages=doc.select(".pages .link");
101 countViajeros=doc.select(".count");
102 NoRatings=doc.select(".noRating");
103 addressLocality=doc.select("title");
104 streetAddress=doc.select(".title .link");
105 for(Element countViajero : countViajeros){
106 //System.out.println(Proposito.text());
107 countV=Integer.parseInt(countViajero.text());
108 }
109 for(Element TituloComentario : TitulosComentarios){
110 //System.out.println(TituloComentario.text());
111 tc.add(TituloComentario.text());
112 }
113 for(Element Comentario : Comentarios){
114 //System.out.println(Comentario.text());
115 co.add(Comentario.text());
116 }
117 int cont=0;
118 for(Element Rating : Ratings){
119 //System.out.println(Rating.text());
87
120 ra.add(Rating.text());
121 }
122 int contreco=0;
123 for(Element Recomendacion : Recomendaciones){
124 //System.out.println(Recomendacion.text());
125 re.add(Recomendacion.text());
126 if(Recomendacion.text().equals("Lo recomendaría")){
127 contr.add(contreco++);
128 }
129 }
130 System.out.println("conreco: "+contreco);
131 for(Element User : Users){
132 //System.out.println(User.text());
133 us.add(User.text());
134 }
135 for(Element Ubicacion : Ubicaciones){
136 //System.out.println(Ubicacion.text());
137 ub.add(Ubicacion.text());
138 }
139 for(Element CaracteristicaHotel: CaracteristicasHotel){
140 //System.out.println(Ubicacion.text());
141 iys.add(CaracteristicaHotel.text());
142 }
143 for(Element NombreHotel : HotelName){
144 //System.out.println(TituloComentario.text());
145 hn.add(NombreHotel.text());
146 }
147 for(Element Fecha : Fechas){
148 //System.out.println(Fecha.text());
149 f.add(Fecha.text());
150 }
151 for(Element Proposito : Propositos){
152 //System.out.println(Proposito.text());
153 p.add(Proposito.text());
154 }
155 for(Element currentPage : currentPages){
156 //System.out.println(Proposito.text());
157 cp.add(currentPage.text());
158 }
159 String calle=null;160 for(Element callehotel: streetAddress){
161 //System.out.println(Ubicacion.text());
162 calle=callehotel.text();
163 }
164 String ciudad=null;165 for(Element ciudadhotel: addressLocality){
166 //System.out.println(Ubicacion.text());
167 ciudad=ciudadhotel.text();
168 }
88
169 for(Element NoRating : NoRatings){
170 System.out.println(NoRatings);
171 System.out.println(NoRating.text());
172 System.out.println("Página No Rating: "+i);
173 String noRating=NoRating.text();
174 if(noRating.equals("Sin puntuación")){
175 ContNoRating++;
176 System.out.println("ContNoRating: "+ContNoRating);
177 iys.add(ra.get(ra.size()-1));
178 }
179 }
180 list.setTitulosComentarios(tc);
181 list.setComentarios(co);
182 list.setRatings(ra);
183 list.setUbicaciones(ub);
184 list.setUsers(us);
185 list.setRecomendaciones(re);
186 list.setCaracteristicasHotel(iys);
187 list.setHotelName(hn);
188 list.setFechas(f);
189 list.setPropositos(p);
190 list.setCurrentPages(cp);
191 list.setCountViajeros(countV);
192 list.setCiudadHotel(ciudad);
193 int porcentaje=(100*contr.size())/(list.TitulosComentarios.size());
194 list.setTotalRecomendación(porcentaje);
195 String[] Calle=calle.split(" ");
196 String calle1=Calle[4];
197 String[] calle2=calle1.split(",");
198 list.setDireccionHotel(Calle[3]+" "+calle2[0]);
199 int aux=0;
200 int CantComenEndPage=countV/10;
201 list.setCantidadComentarioPage(CantComenEndPage);
202 }
203 }catch(Exception e){
204 e.printStackTrace();
205 JOptionPane.showInternalMessageDialog(null, "Error de Conexión");
206 }
207 System.out.println("currentPage :"+list.currentPages);
208 System.out.println("countViajeros :"+list.countViajeros);
209 System.out.println("size: "+size);
210 System.out.println("linkes: "+listLink);
211 System.out.println("list: "+list.TitulosComentarios);
212 System.out.println("list: "+list.Comentarios);
213 System.out.println("list: "+list.CaracteristicasHotel);
214 ArrayList<String> instalaciones =new ArrayList();
215 ArrayList<String> limpieza =new ArrayList();
216 ArrayList<String> comodidad =new ArrayList();
217 ArrayList<String> personal =new ArrayList();
89
218 ArrayList<String> ubicacion =new ArrayList();
219 ArrayList<String> calidad =new ArrayList();
220 int k=0;
221 for(int j=0;j<list.TitulosComentarios.size();j++){
222 instalaciones.add(list.CaracteristicasHotel.get(k));
223 limpieza.add(list.CaracteristicasHotel.get(k+1));
224 personal.add(list.CaracteristicasHotel.get(k+2));
225 comodidad.add(list.CaracteristicasHotel.get(k+3));
226 ubicacion.add(list.CaracteristicasHotel.get(k+4));
227 calidad.add(list.CaracteristicasHotel.get(k+5));
228 System.out.print(list.CaracteristicasHotel.get(k)+" , ");
229 System.out.print(list.CaracteristicasHotel.get(k+1)+" , ");
230 System.out.print(list.CaracteristicasHotel.get(k+2)+" , ");
231 System.out.print(list.CaracteristicasHotel.get(k+3)+" , ");
232 System.out.print(list.CaracteristicasHotel.get(k+4)+" , ");
233 System.out.println(list.CaracteristicasHotel.get(k+5)+" , ");
234 k=k+6;
235 //System.out.println("j: "+j);
236 //System.out.println("k: "+k);
237 //System.out.println("largo: "+list.TitulosComentarios.size());
238 //if(k==60) break;
239 }
240 list.setIyS(instalaciones);
241 list.setLimpieza(limpieza);
242 list.setPersonal(personal);
243 list.setComodidad(comodidad);
244 list.setUbicacion(ubicacion);
245 list.setCalidad(calidad);
246 System.out.println("C.H.: "+list.CaracteristicasHotel);
247 System.out.println(list.IyS);
248 System.out.println(list.Limpieza);
249 System.out.println(list.Personal);
250 System.out.println(list.Comodidad);
251 System.out.println(list.Ubicacion);
252 System.out.println(list.Calidad);
253 return list;
254 }
255 }
1 public class Ventana1 extends JFrame{
2 public JFrame frmMineraWeb;
3 public Ventana1() {
4 //crea la ventana 1
5 setTitle("Miner\u00EDa Web");
6 setBounds(100, 100, 579, 487);
7 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
8 getContentPane().setLayout(null);9 JTextPane txtpn = new JTextPane();
90
10 txtpn.setText("Aplicaci\u00F3n de Miner\u00EDa de Datos desarrollada para
Proyecto 1 con el objetivo de extraer datos del sitio web transaccional
Hotelclub.com, y as\u00ED mejorar la calidad de los servicios de este.\r
\nLos datos extra\u00EDdos son:\r\n\r\n-Nombre Hotel\r\n-Titutlos de
comentarios\r\n-Comentarios\r\n-Notas de Comentarios\r\n-Nobres de
Usuario\r\n-Ubicaci\u00F3n de Usuario\r\n-Recomendaci\u00F3n\r\n\r\nAdem
\u00E1s de algunas notas especificas de los servicios encontrados como
lo son:\r\n\r\n-Instalaciones y servicios\r\n-Limpieza\r\n-Personal del
Hotel\r\n-Comodidad\r\n-Ubicaci\u00F3n\r\n-Calidad-Precio");
11 txtpn.setBounds(20, 22, 523, 328);
12 getContentPane().add(txtpn);
13 Agregar_Hotel();
14 Elegir_Hotel(); //sección datos del usuario del sistema
15 Boton_Salir(); //boton salir de la ventana 1
16 }
17 public void Agregar_Hotel(){
18 final ObtenerHoteles OH = new ObtenerHoteles();
19 JButton btnAgregarHotel = new JButton("Agregar Hotel");
20 btnAgregarHotel.addActionListener(new ActionListener() {
21 public void actionPerformed(ActionEvent e) {
22 String link = null;23 do{24 link = (String)JOptionPane.showInputDialog(null,25 "Ingrese LINK de la locación buscada en Hotelclub.com");
26 if(link!=null){27 try {
28 OH.ExtraerHotel(link);
29 } catch (IOException e1) {
30 // TODO Auto-generated catch block
31 e1.printStackTrace();
32 System.out.println("Error en la función!");
33 System.exit(0);
34 }
35 }else{36 JOptionPane.showMessageDialog(null, "El LINK ingresado no es valido, por
favor ingrese otro");
37 System.exit(0);
38 }
39 }while(link==null);40 }
41 });
42 btnAgregarHotel.setBounds(20, 387, 150, 23);
43 getContentPane().add(btnAgregarHotel);
44 }
45 public void Boton_Salir(){
46 JButton btnSalir = new JButton("Salir");
47 btnSalir.addActionListener(new ActionListener() {
48 public void actionPerformed(ActionEvent arg0) {
49 System.exit(0);
91
50 }
51 });
52 btnSalir.setBounds(393, 387, 150, 23);
53 getContentPane().add(btnSalir);
54 }
55 public void Elegir_Hotel(){
56 final Ventana2 ventana2 = new Ventana2();
57 JButton btnEntrar = new JButton("Elegir Hotel");
58 btnEntrar.addActionListener(new ActionListener() {
59 public void actionPerformed(ActionEvent arg0) {
60 ventana2.setVisible(true);61 dispose();
62 }
63 });
64 btnEntrar.setBounds(202, 387, 150, 23);
65 getContentPane().add(btnEntrar);
66 }
67 }
1 public class Ventana2 extends JFrame {
2 private JPanel contentPane;
3 public Ventana2() {
4 //crea la venatana 2
5 setTitle("Selecci\u00F3n de Locaci\u00F3n y Hotel");
6 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
7 setBounds(100, 100, 450, 368);
8 contentPane = new JPanel();
9 contentPane.setBorder(new EmptyBorder(5, 5, 5, 5));
10 setContentPane(contentPane);
11 contentPane.setLayout(null);12 Seleccione_Locacion();
13 Boton_Salir(); //boton para salir de la ventana 2
14 }
15 public void Boton_Siguiente(JComboBox cmb_hotel, JComboBox cmb_locacion){
16 Leer_y_Escribir_Ficheros write_read = new Leer_y_Escribir_Ficheros();
17 ArrayList lectura_archivo = write_read.Leer_Fichero(cmb_locacion);
18 JButton btn_ingresar = new JButton("Siguiente");
19 btn_ingresar.addActionListener(new ActionListener() {
20 public void actionPerformed(ActionEvent e) {
21 ExtractDataWeb edw = new ExtractDataWeb();
22 String link = null;23 int i=0;
24 while(i<lectura_archivo.size()){25 if(cmb_hotel.getSelectedItem().equals(lectura_archivo.get(i))){26 link=(String) lectura_archivo.get(i+1);
27 }
28 i=i+2;
29 }
92
30 if(link==null){31 System.out.println("Error en el link");
32 }
33 System.out.println("El link elegido es: "+link);
34 System.out.println("El Hotel elegido es: "+cmb_hotel.getSelectedItem());
35 final Ventana5 ventana5 = new Ventana5(link);
36 ventana5.setVisible(true);37 dispose();
38 }
39 });
40 btn_ingresar.setFont(new Font("Times New Roman", Font.BOLD, 14));
41 btn_ingresar.setBounds(166, 288, 103, 31);
42 contentPane.add(btn_ingresar);
43 }
44 public void Boton_Salir(){
45 JButton btn_salir = new JButton("Salir");
46 btn_salir.setFont(new Font("Times New Roman", Font.BOLD, 14));
47 btn_salir.addActionListener(new ActionListener() {
48 public void actionPerformed(ActionEvent arg0) {
49 System.out.println("Salir");
50 System.exit(0);
51 }
52 });
53 btn_salir.setBounds(279, 288, 96, 31);
54 contentPane.add(btn_salir);
55 {
56 JButton btnAtras = new JButton("Atras");
57 btnAtras.addActionListener(new ActionListener() {
58 public void actionPerformed(ActionEvent e) {
59 final Ventana1 ventana1 = new Ventana1();
60 ventana1.setVisible(true);61 dispose();
62 }
63 });
64 btnAtras.setFont(new Font("Times New Roman", Font.BOLD, 14));
65 btnAtras.setBounds(53, 288, 103, 31);
66 contentPane.add(btnAtras);
67 }
68 }
69 public JComboBox Seleccione_Locacion(){
70 JLabel lblNewLabel = new JLabel("Seleccione Locaci\u00F3n");
71 lblNewLabel.setFont(new Font("Times New Roman", Font.BOLD, 14));
72 lblNewLabel.setBounds(88, 16, 151, 20);
73 contentPane.add(lblNewLabel);
74 final JComboBox cmb_locacion = new JComboBox();
75 cmb_locacion.setFont(new Font("Times New Roman", Font.PLAIN, 12));
76 cmb_locacion.setModel(new DefaultComboBoxModel(new String[] {"Santiago de
Chile",
77 "Viña del Mar","Nueva York", "Buenos Aires"}));
93
78 cmb_locacion.setBounds(88, 47, 268, 25);
79 contentPane.add(cmb_locacion);
80 Seleccione_Hotel(cmb_locacion);
81 return cmb_locacion;
82 }
83 public void Seleccione_Hotel(JComboBox cmb_locacion){
84 cmb_locacion.addActionListener(new ActionListener(){
85 public void actionPerformed(ActionEvent e) {
86 Vector comboBoxItems=new Vector();
87 Leer_y_Escribir_Ficheros write_read = new Leer_y_Escribir_Ficheros();
88 ArrayList lectura_archivo = write_read.Leer_Fichero(cmb_locacion);
89 for(int i=0;i<lectura_archivo.size();i=i+2){
90 comboBoxItems.add(lectura_archivo.get(i));
91 }
92 JLabel lblSeleccineHotel = new JLabel("Selecci\u00F3ne Hotel");
93 lblSeleccineHotel.setFont(new Font("Times New Roman", Font.BOLD, 14));
94 lblSeleccineHotel.setBounds(88, 90, 151, 20);
95 contentPane.add(lblSeleccineHotel);
96 final DefaultComboBoxModel model = new DefaultComboBoxModel(comboBoxItems);
97 final JComboBox cmb_hotel = new JComboBox(model);
98 cmb_hotel.setMaximumRowCount(20);
99 cmb_hotel.setFont(new Font("Times New Roman", Font.PLAIN, 12));
100 cmb_hotel.setBounds(88, 121, 268, 25);
101 contentPane.add(cmb_hotel);
102 Boton_Siguiente(cmb_hotel,cmb_locacion);
103 }
104 });
105 }
106 }
1 public class Ventana3 extends JFrame{
2 public ListaObjetos list = new ListaObjetos();
3 public ListaEstadisticas list_est = new ListaEstadisticas();
4 public Estadisticas est = new Estadisticas();
5 public Ventana3(ListaObjetos list){
6 JFrame f = new JFrame("Datos Extraídos");
7 Container content = f.getContentPane();
8 Ventana3(list);
9 Boton_Salir(content);
10 Boton_Atras(content);
11 }
12 public void Boton_Salir(Container content){
13 JButton btnSalir = new JButton("Salir");
14 btnSalir.addActionListener(new ActionListener() {
15 public void actionPerformed(ActionEvent e) {
16 System.exit(0);
17 }
18 });
94
19 btnSalir.setBounds(305, 456, 107, 29);
20 content.add(btnSalir);
21 }
22 public void Boton_Atras(Container content){
23 JButton btnAtras = new JButton("Atras");
24 final Ventana2 ventana2 = new Ventana2();
25 btnAtras.addActionListener(new ActionListener() {
26 public void actionPerformed(ActionEvent e) {
27 ventana2.setVisible(true);28 dispose();
29 }
30 });
31 btnAtras.setBounds(177, 456, 107, 29);
32 content.add(btnAtras);
33 }
34 public void Ventana3(ListaObjetos list){
35 JFrame f = new JFrame("Datos Extraídos");
36 Container content = f.getContentPane();
37 JTree tree = new JTree();
38 tree.setModel(new DefaultTreeModel(
39 new DefaultMutableTreeNode("Extracción de Datos"){
40 {
41 int j=1;
42 DefaultMutableTreeNode node_1;
43 for(int i=0;i<list.TitulosComentarios.size();i++){
44 node_1 = new DefaultMutableTreeNode("Comentario "+j);
45 node_1.add(new DefaultMutableTreeNode("Fecha: "+
46 list.getFechas().get(i)));
47 node_1.add(new DefaultMutableTreeNode("Proposito: "+
48 list.getPropositos().get(i)));
49 node_1.add(new DefaultMutableTreeNode("Titulo Comentario: "+
50 list.getTitulosComentarios().get(i)));
51 node_1.add(new DefaultMutableTreeNode("Comentario: "+
52 list.getComentarios().get(i)));
53 node_1.add(new DefaultMutableTreeNode("Rating: "+
54 list.getRatings().get(i)));
55 node_1.add(new DefaultMutableTreeNode("Recomendación: "+
56 list.getRecomendaciones().get(i)));
57 node_1.add(new DefaultMutableTreeNode("Usuario: "+
58 list.getUsers().get(i)));
59 node_1.add(new DefaultMutableTreeNode("Ubicación: "+
60 list.getUbicaciones().get(i)));
61 node_1.add(new DefaultMutableTreeNode("Instalaciones y Servicios: "+
62 list.IyS.get(i)));
63 node_1.add(new DefaultMutableTreeNode("Limpieza: "+
64 list.Limpieza.get(i)));
65 node_1.add(new DefaultMutableTreeNode("Personal del hotel: "+
66 list.Personal.get(i)));
67 node_1.add(new DefaultMutableTreeNode("Comodidad: "+
95
68 list.Comodidad.get(i)));
69 node_1.add(new DefaultMutableTreeNode("Ubicación: "+
70 list.Ubicacion.get(i)));
71 node_1.add(new DefaultMutableTreeNode("Calidad-Precio: "+
72 list.Calidad.get(i)));
73 add(node_1);
74 j++;
75 }}}));
76 JScrollPane scrollPane = new JScrollPane(tree);
77 content.add(scrollPane, BorderLayout.CENTER);
78 f.setSize(550, 434);
79 f.setVisible(true);80 }}
1 public class Ventana5 extends JFrame {
2 private JPanel contentPane;
3 public ListaObjetos list = new ListaObjetos();
4 public ListaEstadisticas list_est = new ListaEstadisticas();
5 public Estadisticas est = new Estadisticas();
6 public String Link;
7 public Ventana5(String link) {
8 setTitle("Menu");
9 setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
10 setBounds(100, 100, 760, 340);
11 contentPane = new JPanel();
12 contentPane.setBorder(new EmptyBorder(5, 5, 5, 5));
13 setContentPane(contentPane);
14 contentPane.setLayout(null);15 Link=link;
16 System.out.println(Link);
17 ExtractDataWeb edw = new ExtractDataWeb();
18 try {
19 list=edw.ExtraerData(Link);
20 } catch (IOException e) {
21 e.printStackTrace();
22 }
23 JLabel lblNewLabel1 = new JLabel("Nombre Hotel: "+list.HotelName.get(0));
24 lblNewLabel1.setFont(new Font("Times New Roman", Font.BOLD, 14));
25 lblNewLabel1.setBounds(390, 40, 600, 20);
26 contentPane.add(lblNewLabel1);
27 JLabel lblNewLabel2 = new JLabel("Cantidad de Comentarios: "+list.
countViajeros);
28 lblNewLabel2.setFont(new Font("Times New Roman", Font.BOLD, 14));
29 lblNewLabel2.setBounds(390, 70, 600, 20);
30 contentPane.add(lblNewLabel2);
31 JLabel lblNewLabel3 = new JLabel("Ciudad del Hotel: "+list.CiudadHotel);
32 lblNewLabel3.setFont(new Font("Times New Roman", Font.BOLD, 14));
33 lblNewLabel3.setBounds(390, 100, 600, 20);
96
34 contentPane.add(lblNewLabel3);
35 JLabel lblNewLabel4 = new JLabel("Dirección del Hotels: "+list.
DireccionHotel);
36 lblNewLabel4.setFont(new Font("Times New Roman", Font.BOLD, 14));
37 lblNewLabel4.setBounds(390, 130, 600, 20);
38 contentPane.add(lblNewLabel4);
39 JLabel lblNewLabel5 = new JLabel("Recomendación: "+list.TotalRecomendación+"
%");
40 lblNewLabel5.setFont(new Font("Times New Roman", Font.BOLD, 14));
41 lblNewLabel5.setBounds(390, 160, 600, 20);
42 contentPane.add(lblNewLabel5);
43 VisualizarComentarios(list,Link);
44 CrearExcel(list);
45 VisualizarEstadisticas(list,Link);
46 VisualizarAnalisisDeCorrelación(list,Link);
47 Atras();
48 Salir();
49 }
50 public void VisualizarComentarios(ListaObjetos list, String Link){
51 JButton btnNewButton = new JButton("Visualizar Comentarios");
52 btnNewButton.addActionListener(new ActionListener() {
53 public void actionPerformed(ActionEvent e) {
54 final Ventana3 prueba=new Ventana3(list);
55 }
56 });
57 btnNewButton.setBounds(106, 30, 230, 30);
58 contentPane.add(btnNewButton);
59 }
60 public void CrearExcel(ListaObjetos list){
61 JButton btnCrearExcelCon = new JButton("Crear Excel con los Datos");
62 btnCrearExcelCon.addActionListener(new ActionListener() {
63 CreateExcel excel = new CreateExcel();
64 public void actionPerformed(ActionEvent e) {
65 excel.CrearExcel(list);
66 System.out.println("Crear Excel");
67 }
68 });
69 btnCrearExcelCon.setBounds(106, 70, 230, 30);
70 contentPane.add(btnCrearExcelCon);
71
72 }
73 public void VisualizarEstadisticas(ListaObjetos list, String Link){
74 JButton btnVisualizarEstadisticas = new JButton("Visualizar Estadísticas");
75 Estadisticas le = new Estadisticas();
76 list_est=le.Estadisticas(list);
77 btnVisualizarEstadisticas.addActionListener(new ActionListener() {
78 public void actionPerformed(ActionEvent e) {
79 System.out.println("Visualizar Estadísticas");
80 final Ventana6 ventana6 = new Ventana6(list,list_est);
97
81 }
82 });
83 btnVisualizarEstadisticas.setBounds(106, 110, 230, 30);
84 contentPane.add(btnVisualizarEstadisticas);
85 }
86 public void VisualizarAnalisisDeCorrelación(ListaObjetos list, String Link){
87 JButton btnVisualizarADC = new JButton("Visualizar Análisis de Correlación")
;
88 btnVisualizarADC.addActionListener(new ActionListener() {
89 public void actionPerformed(ActionEvent e) {
90 Analisis_de_Correlacion ADC = new Analisis_de_Correlacion();
91 double[][] correlacion = ADC.EjecutarAnalisis(list);
92 final Ventana7 ventana7 = new Ventana7(correlacion);
93 System.out.println("Visualizar Análisis de Correlación");
94 }
95 });
96 btnVisualizarADC.setBounds(106, 150, 230, 30);
97 contentPane.add(btnVisualizarADC);
98 }
99 public void Atras(){
100 final Ventana2 ventana2 = new Ventana2();
101 JButton btnAtras = new JButton("Atras");
102 btnAtras.addActionListener(new ActionListener() {
103 public void actionPerformed(ActionEvent arg0) {
104 System.out.println("Atras");
105 ventana2.setVisible(true);106 dispose();
107 }
108 });
109 btnAtras.setBounds(106, 190, 230, 30);
110 contentPane.add(btnAtras);
111 }
112
113 public void Salir(){
114 JButton btnSalir = new JButton("Salir");
115 btnSalir.addActionListener(new ActionListener() {
116 public void actionPerformed(ActionEvent arg0) {
117 System.out.println("Salir");
118 System.exit(0);
119 }
120 });
121 btnSalir.setBounds(106, 230, 230, 30);
122 contentPane.add(btnSalir);
123 }
124 }
1 public class Ventana6 extends JFrame{
2 public ListaObjetos list = new ListaObjetos();
98
3 public ListaEstadisticas list_est = new ListaEstadisticas();
4 public Estadisticas est = new Estadisticas();
5 public Ventana6(ListaObjetos list, ListaEstadisticas list_est){
6 JFrame f = new JFrame("Datos Extraídos");
7 Container content = f.getContentPane();
8 TableModel(list,list_est);
9 Boton_Salir(content);
10 Boton_Atras(content);
11 }
12 public void Boton_Salir(Container content){
13 JButton btnSalir = new JButton("Salir");
14 btnSalir.addActionListener(new ActionListener() {
15 public void actionPerformed(ActionEvent e) {
16 System.exit(0);
17 }
18 });
19 btnSalir.setBounds(305, 456, 107, 29);
20 content.add(btnSalir);
21 }
22 public void Boton_Atras(Container content){
23 JButton btnAtras = new JButton("Atras");
24 final Ventana2 ventana2 = new Ventana2();
25 btnAtras.addActionListener(new ActionListener() {
26 public void actionPerformed(ActionEvent e) {
27 ventana2.setVisible(true);28 dispose();
29 }
30 });
31 btnAtras.setBounds(177, 456, 107, 29);
32 content.add(btnAtras);
33 }
34 public void TableModel(ListaObjetos list, ListaEstadisticas list_est){
35 JFrame f = new JFrame("Datos Extraídos");
36 //f.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
37 Container content = f.getContentPane();
38 DecimalFormat decimales = new DecimalFormat("0.00");
39 JTable table_1 = new JTable();
40 table_1.setFont(new Font("Times New Roman", Font.PLAIN, 12));
41 DefaultTableModel dtm = new DefaultTableModel(0,0);
42 String header[] = new String[]{"N\u00B0 Comentario", "Ranting", "
Instalaciones y Servicios",
43 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-
Precio"};
44 dtm.setColumnIdentifiers(header);
45 table_1.setModel(dtm);
46 int j=1;
47 dtm.addRow(new String[]{"N\u00B0 Comentario", "Ranting", "Instalaciones y
Servicios",
48 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-
99
Precio"});
49 for(int i=0;i<list.countViajeros;i++){
50 dtm.addRow(new Object[]{j,list.Ratings.get(i),list.IyS.get(i),list.Limpieza.
get(i),
51 list.Personal.get(i),list.Comodidad.get(i),list.Ubicacion.get(i),list.
Calidad.get(i)});
52 j++;
53 }
54 dtm.addRow(new String[]{"Media",
55 decimales.format(list_est.Media.get(0)).toString(),
56 decimales.format(list_est.Media.get(1)).toString(),
57 decimales.format(list_est.Media.get(2)).toString(),
58 decimales.format(list_est.Media.get(3)).toString(),
59 decimales.format(list_est.Media.get(4)).toString(),
60 decimales.format(list_est.Media.get(5)).toString(),
61 decimales.format(list_est.Media.get(6)).toString()});
62 dtm.addRow(new String[]{"Varianza",
63 decimales.format(list_est.Varianza.get(0)).toString(),
64 decimales.format(list_est.Varianza.get(1)).toString(),
65 decimales.format(list_est.Varianza.get(2)).toString(),
66 decimales.format(list_est.Varianza.get(3)).toString(),
67 decimales.format(list_est.Varianza.get(4)).toString(),
68 decimales.format(list_est.Varianza.get(5)).toString(),
69 decimales.format(list_est.Varianza.get(6)).toString()});
70 dtm.addRow(new String[]{"Desviación Estandar", decimales.format(list_est.
DesviacionEstandar.get(0)).toString(),
71 decimales.format(list_est.DesviacionEstandar.get(1)).toString(),
72 decimales.format(list_est.DesviacionEstandar.get(2)).toString(),
73 decimales.format(list_est.DesviacionEstandar.get(3)).toString(),
74 decimales.format(list_est.DesviacionEstandar.get(4)).toString(),
75 decimales.format( list_est.DesviacionEstandar.get(4)).toString(),
76 decimales.format( list_est.DesviacionEstandar.get(6)).toString()});
77 table_1.getColumnModel().getColumn(0).setPreferredWidth(106);
78 table_1.getColumnModel().getColumn(2).setResizable(false);79 table_1.getColumnModel().getColumn(2).setPreferredWidth(132);
80 table_1.getColumnModel().getColumn(3).setResizable(false);81 table_1.getColumnModel().getColumn(3).setPreferredWidth(67);
82 table_1.getColumnModel().getColumn(4).setResizable(false);83 table_1.getColumnModel().getColumn(4).setPreferredWidth(107);
84 table_1.getColumnModel().getColumn(5).setResizable(false);85 table_1.getColumnModel().getColumn(5).setPreferredWidth(69);
86 table_1.getColumnModel().getColumn(6).setResizable(false);87 table_1.getColumnModel().getColumn(6).setPreferredWidth(60);
88 table_1.getColumnModel().getColumn(7).setResizable(false);89 table_1.getColumnModel().getColumn(7).setPreferredWidth(90);
90 table_1.setSelectionMode(ListSelectionModel.MULTIPLE_INTERVAL_SELECTION);
91 table_1.setBorder(UIManager.getBorder("Table.focusCellHighlightBorder"));
92 table_1.setBounds(10, 11, 731, 346);
93 add(table_1);
100
94 JScrollPane scrollPane = new JScrollPane(table_1);
95 content.add(scrollPane, BorderLayout.CENTER);
96 f.setSize(731, 346);
97 f.setVisible(true);98 }
99 }
1 public class Ventana7 extends JFrame {
2 private JTable table_1;
3 public Ventana7(double[][] correlacion) {
4 JFrame f = new JFrame("Análisis de Correlación");
5 Container content = f.getContentPane();
6 TableModel(correlacion);
7 Boton_Salir(content);
8 Boton_Atras(content);
9 }
10 public void Boton_Salir(Container content){
11 JButton btnSalir = new JButton("Salir");
12 btnSalir.addActionListener(new ActionListener() {
13 public void actionPerformed(ActionEvent e) {
14 System.exit(0);
15 }
16 });
17 btnSalir.setBounds(305, 456, 107, 29);
18 content.add(btnSalir);
19 }
20 public void Boton_Atras(Container content){
21 JButton btnAtras = new JButton("Atras");
22 final Ventana2 ventana2 = new Ventana2();
23 btnAtras.addActionListener(new ActionListener() {
24 public void actionPerformed(ActionEvent e) {
25 ventana2.setVisible(true);26 dispose();
27 }
28 });
29 btnAtras.setBounds(177, 456, 107, 29);
30 content.add(btnAtras);
31 }
32 public void TableModel(double[][] Correlacion){
33 JFrame f = new JFrame("Análisis de Correlación");
34 //f.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
35 Container content = f.getContentPane();
36 DecimalFormat decimales = new DecimalFormat("0.00");
37 JTable table_1 = new JTable();
38 table_1.setFont(new Font("Times New Roman", Font.PLAIN, 12));
39 DefaultTableModel dtm = new DefaultTableModel(0,0);
40 String header[] = new String[]{"Dimensiones", "Ranting", "Instalaciones y
Servicios",
101
41 "Limpieza", "Personal del Hotel", "Comodidad", "Ubicaci\u00F3n", "Calidad-
Precio"};
42 dtm.setColumnIdentifiers(header);
43 table_1.setModel(dtm);
44 int j=1;
45 dtm.addRow(new Object[]{"Rating",
decimales.format(Correlacion[0][0]),decimales.format(Correlacion[0][1]),
46 decimales.format(Correlacion[0][2]),decimales.format(Correlacion[0][3]),
47 decimales.format(Correlacion[0][4]),decimales.format(Correlacion[0][5]),
48 decimales.format(Correlacion[0][6])});
49 dtm.addRow(new Object[]{"Instalaciones y Servicios",
50 decimales.format(Correlacion[1][0]),decimales.format(Correlacion[1][1]),
51 decimales.format(Correlacion[1][2]),decimales.format(Correlacion[1][3]),
52 decimales.format(Correlacion[1][4]),decimales.format(Correlacion[1][5]),
53 decimales.format(Correlacion[1][6])});
54 dtm.addRow(new Object[]{"Limpieza",
decimales.format(Correlacion[2][0]),decimales.format(Correlacion[2][1]),
55 decimales.format(Correlacion[2][2]),decimales.format(Correlacion[2][3]),
56 decimales.format(Correlacion[2][4]),decimales.format(Correlacion[2][5]),
57 decimales.format(Correlacion[2][6])});
58 dtm.addRow(new Object[]{"Personal del Hotel", decimales.format(
Correlacion[3][0]),decimales.format(Correlacion[3][1]),
59 decimales.format(Correlacion[3][2]),decimales.format(Correlacion[3][3]),
60 decimales.format(Correlacion[3][4]),decimales.format(Correlacion[3][5]),
61 decimales.format(Correlacion[3][6])});
62 dtm.addRow(new Object[]{"Comodidad", decimales.
format(Correlacion[4][0]),decimales.format(Correlacion[4][1]),
63 decimales.format(Correlacion[4][2]),decimales.format(Correlacion[4][3]),
64 decimales.format(Correlacion[4][4]),decimales.format(Correlacion[4][5]),
65 decimales.format(Correlacion[4][6])});
66 dtm.addRow(new Object[]{"Ubicaciones", decimales.
format(Correlacion[5][0]),decimales.format(Correlacion[5][1]),
67 decimales.format(Correlacion[5][2]),decimales.format(Correlacion[5][3]),
68 decimales.format(Correlacion[5][4]),decimales.format(Correlacion[5][5]),
69 decimales.format(Correlacion[5][6])});
70 dtm.addRow(new Object[]{"Calidad-Precio", decimales.
format(Correlacion[6][0]),decimales.format(Correlacion[6][1]),
71 decimales.format(Correlacion[6][2]),decimales.format(Correlacion[6][3]),
72 decimales.format(Correlacion[6][4]),decimales.format(Correlacion[6][5]),
73 decimales.format(Correlacion[6][6])});
74 table_1.getColumnModel().getColumn(0).setPreferredWidth(106);
75 table_1.getColumnModel().getColumn(2).setResizable(false);76 table_1.getColumnModel().getColumn(2).setPreferredWidth(132);
77 table_1.getColumnModel().getColumn(3).setResizable(false);78 table_1.getColumnModel().getColumn(3).setPreferredWidth(67);
79 table_1.getColumnModel().getColumn(4).setResizable(false);80 table_1.getColumnModel().getColumn(4).setPreferredWidth(107);
81 table_1.getColumnModel().getColumn(5).setResizable(false);82 table_1.getColumnModel().getColumn(5).setPreferredWidth(69);
102
83 table_1.getColumnModel().getColumn(6).setResizable(false);84 table_1.getColumnModel().getColumn(6).setPreferredWidth(60);
85 table_1.getColumnModel().getColumn(7).setResizable(false);86 table_1.getColumnModel().getColumn(7).setPreferredWidth(90);
87 table_1.setSelectionMode(ListSelectionModel.MULTIPLE_INTERVAL_SELECTION);
88 table_1.setBorder(UIManager.getBorder("Table.focusCellHighlightBorder"));
89 table_1.setBounds(10, 11, 731, 346);
90 add(table_1);
91 JScrollPane scrollPane = new JScrollPane(table_1);
92 content.add(scrollPane, BorderLayout.CENTER);
93 f.setSize(731, 346);
94 f.setVisible(true);95 }
96 }
1 public class Estadisticas {
2 public ListaObjetos list = new ListaObjetos();
3 public ListaEstadisticas list_est=new ListaEstadisticas();
4 public Estadisticas(){
5 }
6 public ListaEstadisticas Estadisticas(ListaObjetos list) {
7 ArrayList<Float> media = new ArrayList();
8 ArrayList<Double> varianza = new ArrayList();
9 ArrayList<Double> desviacionestandar = new ArrayList();;
10 int num=list.Comentarios.size();
11 System.out.println("num: "+num);
12 int SumatoriaRating=0;
13 int SumatoriaIyS=0;
14 int SumatoriaLimpieza=0;
15 int SumatoriaPdelH=0;
16 int SumatoriaComodidad=0;
17 int SumatoriaUbucacion=0;
18 int SumatoriaCyP=0;
19 int flag=0;
20 for(int i=0;i<num;i++){
21 SumatoriaRating=SumatoriaRating+Integer.parseInt(list.Ratings.get(i));
22 }
23 float mediaR=Media(SumatoriaRating, num);
24 media.add(mediaR);
25 flag=1;
26 double varianzaR=Varianza(mediaR,num,list,flag);
27 varianza.add(varianzaR);
28 double desviacionR=DesviacionEstandar(varianzaR);
29 desviacionestandar.add(desviacionR);
30 for(int i=0;i<num;i++){
31 SumatoriaIyS=SumatoriaIyS+Integer.parseInt(list.IyS.get(i));
32 }
33 float mediaIyS=Media(SumatoriaIyS, num);
103
34 media.add(mediaIyS);
35 flag=2;
36 double varianzaIyS=Varianza(mediaIyS,num,list,flag);
37 varianza.add(varianzaIyS);
38 double desviacionIyS=DesviacionEstandar(varianzaIyS);
39 desviacionestandar.add(desviacionIyS);
40 for(int i=0;i<num;i++){
41 SumatoriaLimpieza=SumatoriaLimpieza+Integer.parseInt(list.Limpieza.get(i));
42 }
43 float mediaLimpieza=Media(SumatoriaLimpieza,num);
44 media.add(mediaLimpieza);
45 flag=3;
46 double varianzaLimpieza=Varianza(mediaLimpieza,num,list,flag);
47 varianza.add(varianzaLimpieza);
48 double desviacionLimpieza=DesviacionEstandar(varianzaLimpieza);
49 desviacionestandar.add(desviacionLimpieza);
50 for(int i=0;i<num;i++){
51 SumatoriaPdelH=SumatoriaPdelH+Integer.parseInt(list.Personal.get(i));
52 }
53 float mediaPdelH=Media(SumatoriaPdelH,num);
54 media.add(mediaPdelH);
55 flag=4;
56 double varianzaPdelH=Varianza(mediaPdelH,num,list,flag);
57 varianza.add(varianzaPdelH);
58 double desviacionPdelH=DesviacionEstandar(varianzaPdelH);
59 desviacionestandar.add(desviacionPdelH);
60 for(int i=0;i<num;i++){
61 SumatoriaComodidad=SumatoriaComodidad+Integer.parseInt(list.Comodidad.get(i)
);
62 }
63 float mediaComodidad=Media(SumatoriaComodidad,num);
64 media.add(mediaComodidad);
65 flag=5;
66 double varianzaComodidad=Varianza(mediaComodidad,num,list,flag);
67 varianza.add(varianzaComodidad);
68 double desviacionComodidad=DesviacionEstandar(varianzaComodidad);
69 desviacionestandar.add(desviacionComodidad);
70 for(int i=0;i<num;i++){
71 SumatoriaUbucacion=SumatoriaUbucacion+Integer.parseInt(list.Ubicacion.get(i)
);
72 }
73 float mediaUbucacion=Media(SumatoriaUbucacion,num);
74 media.add(mediaUbucacion);
75 flag=6;
76 double varianzaUbicacion=Varianza(mediaUbucacion,num,list,flag);
77 varianza.add(varianzaUbicacion);
78 double desviacionUbicacion=DesviacionEstandar(varianzaUbicacion);
79 desviacionestandar.add(desviacionUbicacion);
80 for(int i=0;i<num;i++){
104
81 SumatoriaCyP=SumatoriaCyP+Integer.parseInt(list.Calidad.get(i));
82 }
83 float mediaCyP=Media(SumatoriaCyP,num);
84 media.add(mediaCyP);
85 flag=7;
86 double varianzaCyP=Varianza(mediaCyP,num,list,flag);
87 varianza.add(varianzaCyP);
88 double desviacionCyP=DesviacionEstandar(varianzaCyP);
89 desviacionestandar.add(desviacionCyP);
90 list_est.setMedia(media);
91 list_est.setVarianza(varianza);
92 list_est.setDesviacionEstandar(desviacionestandar);
93 return list_est;
94 }
95 public float Media(int sumatoria, int num){
96 float media = 0;
97 media = sumatoria / (num*1.0f);
98 return media;
99 }
100 public double Varianza(float media, int num, ListaObjetos list, int flag){
101 DecimalFormat decimales = new DecimalFormat("0.00");
102 int valor[] = new int[num];103 int sumatoria = 0;
104 double varianza = 0.00;
105 double desviacion = 0.00;
106 for (int i = 0; i < num; i++) {
107 double rango = 0;
108 if(flag==1){109 rango = Math.pow(Integer.parseInt(list.Ratings.get(i)) - media, 2);
110 }
111 if(flag==2){112 rango = Math.pow(Integer.parseInt(list.IyS.get(i)) - media, 2);
113 }
114 if(flag==3){115 rango = Math.pow(Integer.parseInt(list.Limpieza.get(i)) - media, 2);
116 }
117 if(flag==4){118 rango = Math.pow(Integer.parseInt(list.Personal.get(i)) - media, 2);
119 }
120 if(flag==5){121 rango = Math.pow(Integer.parseInt(list.Comodidad.get(i)) - media, 2);
122 }
123 if(flag==6){124 rango = Math.pow(Integer.parseInt(list.Ubicacion.get(i)) - media, 2);
125 }
126 if(flag==7){127 rango = Math.pow(Integer.parseInt(list.Calidad.get(i)) - media, 2);
128 }
129 if(rango==0){
105
130 System.out.println("Error de varianza");
131 }
132 varianza = varianza + rango;
133 }
134 varianza = varianza / (num-1);
135 return varianza;
136 }
137 public double DesviacionEstandar(double varianza){
138 DecimalFormat decimales = new DecimalFormat("0.00");
139 double desviacion = 0.00;
140 desviacion = Math.sqrt(varianza);
141 return desviacion;
142 }
143 }
1 public class ListaEstadisticas {
2 public ArrayList<Float> Media;
3 public ArrayList<Double> Varianza;
4 public ArrayList<Double> DesviacionEstandar;
5 public ListaEstadisticas() {
6 this.Media=Media;7 this.Varianza=Varianza;8 this.DesviacionEstandar=DesviacionEstandar;9 }
10 public ArrayList<Float> getMedia() {
11 return Media;
12 }
13 public void setMedia(ArrayList<Float> media) {
14 Media = media;
15 }
16 public ArrayList<Double> getVarianza() {
17 return Varianza;
18 }
19 public void setVarianza(ArrayList<Double> varianza) {
20 Varianza = varianza;
21 }
22 public ArrayList<Double> getDesviacionEstandar() {
23 return DesviacionEstandar;
24 }
25 public void setDesviacionEstandar(ArrayList<Double> desviacionEstandar) {
26 DesviacionEstandar = desviacionEstandar;
27 }
28 }
1 public class ListaObjetos{
2 public ArrayList<String> TitulosComentarios;
3 public ArrayList<String> Comentarios;
106
4 public ArrayList<String> Ratings;
5 public ArrayList<String> Recomendaciones;
6 public ArrayList<String> Ubicaciones;
7 public ArrayList<String> Users;
8 public ArrayList<String> CaracteristicasHotel;
9 public ArrayList<String> HotelName;
10 public ArrayList<String> Fechas;
11 public ArrayList<String> Propositos;
12 public ArrayList<String> IyS;
13 public ArrayList<String> Limpieza;
14 public ArrayList<String> Personal;
15 public ArrayList<String> Comodidad;
16 public ArrayList<String> Ubicacion;
17 public ArrayList<String> Calidad;
18 public String DireccionHotel;
19 public String CiudadHotel;
20 public int TotalRecomendación;
21 public int getTotalRecomendación() {
22 return TotalRecomendación;
23 }
24 public void setTotalRecomendación(int totalRecomendación) {
25 TotalRecomendación = totalRecomendación;
26 }
27 public String getDireccionHotel() {
28 return DireccionHotel;
29 }
30 public void setDireccionHotel(String direccionHotel) {
31 DireccionHotel = direccionHotel;
32 }
33 public String getCiudadHotel() {
34 return CiudadHotel;
35 }
36 public void setCiudadHotel(String ciudadHotel) {
37 CiudadHotel = ciudadHotel;
38 }
39 public ArrayList<String> getIyS() {
40 return IyS;
41 }
42 public void setIyS(ArrayList<String> iyS) {
43 IyS = iyS;
44 }
45 public ArrayList<String> getLimpieza() {
46 return Limpieza;
47 }
48 public void setLimpieza(ArrayList<String> limpieza) {
49 Limpieza = limpieza;
50 }
51 public ArrayList<String> getPersonal() {
52 return Personal;
107
53 }
54 public void setPersonal(ArrayList<String> personal) {
55 Personal = personal;
56 }
57 public ArrayList<String> getComodidad() {
58 return Comodidad;
59 }
60 public void setComodidad(ArrayList<String> comodidad) {
61 Comodidad = comodidad;
62 }
63 public ArrayList<String> getUbicacion() {
64 return Ubicacion;
65 }
66 public void setUbicacion(ArrayList<String> ubicacion) {
67 Ubicacion = ubicacion;
68 }
69 public ArrayList<String> getCalidad() {
70 return Calidad;
71 }
72 public void setCalidad(ArrayList<String> calidad) {
73 Calidad = calidad;
74 }
75 public ArrayList<String> currentPages;
76 public int countViajeros;
77 public int CantidadComentarioPage;
78 public ArrayList<String> getTitulosComentarios() {
79 return TitulosComentarios;
80 }
81 public void setTitulosComentarios(ArrayList<String> titulosComentarios) {
82 TitulosComentarios = titulosComentarios;
83 }
84 public ArrayList<String> getComentarios() {
85 return Comentarios;
86 }
87 public void setComentarios(ArrayList<String> comentarios) {
88 Comentarios = comentarios;
89 }
90 public ArrayList<String> getRatings() {
91 return Ratings;
92 }
93 public void setRatings(ArrayList<String> ratings) {
94 Ratings = ratings;
95 }
96 public ArrayList<String> getRecomendaciones() {
97 return Recomendaciones;
98 }
99 public void setRecomendaciones(ArrayList<String> recomendaciones) {
100 Recomendaciones = recomendaciones;
101 }
108
102 public ArrayList<String> getUbicaciones() {
103 return Ubicaciones;
104 }
105 public void setUbicaciones(ArrayList<String> ubicaciones) {
106 Ubicaciones = ubicaciones;
107 }
108 public ArrayList<String> getUsers() {
109 return Users;
110 }
111 public void setUsers(ArrayList<String> users) {
112 Users = users;
113 }
114 public ArrayList<String> getCaracteristicasHotel() {
115 return CaracteristicasHotel;
116 }
117 public void setCaracteristicasHotel(ArrayList<String> caracteristicasHotel)
{
118 CaracteristicasHotel = caracteristicasHotel;
119 }
120 public ArrayList<String> getHotelName() {
121 return HotelName;
122 }
123 public void setHotelName(ArrayList<String> hotelName) {
124 HotelName = hotelName;
125 }
126 public ArrayList<String> getFechas() {
127 return Fechas;
128 }
129 public void setFechas(ArrayList<String> fechas) {
130 Fechas = fechas;
131 }
132 public ArrayList<String> getPropositos() {
133 return Propositos;
134 }
135 public void setPropositos(ArrayList<String> propositos) {
136 Propositos = propositos;
137 }
138 public ArrayList<String> getCurrentPages() {
139 return currentPages;
140 }
141 public void setCurrentPages(ArrayList<String> currentPages) {
142 this.currentPages = currentPages;
143 }
144 public int getCountViajeros() {
145 return countViajeros;
146 }
147 public void setCountViajeros(int countViajeros) {
148 this.countViajeros = countViajeros;
149 }
109
150 public int getCantidadComentarioPage() {
151 return CantidadComentarioPage;
152 }
153 public void setCantidadComentarioPage(int cantidadComentarioPage) {
154 CantidadComentarioPage = cantidadComentarioPage;
155 }
156 }
1 public class CreateExcel {
2 public void CrearExcel(ListaObjetos list) {
3 HSSFWorkbook wb = new HSSFWorkbook();
4 HSSFSheet sheet = wb.createSheet("Estadísticas");
5 System.out.println("Crear Excel");
6 for(int i=0;i<list.countViajeros;i++){
7 System.out.println("Fechas: "+list.Fechas.get(i).toString());
8 System.out.println("Propositos: "+list.Propositos.get(i).toString());
9 System.out.println("Titulo Comentario: "+list.TitulosComentarios.get(i).
toString());
10 System.out.println("Comentarios: "+list.Comentarios.get(i).toString());
11 System.out.println("User :"+list.Users.get(i).toString());
12 System.out.println("Ubicaciones: "+list.Ubicaciones.get(i).toString());
13 System.out.println("Recomendaciones: "+list.Recomendaciones.get(i).toString
());
14 System.out.println("Rating: "+list.Ratings.get(i).toString());
15 System.out.println("Ins y Serv: "+list.IyS.get(i).toString());
16 System.out.println("Limpieza: "+list.Limpieza.get(i).toString());
17 System.out.println("Personal: "+list.Personal.get(i).toString());
18 System.out.println("Comodidad: "+list.Comodidad.get(i).toString());
19 System.out.println("Ubicacion: "+list.Ubicacion.get(i).toString());
20 System.out.println("Calidad-Precio: "+list.Calidad.get(i).toString());
21
22 }
23 Map<String, Object[]> data = new TreeMap<String, Object[]>();
24 data.put("0", new Object[] {"Número Comentario",
25 "Fecha","Proposito","Titulo Comentario",
26 "Comentario",
27 "Usuario", "Ubicacion",
28 "Recomendaciones",
29 "Rating",
30 "Instalaciones y Servicios",
31 "Limpieza",
32 "Personal del Hotel",
33 "Comodidad",
34 "Ubicación",
35 "Calidad-Precio"});
36 for(int i=0;i<list.countViajeros;i++){
37 System.out.println("i: "+i);;
38 String cont=Integer.toString(i+1);
110
39 String num=Integer.toString(i+1);
40 int k=i;
41 data.put(cont, new Object[] {num, list.Fechas.get(i).toString(),
42 list.Propositos.get(i).toString(),
43 list.TitulosComentarios.get(i).toString(),
44 list.Comentarios.get(i).toString(),
45 list.Users.get(i).toString(),
46 list.Ubicaciones.get(i).toString(),
47 list.Recomendaciones.get(i).toString(),
48 list.Ratings.get(i).toString(),
49 list.IyS.get(i).toString(),
50 list.Limpieza.get(i).toString(),
51 list.Personal.get(i).toString(),
52 list.Comodidad.get(i).toString(),
53 list.Ubicacion.get(i).toString(),
54 list.Calidad.get(i).toString()});
55 }
56 Set<String> keyset = data.keySet();
57 int rownum = 0;
58 for (String key : keyset) {
59 Row row = sheet.createRow(rownum++);
60 System.out.println("rownumm:"+rownum);
61 Object [] objArr = data.get(key);
62 int cellnum = 0;
63 for (Object obj : objArr) {
64 Cell cell = row.createCell(cellnum++);
65 System.out.println("cellnumm:"+cellnum);
66 if(obj instanceof Date)
67 cell.setCellValue((Date)obj);
68 else if(obj instanceof Boolean)
69 cell.setCellValue((Boolean)obj);
70 else if(obj instanceof String)
71 cell.setCellValue((String)obj);
72 else if(obj instanceof Double)
73 cell.setCellValue((Double)obj);
74 }
75 }
76 try {
77 String NombreExcel=list.HotelName.get(0);
78 FileOutputStream fileOut = new FileOutputStream(NombreExcel+".xls");
79 wb.write(fileOut);
80 fileOut.close();
81 System.out.println("Excel Escrito Satisfactoriamente..");
82 JOptionPane.showMessageDialog(null, "Excel Creado Exitosamente!!");
83 } catch (FileNotFoundException e) {
84 e.printStackTrace();
85 } catch (IOException e) {
86 e.printStackTrace();
87 }
111
88 }
89 }
1 public class ObtenerHoteles {
2 public Elements NombreHoteles;
3 public Elements CantidadHoteles;
4 public Elements LinkHoteles;
5 public Elements Locacion;
6 public int num;
7 public String Locaciones;
8 public String CantidadComentario;
9 public Elements CantidadComentarios;
10 public ObtenerHoteles() {
11 }
12 public ObtenerHoteles(Elements NombreHoteles, Elements CantidadHoteles,
Elements LinkHoteles,Elements Locacion, Elements CantidadComentarios){
13 this.NombreHoteles=NombreHoteles;14 this.CantidadHoteles=CantidadHoteles;15 this.LinkHoteles=LinkHoteles;16 this.Locacion=Locacion;17 this.CantidadComentarios=CantidadComentarios;18 }
19
20 public ListaHoteles ExtraerHotel(String link) throws IOException{
21 //String santiago = "http://www.hotelclub.com/shop/home?hotDA=true&hotel.
keyword.dl=26548&hotel.rooms%5B0%5D.chldAge%5B1%5D=&hotel.rooms%5B0%5D.
chldAge%5B2%5D=&hotel.rooms%5B0%5D.chldAge%5B0%5D=&hotel.couponCode=&
hotel.rooms%5B0%5D.adlts=2&hotel.keyword.key=santiago&type=hotel&hotel.
chkin=&hotel.rooms%5B0%5D.chlds=0&hotel.rooms%5B0%5D.chldAge%5B3%5D=&
hotel.rooms%5B0%5D.chldAge%5B4%5D=&hotel.chkout=&hotel.rating=&hotel.
coord=&hotel.type=keyword&hotel.hname=&search=Continuar&hsv.page=";
22 //String vina="http://www.hotelclub.com/shop/home?type=hotel&hotel.type=
keyword&hotel.fid=&hotel.coord=&hotel.keyword.key=Viña+del+Mar%2C+Chile&
hotel.locId=loc.id%3A26550&hotel.chkin=&hotel.chkout=&hotel.rooms%5B0%5D
.adlts=2&hotel.rooms%5B0%5D.chlds=0&hotel.rooms%5B0%5D.chldAge%5B0%5D=&
hotel.rooms%5B0%5D.chldAge%5B1%5D=&hotel.rooms%5B0%5D.chldAge%5B2%5D=&
hotel.rooms%5B0%5D.chldAge%5B3%5D=&hotel.rooms%5B0%5D.chldAge%5B4%5D=&
hotel.rating=&hotel.hname=&hotel.couponCode=&search=Buscar";
23 //String link=santiago;
24 Document doc;
25 Document doc1;
26 ListaHoteles ListHoteles=new ListaHoteles();
27 ArrayList<String> nh =new ArrayList();
28 ArrayList<String> lh =new ArrayList();
29 ArrayList<String> listLink =new ArrayList();
30 String LinkH=link;
31 listLink.add(LinkH);
32 try{
112
33 doc1=Jsoup.connect(listLink.get(0)).get();
34 CantidadHoteles=doc1.select(".numberOfResults");
35 for(Element CantidadHotel : CantidadHoteles){
36 num=Integer.parseInt(CantidadHotel.text());
37 }
38 }catch(IOException e){
39 System.out.println("Problemas de conexión a internet!");
40 JOptionPane.showMessageDialog(null, "Problema con la conexión a internet!");
41 }
42 System.out.println("num1:"+num);
43 if(num>25){44 int mod=num%25;
45 int div=num/25;
46 if(mod==0){47 num=div;
48 ListHoteles.setCantidadHoteles(num);
49 }else{50 num=div+1;
51 ListHoteles.setCantidadHoteles(num);
52 }
53 String[] linkSplit=listLink.get(0).split("page=");
54 for(int i=2;i<=ListHoteles.CantidadHoteles;i++){
55 listLink.add(linkSplit[0]+"page="+i);
56 }
57 }else{58 num=1;
59 ListHoteles.setCantidadHoteles(num);
60 }
61 System.out.println("Link paginas hoteles:"+listLink);
62 try{63 for(int j=0;j<ListHoteles.CantidadHoteles;j++){
64 System.out.println("j:"+j);
65 doc=Jsoup.connect(listLink.get(j)).get();
66
67 NombreHoteles=doc.select(".hotelName a");
68 LinkHoteles=doc.select(".hotelName a[href]");
69 Locacion=doc.select("title");
70 CantidadComentarios=doc.select(".numReviews link");
71
72 for(Element NombreHotel : NombreHoteles){
73 nh.add(NombreHotel.text());
74 }
75 for(Element LinkHotel : LinkHoteles){
76 lh.add(LinkHotel.attr("abs:href"));
77 }
78 for(Element locacion : Locacion){
79 Locaciones=locacion.text();
80 }
81 for(Element cantidadComentario : CantidadComentarios){
113
82 CantidadComentario=cantidadComentario.text();
83 }
84
85 ListHoteles.setNombreHoteles(nh);
86 ListHoteles.setLinkHoteles(lh);
87 ListHoteles.setLocacion(Locaciones);
88 ListHoteles.setCantidadComentario(CantidadComentario);
89 }
90 }catch(IOException e){
91 System.out.println("Problemas de conexión a internet!");
92 JOptionPane.showMessageDialog(null, "Problema con la conexión a internet!");
93 }
94 for(int i=0;i<ListHoteles.NombreHoteles.size();i++){
95 System.out.println(i+1+")"+"NombreHoteles :"+ListHoteles.NombreHoteles.get(i
)+"\n");
96 System.out.println(i+1+")"+"LinkHotel: "+ListHoteles.LinkHoteles.get(i)+"\n"
);
97 System.out.println("Locacion: "+ListHoteles.Locacion);
98 }
99 System.out.println("Cantidad de Hoteles :"+ListHoteles.NombreHoteles.size())
;
100 System.out.println("Cantidad Comentarios: "+ListHoteles.CantidadComentario);
101
102 Leer_y_Escribir_Ficheros read_write = new Leer_y_Escribir_Ficheros();
103 read_write.Escribir_Fichero(ListHoteles);
104 return ListHoteles;
105 }
106 }
1 public class Leer_y_Escribir_Ficheros {
2 public Leer_y_Escribir_Ficheros() {
3 }
4 public void Escribir_Fichero(ListaHoteles ListHoteles){
5 try{6 //Crear un objeto File se encarga de crear o abrir acceso a un archivo que
se especifica en su constructor
7 String[] nombreSplit=ListHoteles.Locacion.split("-");
8 File archivo=new File(nombreSplit[0]+".txt");
9
10 //Crear objeto FileWriter que sera el que nos ayude a escribir sobre archivo
11 FileWriter escribir=new FileWriter(archivo,true);12
13 //Escribimos en el archivo con el metodo write
14 for(int k=0;k<ListHoteles.NombreHoteles.size();k++){
15 escribir.write(ListHoteles.NombreHoteles.get(k)+"\r\n");
16 escribir.write(ListHoteles.LinkHoteles.get(k)+"\r\n");
17 //escribir.write(ListHoteles.CantidadComentario+"\r\n");
18 }
114
19 //Cerramos la conexion
20 escribir.close();
21 JOptionPane.showMessageDialog(null, "Hoteles Guardados Correctamente!");
22 }catch(Exception e){
23 System.out.println("Error al escribir");
24 JOptionPane.showMessageDialog(null, "Error al guardar los hoteles!");
25 }
26 }
27 public ArrayList Leer_Fichero(JComboBox cmb_locacion){
28 System.out.println("Nombre Archivo:"+cmb_locacion.getSelectedItem());
29 File archivo = new File(cmb_locacion.getSelectedItem()+" "+".txt");
30 Scanner s = null;31 ArrayList<String> lectura_archivo =new ArrayList();
32 try {
33 // Leemos el contenido del fichero
34 //System.out.println("... Leemos el contenido del fichero ...");
35 s = new Scanner(archivo);
36
37 // Leemos linea a linea el fichero
38 while (s.hasNextLine()) {
39 String linea = s.nextLine(); // Guardamos la linea en un String
40 //System.out.println(linea); // Imprimimos la linea
41 lectura_archivo.add(linea);
42 }
43 } catch (Exception ex) {
44 System.out.println("Mensaje: " + ex.getMessage());
45 JOptionPane.showMessageDialog(null, "Mensaje: " + ex.getMessage());
46 } finally {
47 // Cerramos el fichero tanto si la lectura ha sido correcta o no
48 try {
49 if (s != null)50 s.close();
51 } catch (Exception ex2) {
52 System.out.println("Mensaje 2: " + ex2.getMessage());
53 JOptionPane.showMessageDialog(null, "Mensaje 2: " + ex2.getMessage());
54 }
55 }
56 return lectura_archivo;
57 }
58 }
1 public class Analisis_de_Correlacion {
2 public double COV1=0;
3 public double COV2=0;
4 public double Sx=0;
5 public double Sy=0;
6 public double r=0;
7 public double SxSy=0;
115
8 public double[][] Correlacion= {{1,0,0,0,0,0,0},
9 {0,1,0,0,0,0,0},
10 {0,0,1,0,0,0,0},
11 {0,0,0,1,0,0,0},
12 {0,0,0,0,1,0,0},
13 {0,0,0,0,0,1,0},
14 {0,0,0,0,0,0,1}};
15 public double[][] EjecutarAnalisis(ListaObjetos list){
16 DecimalFormat decimales = new DecimalFormat("0.00");
17 double n=list.TitulosComentarios.size();
18 double SumR = 0;double SumIyS=0;double SumL=0;double SumP=0;double SumC=0;
double SumU=0;double SumCP=0;
19 double SumRIyS=0;double SumRL=0;double SumRP=0;double SumRC=0;double SumRU
=0;double SumRCP=0;
20 double SumIySL=0;double SumIySP=0;double SumIySC=0;double SumIySU=0;doubleSumIySCP=0
21 double SumLP=0;double SumLC=0;double SumLU=0;double SumLCP=0;
22 double SumPC=0;double SumPU=0;double SumPCP=0;
23 double SumCU=0;double SumCCP=0;double SumUCP=0;
24 double PromR=0;double PromIyS=0;double PromL=0;double PromP=0;double PromC
=0;double PromU=0;double PromCP=0;
25 double SumR2=0;double SumIyS2=0;double SumL2=0;double SumP2=0;double SumC2
=0;double SumU2=0;double SumCP2=0;
26 int tope=list.TitulosComentarios.size();
27 double largo=list.TitulosComentarios.size();
28 for(int i=0;i<largo;i++){
29 SumR=SumR+Integer.parseInt(list.Ratings.get(i));
30 SumIyS=SumIyS+Integer.parseInt(list.IyS.get(i));
31 SumL=SumL+Integer.parseInt(list.Limpieza.get(i));
32 SumP=SumP+Integer.parseInt(list.Personal.get(i));
33 SumC=SumC+Integer.parseInt(list.Comodidad.get(i));
34 SumU=SumU+Integer.parseInt(list.Ubicacion.get(i));
35 SumCP=SumCP+Integer.parseInt(list.Calidad.get(i));
36 SumRIyS=SumRIyS+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list
.IyS.get(i)));
37 SumRL=SumRL+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.
Limpieza.get(i)));
38 SumRP=SumRP+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.
Personal.get(i)));
39 SumRC=SumRC+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.
Comodidad.get(i)));
40 SumRU=SumRU+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.
Ubicacion.get(i)));
41 SumRCP=SumRCP+(Integer.parseInt(list.Ratings.get(i))*Integer.parseInt(list.
Calidad.get(i)));
42 SumIySL=SumIySL+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.
Limpieza.get(i)));
43 SumIySP=SumIySP+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.
Personal.get(i)));
116
44 SumIySC=SumIySC+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.
Comodidad.get(i)));
45 SumIySU=SumIySU+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.
Ubicacion.get(i)));
46 SumIySCP=SumIySCP+(Integer.parseInt(list.IyS.get(i))*Integer.parseInt(list.
Calidad.get(i)));
47 SumLP=SumLP+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.
Personal.get(i)));
48 SumLC=SumLC+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.
Comodidad.get(i)));
49 SumLU=SumLU+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.
Ubicacion.get(i)));
50 SumLCP=SumLCP+(Integer.parseInt(list.Limpieza.get(i))*Integer.parseInt(list.
Calidad.get(i)));
51 SumPC=SumPC+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.
Comodidad.get(i)));
52 SumPU=SumPU+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.
Ubicacion.get(i)));
53 SumPCP=SumPCP+(Integer.parseInt(list.Personal.get(i))*Integer.parseInt(list.
Calidad.get(i)));
54 SumCU=SumCU+(Integer.parseInt(list.Comodidad.get(i))*Integer.parseInt(list.
Ubicacion.get(i)));
55 SumCCP=SumCCP+(Integer.parseInt(list.Comodidad.get(i))*Integer.parseInt(list
.Calidad.get(i)));
56 SumUCP=SumUCP+(Integer.parseInt(list.Ubicacion.get(i))*Integer.parseInt(list
.Calidad.get(i)));
57 SumR2=SumR2+(Integer.parseInt(list.Ratings.get(i)))*(Integer.parseInt(list.
Ratings.get(i)));
58 SumIyS2=SumIyS2+(Integer.parseInt(list.IyS.get(i)))*(Integer.parseInt(list.
IyS.get(i)));
59 SumL2=SumL2+(Integer.parseInt(list.Limpieza.get(i)))*(Integer.parseInt(list.
Limpieza.get(i)));
60 SumP2=SumP2+(Integer.parseInt(list.Personal.get(i)))*(Integer.parseInt(list.
Personal.get(i)));
61 SumC2=SumC2+(Integer.parseInt(list.Comodidad.get(i)))*(Integer.parseInt(list
.Comodidad.get(i)));
62 SumU2=SumU2+(Integer.parseInt(list.Ubicacion.get(i)))*(Integer.parseInt(list
.Ubicacion.get(i)));
63 SumCP2=SumCP2+(Integer.parseInt(list.Calidad.get(i)))*(Integer.parseInt(list
.Calidad.get(i)));
64 }
65 PromR=SumR/largo;
66 PromIyS=SumIyS/largo;
67 PromL=SumL/largo;
68 PromP=SumP/largo;
69 PromC=SumC/largo;
70 PromU=SumU/largo;
71 PromCP=SumCP/largo;
72 Correlacion[0][1]=r(n,SumR,SumIyS,SumRIyS,SumR2,SumIyS2,PromR,PromIyS);
117
73 Correlacion[0][2]=r(n,SumR,SumL,SumRL,SumR2,SumL2,PromR,PromL);
74 Correlacion[0][3]=r(n,SumR,SumP,SumRP,SumR2,SumP2,PromR,PromP);
75 Correlacion[0][4]=r(n,SumR,SumC,SumRC,SumR2,SumC2,PromR,PromC);
76 Correlacion[0][5]=r(n,SumR,SumU,SumRU,SumR2,SumU2,PromR,PromU);
77 Correlacion[0][6]=r(n,SumR,SumCP,SumRCP,SumR2,SumCP2,PromR,PromCP);
78 Correlacion[1][2]=r(n,SumIyS,SumL,SumIySL,SumIyS2,SumL2,PromIyS,PromL);
79 Correlacion[1][3]=r(n,SumIyS,SumP,SumIySP,SumIyS2,SumP2,PromIyS,PromP);
80 Correlacion[1][4]=r(n,SumIyS,SumC,SumIySC,SumIyS2,SumC2,PromIyS,PromC);
81 Correlacion[1][5]=r(n,SumIyS,SumU,SumIySU,SumIyS2,SumU2,PromIyS,PromU);
82 Correlacion[1][6]=r(n,SumIyS,SumCP,SumIySCP,SumIyS2,SumCP2,PromIyS,PromCP);
83 Correlacion[2][3]=r(n,SumL,SumP,SumLP,SumL2,SumP2,PromL,PromP);
84 Correlacion[2][4]=r(n,SumL,SumC,SumLC,SumL2,SumC2,PromL,PromC);
85 Correlacion[2][5]=r(n,SumL,SumU,SumLU,SumL2,SumU2,PromL,PromU);
86 Correlacion[2][6]=r(n,SumL,SumCP,SumLCP,SumL2,SumCP2,PromL,PromCP);
87 Correlacion[3][4]=r(n,SumP,SumC,SumPC,SumP2,SumC2,PromP,PromC);
88 Correlacion[3][5]=r(n,SumP,SumU,SumPU,SumP2,SumU2,PromP,PromU);
89 Correlacion[3][6]=r(n,SumP,SumCP,SumPCP,SumP2,SumCP2,PromP,PromCP);
90 Correlacion[4][5]=r(n,SumC,SumU,SumCU,SumC2,SumU2,PromC,PromU);
91 Correlacion[4][6]=r(n,SumC,SumCP,SumCCP,SumC2,SumCP2,PromC,PromCP);
92 Correlacion[5][6]=r(n,SumU,SumCP,SumUCP,SumU2,SumCP2,PromU,PromCP);
93 SxSy=Math.sqrt(Sx*Sy);
94 r=(COV1-COV2)/SxSy;
95 System.out.println("Matriz de Correlación:");
96 for (int i = 0; i < Correlacion.length; i++) {
97 for (int j = 0; j < Correlacion[i].length; j++) {
98 System.out.print(decimales.format(Correlacion[i][j]) + " ");
99 }
100 System.out.println();
101 }
102 return Correlacion;
103 }
104 public double r(double n, double SumX, double SumY, double SumXY,doubleSumX2, double SumY2,double PromX, double PromY){
105 System.out.println("SumX :"+SumX);
106 System.out.println("SumY :"+SumY);
107 System.out.println("SumXY :"+SumXY);
108 System.out.println("SumX2 :"+SumX2);
109 System.out.println("SumY2 :"+SumY2);
110 System.out.println("PromoX :"+PromX);
111 System.out.println("PromY :"+PromY);
112 COV1=SumXY;
113 System.out.println("COV1: "+COV1);
114 COV2=(SumX*SumY)/n;
115 System.out.println("COV2: "+COV2);
116 Sx=SumX2-(n*(Math.pow(PromX, 2)));
117 System.out.println("Sx: "+Sx);
118 Sy=SumY2-(n*(Math.pow(PromY, 2)));
119 System.out.println("Sy: "+Sy);
120 SxSy=Math.sqrt(Sx*Sy);
118
121 System.out.println("SxSy: "+SxSy);
122 r=(COV1-COV2)/SxSy;
123 System.out.println("r: "+r);
124 return r;
125 }
126 }
1 public class CaracteristicasHotel {
2
3 public String TipoCaracteristica;
4 public String Puntuacion;
5
6 public String getTipoCaracteristica() {
7 return TipoCaracteristica;
8 }
9 public void setTipoCaracteristica(String tipoCaracteristica) {
10 TipoCaracteristica = tipoCaracteristica;
11 }
12 public String getPuntuacion() {
13 return Puntuacion;
14 }
15 public void setPuntuacion(String puntuacion) {
16 Puntuacion = puntuacion;
17 }
18 }
119