proyecto docente análisis de datos y procesado de la
TRANSCRIPT
Datos básicos de la asignaturaTitulación: Máster Universitario en Ingeniería de TelecomunicaciónAño plan de estudio: 2014
Curso implantación: 2020-21Centro responsable: E.T.S. de Ingeniería
Nombre asignatura: Análisis de Datos y Procesado de la InformaciónCódigo asigantura: 51420022Tipología: OPTATIVACurso: 2Periodo impartición: Segundo cuatrimestre
Créditos ECTS: 4Horas totales: 100Área/s: Teoría de la Señal y ComunicacionesDepartamento/s: Teoría de la Señal y Comunicaciones
Coordinador de la asignatura
MURILLO FUENTES JUAN JOSE
Profesorado
Profesorado del grupo principal:
MURILLO FUENTES JUAN JOSE
Objetivos y competencias
OBJETIVOS:
Los descriptores de la asignatura en la memoria de verificación del Máster Universitario en
Ingeniería de Telecomunicación son los siguientes:
Fundamentos de clasificación y estimación Bayesianas. Estimación/Regresión semianalítica y
máquina. Procesos Gaussianos. Clasificación semianalítica y máquina. ERM y máquinas de
Vectores Soporte. Métodos no paramétricos. Agrupamiento. Grafos. Aplicaciones. Técnicas de
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 1 de 16
análisis de componentes: principales, independientes, no negativas, acotadas, escasas (poco
activas). Algoritmos de separación y extracción de información. Técnicas de análisis de datos
tensoriales. Regularización y muestreo compresivo. Aplicaciones en separación y mejora de
señales de voz, imágenes, señales de comunicaciones, interfaces cerebro-máquina, búsqueda e
indexación automática de documentos.
De acuerdo a estos descriptores, el objetivo fundamental de esta asignatura es estudiar
herramientas de análisis de datos y procesado de información dentro desde el ámbito de
reconocimiento de patrones y aprendizaje máquina, y adquirir la capacidad de aplicarlos a datos e
información real. Asociados a este objetivo general, el alumno deberá
- conocer las herramientas de procesado estadístico más relevantes
- revisar las herramientas lineales de estimación, clasificación y regresión, así como los sistemas de
recomendación y de detección de anomalías
- conocer el funcionamiento y base de las redes neuronales artificiales
- distinguir métodos supervisados de métodos no supervisados
- entender la diferencia entre métodos discriminativos y generativos
- aprender el uso, incluida aplicación práctica de algún clasificador y de algún regresor
- iniciar al alumno en la decisión a la hora de la herramienta a adoptar y la preparación de los datos
- conocer los lenguajes de programación utilizados en el ámbito
Así, entre los resultados del aprendizaje, de forma global el alumno será capaz de resolver
problemas de análisis de datos y procesado de información, mediante la identificación de la
herramienta adecuada y de su utilización. Y en particular, se detallan los siguientes
- identificar los diferentes tipos de problemas y en particular distinguir entre escenarios lineales y no
lineales, supervisados y no supervisados, de clasificación y de regresión.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 2 de 16
- identificar las principales diferencias entre las herramientas y métodos existentes.
- asimilar el funcionamiento y principios teóricos de diferentes métodos.
- resolver problemas con datos reales.
COMPETENCIAS:
Dentro de las competencias, se trabajaran las siguientes en esta asignatura:
CB01 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en
el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
CB03 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad
de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones
sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y
juicios;
CB05 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar
estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
CG01 Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos
los
ámbitos de la ingeniería de telecomunicación.
CG12 Poseer habilidades para el aprendizaje continuado, autodirigido y autónomo.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 3 de 16
CG13 Conocimiento, comprensión y capacidad para aplicar la legislación necesaria en el ejercicio
de la profesión de Ingeniero de Telecomunicación.
CT01 Funcionar de forma efectiva tanto de forma individual como en equipo.
CT05 Reconocer la necesidad y tener la capacidad para desarrollar voluntariamente el
aprendizaje continuo.
CT07 Trabajar y comunicarse eficazmente en contextos nacionales e internacionales.
RdA01 Profundo conocimiento y comprensión de los principios de su especialidad.
RdA03 Capacidad para resolver problemas fuera de las pautas estándar de su rama de ingeniería,
definidos de forma incompleta que tienen especificaciones inconsistentes.
RdA05 Capacidad de utilizar su conocimiento y la comprensión adecuada para conceptualizar
modelos, sistemas y procesos de ingeniería.
Contenidos o bloques temáticos
I. Introducción: teoría de probabilidad
II. Preparación de los datos y recomendaciones prácticas
III. Detección de Anomalías
IV. Regresión y clasificación
V. Sistemas de recomendación
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 4 de 16
VI. Aprendizaje profundo
Relación detallada y ordenación temporal de los contenidos
Unidad 0. Presentación (1.25h approx.) - Presentation
- Información General
- Referencias
- Motivación
- Definición de aprendizaje máquina
- Clasificación de métodos
Unidad 1. Teoría de la Probabilidad (3.75h approx.) - Probability Theory
- Conceptos básicos
- Modelos generativos vs. discriminativos
- Teoría de la estimación y estimadores
- Teoría de la decisión
* Tarea 1: Detección de Anomalías (2.5h approx.) - Anomaly Detection
Unidad 2. Regresión Lineal y Polinómica (5h approx.) - Linear and Polinomic Regression
- Regresor lineal: mínimos cuadrados
- Regresor polynomial
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 5 de 16
- Regularización
- Ejemplo
Unidad 3. Sistemas de Recomendación (1h approx.) - Recommendation Systems
- Sistemas de recomendación
- Sistemas basados en contenidos
- Filtrado colaborativo
* Tarea 2: Sistemas de Recomendación (1.5h approx.) - Recommendation Systems
Unidad 4. Regresión Logística para clasificación (1.5h approx.) - Logistic Regression for
Classification
- Regresión logística
- Clasificación multiclase con SoftMax
- Ejemplo
* Tarea 3: Clasificación MNIST (2.5 h) - Classification of MNIST
Unidad 5. Cuestiones de diseño (2.5 h) - Practical Issues
- Diagnosis
- Selección de modelo
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 6 de 16
- Validación cruzada
- Sesgo frente a varianza y regularización
- Tamaño de los datos
- Pasos en el diseño
- Representatividad de los datos (skewness)
- Grandes tamaños de datos
* Tarea 4: Regresión para estimación de energía en aerogenerador (5 h) - Regression for
Aerogenerator Energy
Examen (1 h)
Unidad 6. Redes Neuronales y Deep learning (5 h) - Artificial Neural Networks and Deel Learning
- Red neuronal multicapa
- Redes convolucionales
- Ejemplo con Tensor Flow y Keras
* Tarea 5: Clasificación con deep learning - Classification with deep learning
Unidad 8. Software de Machine Learning (5 h) - Software for Machine Learning
- Introducción a Software BigML
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 7 de 16
- Ejercicios
Unidad 9. Métodos kernels (2.5) - Kernel Methods
- Conceptos básicos
- Mínimos cuadrados con kernels
- Ejercicio
Actividades formativas y horas lectivas
Actividad Créditos Horas
B Clases Teórico/ Prácticas 3,2 32
Metodología de enseñanza-aprendizaje
Clases teóricas
Mediante clases magistrales se introducen los conceptos teóricos del asignatura. Estas clases
serán de corta duración.
Prácticas informáticas
Se plantearán un conjunto de problemas a resolver, que el alumno deberá abordar desde las
técnicas vistas en las clases teóricas. A esta actividad se dedicará la mayor parte del tiempo. Se
trabajará con datos reales.
Sistemas y criterios de evaluación y calificación
En el proyecto docente correspondiente, el profesor determinará los criterios y sistemas específicos
elegidos para la evaluación, así como su peso concreto en la calificación de la asignatura.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 8 de 16
Criterios de calificación del grupo
CRITERIOS DE EVALUACION EN EL ESCENARIO ORDINARIO
La evaluación se basará fundamentalmente en exámenes y en la evaluación de la resolución de
problemas propuestos, mediante memorias.
En los exámenes se evaluará sobre todo la parte teórica de la asignatura, y constituirá el 30% de la
calificación final.
Para la evaluación de los problemas propuestos se pedirá entregar una pequeña memoria de cada
tarea propuesta, que se evaluará junto con el trabajo desarrollado en clase. Representará un 60%
de la calificación.
Un 10% de la calificación medirá el interés, motivación y trabajo en clase.
NORMAS DE OBLIGADO CUMPLIMIENTO
No se permite la difusión o redistribución privada o pública de
- Material de la asignatura incluyendo apuntes del profesor, transparencias, videos, audios,
enunciados de exámenes y tareas,
- Grabaciones realizadas por los alumnos de las clases.
En las distintas actividades de evaluación tales como exámenes o tareas, el estudiante, o los
estudiantes si la evaluación es en grupo, habrá de comprometerse a:
- No permitir ni realizar ningún tipo de suplantación de identidad.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 9 de 16
- No recibir ayuda externa, ni proporcionarla por ningún medio oral, escrito, digital ni de ningún otro
tipo.
- No compartir, difundir ni reproducir en ningún modo el enunciado de la evaluación ni de su
resultado (respuestas del examen, memoria de una tarea,?).
- Realizar, en general, la evaluación de forma honesta, responsable y confiable, con ánimo de que
el resultado de la evaluación refleje el aprendizaje alcanzado por el propio alumno.
Cualquier violación de las reglas anteriores significará el suspenso de la asignatura y la adopción de
cualesquiera otras medidas disciplinarias que pudieran derivarse.
PLAN DE CONTINGENCIA PARA EL CURSO 2020/21
Dada el actual escenario de pandemia y de acuerdo con las normas del Vicerrectorado de
Ordenación Académica, deben especificarse las adaptaciones de la asignatura, tanto para el
desarrollo de la docencia como para el desarrollo de los procesos de evaluación, a dos posibles
escenarios: un escenario de menor actividad académica presencial como consecuencia de medidas
sanitarias de distanciamiento interpersonal que limiten el aforo permitido en las aulas (escenario A)
y un escenario de suspensión de la actividad presencial (escenario B).
En el escenario A, la docencia y la evaluación de la asignatura se realizarán combinando tanto
medios presenciales como telemáticos de acuerdo con las instrucciones dictadas en cada momento
por las autoridades académicas y sanitarias competentes. En el escenario B, tanto la docencia
como la evaluación de la asignatura tendrán lugar de manera íntegramente remota.
En el desarrollo de la docencia, y en ambos casos, se hará uso preferente de la herramienta
Blackboard Collaborate, dentro de la plataforma de Enseñanza Virtual, sin perjuicio de que se
acuerde el uso de cualquier otra herramienta. También se deja abierta la posibilidad de distribuir
clases pregrabadas u otro tipo de material, dejando el tiempo de clase para su visionado y estudio,
resolver preguntas sobre el mismo y/o actividades de evaluación.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 10 de 16
Las tutorías se realizarán de forma remota, sin perjuicio de que el alumno y el profesorado puedan
concertar una tutoría presencial, siempre que se realice dentro de las condiciones que establezca el
Servicio de Prevención de Riesgos Laborales de la Universidad de Sevilla.
En la evaluación de la docencia, entre otras posibilidades, se contemplará el uso de herramientas
de evaluación online para realizar los exámenes previstos, hacer la evaluación de forma oral o
sustituir, de forma parcial o total, los exámenes por otras actividades, que podrán incluir la
evaluación de la actividad y participación del estudiante.
En la evaluación online, se indicará la forma de identificación del alumno, dentro de las
posibilidades que la Universidad de Sevilla determine. Una identificación no satisfactoria conllevará
la no evaluación del examen del alumno.
Se incluirán mecanismos de garantía de la autoría de las pruebas por parte del estudiantado que la
Universidad de Sevilla considere adecuados. En particular, las pruebas orales, si las hubiere,
podrán quedar grabadas, por el procedimiento y en la forma que la Universidad de Sevilla
determine, para facilitar una posterior revisión o apelación de la prueba.
En los exámenes online el profesorado podrá exigir realizar una prueba o ensayo previo.
En los exámenes online se determinará si habrá, y en qué condiciones, procedimiento alternativo en
caso de que el alumno sufra problemas de conectividad durante el transcurso del examen.
En los exámenes presenciales, el profesorado aclarará si es posible y en qué condiciones realizar
una prueba en el caso de que el alumno esté en cuarentena por Covid19, siempre dentro del
presente marco normativo o del que establezca la Universidad de Sevilla.
En particular, para esta asignatura, si no fuera posible realizar el examen presencial, se contempla
evaluar el 90% de la asignatura en base a memorias de los trabajos propuestos. Se deja abierta la
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 11 de 16
posibilidad a requerir a los alumnos que defiendan de forma oral alguna o todas las memorias
presentadas. El otro 10% quedará para evaluar el interés, trabajo y motivación en clase.
Horarios del grupo del proyecto docente
http://www.etsi.us.es/academica
Calendario de exámenes
http://www.etsi.us.es/academica
Tribunales específicos de evaluación y apelación
Presidente: SERGIO ANTONIO CRUCES ALVAREZ
Vocal: FRANCISCO JAVIER PAYAN SOMET
Secretario: JOSE RAMON CERQUIDES BUENO
Suplente 1: RUBEN MARTIN CLEMENTE
Suplente 2: RAFAEL BOLOIX TORTOSA
Suplente 3: FRANCISCO JOSE SIMOIS TIRADO
Bibliografía recomendada
BIBLIOGRAFÍA GENERAL:
Pattern recognition and machine learning
Autores: Christopher M. Bishop
Edición: 2009
Publicación: Springer
ISBN: 0-387-31073-8, 978-0387-31073-2
Machine learning, a probabilistic perspective
Autores: Kevin P. Murphy
Edición: 2012
Publicación: The MIT Press
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 12 de 16
ISBN: 978-0-262-01802-9
Deep learning
Autores: Ian Goodfellow, Yoshua Bengio, Aaron Courville
Edición: 1
Publicación: MIT Press
ISBN: 9780262035613
Information Theory, Inference, and Learning Algorithms
Autores: David J.C. MacKay
Edición: 1
Publicación: Cambridge University Press
ISBN: 9780262035613
Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and
Techniques to Build Intelligent Systems
Autores: Aurelien Geron
Edición: 14 octubre 2019
Publicación: O'REILLY
ISBN: 978-1492032649
BIBLIOGRAFÍA ESPECÍFICA:
Gaussian processes for machine learning
Autores: C. E. Rasmussen, C. J. I. Williams
Edición: 2006
Publicación: MIT Press
ISBN: 0-262-18253-X
Graphical models for machine learning in digital communications
Autores: B. J. Frey
Edición: 1999
Publicación: The MIT Press
ISBN: 0-262-06202-X
Learning with kernels
Autores: B. Scholkopf, A. J. Smola
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 13 de 16
Edición: 2002
Publicación: The MIT Press
ISBN: 0-262-19475-9
Information Theory, Inference, and Learning Algorithms
Autores: David J.C. MacKay
Edición: 1
Publicación: Cambridge University Press
ISBN: 9780262035613
Factor Graphs and the Sum-Product Algorithm
Autores: Frank R. Kschischang, Brendan J. Frey, and Hans-Andrea Loeliger
Edición: 1
Publicación: IEEE Transactions on Information theory, Vol. 47, No. 2, Pp. 498. Feb 2001
ISBN: 9780262035613
Bayesian reasoning and machine learning
Autores: David Barber
Edición: 2012
Publicación: Cambridge University Press
ISBN: 978-0-521-51814-7
INFORMACIÓN ADICIONAL
- Code of the book by Geron https://github.com/ageron/handson-ml2
- List of videos on machine learning https://www.springboard.com/blog/machine-learning-youtube/
- Weekly brief list of pieces of news
https://www.deeplearningweekly.com/?utm_source=Deep+Learning+Weekly&utm_campaign=5230c
b8a5f-EMAIL_CAMPAIGN_2019_04_24_03_18_COPY_01&utm_medium=email&utm_term=0_3845
67b42d-5230cb8a5f-77193189
- Course on Machine Learning by Prof. Nguyen at Standford University:
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 14 de 16
https://es.coursera.org/learn/machine-learning
- (Spanish) Canal de youtube DotCSV, de Carlos Santana Vega, ingeniero informático y divulgador
de conocimientos sobre inteligencia artificial. Se deja una lista de reproducción pública con los
vídeos más importantes
https://www.youtube.com/playlist?list=PLx3EIRLhRAK6oovkZV8OjSI4CdRHaYo8H
- Podcast by M. I. Jordan
https://podcasts.apple.com/es/podcast/74-michael-i-jordan-machine-learning-recommender-systems
/id1434243584?i=1000466516116&l=en see more at
https://podcasts.apple.com/es/podcast/lex-fridman-podcast-artificial-intelligence-ai/id1434243584?l=
en
- Podcast by A. Nguyen
https://podcasts.apple.com/es/podcast/73-andrew-ng-deep-learning-education-and-real-world-ai/id1
434243584?i=1000466196078&l=en see more at
https://podcasts.apple.com/es/podcast/lex-fridman-podcast-artificial-intelligence-ai/id1434243584?l=
en
- Discussion on
https://datascience.stackexchange.com/questions/65736/why-does-keras-need-tensorflow-as-backe
nd
- Image Convolution examples: https://aishack.in/tutorials/image-convolution-examples/
- (Spanish) Qué son y cómo crear una red neuronal convolucional con Keras (Ander Fernández
Jauregi):
https://anderfernandez.com/blog/que-es-una-red-neuronal-convolucional-y-como-crearlaen-keras/
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 15 de 16
- A. W. Harley. "An Interactive Node-Link Visualization of Convolutional Neural Networks". 2020 [en
línea]. Disponible en: https://www.cs.ryerson.ca/~aharley/vis/conv/.
- ¿Cómo funcionan las Convolutional Neural Networks? Visión por Ordenador.Aprende Machine
Learning. 2020[en línea]. Disponible en:
https://www.aprendemachinelearning.com/como-funcionan-las-
convolutional-neural-networks-vision-por-ordenador/.
PROYECTO DOCENTE
Análisis de Datos y Procesado de la Información
Grupo 1 (INGLÉS) Machine Learning
CURSO 2020-21
Última modificación 02/09/2020 Página 16 de 16