t
PROGETTO DELLA SCUOLA DI SCIENZE PER LA ATTIVAZIONE DI DUE LAUREE MAGISTRALI:
DATA SCIENCE DATA SCIENCE FOR PHYSICS MODELING
INCONTRO DI CONSULTAZIONE CON LE ORGANIZZAZIONI RAPPRESENTATIVE DELLA
PRODUZIONE, SERVIZI, PROFESSIONI E RICERCA. (ai sensi dell’art. 11, c. 4, DM 270/2004)
Padova, 27 settembre 2016
Scuola di Scienze, Aula Vigna
L’incontro, organizzato dalla Scuola di Scienze, ha avuto lo scopo di illustrare alle
parti sociali il progetto che prevede l’istituzione di due nuovi corsi di laurea magistrale in
Data Science, per un confronto sulla validità, attualità e opportunità delle nuove proposte
formative e per verificare le esigenze del territorio e del mondo del lavoro, monitorando i
possibili sbocchi occupazionali.
Sono questi i concetti chiave che hanno rappresentato i motivi ispiratori del meeting,
strutturato in due momenti:
1. una fase introduttiva nella quale è stato presentato il progetto dei due corsi di laurea
magistrale, entrambi a numero programmato ed erogati in lingua inglese.
DATA SCIENCE, proposto dal Dipartimento di Matematica in collaborazione con i
Dipartimenti di Scienze Statistiche, Ingegneria dell’Informazione, Psicologia
Generale, e Scienze Biomediche, per studenti provenienti da diversi percorsi
formativi, con lauree triennali in Matematica, Statistica, Informatica, Biologia,
Economia e Ingegneria. L’obiettivo è formare la figura professionale emergente del
data scientist, molto richiesta da aziende e servizi, le cui competenze tecniche sono
accompagnate da una preparazione multidisciplinare relativa a vari ambiti in cui
emergono i big data e la capacità di dialogare con i dirigenti nella pianificazione del
trattamento dei dati.
DATA SCIENCE FOR PHYSICS MODELING, proposto dal Dipartimento di Fisica e
Astronomia “Galileo Galilei”, per studenti provenienti dalle lauree triennali in Fisica e
2
in Astronomia, con l’obiettivo di rispondere prioritariamente alla crescente esigenza,
in molti settori di ricerca, di formare fisici con competenze nel trattamento di grandi
moli di dati. Questo richiede l’integrazione delle specifiche conoscenze in fisica con
conoscenze avanzate in statistica e teoria dell’informazione, teoria dei segnali,
calcolo numerico e parallelo.
2. una fase di confronto e discussione con le parti sociali sull’offerta considerando i
seguenti punti:
a. i profili culturali e le figure professionali che si intendono formare,
b. risultati di apprendimento attesi,
c. sbocchi professionali,
d. competenze extra curriculari utili all’inserimento nel mondo del lavoro,
e. percorso formativo (accesso, insegnamenti, stage, prova finale).
Per l’organizzazione del workshop si era precedentemente costituito un Tavolo Tecnico,
composto dai Proff. Dai Pra e Zanetti - coordinatori dei comitati organizzatori dei due corsi
di laurea magistrale, rispettivamente Data Science il primo e Data Science for Physics
Modeling il secondo - e dal Presidente della Scuola di Scienze, che aveva predisposto una
lettera di invito alle Parti Sociali (prot. 158/2016 - allegato 1) a cui sono seguite diverse e-
mail per dettagliare gli obiettivi dell’incontro e del dibattito.
Di seguito l’elenco, in ordine alfabetico, delle Parti Sociali contattate, legate al mondo del
lavoro quali enti di gestione, enti di ricerca, ordini professionali, aziende e associazioni di
categoria: - Ali SpA
- Associazione Nazionale dei Biotecnologici Italiani - ANBI
- Agenzia regionale per la prevenzione e protezione ambientale del Veneto - ARPA Veneto
- Asi – Agenzia Spaziale Italiana
- ASCOM Confcommercio Padova
- Azienda Ospedaliera Padova – Dipartimento risorse per i servizi tecnici e informatici
- Bus Italia Veneto SpA
- Camera di Commercio Padova – Ufficio Studi e statistica
- CMD SpA
- CNISM – Consorzio Interuniversitario per le Scienze Fisiche della Materia
- CNR-IBCN – Istituto di Biologia Cellulare e Neurobiologia
- CNR ICMATE Padova – Istituto di Chimica della Materia Condensata
3
- CNR IFN Padova – Istituto di Fotonica e Nanotecnologie
- CNR – IGI Istituto Gas Ionizzati
- CNR – IN Padova – Istituto di Neuroscienze
- CNR – IDPA Padova – Istituto per la Dinamica dei Processi Ambientali
- Comune di Padova – Sistemi Informativi
- CONFAPI Padova – Confederazione italiana della piccola e Media Impresa
- Confindustria Padova
- Consorzio di Bonifica Adige Euganeo
- Engineering SpA
- EnginSoft SpA
- FOIV – Federazione Ordine Ingegneri Veneto
- Fondazione Bruno Kessler
- GMT SpA
- IOV – Istituto Oncologico Veneto
- INAF OaPd Istituto Nazionale di Astrofisica Padova
- INFN Istituto Nazionale di Fisica Nucleare
- ISTAT
- Regione Veneto – Istruzione
- Regione Veneto – SER Sistema Epidemiologico
- Regione Veneto – Sistema Statistico
- Regione Veneto – Dipartimento Formazione Istruzione e Lavoro
- Regione Veneto – Dipartimento Ambiente
- Sec Servizi SpA
- Unicredit
- Unox SpA
- Venetolavoro
I rappresentanti delle Parti Sociali che hanno preso parte all’incontro sono elencati nel
foglio con le firme di presenza (allegato 2).
Di seguito viene riportata una sintesi degli interventi, che sono stati supportati da
presentazioni power point (allegato 3).
4
Intervento introduttivo del prof. Mariano Beltramini – Presidente della Scuola di Scienze Questa riunione di consultazione rappresenta un momento iniziale e di confronto che
porterà verosimilmente al compimento di un progetto didattico in Data Science che si
articola in modo complesso. E’ un momento preliminare ma importantissimo da cui
ottenere spunti per programmare l’offerta didattica sia in aula sia nel territorio.
L’incontro, dopo la presentazione delle due offerte formative che la Scuola di Scienze
propone come progetto unitario, prevede un confronto e una discussione con i presenti al
fine di ricevere pareri, suggerimenti e contributi.
L’idea è nata nella primavera/estate 2016 quando si sono costituiti i comitati ordinatori dei
due nuovi corsi di laurea magistrale che hanno predisposto i progetti Data Science e Data
Science for Physics Modeling e li hanno proposti ai rispettivi Consigli di Dipartimento i
quali hanno deliberato favorevolmente, garantendo le risorse necessarie
all’implementazione. Il Consiglio della Scuola del 21/07/2016 ha approvato l’avanzamento
del progetto.
La consultazione con le Parti Sociali è una fase fondamentale per avere pareri e
suggerimenti in rapporto alle esigenze del mondo del lavoro, da riportare in sede degli
organi accademici e a livello centrale (CUN, ANVUR; MIUR) a sostegno dell’istituzione di
questi due nuovi corsi di laurea magistrale.
L’illustrazione del progetto e del substrato culturale che ha ispirato questa idea viene
presentata dai proff. Paolo Dai Pra e Marco Zanetti. Successivamente saranno presentati i
dettagli delle due lauree magistrali.
5
Intervento sul contesto generale nel quale si inserisce l’attivazione delle due lauree magistrali - prof. Marco Zanetti - Dipartimento di Fisica e Astronomia “Galileo Galilei”, prof. Paolo Dai Pra - Dipartimento di Matematica Questo intervento, curato dai rappresentanti dei due comitati ordinatori, ha lo scopo di
illustrare le motivazioni che hanno portato alla proposta di attivazione delle due Lauree
Magistrali.
Nella moderna società dell’informazione la presenza massiccia e l’influenza del dato ha un
forte impatto, con ricadute nel mondo accademico, della ricerca e nel mondo del lavoro.
L’importanza di formare nuovi studenti all’interno della Data Science risulta evidente
considerando che “la quantità di informazioni prodotta dall’umanità dai suoi albori al 2003
è pari a quanto creato attualmente ogni due giorni” (Eric Schmidt - Google). Questo è un
trend destinato a crescere grazie a una tecnologia che consente lo stoccaggio e il
salvataggio di una massiva quantità di dati. Abbiamo a disposizione un’enorme quantità di
informazioni proveniente da rete, accessoristica, social network, anagrafica, ecc. che
viene salvata e immagazzinata e che è destinata a crescere esponenzialmente.
Il Data Scientist può essere impiegato in moltissimi ambiti lavorativi: servizi, informatica,
manifattura, grande distribuzione, finanza, assicurazioni, rifiuti, vendita all’ingrosso,
educazione, turismo, sanità, immobiliare, edilizia, trasporti, pubblica amministrazione, ecc.
In Italia il trend è in forte crescita anche se l’interesse non è ancora così evidente come
negli Stati Uniti, dove l’amministrazione Obama ha finanziato la ricerca sui Big Data
investendo 200 milioni di dollari, e la società di consulenza manageriale McKinsey
prevede che a partire dal 2018 saranno richiesti 1.500.000 manager e analisti in Big Data.
Lo stesso MIUR (Ministero dell’Istruzione, dell’Università e della Ricerca) ha istituito un
gruppo di lavoro, presieduto dal direttore della Scuola Normale di Pisa, dedicato a studiare
e monitorare il fenomeno, incentivando iniziative che affrontino il tema Data Science.
Dal rapporto si evince quanto segue:
1) Nel luglio 2014 la commissione europea ha delineato una nuova strategia sui Big Data
per supportare e incentivare la transizione verso una economia basata sul dato,
evidenziando tre linee fondamentali di intervento:
a) Sviluppare le tecnologie, le infrastrutture e le competenze necessarie, in particolare
a beneficio delle piccole e medie imprese;
6
b) Condividere, utilizzare e sviluppare su larga scala le proprie risorse in termini di dati
pubblici (digitalizzazione dei servizi) e infrastrutture di dati per la ricerca;
c) Focalizzare la ricerca pubblica sulla tecnologia, sull’aspetto legale e su altri possibili
punti deboli.
2) Per quanto riguarda l’educazione alla cultura del dato e al suo corretto utilizzo, il
gruppo di lavoro identifica proprio nella formazione universitaria, con particolare
riferimento alla laurea magistrale, il livello ottimale per formare specialisti in Data
Science. Inoltre suggerisce con forza la differenziazione, declinando i corsi in aree
tematiche scientifiche specifiche, con percorsi didattici distinti a seconda del settore nel
quale il data scientist porterà la sua attività.
Questo è esattamente ciò che si prefigge la Scuola di Scienze con il suo progetto di
due lauree magistrali in Data Science, una più generica e trasversale, l’altra di indirizzo
in fisica.
Nel comunicato stampa del MIUR del 28 luglio 2016, in occasione della presentazione del
lavoro della Commissione Big Data, si cita la frase conclusiva del Ministro Giannini:
"Metteremo poi in campo tutte le azioni possibili, anche con incentivi economici, per
incoraggiare gli atenei a diffondere la cultura della gestione dei Big Data in tutti i livelli dei
corsi di laurea. Dati aperti e scienza aperta sono le basi imprescindibili per un sempre più
solido rapporto tra scienza e società"
E’ importante sottolineare che la Data Science a Padova esiste da tempo, sono presenti
ottime competenze e sono coinvolti numerosi dipartimenti. Nella ricerca come nella
formazione professionale, la Data Science è declinata in tanti modi diversi. In Ateneo vi
sono docenti che si occupano di aspetti teorici e metodologici legati alla statistica, alla
matematica e all’informatica e gruppi di ricerca che si occupano di svariate applicazioni in
tantissimi ambiti come quello economico-finanziario, le neuroscienze, la biologia e
naturalmente la fisica.
Il presente progetto Data Science vuole integrare tali competenze e offrire nuove proposte
didattiche.
Confrontandoci con le offerte di diverse università nel mondo, possiamo notare come i
corsi in Data Science vengano declinati in diverse specializzazioni e a diversi livelli
(master, bachelor, PhD). Ad esempio il Data Science Center di Hannover propone 4
7
master in Data Science ognuno con caratteristiche ben definite. Quindi abbiamo una
struttura che coordina la ricerca e la didattica e fa proposte che declinano la scienza dei
dati in direzioni diverse.
Nel medio termine è possibile per Padova avanzare una proposta diversificata con
l’attivazione di due corsi di Laurea magistrale, tenendo in considerazione che
l’organizzazione didattica può essere integrata con dei corsi comuni per un utilizzo
razionale delle risorse docenza.
Attivare entrambe le proposte renderebbe l’Ateneo unico nel panorama italiano con
un’offerta didattica ben strutturata e ricca.
Presentazione del dettaglio organizzativo delle due Lauree Magistrali
DATA SCIENCE prof. Paolo Dai Pra - Dipartimento di Matematica
Questa Laurea Magistrale dalla forte connotazione interdisciplinare giunge dalla
collaborazione di 5 dipartimenti: Ingegneria dell’Informazione, Matematica (proponente),
Psicologia Generale, Scienze Biomediche e Scienze Statistiche. In questo progetto c’è
l’importante contributo della Fondazione Bruno Kessler, ente con sede a Trento, che
sviluppa la propria attività in otto ambiti di ricerca, e collabora con strutture pubbliche e
private in Italia e all’estero.
La parte importante di questo progetto si basa su un laboratorio: il DataScienceLab che
sarà il punto di riferimento per la didattica e la ricerca e che verrà attivato in collaborazione
con la Fondazione Bruno Kessler.
Gli ambiti in cui indirizzare gli studenti di questa Laurea Magistrale sono:
- analisi ed elaborazione delle previsioni su grandi flussi di dati, identificando gli
strumenti software più adeguati;
- valorizzazione degli open data (dati pubblici): valutazione dell’affidabilità e della
sicurezza, progettazione di servizi a cittadini, istituti di analisi, aziende;
- utilizzo di metodologie di Data Science atte ad ottimizzare i processi organizzativi delle
aziende e le loro strategie di mercato;
- sviluppo dell’aspetto ingegneristico per quanto riguarda l’installazione e il
funzionamento delle infrastrutture software, hardware e di rete per i big data.
Alcune di queste tematiche richiamano le competenze professionalizzanti di altre lauree
magistrali già esistenti come per esempio Scienze Statistiche ma se gli statistici si
caratterizzano per essere sviluppatori di metodi statistici, lo scienziato dei dati sarà più
8
orientato all’esigenza computazionale. Rispetto a un Ingegnere Informatico invece il data
scientist avrà una preparazione più focalizzata all’analisi dei dati. In questo senso la nuova
laurea è più specialistica e multidisciplinare.
Organizzazione e Percorso didattico.
Il corso sarà a numero programmato (40 studenti) e sarà erogato in lingua inglese. Il
numero programmato, in ingresso permette la selezione perché valuta i curricula, i
programmi degli esami svolti, i voti degli esami, il voto di laurea, e successivamente
garantisce a tutti gli studenti uno stage di livello elevato. Inoltre, accogliendo studenti di
diversa provenienza la classe sarà eterogenea, ognuno avrà competenze particolari e
questo dovrebbe generare una collaborazione virtuosa tra studenti per integrare le loro
competenze (non si vogliono differenziare gli insegnamenti per stimolare questo tipo di
collaborazione tra gli studenti, insegnando loro a lavorare in team).
Le materie fondamentali della Laurea in Data Science saranno:
•discipline informatiche (24 CFU):
Fundamentals of Information Systems (primo anno- 12 CFU)
Algorithmic Methods and Machine Learning (secondo anno – 12 CFU)
•discipline matematiche (12 CFU)
Stochastic Methods (primo anno – 6 CFU)
Large Scale Optimization methods (secondo anno – 6 CFU)
•discipline statistiche (12CFU)
Statistical Learning part I (primo anno)
Statistica Learning part II (secondo anno)
seguono 3 corsi di indirizzo obbligatori per tutti gli studenti:
Cognitive, Behavioral and Social Data (primo anno - 6 CFU)
Business and Economic Data (secondo anno – 6 CFU)
Biological Data (secondo anno – 6 CFU)
Infine 4 corsi a scelta dello studente per un totale di 24 CFU, grazie ai quali sarà possibile
costruire percorsi “specialistici”.
9
I corsi obbligatori saranno tutti di nuova istituzione e quindi pensati e progettati
appositamente per questo corso di laurea.
Tra i corsi “a scelta” alcuni saranno condivisi con altre Lauree Magistrali, altri saranno di
nuova istituzione. Tra questi, ve ne saranno alcuni forniti dalla Fondazione Bruno Kessler:
Knowledge and data Mining, Process Mining, Financial Technology, Computational
Marketing.
Il quarto semestre sarà interamente dedicato allo stage e alla prova finale.
DATA SCIENCE FOR PHYSICS MODELING
prof. Marco Zanetti – Dipartimento di Fisica e Astronomia “Galileo Galilei”
Questa proposta integra e completa il pacchetto formativo Data Science della Scuola di
Scienze, con una specializzazione che declina le tecniche in Data Science per la Fisica.
Si vuole creare una figura professionale caratterizzata per le elevate competenze in Fisica
e in Data Science. Il legame che unisce queste due materie infatti è strettissimo. In tutti gli
ambiti della Fisica si gestiscono e si analizzano grandi moli di dati. Esempi molteplici si
possono trovare nell’area della fisica delle particelle, ma anche in ambito cosmologico o
della scienza dei materiali, ecc.
Il corso in Data Science for Physics Modeling nasce da una duplice esigenza.
Da una parte gli studenti soffrono del fatto che non vengono offerte loro le competenze in
data science richieste in quasi tutti i campi della ricerca in fisica, e per ovviare a questa
carenza formativa e poter affrontare i problemi della fisica moderna, al momento sono
costretti a costruirsi delle competenze in modo indipendente o da autodidatti.
Dall’altra il Dipartimento si sente in dovere di fornire questi strumenti, per offrire una
formazione sempre al passo con i tempi e con l’evoluzione della ricerca.
I ricercatori di area fisica e astronomica non possono, d’altro canto, demandare questo
tipo di competenze ad altre figure di data scientist, poiché le tematiche da affrontate sono
strettamente e intrinsecamente legate alle grandi moli di dati ottenuti dagli esperimenti di
fisica avanzata e non possono essere che dei fisici a lavorare su questi dati. Le capacità in
Data Science devono essere possedute da chi fa ricerca in Fisica e Astronomia.
Da qui l’esigenza sempre più pressante di colmare un vuoto formativo fornendo agli
studenti di Fisica una preparazione in Data Science particolare e di settore, che permetta
da un lato di mantenere l’identità del Fisico nella specificità e nella complessità delle
10
materie trattate, dall’altro di fornire le competenze specialistiche necessarie
all’elaborazione delle grandi moli di dati necessari allo sviluppo della ricerca.
Le competenze acquisite saranno tuttavia spendibili anche al di fuori del mondo della
ricerca scientifica e tecnologica. Sappiamo infatti che i laureati in fisica sono apprezzati nel
mondo del lavoro, e vengono assunti in vari ambiti per la loro versatilità, flessibilità,
capacità di problem-solving, analisi e interpretazione dei dati.
Organizzazione e Percorso didattico.
Il corso appartiene alla classe di Laurea Magistrale in Fisica LM 17 e si pone l’obiettivo di
formare laureati in Fisica con specifiche competenze in Data Science per fornire
all’ambiente accademico scienziati con capacità nella gestione, elaborazione e analisi di
grandi moli di dati, e per fornire al mondo del lavoro professionisti dei dati.
Il corso sarà a numero chiuso (30 studenti) e verrà erogato in lingua inglese. Per accedere
è necessario possedere delle solide basi in fisica, e pertanto verrà valutato il percorso
didattico di provenienza. Vista l’originalità e gli aspetti innovativi del corso, unico nel suo
genere, l’obiettivo è quello di attrarre anche studenti provenienti da altre sedi, italiane e
straniere.
Il percorso di studi prevede corsi di base, corsi specializzanti in fisica avanzata e corsi
teorici e applicati di statistica avanzata, data science, computing, ecc. in collaborazione
con i corsi di Laurea Magistrale in Fisica e in Data Science.
Insegnamenti obbligatori Primo semestre
•Laboratory of Computational Physics. (12CFU). Programming and pool of applications.
•Theoretical Physics I (6 CFU). Stochastic processes with physical applications.
Secondo e terzo semestre
•Theoretical Physics II (6CFU). Complex systems modelling.
•Advanced statistics for physics analysis (6 CFU). Statistical modelling, estimation and
inference. Model assessment.
•Laboratory of Data management for data science (12 CFU). Hardware and software
applications.
•Machine learning and predictive analytics (6 CFU). Machine Learning, Neural networks
and applications in physics data analysis.
11
•Numerical methods for modelling and physics data analysis (6 CFU). Algorithms,
Monte Carlo and numerical integrations.
Insegnamenti opzionali, a scelta dello studente
Primo semestre
•Particle Physics
•Oceanography/Meteorology
•Quantitative life science
•Astrophysics and cosmology
•Econophysics
Secondo e terzo semestre
•Information Theory and Computation
•Large deviations
•Computational Neuroscience
•Bioinformatics and genomics
•Algorithms and data structures for big data
•High Performance Computing
•Signal processing
•Data mining techniques
•Astro-statistics and big Astrophysical datasets
Quarto semestre
•Stage e prova finale (30 CFU)
Il tirocinio anche per questa laurea magistrale sarà molto importante, e potrà svolgersi
in ambiente di ricerca, in ente pubblico o in aziende private, anche grazie alle
collaborazioni già attive con gli enti di ricerca e alla manifestazione di interesse di realtà
pubbliche e private.
Notevole l’interesse manifestato dagli studenti per questa iniziativa: è stato effettuato un
sondaggio tra gli studenti che frequentano il dipartimento, chiedendo se per loro può
essere attrattivo questo nuovo corso di laurea magistrale e il 70% ha risposto
affermativamente.
12
Interventi delle Parti Sociali Nei loro interventi, i partecipanti hanno appoggiato ampiamente la proposta di attivazione
delle due lauree magistrali.
In particolare:
- vi è convergenza nel considerare i due progetti in linea con le esigenze del mondo
del lavoro, sia attuali sia proiettate a più lungo termine;
- si ribadisce la necessità di integrazione di competenze diverse, di sviluppare la
capacità di lavorare in team e di sviluppare le capacità comunicative;
- la previsione di assunzione dei laureati tenderà ad aumentare nel tempo;
- l’ambito di occupazione può essere molto diversificato;
- molti partecipanti si sono dimostrati interessati ad avere stagisti presso le proprie
strutture.
Di seguito si riporta una sinossi dei diversi interventi in presenza o inviati in data
successiva alla Scuola.
Dott. Demetrio Falorsi – Istat – Direttore area della metodologia e disegno dei processi (presentazione allegato 4) Istat, come tutti gli altri Istituti di Statistica europei, è in una fase di grande riorganizzazione
nella quale la sfida è quella di produrre nuove informazioni integrando i dati senza più
raccoglierli facendo indagini con i metodi tradizionali che sono sempre più difficoltosi.
Le fonti tradizionali sono i dati di indagini e i dati amministrativi. La nuova frontiera sarà nel
campo della grande mole di dati che permetteranno di ottenere informazioni su fenomeni
che attualmente, con lo strumento delle statistiche ufficiali, non si riescono a conoscere,
per esempio le transazioni da internet, i dati di flusso, ecc.
A livello europeo e italiano sono state condotte varie sperimentazioni sui big data che
hanno permesso di avviare ulteriori statistiche (per esempio in Olanda partendo dai big
data si producono statistiche sul traffico). In Istat ci sono tanti statistici bravissimi ma
attualmente c’è carenza di figure professionali come il data scientist. E’ una competenza
che serve e che deve essere acquisita.
Valutando l’offerta formativa del progetto della Scuola presentato oggi e le necessità
emergenti in Istat, domanda e offerta si incontrano perfettamente. Una delle cose in
13
discussione in Istat è quella dell’acquisizione del know-how, del come portare all’interno le
competenze, cosa che non avverrà solo attraverso concorsi e acquisizioni. L’intenzione è
di offrire stage. Studenti che vengono a studiare un problema e che poi mettono a
disposizione i risultati e i loro applicativi con cui poter produrre statistiche ufficiali.
Esperienze come questa rendono possibili sinergie con l’Università.
Dott.ssa Liana Benedetti - Camera di Commercio - Responsabile ufficio studi e statistica (presentazione allegato 5) Presenta alcuni dati provenienti dal sistema Excelsior e da Veneto lavoro sulle assunzioni
da parte delle imprese, da Isfol sulla preparazione richiesta dalle imprese.
Le richieste dei laureati a indirizzo sia scientifico, matematico e fisico sia economico e
statistico sono in aumento, quindi il trend è positivo, anche se per il Veneto le previsioni di
assunzioni sono basse, essendo un mercato che deve ancora maturare.
Apprezzabile che i corsi presentati vengano svolti in lingua inglese perché la conoscenza
di una lingua straniera è sempre molto apprezzata dalle aziende.
L’opinione è che i due corsi non entrano in competizione l’uno con l’altro, il Data Science
for Physics Modeling ha come target principale i centri di ricerca o la grande impresa
internazionale, mentre il corso in Data Science formerà professionisti che possono
collaborare anche con imprese locali, per esempio compagnie assicurative, banche,
grande distribuzione e società di marketing.
Dott. Gabriele Ruffatti - Engineering – Direttore centro di competenza Big Data In Engineering coesistono due ambiti di attività: l’uno è quello infrastrutturale con tutte le
architetture per contenere e trattare i dati (ambito di competenza degli informatici), l’altro è
quello della modellizzazione (ambito dei matematici, fisici ecc). Il personale comprende
quindi fisici, matematici, statistici, esperti linguisto-computazionali e una farmacologa.
Nell’ultimo anno Engineering ha assunto più fisici e matematici che statistici perché la
preparazione è diversa.
Non si può guardare solo la fotografia del fabbisogno che c’è nel Veneto. L’Università
deve guardare oltre se vuole emergere con un’offerta formativa proiettata al futuro e deve
saperlo comunicare, con un’azione parallela per far capire come la professionalità del data
scientist possa servire alle aziende. Quindi dare già a livello universitario la possibilità di
accesso ad un corso professionalizzante in Data Science a studenti con lauree triennali
eterogenee è sicuramente utile e la proposta della Scuola di Scienze è di valore.
14
Si dà disponibilità a contribuire a livello di stage. Esistono già collaborazioni attive con
Roma, Torino, Bologna sul tema Data Science.
Questi concetti sono stati ripresi in un testo scritto (allegato 6) che il Dott. Ruffatti ha
successivamente inviato alla Scuola.
Dott. Andrea Simoni - Fondazione Bruno Kessler La Fondazione Bruno Kessler è stata citata nella presentazione del progetto come partner
del laboratorio di Data Science. E’ una Fondazione di diritto privato ma di proprietà della
Provincia di Trento. Al suo interno ci sono circa 400 ricercatori e si fa ricerca di eccellenza
soprattutto di tipo applicativo. Nel 2016 si stanno seguendo più di 160 progetti di ricerca
soprattutto con aziende nazionali grandi e piccole. Ci sono laboratori congiunti.
La Fondazione ha cominciato ad affrontare il tema del Data Science già da qualche anno
ma questo richiede sempre più forza lavoro e più risorse. I ricercatori sono sempre più
focalizzati su temi applicativi legati ai big data. Nella manifattura per esempio si sta
cercando di migliorare e innovare il processo produttivo partendo dalla gestione dei dati.
La figura professionale che viene cercata non è tanto quella dello statistico classico ma
piuttosto quella del matematico o dell’informatico con competenze in deep learning e
machine learning, capace di predisporre algoritmi per gestire e usare questa grande mole
di dati. Le aziende hanno sempre più bisogno di lavorare in ambito dei Big Data e di
conseguenza c’è sempre più necessità di Data Scientist. Le richieste cominciano a
diventare importanti. Per questo si è previsto un percorso di 5 anni di crescita e per lo
stesso motivo la Fondazione ha deciso, con il DatScienceLab, di allearsi con le realtà in
cui vi sono eccellenze. In questo laboratorio congiunto la Fondazione sarà la parte che si
rapporterà maggiormente con le aziende in cui gli studenti potranno sperimentare progetti
concreti. L’obiettivo è quello di divenire un importante punto di riferimento italiano.
Gilda Rota – Università degli Studi di Padova - Responsabile servizio Stage Career Service Il servizio fa delle piccole ricerche con le aziende per rendersi conto dell’andamento del
mercato del lavoro e riceve richieste per stage e offerte di lavoro per i propri laureati.
A testimonianza di quanto sia sentito il tema dei Big Data dalle aziende, recentemente è
stato organizzato assieme al Dipartimento di Scienze Statistiche un evento dal titolo
“Business Game” per la selezione di Data Scientists per 10 aziende. Questo evento è
stato un successo e gli studenti vincitori sono stati tutti assunti. Il business game era
15
trasversale perché coinvolgeva non solo statistici ma anche matematici, fisici, ingegneri ed
economisti.
L’Ateneo di Padova non riesce a soddisfare la grande quantità di richieste di assunzione
che arrivano dalle aziende soprattutto per le figure di informatici e statistici.
La percezione del Servizio Stage e Career Service relativamente all’istituzione di questi
due nuovi corsi di Laurea Magistrale è senz’altro positiva. La richiesta di figure
professionali che sappiano trattare con grandi moli di dati è forte. Le aziende stanno
richiedendo di organizzare nuove edizioni di “Business Game” per Data Scientist.
E’ importante anche che i docenti facciano capire agli studenti di guardare oltre certe
professioni standard.
Dott.ssa Maria Teresa Coronella – Regione Veneto - Responsabile del servizio di Statistica Il servizio di Statistica della Regione Veneto è attualmente composto da 30 persone.
Inizialmente costituito da tre unità, l’ufficio ha potuto crescere mostrando le sue capacità e
potenzialità agli amministratori. E’ composto per la maggior parte da laureati in statistica,
da informatici, da grafici e laureati in giurisprudenza. L’integrazione fra le varie
competenze e il gioco di squadra è molto importante. Questo a sostegno di quanto
presentato per la laurea in Data Science in cui si parlava della provenienza eterogenea
degli studenti e dell’importanza di farli lavorare assieme nei laboratori in modo che ognuno
possa contribuire con le proprie competenze peculiari creando un team.
Si suggerisce di dedicare spazio, nei piani di studi presentati, alla gestione del progetto e
dei processi, laddove la definizione del progetto implica anche lo studio e la conoscenza
della normativa alla fonte e della normativa sulla privacy per la gestione dei dati sensibili.
Si sottolinea l’importanza del fatto che un corso di laurea magistrale sia realmente
professionalizzante, facendo lavorare da subito nelle varie fonti di dati.
Infine si pone l’accento sulle capacità di saper comunicare i dati ottenuti e i risultati.
Questo implica anche saper usare un linguaggio efficace e comunicativo, conoscere gli
strumenti di comunicazione per rappresentare al meglio quanto ottenuto anche dal punto
di vista grafico. L’integrazione di tutte queste discipline sarebbe auspicabile.
Dott. Alberto Corò – Comune di Padova – Responsabile settore Servizi Informatici Padova, quale città capoluogo, ha introdotto nello sviluppo aree urbane un progetto che
riguarda proprio la Data Science abbinato al mondo della sensoristica.
16
E’ un progetto che partirà nei prossimi anni. Attualmente, per quanto riguarda gli enti
locali, siamo ancora all’anno zero sulla Data Science; in questa ottica il progetto
presentato oggi è molto interessante, in particolare il laboratorio (per la progettazione
esecutiva dei progetti). Il territorio potrà usufruire dei risultati dell’attivazione di questi due
nuovi corsi di laurea sia per quanto riguarda le nuove professionalità che per avere un
confronto e un supporto in termini di know how.
Dott. Massimo Turatto - Direttore Osservatorio Astronomico di Padova - Inaf OaPd - Istituto Nazionale di Astrofisica Nel settore dell’astronomia e dell’astrofisica vi è un gran bisogno delle figure professionali
che il progetto Data Science e, in particolare, la laurea magistrale in Data Science for
Physics Modeling si propone di formare. Si tratta di figure specializzate in grado di
dialogare paritariamente con i ricercatori che sviluppano i modelli fisici e con i tecnologi.
L’Università non deve solo rispondere alle necessità immediate della società ma deve
avere un ruolo trainante nello sviluppo della società stessa, facendo da stimolo con una
visione lungimirante dei fabbisogni. E’ estremamente lodevole che Padova abbia pensato
a questa iniziativa, è una proposta innovativa per lo scenario nazionale. Ma l’Italia è
estremamente in ritardo rispetto al resto del mondo, mancano Data Scientists nazionali.
Un esempio per tutti: Inaf ha partecipato ad un bando internazionale in cui si selezionava
la città ospitante il quartier generale della più grande rete di radiotelescopi (progetto SKA).
Uno dei motivi per cui Padova ha perso rispetto a Manchester è stata proprio la mancanza
di professionalità in Big Data. Se si vuole essere competitivi e trainanti a tutti i livelli si
deve pensare di sviluppare queste competenze.
Entrambi i corsi di laurea sono interessanti e ben studiati, l’Osservatorio di Padova è
disponibile a contribuire, offrendo stage per studenti di entrambi i corsi e collaborando alla
didattica.
Il parere sulla proposta di attivazione dei due corsi è fortemente positivo
Questi concetti sono stati ripresi in un testo scritto (allegato 7) che successivamente è
stato inviato alla Scuola.
Ing. Angelo Messina - EnginSoft SpA – Responsabile ufficio sviluppo e ricerca EnginSoft è una società multinazionale con sede a Padova che opera nel campo dei
servizi all’ingegneria con una visione quasi a 360° del mondo produttivo.
17
I due corsi sono entrambi interessanti: per EnginSoft il Data Science è quello di maggior
interesse in quanto più generalista e trasversale, anche se si conferma che in azienda vi
sono state molte assunzioni di fisici proprio per la loro capacità di modellizzazione.
L’esigenza di avere disponibilità di laureati in Data Science è un’esigenza molto attuale, è
opportuno agire tempestivamente considerando che i primi laureati saranno disponibili nel
2019-2020. C’è disponibilità a far svolgere stage in azienda.
Dott. Renato Signorelli – SEC Servizi – Responsabile sistemi e servizi direzionali SEC SERVIZI è un’azienda che fornisce servizi nell’ambito dell’informatica al mondo
bancario, in particolare alle banche venete. Le banche pur vivendo un momento di crisi
stanno investendo prioritariamente nell’ambito della gestione dei dati. Hanno capito che è
sui dati che si gioca il loro futuro ma non hanno ancora ben chiaro come utilizzarli e quali
sono le potenzialità. Per fare business è cruciale sapere utilizzare bene questi dati. Il
progetto presentato oggi risponde perfettamente ad un’esigenza attuale, che nel settore
bancario veneto è ancora a livello embrionale ma si svilupperà nel breve termine. La
proposta è centrata nei tempi e nei contenuti. La SEC sta cercando stagisti da far lavorare
sulle macchine di big data appena acquistate e c’è disponibilità nei confronti di entrambi i
corsi. SEC è interessata a lavorare al DataScienceLab con la disponibilità a fare
sperimentazioni in ambito dei big data bancari.
Ing. De Nardi – Azienda Ospedaliera di Padova – Direttore Dipartimento risorse per i servizi tecnici e informatici La Sanità nel Veneto è una grande azienda che impiega 60.000 dipendenti e gestisce 5
milioni di abitanti. La proposta illustrata è percepita come molto importante. L’Informatica
sanitaria ha affrontato nel tempo diverse fasi di sviluppo, dalla gestione amministrativo-
logistica, alla gestione dei documenti dei pazienti ma ora è arrivata al confine di questa
parte di gestione del processo. E’ arrivata al punto in cui ha due possibili potenziali
sviluppi:
• -verso il pensiero medico: arrivare ad analizzare dati molto destrutturati (informazioni
eterogenee da immagini a testi scritti, ecc) su pazienti specifici per aiutare i medici a
formulare delle diagnosi;
• -verso la clinical governance: analisi sulla popolazione utilizzando dati, anche in
questo caso destrutturati, che portino a generare profili sulla loro salute e tendenze.
Disponibilità ad ospitare studenti per stage.
18
Dr.ssa Marta Paiusco – IOV – Responsabile settore fisica sanitaria Questa iniziativa è estremamente importante in ambito sanitario, in particolare per quanto
riguarda il corso in Data Science for Physics Modeling. Il Fisico in sanità ha un altissimo
valore aggiunto grazie alle sue capacità di modellizzare. E’ importante creare un corso
altamente professionalizzante per il Fisico che vuole rimanere in ambito accademico ma
senza sottovalutare né tralasciare il fatto che c’è un mondo fuori che necessità di fisici con
formazione in big data e la fisica sanitaria è uno di questi. Altamente raccomandata
l’integrazione e la collaborazione tra i due corsi.
In ambito sanitario si sta lavorando ormai pesantemente sui dati. Ci sono già esempi di
machine learning relativi alla diagnostica sui pazienti, questo significa raccolta di dati che
fortunatamente in sanità ormai da tempo si stanno raccogliendo. Ciò implica un processo
di analisi e di rielaborazione dei dati collezionati.
In sostanza ci sono grandi risorse di dati disponibili ma bisogna saperli analizzare e
modellizzare con le nuove tecnologie e con i nuovi strumenti. C’è carenza di queste
competenze e la fisica sanitaria è un ambito in crescita.
Dott. Ivan Danesi - Unicredit Riporta l’esperienza positiva della partecipazione al Data Science Game come
stakeholder, segnalando che gli informatici e gli statistici hanno avuto una performance
migliore.
Gli analisti dei big data devono avere moltissime competenze e abilità, non si tratta solo di
trattare grandi quantità di dati ma devono avere la capacità di gestirli e analizzarli,
discriminare la qualità dei dati e saperli integrare. La figura professionale del Data
Scientist deve essere caratterizzata anche dall’apertura mentale e deve sapere in quale
ampio spettro operare. Molto interessante l’idea di unire le capacità degli statistici con le
abilità degli informatici nei corsi presentati. Importantissima la presenza di laboratori in cui
far fare molta esperienza agli studenti. Apprezzabile la possibilità di poter accedere alla
laurea in Data Science provenendo da vari ambiti disciplinari e potendo colmare i vuoti
formativi nella prima fase del corso.
Le vecchie generazioni di Data Scientist provenivano dai più disparati ambiti di laurea ed
erano formati all’interno delle imprese. Questo richiedeva dispendio di tempo e di risorse
per chi li assumeva. Perciò è rilevante per le aziende poter ora accedere a queste nuove
figure professionali formate in corsi di laurea magistrali specialistici.
19
Dr. Michele Schiavinato - Confcommercio Veneto Apprezzamento per questa iniziativa a cui Confommercio guarda con interesse e speranza
in particolare per le previsioni e i contributi che possono ricevere i settori del turismo e dei
servizi. Disponibilità a collaborare con l’Università di Padova al progetto Data Science
anche per quanto riguarda gli stage.
Ing. Lisa Zanatto - Ordine degli Ingegneri di Padova Visto che l’accesso a questa laurea magistrale in Data Science può avvenire anche da
lauree triennali in Ingegneria, chiede se è previsto l’accesso all’esame di Stato di
Ingegneria dell’informazione. Questa possibilità potrebbe essere interessante per chi
proviene da una laurea triennale in ingegneria, con i dovuti filtri. Inoltre, visto che quando
si inizia l’attività professionale c’è sempre meno tempo per la formazione continua che dal
2014 è diventata obbligatoria per gli ingegneri, potrebbe essere appetibile poter accedere
magari a corsi singoli o con altre modalità a questi corsi di laurea in Data Science.
Dr Andrea Bertolo - Agenzia Regionale per l’Ambiente Anche i dati ambientali richiedono analisi, comprensione e modellizzazione di grandi dati e
competenze multidisciplinari, per esempio in ambito meteorologico. E’ molto importante
formare competenze specialistiche in questo senso. Più in generale però, sarebbe
interessante che anche gli studenti in chimica, biologia, geologia e in altre materie
scientifiche fossero in grado di analizzare una quantità, non big ma importante, di dati. Per
esempio analizzare cosa succede in una discarica implica il coinvolgimento di tutta una
serie di competenze multidisciplinari (dal chimico che fa le analisi al geologo che analizza
la stratigrafia e i flussi del terreno ecc.) su set di dati raccolti in decine di anni. Quindi
saper mettere insieme i dati e saperli analizzare è importante per gli studenti di materie
scientifiche in generale. Massima disponibilità ad ospitare stagisti anche se le previsioni di
assunzioni sono in contrazione.
Questi concetti e la manifestazione di interesse per la professionalità e la competenza del
laureato in fisica da parte di ARPAV sono stati ripresi in un testo scritto (allegato 8) che
successivamente è stato inviato alla Direzione del Dipartimento di Fisica e Astronomia.
E’ inoltre pervenuta alla Scuola comunicazione scritta da parte di aderenti all’iniziativa che
non hanno preso la parola durante il dibattito:
20
Dr. Gabriele Ballarin, Dr. M. Cammarota Dr. M. Furlan – UNOX (allegato 9) Il Dr. Ballarin ha partecipato alla prima parte dell’incontro, relativa alla presentazione del
progetto, assieme al dr. Matteo Furlan (per svista non hanno tuttavia firmato il foglio
presenza). Non avendo potuto fermarsi oltre ha inviato una lettera (firmata anche dal Dr.
Cammarota) in cui è segnalato il forte interessamento di UNOX per entrambe i nuovi corsi.
Appare di particolare significato la possibilità di offrire la giusta sinergia tra competenze
sull’analisi dei dati e domain knowledge dei processi fisici che sono alla base del
funzionamento dei prodotti UNOX.
Segnalano un elenco di competenze che possono favorire l’ingresso dei nuovi laureati nei
team (database SQL e NoSQL, programmazione, data cleaning e data preparation,
exploratory data analysis, data visualization, machine learning, predisposizione a
comprendere il contesto e i processi che generano i dati ai fini di estrarne valore.
Prof. Ezio Puppin – CNISM (allegato 10) Il Prof. Puppin aveva delegato il Prof. F. Seno a rappresentarlo durante la riunione. Il
Consorzio CNISM svolge attività di ricerca in vari settori interdisciplinari a cavallo fra fisica,
chimica e biologia. In molti di questi settori, la grande mole di dati raccolti richiede sempre
più l'utilizzo di sofisticate analisi di tipo statistico avanzato che non appartengono al solito
bagaglio culturale dei laureati in fisica, chimica, scienza dei materiali e biologia. La
formazione quindi di nuovi corsi di Laurea che uniscano a una solida base culturale anche
nuove e moderne capacità di analisi dati é certamente estremamente importante e di
grandissimo interesse per le attività di ricerca coordinate dal Consorzio. Viene dato
massimo sostegno alla due iniziative, in particolar modo a quella nella classe di Scienze
Fisiche che é più affine alle tematiche di ricerca del CNISM. Si garantisce la disponibilità di
ospitare nei nostri laboratori distribuiti in 38 sedi universitarie eventuali stagisti e laureandi.
Prof. Fernando Ferroni – INFN (allegato 11) Il Prof. Ferroni, Presidente dell’Istituto Nazionale di Fisica Nucleare, ha inviato al Direttore
del Dipartimento di Fisica e Astronomia una lettera di sostegno all’istituzione del corso di
laurea in Data Science for Physics Modeling.
La professionalità e le competenze del laureato in fisica si sono sempre mostrate le più
adeguate e capaci nella ricerca di soluzioni che siano di frontiera ma al tempo stesso
solide e estremamente performanti.
21
L’incontro con le Parti Sociali è terminato alle ore 13:30.
Allegati: 1 lettera di invito alle Parti Sociali protocollo n. 185/2016 2 foglio presenze Parti Sociali e Università di Padova 3 presentazione mostrata durante l’ incontro (relativo agli interventi dei proff.
Beltramini, Zanetti e Dai Pra) 4 presentazione contributo dr. Falorsi - Istat 5 presentazione contributo dr.ssa Benedetti - Camera di Commercio 6 lettera ing. Ruffatti – Engineering SpA 7 lettera PEC prof. Turatto – INAF Osservatorio Astronomico Padova 8 lettera dr. Bertolo – ARPAV 9 lettera ing. Ballarin – Unox SpA 10 lettera prof. Puppin – CNISM 11 lettera prof. Ferroni – INFN