r ba15032013
TRANSCRIPT
1
Roel Bakker
Creating 010
Hogeschool Rotterdam
Dynamiek van infectieziektenverspreidingAgent based modeling
Besmetting in netwerken
2
Inhoud
Wie is Roel Bakker? Overzicht werk voor Creating 010
Wie is Roel Bakker ?http://www.linkedin.com/in/roelbakker10http://scholar.google.nl/citations?user=GKPr_tAAAAAJ&hl=nl
Hoofddocent bij Informatica (0.5 fte), CMI, HR big data (Hadoop), data science (statistiek, R, Twitter data), Java,
databases, cryptografie
Onderzoeker bij afd. Maatschapplijke Gezondheidszorg, Erasmus MC (0.2 fte)
modelleren van infectieziektenverspreiding, met name HIV/SOA
Eigen bedrijf: Skardahl BV (0.1 fte)
simulatiesoftware
Onderzoeker bij Creating 010 (0.2 fte)
Achtergrond:
UvA (promotie, biologie/(elektro)fysiologie), RU Nijmegen, Univ Wageningen
ABN Amro: technisch IT-specialist, IT-architect
Werk voor Creating 010
SIA Raak project – professsionals supported
architectuur
SunnyApp (simulatieterrasbezetting)
Techniek van agent based modeling ligt in het verlengde van werk Erasmus MC
meer gericht op software architectuur van simulatiemodellen
'magic tree' data structuur
ontwerp complexe agent based (netwerk) modellen vs eenvoudige deterministische modellen
CyberDEW project (vanaf 1 feb 2013) vergelijking IDS (intrusion detecten systems)
5
Achtergrond: modelleren van infectieziektenverspreidinghttp://anintroductiontoinfectiousdiseasemodelling.com/
MGZ, Erasmus MC
infectieziektenmodellen
STDSIM (HIV/SOA)
Onchosim (rivierblindheid)
Schistosim (schistosomiasis)
Lymfasim (elephantiasis)
Lepra, TB
kankerscreeningsmodellen diverse varianten van MISCAN:
borstkanker, baarmoederhalskanker, colonkanker, etc
6
Modelleren van infectieziektenverspreidinghttp://anintroductiontoinfectiousdiseasemodelling.com/STD
STDSIM STDSIM is een complex model, het simuleert
hypothetische individuen in een bevolking inclusief:
geboorte, sterfte, immigratie, emigratie seksuele relaties (incl concurrency), prostitutiecontacten, one-
off contacten verschillende SOA en HIV interventies: condoomgebruik, minder partners, SOA
behandeling tgv symptomen, massabehandeling, vaccinatie, circumcision (M), screening, behandeling met AIDS remmers (incl UTT)
7
Recente toepassingen STDSIM
(submitted to The Lancet)
8
Recente toepassingen STDSIM
(to be resubmitted to PLoS Medicine)
9
STDSIM - example sexual networks
WB profile 1: monogamy, CS
10
STDSIM - example sexual networks
WB profile 3: concurrency, no CS
11
STDSIM - example sexual networks
WB profile 2: concurrency, CS
12
STDSIM: te complex ???
STDSIM: complex model, complexe software te veel een 'black box'
risico op fouten
verborgen 'geheimen'
(klein) deel van mijn werk voor Creating 010
zoeken naar een oplossing voor het algemene probleem van complexe modellen / software
13
Soorten modellen
deterministisch compartimentenmodel; macroscopisch
simulatie van fracties vd bevolking dmv continue toestandsvariabelen
model beschreven door stelsel differentiaalvergelijkingen
eenvoudig te implementeren, documenteren en verifieren
SIR model (vgl reactiekinetiek van chemische reacties)
stochastisch, discrete; microscopisch
simulatie van aantallen individuen in een bepaalde toestand mbv
discrete variabelen en stochastiek (RNG, trekkingen uit verdelingen)
relatief eenvoudig te implementeren, documenteren en valideren
voordelen: discrete bevolkingsgrootte, betrouwbaarheidsintervallen (bijv bij eliminatievraagstukken)
nadelen: complexer, minder snel (elke toestandsovergang is een event)
vgl reactiekinetiek waar het gedrag van individuele moleculen wordt gesimuleerd, bijv (stochastic simulations algorithms, Gillespie)
14
Soorten modellen
deterministisch compartimentenmodel; macroscopisch
stochastisch, discrete; microscopisch
S I R
15
SIR model http://www.epidemics.elsevier.com/http://demonstrations.wolfram.com/SIREpidemicDynamics/
simple SIR (susceptible, infected, removed) model : deterministic and compartmental
S I R
16
Soorten modellen
individual / agent based model
simulatie van individuen
heterogeniteit ('niet alle moleculen van een soort zijn gelijk')
realistisch (maar veel parameters)
andere processen dan Poisson processen (Poisson proces: vaste kans per tijdseenheid => duur tot event uit exp verdeling)
'alles is mogelijk'
nadelen: validatie/verificatie van model
netwerk model
als individueel model, niet alleen random contacten tussen individuen (in groepen), maar contact via relaties (links)
voordelen: realistisch
nadelen: complex, dynamiek van netwerk (begin/einde van link, links tussen wie?)
17
18
19
20
Agent Based Modeling
Agent Based Modeling (incl network modeling)
is nodig (zie Nature, Doyne Farmer)
wordt populairder (oa tgv rekenkracht van PCs)
is de enige voor de hand liggende manier om processen in netwerken te bestuderen
21
Complexiteit van ABM - 1
Hoe om te gaan met software complexiteit? goede applicatieve infrastructuur
software libraries voor agent based modeling (Skardahl) onderdelen van de Apache Commons Math library getest mbv R slimme event scheduler (2x sneller dan Java PQ) 'Abstract Finite State Machine' 'Magic Tree' (publicatie in voorbereiding)
gedeeltelijk genereren van applicatie specificeer model als deterministisch compartimenten model genereer het discrete stochastische model (uit de 'rates' vd
differentiaalvergelijkingen) genereer een ABM zonder heterogeniteit maar met agents
(objecten) ipv alleen aantallen vergelijk met stochastisch model en deterministisch model
voeg heterogeniteit toe
22
Open issues
netwerk aspecten zijn niet eenvoudig te verifieren misschien wel te toetsen aan theorie als alle 'nodes' gelijk
zijn?
visualisatie veel inzicht in dit soort complexe modellen is te krijgen door
het gedrag te visualiseren
23
Infectiedruk in netwerken(waar ik wakker van lig...)
NB vervang 'infectie' door alles wat 'besmettelijk' is (gedrag, nieuws, trend, malware)
Is het mogelijk om op een willekeurig moment i/d tijd te voorspellen wat de kans op besmetting is van M (midden) en R (rechts)?
Vooral het risico dat R loopt is interessant.....
L
M
R
24
Infectiedruk in netwerken(waar ik wakker van lig...)
bij constante contact rate en transmissiekans Pm(t) = 1 – exp(-bt)
L
M
R
25
Simulatie terrasbezetting
Hoe werkt de simulatie? Mensen in verschillende toestanden:
op zoek (10 min), op terras (30 min), winkelen (2u)
Terrassen van verschillende grootten, bijv 10, 20, 40, 100 stoelen
Aantal terrassen Aantal mensen Mensen kiezen terras at random, gewogen naar grootte
26
Simulatie terrasbezetting
Demo – sorry, (nog) geen mooie visualisatie..
27
Toekomst
SIA Raak aansluiten van simulatie op Data Space API
Agent based modeling nieuwe toepassingen (netwerk modellen) publiceren
28
Vragen / discussie