information lifecycle management
TRANSCRIPT
work in progress, Jurgen van de Pol, dec 2013
Daar zit je dan,
je ziet de data dagelijks groeien, back-up vensters kruipen naar de 24-uur, de enorme
nachtelijke data bewegingen verstoppen het netwerk als aderverkalking in een
kransslagader.
De nieuwe aanvraag voor 5 terrabyte ligt bovenop de aanvraag van 7 terrabyte. Hoe
gaan we aan de business uitleggen dan we weer een storage-uitbreiding nodig hebben
terwijl de vorige uitbreiding van 7,5 ton nog maar 7 maanden geleden was.
Hoe gaan we uitleggen dat we weer tonnen aan storage en toebehoren nodig hebben om
de datagroei binnen het bedrijf op te vangen?
Hoelang kunnen we met deze nieuwe investering eigenlijk de datagroei te lijf? Hoe ziet
de groeiprognose er eigenlijk uit voor de komende twee à drie jaar? Is deze investering
eigenlijk wel nodig, wat als we ongebruikte data verwijderen? Redden we het dan wel?
En waarom back-uppen we nu eigenlijk alles, is dat echt nodig?
work in progress, Jurgen van de Pol, dec 2013
Data groeit exponentieel 25% p/jr
"There was 5 exabytes of information created
between the dawn of civilization through 2003,
that much information is now created every 2
days, and the pace is increasing ...
Eric Schmidt CEO Google
work in progress, Jurgen van de Pol, dec 2013
wat betekent data voor CZ
CZ is een informatie gedreven organisatie
naast de relatie met de klant en onze kennis
over de processen van zorgverzekeren,
is data onze meest waardevolle asset
work in progress, Jurgen van de Pol, dec 2013
de algemeen heersende opinie
● we hebben teveel data en datagroei
● we spenderen teveel aan storage en backup
● er kan veel data weg omdat het dubbel is,
onnodig is, of oud is.
work in progress, Jurgen van de Pol, dec 2013
waarom is controle zo moeilijk?
● onze data heeft onduidelijke waarde
● omdat we niet precies weten wat de waarde is, weten we niet
hoeveel tijd en geld we moeten investeren in classificatie, opslag,
management en backup.
● de waarde is subjectief
● wie bepaalt wat weg mag, hoe lang het bewaard moet blijven,
hoeveel kopieën ervan moeten zijn.
● het bepalen van de waarde is een moeizaam multidisciplinair
proces, capaciteit uitbreiden is de weg van de minste weerstand
work in progress, Jurgen van de Pol, dec 2013
gedeelde verantwoordelijkheid
twee partijen:
● partij die de data genereert en consumeert
● partij verantwoordelijk voor opslag en
bescherming
werkzaam in compleet gescheiden afdelingen met
verschillende doelen, missie en prioriteiten
work in progress, Jurgen van de Pol, dec 2013
data & informatie
● IB/TAB beheert de data
● de business is eigenaar van & beheert de informatie
Data wordt informatie zodra het door mensen in context
geplaatst en geïnterpreteerd kan worden.
work in progress, Jurgen van de Pol, dec 2013
onbegrip
● laag bewustzijn van kosten die gepaard gaan met het beheer en
management van de data.
● weinig inzicht in deze kosten.
● opties en keuzes zijn onvoldoende transparant en leiden tot
inefficiënt gebruik van resources.
● IT budget en human resources staan onder druk.
● onbeantwoorde vraag : wiens data/informatie is het nu eigenlijk?
● ICT behandelt alle data gelijkwaardig (full backup & gold level)
● data verwijderen is definitief en onomkeerbaar, wie neemt de
beslissing, data kan in een nieuwe context weer nieuwe waarde
krijgen (data analysis)
work in progress, Jurgen van de Pol, dec 2013
de realiteit
● data groeit exponentieel, niet lineair (80% van alle data
is gegenereerd in de laatste 2 jaar)
● opslag wordt goedkoper, nieuwe technieken als
deduplicatie en thin provisioning maken opslag
efficiënter, maar vraag blijft beschikbare capaciteit
overstijgen
● technologie is niet de Haarlemmer olie voor kosten
beheersing
work in progress, Jurgen van de Pol, dec 2013
Data management omvat
● governance, risk & compliance
● architectuur, analyse & design
● database management
● security (access, encryption, vernietiging, diefstal)
● kwaliteit (opschoning, integriteit, verrijking)
● tiering & archivering
● data warehousing & BI (datamarts, mining, golden records)
● ECM content & records management
● metadata
● BCP
work in progress, Jurgen van de Pol, dec 2013
Information Lifecycle Management
“ILM omvat het samenspel van beleid, processen, praktijken en
tooling toegepast om bedrijfswaarde van informatie af te stemmen
op de best passende en meest kosten effectieve IT-infrastructuur,
vanaf het moment dat informatie wordt gevormd
tot en met haar definitieve verwijdering.
De informatie is afgestemd op de business eisen met behulp van
policies en service levels in samenhang met alle toepassingen,
metadata en gegevens.”
work in progress, Jurgen van de Pol, dec 2013
Informatie
● De business is eigenaar van de informatie.
● Informatie is opgeslagen op basis van business eisen.
● De waarde van informatie kan veranderen met de tijd,
waarde wordt regelmatig opnieuw geëvalueerd.
● De eisen tav informatie zijn helder, goed
gecommuniceerd en worden regelmatig geëvalueerd
work in progress, Jurgen van de Pol, dec 2013
Information Lifecycle Management
storage hardware
storage virtualisatie
SAN Beheer
storage resource beheer
Service Level Monitoring
SLA / OLA beheer
Info
rmatio
n L
ifecycle
Managem
ent
work in progress, Jurgen van de Pol, dec 2013
raadpleeg frequentiebeschikbaarheids
eisen
impact van onbeschikbaarheid
financieel operatiecompliance
data classificatie
primair secundair archief
evaluatie
classificatie
toewijzing
opslag tier
tier 1 tier 2 tier 3
FC/SSD iscsi/sata archief
replicatie / backup / recovery / archivebescherming
work in progress, Jurgen van de Pol, dec 2013
3 onderdelen van een ILM strategie
Een ILM strategie omvat minimaal deze 3 aandachtsgebieden:
● Data lifecycle management infrastructuur
Behandelt de infrastructuur die helpt bij het vaststellen van de juiste opslag categorie,
performance, replicatie, backup levels etc. Deze infrastructuur levert ILM en helpt bij de
vermindering van de totale kosten van data & informatie opslag
● Security
Security is essentieel in het kader van naleving van regel en wetgeving (GRC), beperkte
toegang tot gevoelige informatie beperkt de risico’s. Wie heeft toegang? Hoe wordt je
identiteit gecontroleerd. Hoe is de informatie beschermd?
● Integratie
Beschrijft en realiseert de integratie van applicaties met de fysieke Data Lifecycle
Management infrastructuur. Er bestaat geen complete single vendor oplossing die kan
voldoen aan alle specifieke informatie eisen van CZ, samenwerking tussen verschillende
leverancier tbv een goede integrale oplossing is essentieel.
work in progress, Jurgen van de Pol, dec 2013
Storage Tiering, wat heb je nodig
● Stakeholders bepalen de behoeften.
● Bepaal hoeveel tiers je echt nodig hebt, hoe minder hoe
beter.
● Bepaal hoe je de tiers technologisch levert.
● Bepaal de behoeften binnen elke tier tav de lifecycle
van de data.
work in progress, Jurgen van de Pol, dec 2013
Classificatie van dataVanuit het datacenter perspectief is de informatie van de CZ business slechts DATA
● IT managed alleen de DATA: files, volumes, bits & bytes
● Informatie is data in context geplaatst : business beslissingen zijn gebaseerd op informatie
● Nauwe samenwerking met de business is nodig om goed te bepalen wat de service behoeften zijn
● Met behulp van de geïnventariseerde behoeften kun je een SLA opstellen
Business Informatie stakeholders:
● Applicatie performance, beschikbaarheid , restore-baarheid
● Response tijden eindgebruiker, waarde bepaling van de data
● Kosten van opslag, kopieën, bescherming, retentie, backup, groei
Organisatie informatie stakeholders:
● Security officer :versleuteling ,vertrouwelijkheid, beschikbaarheid
● Records Manager: bewaar termijnen,...
● Compliance officer: autorisatie,retentie,...
Classificatie proces schept de voorwaarden om onderstaande te realiseren:
● Opstellen van een service catalogus
● Opstellen van data classificatie policies
● Afstemmen van de data op de juiste tier gebaseerd op de overeengekomen requirements
work in progress, Jurgen van de Pol, dec 2013
ILM maturity
Initial RepeatableDefined &
measured
Quantatitivaly
managedOptimizing
-no storage service
strategy
-no service lifecycle
-no metrics
-no SLA
-introduction of
service design proces
& functions
-event/fault monitoring
-manual configuration
-some reporting
-storage service
catalog
-service level
transition
-capacity
management
-ILM reporting
-all storage classes in
CMDB
-config & asset
mngmt
-tools
-processes
-highly automated
strategy defineddesign of proces &
function
transistion to
serviceservice operation
full service
lifecycle
work in progress, Jurgen van de Pol, dec 2013
Next Steps
● workshop met IT & business stakeholders
● start met awareness, who’s data is it?
● creëer transparantie in tco/abc en
mogelijkheden
● inventariseer behoeften